Королевская библиотека Швеции (KB) представила KB-Whisper – новую модель преобразования речи в текст, основанную на технологии OpenAI Whisper.
Как сообщает АЗЕРТАДЖ, модель обучена на 50 000 часов шведских телетрансляций, парламентских речей и различных диалектов, что делает ее значительно точнее американских аналогов – на 47 процентов меньше ошибок на уровне слов.
Ранее автоматические субтитры телеканалов TV4 и SVT часто становились предметом насмешек из-за грубых ошибок. Так, например, слово väljarna («избиратели») превращалось в älgarna («лось»), а skydd («защита») – в skit («чушь»). KB-Whisper обещает качественный прорыв. Однако модель пока слабо справляется с акцентами носителей других языков.
Сейчас SVT рассматривает возможность внедрения KB-Whisper для автоматической генерации субтитров. Также модель может быть полезна в медицине, обслуживании клиентов и помощи людям с нарушением слуха.
«В KB мы будем использовать модель для транскрипции нашего радиоархива, чтобы сделать его доступным для исследователей. Если бы мы делали это вручную, ушли бы годы», - говорит старший научный сотрудник по обработке данных в KB Леонора Вестербакка.
https://azertag.az/
Комментариев нет:
Отправить комментарий