среда, 5 марта 2025 г.

Швеция: Королевская библиотека запустила ИИ для транскрипции речи

 Королевская библиотека Швеции (KB) представила KB-Whisper – новую модель преобразования речи в текст, основанную на технологии OpenAI Whisper.

Как сообщает АЗЕРТАДЖ, модель обучена на 50 000 часов шведских телетрансляций, парламентских речей и различных диалектов, что делает ее значительно точнее американских аналогов – на 47 процентов меньше ошибок на уровне слов.

Ранее автоматические субтитры телеканалов TV4 и SVT часто становились предметом насмешек из-за грубых ошибок. Так, например, слово väljarna («избиратели») превращалось в älgarna («лось»), а skydd («защита») – в skit («чушь»). KB-Whisper обещает качественный прорыв. Однако модель пока слабо справляется с акцентами носителей других языков.

Сейчас SVT рассматривает возможность внедрения KB-Whisper для автоматической генерации субтитров. Также модель может быть полезна в медицине, обслуживании клиентов и помощи людям с нарушением слуха.

«В KB мы будем использовать модель для транскрипции нашего радиоархива, чтобы сделать его доступным для исследователей. Если бы мы делали это вручную, ушли бы годы», - говорит старший научный сотрудник по обработке данных в KB Леонора Вестербакка.

https://azertag.az/

Комментариев нет:

Отправить комментарий