04:04 МСК

«VK Видео» увеличил с помощью ИИ точность автоматических субтитров на 25%

Функция субтитров получила высокую оценку пользователей видеоконтента. В течение последнего месяца доля зрителей на платформе «VK Видео», использующих эту функцию, возросла на 28 %. В настоящее время субтитры активны для 11 % всей аудитории сервиса, который значительно улучшил точность расшифровки речи.

Увеличение точности распознавания речи на 25 % на платформе «VK Видео» стало возможным благодаря внедрению новых алгоритмов искусственного интеллекта. Эти алгоритмы автоматизируют распознавание речи и синтез субтитров для различных видов контента, включая ролики, шоу и клипы. Важным фактором также является быстрое освоение нейросетями множества новых слов, таких как имена собственные, профессиональные термины, акронимы и мемы. В ближайшем будущем ИИ сможет разделять речь разных спикеров на отдельные реплики, что сделает субтитры еще более понятными.

ML-модели, которые создают текст, расставляют знаки препинания и синхронизируют его с видео, играют ключевую роль в процессе автоматического создания субтитров. ИИ обрабатывает аудиопоток в несколько этапов, чтобы повысить точность анализа. Вначале нейросеть устраняет посторонние шумы и преобразует распознаваемую речь в текст. Затем модели пунктуации и денормализации формируют читаемые фразы из набора распознанных слов. На последнем этапе ИИ синхронизирует текст с аудиодорожкой.

Технология субтитров особенно полезна для людей с нарушениями слуха и востребована в ситуациях, когда просмотр видео осуществляется без звука.

Источник: CNews

Поделиться: