ОК запустили сервис распознавания аудиосообщений

В социальной сети Одноклассники появилась функция перевода аудиосообщений в текст.

Ия Пфанштиль213читать 2 м.23 Сентября 2021
ОК запустили сервис распознавания аудиосообщений

Сервис распознавания аудио автоматически конвертирует голосовое сообщение в текст, позволяя без прослушивания понять, о чем говорит собеседник. Сервис работает на базе искусственного интеллекта и реализован на основе технологии, разработанной ВКонтакте. Запуск стал очередным важным шагом в интеграции ОК и экосистемы VK.

Новый сервис сделает общение в ОК более комфортным в ситуациях, когда прослушать голосовое сообщение невозможно: в общественном транспорте, во время совещания с коллегами или во время просмотра фильма. Технология распознает как полученные, так и отправленные голосовые сообщения на русском языке длительностью до 60 минут. Благодаря этому текст аудиосообщений индексируется поиском по сообщениям, что позволяет легко найти в чате любую информацию, даже отправленную голосом. При ответе на распознанное голосовое сообщение в чате будет отображаться текст исходного сообщения, а не аудио, что поможет ориентироваться в переписке с собеседником. Для распознанных сообщений в списке чатов также отображается текст, а не значок аудиосообщения.

Конвертация голосовых сообщений в текст в ОК полностью автоматизирована: пользователь сразу получает расшифровку без дополнительных действий. ОК также добавили возможность скопировать текст распознанного аудиосообщения. Функцию можно использовать для работы с текстами, которые наговорит собеседник, или конвертации собственных голосовых заметок в текст для дальнейшей работы с ним.

Технология распознавания речи ВКонтакте основана на трех нейросетях: одна отвечает за распознавание, вторая находит подходящие слова, а третья расставляет знаки препинания и заглавные буквы. Для обучения нейросетей используются аудио, которые специально для этой задачи записывают участники программы VK Testers, и база субтитров из фильмов. На конвертацию аудио в текст уходит всего около секунды. Нейросеть распознает русскоязычную речь, при этом в расшифровке учитываются разговорные слова, заимствованная лексика, а также сложные условия записи – например, низкое качество звука или нечеткая речь собеседника. 

Распознавание аудиосообщений автоматически включено у всех пользователей последних версий мобильных приложениях ОК на Android и iOS, а также в десктопной версии соцсети. Отключить новую функцию можно в настройках профиля, в разделе «Сообщения».

Другие новости
YouTube поделился результатами формата Shorts

YouTube поделился результатами формата Shorts

Как сделать мобильные сайты удобнее. Исследование

Как сделать мобильные сайты удобнее. Исследование

Яндекс представил Мастер кампаний

Яндекс представил Мастер кампаний

Подписаться на новостную рассылку12 тысяч маркетологов уже подписались!
Следующий
Тренды B2B на 2019 год. Исследование

Тренды B2B на 2019 год. Исследование

читать минут
Рекомендуемые

ВКонтакте запустила собственный сервис для майнинга

читать минут

Комментарии (0)