[Разработка для Office 365, Искусственный интеллект, Голосовые интерфейсы] MS Word из пакета Microsoft 365 научили переводить голос в текст в режиме реального времени

Автор Сообщение
news_bot ®

Стаж: 6 лет 9 месяцев
Сообщений: 27286

Создавать темы news_bot ® написал(а)
26-Авг-2020 20:32

В онлайн-версию Word от Microsoft добавили функцию «Transcribe in Word», которую определенно оценят те, кому приходится заниматься расшифровкой конференций и просто звонков. Вместе с ней MS Word из пакета Microsoft 365 обзавелся функцией расшифровки речи «на лету», сообщается в официальном блоге компании.

В первую очередь, в основе платформы лежит функция Transcribe in Word — транскрипции надиктованного текста в письменный вид.
Главным преимуществом Microsoft называет то, что для работы сервиса понадобится только доступ к веб-версии Word из пакета Microsoft 365 и, собственно, само записывающее устройство, под которое подпадает как смартфон, так и ноутбук.
Режим транскрипции запускается в самом Word и после его активации, включается запись в формате WAV, которая в режиме реального времени выгружается на сервера компании и трансформируется в текст.
По заверениям разработчиков, новая система не только ведет запись в высоком качестве, но и даже способна разбить получаемую запись по голосам на действующих лиц, чтобы корректно оформлять отдельные реплики участников звонков. Кроме этого новая система может просто улавливать звук с устройства, то есть переводу в текст можно подвергнуть условную запись лекции с YouTube.
При этом новая функция работает и в режиме загрузки аудио. Конечно, в этом случае на обработку аудиофайла потребуется больше времени (при синхронном запуске транскрипция производится с задержкой всего в несколько секунд). Плюс существует ряд ограничений: принимаются к обработке только файлы форматов MP3, WAV, M4A или MP4, а объем каждого ограничен 200 Мб. Также пока существует ограничение на продолжительность переведенного в текст аудио. Сейчас пользователям Microsoft 365 официально с одного аккаунта доступна транскрипция 300 минут (5 часов) записи в месяц. У некоторых конкурентных узконаправленных сервисов этот параметр составляет 600 минут (10 часов). The Verge приводит, к примеру, сервис Otter.ai. Но важно понимать, что Otter.ai — нишевый монопродукт, а Word — огромный комбайн от Microsoft.
Transcribe in Word не появился из ниоткуда, работа компанией в этом направлении велась уже давно.
Так, еще в 2018 году компания представила сервис ввода и распознавания текста для дислексиков под названием Dictation for Office 365, о чем писалось на Хабре. Тогда же аннонсировали Immersive Reader — разработку, которая организует построчное прочтение текста с математическими формулами для облегчения восприятия смешанного текста.

Таким образом, система транскрипции речи в текст с должным качеством — это результат минимум трех лет работы инженеров компании, которые методично вывели узкоспециализированные «фишки» Office 365, которые изначально задумывались в помощь пользователям, с нарушением восприятия и ограниченными возможностями, на уровень общеприменимой функции.
Новая функция точно будет пользоваться популярностью, как стал популярен голосовой ввод поисковых запросов от Google. Вопрос только в том, когда Microsoft адаптирует новинку под другие языки, потому что пока Transcribe in Word доступен только на английском языке.
===========
Источник:
habr.com
===========

Похожие новости: Теги для поиска: #_razrabotka_dlja_office_365 (Разработка для Office 365), #_iskusstvennyj_intellekt (Искусственный интеллект), #_golosovye_interfejsy (Голосовые интерфейсы), #_itsumma, #_transcribe_in_word, #_ms_office, #_ms_word, #_microsoft_365, #_golosovye_pomoschniki (голосовые помощники), #_blog_kompanii_itsumma (
Блог компании ITSumma
)
, #_razrabotka_dlja_office_365 (
Разработка для Office 365
)
, #_iskusstvennyj_intellekt (
Искусственный интеллект
)
, #_golosovye_interfejsy (
Голосовые интерфейсы
)
Профиль  ЛС 
Показать сообщения:     

Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы

Текущее время: 22-Ноя 23:39
Часовой пояс: UTC + 5