[Разработка для Office 365, Искусственный интеллект, Голосовые интерфейсы] MS Word из пакета Microsoft 365 научили переводить голос в текст в режиме реального времени
Автор
Сообщение
news_bot ®
Стаж: 6 лет 9 месяцев
Сообщений: 27286
В онлайн-версию Word от Microsoft добавили функцию «Transcribe in Word», которую определенно оценят те, кому приходится заниматься расшифровкой конференций и просто звонков. Вместе с ней MS Word из пакета Microsoft 365 обзавелся функцией расшифровки речи «на лету», сообщается в официальном блоге компании.
В первую очередь, в основе платформы лежит функция Transcribe in Word — транскрипции надиктованного текста в письменный вид.
Главным преимуществом Microsoft называет то, что для работы сервиса понадобится только доступ к веб-версии Word из пакета Microsoft 365 и, собственно, само записывающее устройство, под которое подпадает как смартфон, так и ноутбук.
Режим транскрипции запускается в самом Word и после его активации, включается запись в формате WAV, которая в режиме реального времени выгружается на сервера компании и трансформируется в текст.
По заверениям разработчиков, новая система не только ведет запись в высоком качестве, но и даже способна разбить получаемую запись по голосам на действующих лиц, чтобы корректно оформлять отдельные реплики участников звонков. Кроме этого новая система может просто улавливать звук с устройства, то есть переводу в текст можно подвергнуть условную запись лекции с YouTube.
При этом новая функция работает и в режиме загрузки аудио. Конечно, в этом случае на обработку аудиофайла потребуется больше времени (при синхронном запуске транскрипция производится с задержкой всего в несколько секунд). Плюс существует ряд ограничений: принимаются к обработке только файлы форматов MP3, WAV, M4A или MP4, а объем каждого ограничен 200 Мб. Также пока существует ограничение на продолжительность переведенного в текст аудио. Сейчас пользователям Microsoft 365 официально с одного аккаунта доступна транскрипция 300 минут (5 часов) записи в месяц. У некоторых конкурентных узконаправленных сервисов этот параметр составляет 600 минут (10 часов). The Verge приводит, к примеру, сервис Otter.ai. Но важно понимать, что Otter.ai — нишевый монопродукт, а Word — огромный комбайн от Microsoft.
Transcribe in Word не появился из ниоткуда, работа компанией в этом направлении велась уже давно.
Так, еще в 2018 году компания представила сервис ввода и распознавания текста для дислексиков под названием Dictation for Office 365, о чем писалось на Хабре. Тогда же аннонсировали Immersive Reader — разработку, которая организует построчное прочтение текста с математическими формулами для облегчения восприятия смешанного текста.
Таким образом, система транскрипции речи в текст с должным качеством — это результат минимум трех лет работы инженеров компании, которые методично вывели узкоспециализированные «фишки» Office 365, которые изначально задумывались в помощь пользователям, с нарушением восприятия и ограниченными возможностями, на уровень общеприменимой функции.
Новая функция точно будет пользоваться популярностью, как стал популярен голосовой ввод поисковых запросов от Google. Вопрос только в том, когда Microsoft адаптирует новинку под другие языки, потому что пока Transcribe in Word доступен только на английском языке.
===========
Источник:
habr.com
===========
Похожие новости:
- [Искусственный интеллект] МКБ внедрил технологию распознавания клиентских данных с помощью искусственного интеллекта
- [Машинное обучение, Искусственный интеллект, Транспорт] Детектирование состояния светофоров на железнодорожных переездах для фиксации нарушений ПДД
- [Поисковые технологии, Машинное обучение, Искусственный интеллект] Нейросетевой визуальный поиск
- [Python, Работа с 3D-графикой, Искусственный интеллект] 3D ML. Часть 3: датасеты и фреймворки в 3D ML
- [Машинное обучение, Искусственный интеллект, Звук] Увольнения в Mozilla ставят под угрозу будущее проекта DeepSpeech
- [Python, Data Mining, Машинное обучение, Искусственный интеллект, Natural Language Processing] Проект Natasha. Набор качественных открытых инструментов для обработки естественного русского языка (NLP)
- [IT-инфраструктура, Разработка систем связи, Стандарты связи] Новый рекорд скорости передачи данных в интернете — 178 терабит в секунду
- [Машинное обучение, Искусственный интеллект] Как машинное обучение и искусственный интеллект ускоряют поиск новых лекарств (перевод)
- [Информационная безопасность, Социальные сети и сообщества, IT-компании] Вновь утечка: в сети оказались данные 235 миллионов пользователей Instagram, YouTube и TikTok
- [Терминология IT, Хакатоны, Прототипирование, Искусственный интеллект, Будущее здесь] Стартовал прием заявок на участие в масштабном онлайн-хакатоне «Лидеры цифровой трансформации»
Теги для поиска: #_razrabotka_dlja_office_365 (Разработка для Office 365), #_iskusstvennyj_intellekt (Искусственный интеллект), #_golosovye_interfejsy (Голосовые интерфейсы), #_itsumma, #_transcribe_in_word, #_ms_office, #_ms_word, #_microsoft_365, #_golosovye_pomoschniki (голосовые помощники), #_blog_kompanii_itsumma (
Блог компании ITSumma
), #_razrabotka_dlja_office_365 (
Разработка для Office 365
), #_iskusstvennyj_intellekt (
Искусственный интеллект
), #_golosovye_interfejsy (
Голосовые интерфейсы
)
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Текущее время: 22-Ноя 23:39
Часовой пояс: UTC + 5
Автор | Сообщение |
---|---|
news_bot ®
Стаж: 6 лет 9 месяцев |
|
В онлайн-версию Word от Microsoft добавили функцию «Transcribe in Word», которую определенно оценят те, кому приходится заниматься расшифровкой конференций и просто звонков. Вместе с ней MS Word из пакета Microsoft 365 обзавелся функцией расшифровки речи «на лету», сообщается в официальном блоге компании. В первую очередь, в основе платформы лежит функция Transcribe in Word — транскрипции надиктованного текста в письменный вид. Главным преимуществом Microsoft называет то, что для работы сервиса понадобится только доступ к веб-версии Word из пакета Microsoft 365 и, собственно, само записывающее устройство, под которое подпадает как смартфон, так и ноутбук. Режим транскрипции запускается в самом Word и после его активации, включается запись в формате WAV, которая в режиме реального времени выгружается на сервера компании и трансформируется в текст. По заверениям разработчиков, новая система не только ведет запись в высоком качестве, но и даже способна разбить получаемую запись по голосам на действующих лиц, чтобы корректно оформлять отдельные реплики участников звонков. Кроме этого новая система может просто улавливать звук с устройства, то есть переводу в текст можно подвергнуть условную запись лекции с YouTube. При этом новая функция работает и в режиме загрузки аудио. Конечно, в этом случае на обработку аудиофайла потребуется больше времени (при синхронном запуске транскрипция производится с задержкой всего в несколько секунд). Плюс существует ряд ограничений: принимаются к обработке только файлы форматов MP3, WAV, M4A или MP4, а объем каждого ограничен 200 Мб. Также пока существует ограничение на продолжительность переведенного в текст аудио. Сейчас пользователям Microsoft 365 официально с одного аккаунта доступна транскрипция 300 минут (5 часов) записи в месяц. У некоторых конкурентных узконаправленных сервисов этот параметр составляет 600 минут (10 часов). The Verge приводит, к примеру, сервис Otter.ai. Но важно понимать, что Otter.ai — нишевый монопродукт, а Word — огромный комбайн от Microsoft. Transcribe in Word не появился из ниоткуда, работа компанией в этом направлении велась уже давно. Так, еще в 2018 году компания представила сервис ввода и распознавания текста для дислексиков под названием Dictation for Office 365, о чем писалось на Хабре. Тогда же аннонсировали Immersive Reader — разработку, которая организует построчное прочтение текста с математическими формулами для облегчения восприятия смешанного текста. Таким образом, система транскрипции речи в текст с должным качеством — это результат минимум трех лет работы инженеров компании, которые методично вывели узкоспециализированные «фишки» Office 365, которые изначально задумывались в помощь пользователям, с нарушением восприятия и ограниченными возможностями, на уровень общеприменимой функции. Новая функция точно будет пользоваться популярностью, как стал популярен голосовой ввод поисковых запросов от Google. Вопрос только в том, когда Microsoft адаптирует новинку под другие языки, потому что пока Transcribe in Word доступен только на английском языке. =========== Источник: habr.com =========== Похожие новости:
Блог компании ITSumma ), #_razrabotka_dlja_office_365 ( Разработка для Office 365 ), #_iskusstvennyj_intellekt ( Искусственный интеллект ), #_golosovye_interfejsy ( Голосовые интерфейсы ) |
|
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Текущее время: 22-Ноя 23:39
Часовой пояс: UTC + 5