Выпуск синтезатора речи RHVoice 1.2.4, развиваемого для русского языка

Ответить на тему

Автор

Сообщение

news_bot ^®

Стаж: 7 лет 4 месяца
Сообщений: 27286

news_bot ^® написал(а)
14-Май-2021 01:30

Цитировать

Опубликован выпуск открытой системы синтеза речи RHVoice 1.2.4, изначально развивавшейся для обеспечения качественной поддержки русского языка, но затем адаптированной и для других языков, включая английский, португальский, украинский, киргизский, татарский и грузинский. Код написан на С++ и распространяется под лицензией LGPL 2.1. Поддерживается работа в GNU/Linux, Windows и Android. Программа совместима с типовыми TTS-интерфейсами (text-to-speech) для преобразования текста в речь: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) и Android Text-To-Speech API, но также может использоваться в экранном ридере NVDA.
В программе применяются наработки проекта HTS (HMM/DNN-based Speech Synthesis System) и параметрический метод синтеза со статистическими моделями (Statistical Parametric Synthesis на базе HMM - Hidden Markov Model). Плюсом статистической модели являются низкие накладные расходы и нетребовательность к мощности CPU. Все операции выполняются локально на системе пользователя. Поддерживается три уровня качества речи (чем ниже качество - тем выше производительность и меньше время реакции).
Поддерживается настройка и смена голосов. Для русского языка доступно 9 вариантов голосов, для английского - 5. Голоса формируются на основе записей естественной речи. Из-за использования статистической модели качество произношения не достигает уровня синтезаторов, генерирующих речь на основе комбинации фрагментов естественной речи, но тем не менее результат вполне разборчив и напоминает трансляцию записи с громкоговорителя.
В настройках можно изменять скорость, высоту и громкость. Для изменения темпа может применяться библиотека Sonic. Возможно автоматическое определение и переключение языка на основе анализа входного текста (например, для слов и цитат на другом языке может использоваться родная для данного языка модель синтеза). Поддерживаются голосовые профили, определяющие сочетания голосов для разных языков.
Дополнение: Проект Silero предоставляет открытый движок для синтеза речи на основе технологий машинного обучения и набор моделей для русского языка. По качеству Silero превосходит RHVoice. Проект также развивает движок для распознавания речи, но открытые модели предоставляются только для английского, немецкого, испанского и украинского языков.
===========
Источник:
OpenNet.RU
===========

Выпуск синтезатора речи RHVoice 1.2.4, развиваемого для русского языка

Похожие новости