Выпуск синтезатора речи RHVoice 1.2.4, развиваемого для русского языка
Автор
Сообщение
news_bot ®
Стаж: 7 лет 2 месяца
Сообщений: 27286
Опубликован выпуск открытой системы синтеза речи RHVoice 1.2.4, изначально развивавшейся для обеспечения качественной поддержки русского языка, но затем адаптированной и для других языков, включая английский, португальский, украинский, киргизский, татарский и грузинский. Код написан на С++ и распространяется под лицензией LGPL 2.1. Поддерживается работа в GNU/Linux, Windows и Android. Программа совместима с типовыми TTS-интерфейсами (text-to-speech) для преобразования текста в речь: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) и Android Text-To-Speech API, но также может использоваться в экранном ридере NVDA.
В программе применяются наработки проекта HTS (HMM/DNN-based Speech Synthesis System) и параметрический метод синтеза со статистическими моделями (Statistical Parametric Synthesis на базе HMM - Hidden Markov Model). Плюсом статистической модели являются низкие накладные расходы и нетребовательность к мощности CPU. Все операции выполняются локально на системе пользователя. Поддерживается три уровня качества речи (чем ниже качество - тем выше производительность и меньше время реакции).
Поддерживается настройка и смена голосов. Для русского языка доступно 9 вариантов голосов, для английского - 5. Голоса формируются на основе записей естественной речи. Из-за использования статистической модели качество произношения не достигает уровня синтезаторов, генерирующих речь на основе комбинации фрагментов естественной речи, но тем не менее результат вполне разборчив и напоминает трансляцию записи с громкоговорителя.
В настройках можно изменять скорость, высоту и громкость. Для изменения темпа может применяться библиотека Sonic. Возможно автоматическое определение и переключение языка на основе анализа входного текста (например, для слов и цитат на другом языке может использоваться родная для данного языка модель синтеза). Поддерживаются голосовые профили, определяющие сочетания голосов для разных языков.
Дополнение: Проект Silero предоставляет открытый движок для синтеза речи на основе технологий машинного обучения и набор моделей для русского языка. По качеству Silero превосходит RHVoice. Проект также развивает движок для распознавания речи, но открытые модели предоставляются только для английского, немецкого, испанского и украинского языков.
===========
Источник:
OpenNet.RU
===========
Похожие новости
- Главная ссылка к новости (https://github.com/RHVoice/RHV...)
- OpenNews: Представлен первый релиз свободного синтезатора речи Gnuspeech
- OpenNews: Компания Mozilla представила движок распознавания речи DeepSpeech 0.9
- OpenNews: Техника воссоздания речи через анализ вибрации лампы в подвесном светильнике
- OpenNews: Компания Mozilla представила систему синтеза речи LPCNet
- OpenNews: Facebook опубликовал открытую систему распознавания речи Wav2letter++
Похожие новости:
- [Машинное обучение, Искусственный интеллект] И чат, и бот, и логопед. Как разработать сервис на основе ML для диагностики дефектов речи у детей
- [Изучение языков] Пассив в английском: его не любят, но все равно используют
- NVIDIA инвестирует 1.5 млн долларов в проект Mozilla Common Voice
- [Искусственный интеллект, DIY или Сделай сам, Natural Language Processing, Голосовые интерфейсы] Как разработчику голосовых навыков получить выход на аудиторию Сбера (короткий путь)
- [Ненормальное программирование, Системное администрирование, Сетевые технологии] NetBox как Voice и UC Source of Truth
- [Управление продажами, Облачные сервисы] Speech Analytics: Benefits and its New Importance in Telecommunication Technology
- [Firefox, Расширения для браузеров, Машинное обучение, Финансы в IT] Mozilla закрывает проекты Firefox Voice и Voice Fill
- [Расширения для браузеров, Браузеры, IT-компании] Mozilla закрывает проект Speech Proxy Server и удалит расширения VoiceFill и Firefox Voice Beta
- Mozilla свернула разработку проектов Voice Fill и Firefox Voice
- [API, Видеоконференцсвязь] Top 10 Best Voice Chat APIs for Mobile & Web Apps
Теги для поиска: #_rhvoice, #_voice
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Текущее время: 28-Апр 13:33
Часовой пояс: UTC + 5
Автор | Сообщение |
---|---|
news_bot ®
Стаж: 7 лет 2 месяца |
|
Опубликован выпуск открытой системы синтеза речи RHVoice 1.2.4, изначально развивавшейся для обеспечения качественной поддержки русского языка, но затем адаптированной и для других языков, включая английский, португальский, украинский, киргизский, татарский и грузинский. Код написан на С++ и распространяется под лицензией LGPL 2.1. Поддерживается работа в GNU/Linux, Windows и Android. Программа совместима с типовыми TTS-интерфейсами (text-to-speech) для преобразования текста в речь: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) и Android Text-To-Speech API, но также может использоваться в экранном ридере NVDA. В программе применяются наработки проекта HTS (HMM/DNN-based Speech Synthesis System) и параметрический метод синтеза со статистическими моделями (Statistical Parametric Synthesis на базе HMM - Hidden Markov Model). Плюсом статистической модели являются низкие накладные расходы и нетребовательность к мощности CPU. Все операции выполняются локально на системе пользователя. Поддерживается три уровня качества речи (чем ниже качество - тем выше производительность и меньше время реакции). Поддерживается настройка и смена голосов. Для русского языка доступно 9 вариантов голосов, для английского - 5. Голоса формируются на основе записей естественной речи. Из-за использования статистической модели качество произношения не достигает уровня синтезаторов, генерирующих речь на основе комбинации фрагментов естественной речи, но тем не менее результат вполне разборчив и напоминает трансляцию записи с громкоговорителя. В настройках можно изменять скорость, высоту и громкость. Для изменения темпа может применяться библиотека Sonic. Возможно автоматическое определение и переключение языка на основе анализа входного текста (например, для слов и цитат на другом языке может использоваться родная для данного языка модель синтеза). Поддерживаются голосовые профили, определяющие сочетания голосов для разных языков. Дополнение: Проект Silero предоставляет открытый движок для синтеза речи на основе технологий машинного обучения и набор моделей для русского языка. По качеству Silero превосходит RHVoice. Проект также развивает движок для распознавания речи, но открытые модели предоставляются только для английского, немецкого, испанского и украинского языков. =========== Источник: OpenNet.RU =========== Похожие новости
|
|
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Текущее время: 28-Апр 13:33
Часовой пояс: UTC + 5