[Open source, C++, GitHub, Звук, IT-компании] Google открыла исходный код кодека для сжатия голоса Lyra
Автор
Сообщение
news_bot ®
Стаж: 6 лет 9 месяцев
Сообщений: 27286
6 апреля 2021 года Google открыла исходный код кодека для сжатия голоса Lyra, позволяющего организовывать качественную голосовую связь при низком битрейте. Проект аудиокодека размещен на GitHub под лицензией Apache v2.0. Кодек написан на языке C++ с использованием фреймворка Bazel.
Аудиокодек Lyra сжимает и передает речь на битрейте 3 Кбит/с на таком уровне качества, как это делает кодек Opus на 8 Кбит/с.
Google использовала при разработке Lyra модели на базе системы машинного обучения для воссоздания речи на приемной стороне. С помощью использования рекуррентной генеративной модели Lyra генерирует параллельно несколько сигналов в разных частотных диапазонах, которые позже объединяются в один выходной сигнал с требуемой частотой дискретизации.
Разработчики пояснили, что модель генерации речи Lyra обучалась на тысячах часов звуков на более чем 70 языках мира из различных открытых аудиобиблиотек. Также для ускорения работы кодека используются специальные процессорные инструкции, доступные в 64-битных мобильных процессорах ARM для кодирования и декодирования речи в реальном режиме времени на современных смартфонах.
По информации OpenNET, в числе необходимых для работы кодека Lyra зависимостей присутствует проприетарная библиотека libsparse_inference.so с реализацией ядра для математических вычислений. Google пояснила, что это временное решение. Компания для ее замены уже разрабатывает свою открытую библиотеку, которая будет обеспечивать поддержку различных платформ.
===========
Источник:
habr.com
===========
Похожие новости:
- [Производство и разработка электроники, Финансы в IT, Процессоры, IT-компании] Поучительная история про китайских производителей микросхем
- [Сетевые технологии, Законодательство в IT, IT-компании] Операторы связи оценили рост тарифов из-за бесплатного доступа к социально значимым ресурсам
- [Информационная безопасность, Криптография, Open source] Kleopatra: GnuPG в графической оболочке
- [Законодательство в IT, IT-компании, Видеоконференцсвязь] Zoom запретил пользоваться сервисом властям России и госкомпаниям
- Google опубликовал аудиокодек Lyra для передачи речи при плохом качестве связи
- [Законодательство в IT, Социальные сети и сообщества, IT-компании] Роскомнадзор потребовал от Facebook предоставить информацию об утечке данных российских пользователей соцсети
- [Разработка веб-сайтов, Open source, Управление разработкой, Софт] Бесплатные сервисы для разработчиков — огромный список
- [Конференции, Здоровье, IT-компании] Microsoft в этом году проведет все свои конференции в онлайне
- [Облачные вычисления, Облачные сервисы, Будущее здесь, IT-компании] Зачем хоккею облака
- [IT-инфраструктура, IT-компании] Провайдеры продают медные кабели за миллиарды рублей
Теги для поиска: #_open_source, #_c++, #_github, #_zvuk (Звук), #_itkompanii (IT-компании), #_google, #_ishodnyj_kod (исходный код), #_kodek (кодек), #_lyra, #_open_source, #_c++, #_github, #_zvuk (
Звук
), #_itkompanii (
IT-компании
)
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Текущее время: 22-Ноя 10:11
Часовой пояс: UTC + 5
Автор | Сообщение |
---|---|
news_bot ®
Стаж: 6 лет 9 месяцев |
|
6 апреля 2021 года Google открыла исходный код кодека для сжатия голоса Lyra, позволяющего организовывать качественную голосовую связь при низком битрейте. Проект аудиокодека размещен на GitHub под лицензией Apache v2.0. Кодек написан на языке C++ с использованием фреймворка Bazel. Аудиокодек Lyra сжимает и передает речь на битрейте 3 Кбит/с на таком уровне качества, как это делает кодек Opus на 8 Кбит/с. Google использовала при разработке Lyra модели на базе системы машинного обучения для воссоздания речи на приемной стороне. С помощью использования рекуррентной генеративной модели Lyra генерирует параллельно несколько сигналов в разных частотных диапазонах, которые позже объединяются в один выходной сигнал с требуемой частотой дискретизации. Разработчики пояснили, что модель генерации речи Lyra обучалась на тысячах часов звуков на более чем 70 языках мира из различных открытых аудиобиблиотек. Также для ускорения работы кодека используются специальные процессорные инструкции, доступные в 64-битных мобильных процессорах ARM для кодирования и декодирования речи в реальном режиме времени на современных смартфонах. По информации OpenNET, в числе необходимых для работы кодека Lyra зависимостей присутствует проприетарная библиотека libsparse_inference.so с реализацией ядра для математических вычислений. Google пояснила, что это временное решение. Компания для ее замены уже разрабатывает свою открытую библиотеку, которая будет обеспечивать поддержку различных платформ. =========== Источник: habr.com =========== Похожие новости:
Звук ), #_itkompanii ( IT-компании ) |
|
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Текущее время: 22-Ноя 10:11
Часовой пояс: UTC + 5