Компания Google открыла недостающие исходные тексты для аудиокодека Lyra
Автор
Сообщение
news_bot ®
Стаж: 6 лет 9 месяцев
Сообщений: 27286
Компания Google опубликовала обновление аудиокодека Lyra 0.0.2, оптимизированного для достижения максимального качества передачи речи при использовании очень медленных каналов связи. Кодек был открыт в начале апреля, но поставлялся в привязке к проприетарной математической библиотеке. В версии 0.0.2 данный недостаток устранён и для указанной библиотеки создана открытая замена - sparse_matmul, которая как и сам кодек распространяется под лицензией Apache 2.0. Из других улучшений можно отметить возможность использования сборочной системы Bazel с комплиятором GCC и использование данной связки по умолчанию в Linux вместо Bazel+Clang.
Напомним, что по качеству передаваемых голосовых данных на низких скоростях Lyra существенно превосходит традиционные кодеки, в которых используются методы цифровой обработки сигналов. Для достижения высокого качества передачи голоса в условиях ограниченного объёма передаваемой информации, помимо обычных методов сжатия звука и преобразования сигналов, в Lyra применяется речевая модель на базе системы машинного обучения, позволяющая воссоздать недостающую информацию на основе типовых характеристик речи. Задействованная для генерации звука модель обучена с использованием нескольких тысячах часов с записями голосов на более чем 70 языках. Производительности предложенной реализации достаточно для кодирования и декодирования речи в режиме реального времени на смартфонах среднего ценового диапазона, с задержкой передачи сигнала на уровне 90 миллисекунд.
===========
Источник:
OpenNet.RU
===========
Похожие новости
- Главная ссылка к новости (https://github.com/google/lyra...)
- OpenNews: Google опубликовал аудиокодек Lyra для передачи речи при плохом качестве связи
- OpenNews: Sisvel формирует патентный пул для сбора отчислений за использование кодеков AV1 и VP9
- OpenNews: Доступен аудиокодек Opus 1.3
- OpenNews: Увидел свет первый выпуск открытого видеокодека нового поколения AV1
- OpenNews: Обновление свободного звукового кодека FLAC 1.3.2
Похожие новости:
- Выпуск Mixxx 2.3, свободного пакета для создания музыкальных миксов
- [Облачные сервисы, Звук] Музыка, которую мало кто слышал, или успели забыть
- Внедрение вредоносного кода в скрипт Codecov привело к компрометации PGP-ключа HashiCorp
- [Информационная безопасность] Security Week 16: атака на цепочку поставок в компании Codecov
- [Open source, C++, GitHub, Звук, IT-компании] Google открыла исходный код кодека для сжатия голоса Lyra
- Google опубликовал аудиокодек Lyra для передачи речи при плохом качестве связи
- Выпуск звукового редактора Audacity 3.0
- [Сжатие данных, Машинное обучение, Звук] Машинные технологии в звуке. Новый аудиокодек сжимает речь в 3 Кбит/с
- [Спортивное программирование, Программирование, Разработка игр, Искусственный интеллект] Устройство игрового бота: 16-е место в финале Russian AI Cup 2020 (и 5-е после)
- [Социальные сети и сообщества] «Ближе к людям»: чем SoundCloud планирует заинтересовать музыкантов и аудиторию слушателей
Теги для поиска: #_lyra, #_sound, #_codec
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Текущее время: 23-Ноя 23:15
Часовой пояс: UTC + 5
Автор | Сообщение |
---|---|
news_bot ®
Стаж: 6 лет 9 месяцев |
|
Компания Google опубликовала обновление аудиокодека Lyra 0.0.2, оптимизированного для достижения максимального качества передачи речи при использовании очень медленных каналов связи. Кодек был открыт в начале апреля, но поставлялся в привязке к проприетарной математической библиотеке. В версии 0.0.2 данный недостаток устранён и для указанной библиотеки создана открытая замена - sparse_matmul, которая как и сам кодек распространяется под лицензией Apache 2.0. Из других улучшений можно отметить возможность использования сборочной системы Bazel с комплиятором GCC и использование данной связки по умолчанию в Linux вместо Bazel+Clang. Напомним, что по качеству передаваемых голосовых данных на низких скоростях Lyra существенно превосходит традиционные кодеки, в которых используются методы цифровой обработки сигналов. Для достижения высокого качества передачи голоса в условиях ограниченного объёма передаваемой информации, помимо обычных методов сжатия звука и преобразования сигналов, в Lyra применяется речевая модель на базе системы машинного обучения, позволяющая воссоздать недостающую информацию на основе типовых характеристик речи. Задействованная для генерации звука модель обучена с использованием нескольких тысячах часов с записями голосов на более чем 70 языках. Производительности предложенной реализации достаточно для кодирования и декодирования речи в режиме реального времени на смартфонах среднего ценового диапазона, с задержкой передачи сигнала на уровне 90 миллисекунд. =========== Источник: OpenNet.RU =========== Похожие новости
|
|
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Текущее время: 23-Ноя 23:15
Часовой пояс: UTC + 5