Обновление открытого аудиокодека Lyra 1.3
Автор
Сообщение
news_bot ®
Стаж: 6 лет 11 месяцев
Сообщений: 27286
Компания Google опубликовала выпуск аудиокодека Lyra 1.3, нацеленного достижение высокого качества передачи голоса в условиях ограниченного объёма передаваемой информации. Качество речи на битрейтах 3.2 kbps, 6 kbps и 9.2 kbps при использовании кодека Lyra примерно соответствует битрейтам 10 kbps, 13 kbps и 14 kbps при использовании кодека Opus. Для решения поставленной задачи помимо обычных методов сжатия звука и преобразования сигналов, в Lyra применяется речевая модель на базе системы машинного обучения, позволяющая воссоздать недостающую информацию на основе типовых характеристик речи. Эталонная реализация кода написана на C++ и распространяется под лицензией Apache 2.0.
В отличие от предложенного в октябре кардинально переработанного выпуска Lyra 1.2, переведённого на новую архитектуру нейронной сети, в версии 1.3 проведена оптимизация модели машинного обучения без архитектурных изменений. В новой версии для хранения весов и выполнения арифметических операций вместо 32-разрядных чисел с плавающей запятой задействованы 8-разрядные целые числа, что привело к сокращению размера модели на 43% и ускорению работы с моделью на 20% при тестировании на смартфоне Pixel 6 Pro. Качество речи при этом удалось сохранить на том же уровне, но формат передаваемых данных изменился и не совместим с прошлыми выпусками.
===========
Источник:
OpenNet.RU
===========
Похожие новости
- Главная ссылка к новости (https://github.com/google/lyra...)
- OpenNews: Google опубликовал открытый аудиокодек Lyra V2
- OpenNews: Компания Google открыла недостающие исходные тексты для аудиокодека Lyra
- OpenNews: Опубликован свободный звуковой кодек FLAC 1.4
- OpenNews: Предпринята попытка создания патентного пула для свободного звукового кодека Opus
- OpenNews: Facebook опубликовал звуковой кодек EnCodec, использующий машинное обучение
Похожие новости:
- Опубликован свободный звуковой кодек FLAC 1.4
- Выпуск звукового сервера PulseAudio 16.0
- Доступен мультимедийный фреймворк GStreamer 1.20.0
- Новая версия музыкального проигрывателя DeaDBeeF 1.8.8
- Выпуск мультимедийного сервера PipeWire 0.3.33
- Выпуск звукового сервера PulseAudio 15.0
- [Настройка Linux, Звук] Заметка: Контроль звуковых выходов для программ
- Компания Google открыла недостающие исходные тексты для аудиокодека Lyra
- [JavaScript, API, Стандарты связи] Консорциум Всемирной паутины принял стандарт Web Audio в качестве официального
- W3C стандартизировал API Web Audio
Теги для поиска: #_lyra, #_audio
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Текущее время: 04-Фев 00:07
Часовой пояс: UTC + 5
Автор | Сообщение |
---|---|
news_bot ®
Стаж: 6 лет 11 месяцев |
|
Компания Google опубликовала выпуск аудиокодека Lyra 1.3, нацеленного достижение высокого качества передачи голоса в условиях ограниченного объёма передаваемой информации. Качество речи на битрейтах 3.2 kbps, 6 kbps и 9.2 kbps при использовании кодека Lyra примерно соответствует битрейтам 10 kbps, 13 kbps и 14 kbps при использовании кодека Opus. Для решения поставленной задачи помимо обычных методов сжатия звука и преобразования сигналов, в Lyra применяется речевая модель на базе системы машинного обучения, позволяющая воссоздать недостающую информацию на основе типовых характеристик речи. Эталонная реализация кода написана на C++ и распространяется под лицензией Apache 2.0. В отличие от предложенного в октябре кардинально переработанного выпуска Lyra 1.2, переведённого на новую архитектуру нейронной сети, в версии 1.3 проведена оптимизация модели машинного обучения без архитектурных изменений. В новой версии для хранения весов и выполнения арифметических операций вместо 32-разрядных чисел с плавающей запятой задействованы 8-разрядные целые числа, что привело к сокращению размера модели на 43% и ускорению работы с моделью на 20% при тестировании на смартфоне Pixel 6 Pro. Качество речи при этом удалось сохранить на том же уровне, но формат передаваемых данных изменился и не совместим с прошлыми выпусками. =========== Источник: OpenNet.RU =========== Похожие новости
|
|
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Текущее время: 04-Фев 00:07
Часовой пояс: UTC + 5