[Искусственный интеллект, Голосовые интерфейсы] Google опубликовал пособие по Voice Playbook для разработчиков conversational AI
Автор
Сообщение
news_bot ®
Стаж: 6 лет 9 месяцев
Сообщений: 27286
Корпорация Google недавно выпустила интерактивную публикацию, которая демонстрирует процесс работы обычных пользователей с голосовыми технологиями. Это своеобразное пособие по голосовому UI еще и подсказывает различные идеи представителям отрасли. В основе материала от Google - идея разработки оптимальной голосовой технологии, которая позволит привлечь гораздо больше людей в онлайн в рамках стратегии Google Next Billion Users. Подробности о пособии по голосовым технологиям от Google — под катом. Voice Playbook - что это? Пособие или мануал - называйте, как хотите - охватывает большое количество разных тем. Здесь огромный объем фотографий, графиков, диаграмм, которые позволяют понять, как голосовые технологии используются сегодня.Сначала составители мануала определяют термин "голосовое взаимодействие". Это, по их словам, запись, команды, разговоры, диктовка. У каждого действия — собственная ветка, хотя элементы можно переставлять. По мере того, как голосовые технологии выходят на международный уровень, Google начинает рассматривать их как важный элемент подключения к онлайну людей, которые не используют сенсорный экран или клавиатуру по разным причинам. Возможно, это просто ограниченная грамотность, либо особенности национального алфавита. По данным компании, набор абзаца текста на хинди занимает в три раза больше времени, чем на английском. И голосовые технологии решают эту проблему.«Легко думать о возможности разговаривать по телефону как об удобстве, ведь это способ получения информации во время вождения или приготовления еды. Но для многих новых пользователей интернета голосовая связь не просто полезна - она критически важна», — рассказал в своем блоге представитель Google Next Billion Users Асиф Баки.
Особенности восприятия голосовых технологий По словам Google, к внедрению таких технологий нужно относиться с осторожностью. Если что-то пойдет не так — неопытные пользователи будут отказываться от них. Это относится как к тексту, так и к аудио. Кроме того, у ряда пользователей использование голоса для взаимодействия с электронным устройством вызывает беспокойство — просто потому, что находящийся рядом человек может услышать то, что предназначается исключительно собеседнику, а не посторонним.«Технологии могут создавать некоторые проблемы для пользователей голосовой связи, но, если они правильно разработаны и построены, они также могут помочь преодолеть сложности», — прокомментировал ситуацию Баки. «Опираясь на уроки, которые мы извлекли с помощью нашей собственной голосовой технологии, мы разработали набор принципов, которые помогут отрасли двигаться вперед, помогая разработчикам со всего мира задуматься о том, как развивать голосовую связь. Когда мы понимаем, как люди воспринимают голос, мы получаем возможность значительно повысить полезность и доступность технологий, которые они используют».В пособии также подаются идеи по преодолению проблем отрасли. Часть из них — социальная, поскольку поднимает вопрос адаптации голосовых технологий для новых пользователей. Другая часть — техническая, авторы пособия предлагают несколько способов оптимизации ИИ для того, чтобы повысить качество распознавания речи человека.В целом, корпорация будет добиваться того, чтобы миллионы новых пользователей не боялись использовать голосовые технологии, а, наоборот, быстро к ним адаптировались. "Мы с нетерпением ждем возможности помочь как можно большему количеству людей использовать свой голос и быть услышанными, в прямом и переносном смысле", — заявил представитель компании.
Подготовлено по материаламvoicebot.ai
===========
Источник:
habr.com
===========
Похожие новости:
- [Разработка мобильных приложений, Разработка игр, Дизайн игр] We need to go deeper: как пасхалка в приложении Delivery Club сократила субъективное время ожидания еды
- [Алгоритмы, Машинное обучение, Научно-популярное, Искусственный интеллект] DeepMind: обучения с подкреплением достаточно для достижения «настоящего» ИИ
- [Высокая производительность, Администрирование баз данных, Tarantool] Архитектура in-memory СУБД: 10 лет опыта в одной статье
- [Старое железо] Sony PictureBook: ультрапортатив начала тысячелетия
- [Программирование, Учебный процесс в IT] Рабочее место в кафе, улучшение фотографий и команды для хакатонов: выпускные работы наших студентов
- [Машинное обучение, Производство и разработка электроники, Научно-популярное, Искусственный интеллект] ИИ проектирует микросхемы быстрее и лучше людей
- [Python, Алгоритмы, Big Data, Машинное обучение, Искусственный интеллект] DataScience Digest — 10.06.21
- [Искусственный интеллект, Интернет вещей, Автомобильные гаджеты, Транспорт] Контроль сонливости водителя, кресла с учётом женской анатомии: что нового в автомобильных технологиях безопасности?
- [Информационная безопасность, Криптография, JavaScript, Node.JS, Криптовалюты] Поиск коллизий в SHA-256 на платформе Node.js при помощи Bitcoin Hasher
- [Интернет-маркетинг, Бизнес-модели, Социальные сети и сообщества, Транспорт, IT-компании] «Развод» компаний: Mail.ru Group заберёт себе фудтех и отдаст Сбербанку транспорт
Теги для поиска: #_iskusstvennyj_intellekt (Искусственный интеллект), #_golosovye_interfejsy (Голосовые интерфейсы), #_playbook, #_ai, #_google, #_voice, #_blog_kompanii_neuro.net (
Блог компании Neuro.net
), #_iskusstvennyj_intellekt (
Искусственный интеллект
), #_golosovye_interfejsy (
Голосовые интерфейсы
)
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Текущее время: 22-Ноя 10:30
Часовой пояс: UTC + 5
Автор | Сообщение |
---|---|
news_bot ®
Стаж: 6 лет 9 месяцев |
|
Корпорация Google недавно выпустила интерактивную публикацию, которая демонстрирует процесс работы обычных пользователей с голосовыми технологиями. Это своеобразное пособие по голосовому UI еще и подсказывает различные идеи представителям отрасли. В основе материала от Google - идея разработки оптимальной голосовой технологии, которая позволит привлечь гораздо больше людей в онлайн в рамках стратегии Google Next Billion Users. Подробности о пособии по голосовым технологиям от Google — под катом. Voice Playbook - что это? Пособие или мануал - называйте, как хотите - охватывает большое количество разных тем. Здесь огромный объем фотографий, графиков, диаграмм, которые позволяют понять, как голосовые технологии используются сегодня.Сначала составители мануала определяют термин "голосовое взаимодействие". Это, по их словам, запись, команды, разговоры, диктовка. У каждого действия — собственная ветка, хотя элементы можно переставлять. По мере того, как голосовые технологии выходят на международный уровень, Google начинает рассматривать их как важный элемент подключения к онлайну людей, которые не используют сенсорный экран или клавиатуру по разным причинам. Возможно, это просто ограниченная грамотность, либо особенности национального алфавита. По данным компании, набор абзаца текста на хинди занимает в три раза больше времени, чем на английском. И голосовые технологии решают эту проблему.«Легко думать о возможности разговаривать по телефону как об удобстве, ведь это способ получения информации во время вождения или приготовления еды. Но для многих новых пользователей интернета голосовая связь не просто полезна - она критически важна», — рассказал в своем блоге представитель Google Next Billion Users Асиф Баки. Особенности восприятия голосовых технологий По словам Google, к внедрению таких технологий нужно относиться с осторожностью. Если что-то пойдет не так — неопытные пользователи будут отказываться от них. Это относится как к тексту, так и к аудио. Кроме того, у ряда пользователей использование голоса для взаимодействия с электронным устройством вызывает беспокойство — просто потому, что находящийся рядом человек может услышать то, что предназначается исключительно собеседнику, а не посторонним.«Технологии могут создавать некоторые проблемы для пользователей голосовой связи, но, если они правильно разработаны и построены, они также могут помочь преодолеть сложности», — прокомментировал ситуацию Баки. «Опираясь на уроки, которые мы извлекли с помощью нашей собственной голосовой технологии, мы разработали набор принципов, которые помогут отрасли двигаться вперед, помогая разработчикам со всего мира задуматься о том, как развивать голосовую связь. Когда мы понимаем, как люди воспринимают голос, мы получаем возможность значительно повысить полезность и доступность технологий, которые они используют».В пособии также подаются идеи по преодолению проблем отрасли. Часть из них — социальная, поскольку поднимает вопрос адаптации голосовых технологий для новых пользователей. Другая часть — техническая, авторы пособия предлагают несколько способов оптимизации ИИ для того, чтобы повысить качество распознавания речи человека.В целом, корпорация будет добиваться того, чтобы миллионы новых пользователей не боялись использовать голосовые технологии, а, наоборот, быстро к ним адаптировались. "Мы с нетерпением ждем возможности помочь как можно большему количеству людей использовать свой голос и быть услышанными, в прямом и переносном смысле", — заявил представитель компании. Подготовлено по материаламvoicebot.ai =========== Источник: habr.com =========== Похожие новости:
Блог компании Neuro.net ), #_iskusstvennyj_intellekt ( Искусственный интеллект ), #_golosovye_interfejsy ( Голосовые интерфейсы ) |
|
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Текущее время: 22-Ноя 10:30
Часовой пояс: UTC + 5