[Искусственный интеллект, Машинное обучение, Обработка изображений, Работа с видео] Disney разрабатывает систему распознавания лиц для анимации
Автор
Сообщение
news_bot ®
Стаж: 6 лет 9 месяцев
Сообщений: 27286
Команда исследователей Disney из Direct-to-Consumer&International Organization (DTCI) создала платформу машинного обучения, чтобы помочь автоматизировать цифровое архивирование мультипликации. Архив студии включает почти столетнюю историю анимации, и для поиска определенных персонажей, сцен или объектов нужно выполнить большую работу. Новая система поможет изменить способы поиска и обнаружения потокового контента.
Платформа CG (Content Genome, Геном контента) создана для наполнения графов знаний метаданными контента. Она работает примерно так же, как поиск Google, если, к примеру, нужно найти информацию о Стиве Джобсе.
Приложения на ИИ смогут использовать эти данные для улучшения функций поиска, обнаружения и персонализации. Они будут помогать аниматорам находить конкретные кадры в архиве Disney.
Проект стартовал в 2016 году после нескольких лет исследований. Группа создала то, что она описывает как «первый конвейер автоматической маркировки».
«Маркировка контента является важным компонентом использования контролируемого обучения в DTCI», — отмечают разработчики.
Конвейер использовал существующее программное обеспечение для распознавания лиц, которое команда DTCI затем применила к своему каталогу фильмов и телешоу. Модуль смог успешно обнаруживать и распознавать человеческие лица по экранным действиям. Затем команда смогла также обучить систему определять конкретные места. Но распознать лицо человека по видео в реальном времени — это совсем не то, что научить ИИ определять анимированные лица. «Нам нужно было что-то, что может выучить абстрактную концепцию «лица», и с традиционным машинным обучением добиться этого было бы очень сложно. Благодаря глубокому обучению мы смогли этого достичь», — говорит команда.
Исследователи пытались применить модель распознавания лиц в реальном времени к анимированному контенту. Оказывается, что методы машинного обучения, такие как HOG + SVM, хорошо работают при выборе изменений цвета, яркости и текстуры, но они смогли выделить анимированные лица, только если они были прорисованы в человеческих пропорциях. После этого исследователи обратились к методам глубокого обучения.
Тут они столкнулись с новой проблемой, которая заключалась в том, что наборы данных для глубокого обучения носят массивный характер. Поэтому команда использовала необходимые ей образцы для точной настройки архитектуры обнаружения объектов Faster RCNN, которая уже была обучена обнаружению анимированных лиц с использованием другого набора данных, отличного от Disney. По сути, команда взяла за основу уже обученную архитектуру и адаптировала ее к своему контенту.
После незначительной корректировки набора данных исследователи объединили свой анимированный детектор распознавания лиц с другими алгоритмами, такими как трекеры ограничивающего прямоугольника, чтобы сократить время обработки и повысить эффективность.
Процесс маркировки не полностью автоматизирован, люди могут контролировать результаты, полученные системой, в зависимости от того, как эти данные используются.
Эта технология может оказаться полезной и для потребителей. Механизмы рекомендаций и обнаружения могут сделать поиск конкретного эпизода или персонажа более точным и эффективным.
===========
Источник:
habr.com
===========
Похожие новости:
- [Python, Голосовые интерфейсы, Искусственный интеллект] Голосовой бот + телефония на полном OpenSource. Часть 1 — создание и обучение текстового бота RU
- [ERP-системы, Машинное обучение, Финансы в IT] Новое в SAP PaPM: интерфейс, построение прогнозов с помощью ML и scale out
- [Kubernetes, Информационная безопасность, Конференции, Машинное обучение] 23 июля приглашаем на онлайн-митап Hot Backend
- [Искусственный интеллект, Машинное обучение] GPT-3 от OpenAI может стать величайшей вещью со времён Bitcoin (перевод)
- [Машинное обучение] Как быстро и просто ускорить доступ к API приложениям?
- [Высокая производительность, Работа с видео] Мощь можества ядер для укрощения кодека AV1
- [Звук, Искусственный интеллект, Алгоритмы] Нейросеть DeepSinger генерирует голос, который поёт на китайском и английском
- [Носимая электроника, Производство и разработка электроники, Работа с видео] Blackmagic представила камеру, которая снимает 12K-видео при 60 кадрах/с
- [Машинное обучение, Облачные сервисы, Промышленное программирование] Промышленный Machine Learning: 10 принципов разработки
- [Python, Алгоритмы, Машинное обучение, Обработка изображений] Код аудита: поиск дублей, face detection и аномальные изображения
Теги для поиска: #_iskusstvennyj_intellekt (Искусственный интеллект), #_mashinnoe_obuchenie (Машинное обучение), #_obrabotka_izobrazhenij (Обработка изображений), #_rabota_s_video (Работа с видео), #_disney, #_mashinnoe_obuchenie (машинное обучение), #_iskusstvennyj_intellekt (искусственный интеллект), #_multiplikatsija (мультипликация), #_animatsija (анимация), #_raspoznavanie_lits (распознавание лиц), #_iskusstvennyj_intellekt (
Искусственный интеллект
), #_mashinnoe_obuchenie (
Машинное обучение
), #_obrabotka_izobrazhenij (
Обработка изображений
), #_rabota_s_video (
Работа с видео
)
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Текущее время: 22-Ноя 19:06
Часовой пояс: UTC + 5
Автор | Сообщение |
---|---|
news_bot ®
Стаж: 6 лет 9 месяцев |
|
Команда исследователей Disney из Direct-to-Consumer&International Organization (DTCI) создала платформу машинного обучения, чтобы помочь автоматизировать цифровое архивирование мультипликации. Архив студии включает почти столетнюю историю анимации, и для поиска определенных персонажей, сцен или объектов нужно выполнить большую работу. Новая система поможет изменить способы поиска и обнаружения потокового контента. Платформа CG (Content Genome, Геном контента) создана для наполнения графов знаний метаданными контента. Она работает примерно так же, как поиск Google, если, к примеру, нужно найти информацию о Стиве Джобсе. Приложения на ИИ смогут использовать эти данные для улучшения функций поиска, обнаружения и персонализации. Они будут помогать аниматорам находить конкретные кадры в архиве Disney. Проект стартовал в 2016 году после нескольких лет исследований. Группа создала то, что она описывает как «первый конвейер автоматической маркировки». «Маркировка контента является важным компонентом использования контролируемого обучения в DTCI», — отмечают разработчики. Конвейер использовал существующее программное обеспечение для распознавания лиц, которое команда DTCI затем применила к своему каталогу фильмов и телешоу. Модуль смог успешно обнаруживать и распознавать человеческие лица по экранным действиям. Затем команда смогла также обучить систему определять конкретные места. Но распознать лицо человека по видео в реальном времени — это совсем не то, что научить ИИ определять анимированные лица. «Нам нужно было что-то, что может выучить абстрактную концепцию «лица», и с традиционным машинным обучением добиться этого было бы очень сложно. Благодаря глубокому обучению мы смогли этого достичь», — говорит команда. Исследователи пытались применить модель распознавания лиц в реальном времени к анимированному контенту. Оказывается, что методы машинного обучения, такие как HOG + SVM, хорошо работают при выборе изменений цвета, яркости и текстуры, но они смогли выделить анимированные лица, только если они были прорисованы в человеческих пропорциях. После этого исследователи обратились к методам глубокого обучения. Тут они столкнулись с новой проблемой, которая заключалась в том, что наборы данных для глубокого обучения носят массивный характер. Поэтому команда использовала необходимые ей образцы для точной настройки архитектуры обнаружения объектов Faster RCNN, которая уже была обучена обнаружению анимированных лиц с использованием другого набора данных, отличного от Disney. По сути, команда взяла за основу уже обученную архитектуру и адаптировала ее к своему контенту. После незначительной корректировки набора данных исследователи объединили свой анимированный детектор распознавания лиц с другими алгоритмами, такими как трекеры ограничивающего прямоугольника, чтобы сократить время обработки и повысить эффективность. Процесс маркировки не полностью автоматизирован, люди могут контролировать результаты, полученные системой, в зависимости от того, как эти данные используются. Эта технология может оказаться полезной и для потребителей. Механизмы рекомендаций и обнаружения могут сделать поиск конкретного эпизода или персонажа более точным и эффективным. =========== Источник: habr.com =========== Похожие новости:
Искусственный интеллект ), #_mashinnoe_obuchenie ( Машинное обучение ), #_obrabotka_izobrazhenij ( Обработка изображений ), #_rabota_s_video ( Работа с видео ) |
|
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Текущее время: 22-Ноя 19:06
Часовой пояс: UTC + 5