[Машинное обучение, Обработка изображений] Computer Vision. Подсчет клиентопотока
Автор
Сообщение
news_bot ®
Стаж: 6 лет 9 месяцев
Сообщений: 27286
Стояла задача проанализировать и подсчитать поток клиентов в офисе. Для похожих задач существует множество решений, как с использованием сверточных нейронных сетей (Convolution Neural Network, CNN), таких как YOLO (You Only Look Once), SSD (Single Shot Detection), R-CNN и т.д. Но так как входными данными были видео фрагменты различного разрешения и формата, в зависимости от модели регистраторов и выставленных настроек, было принято решение попробовать метод Background Subtraction. Так же хотелось попробовать данный алгоритм, потому что до этого не сталкивался с ним и было интересно на что он способен.
Данный метод основывается на фоне, как видно из названия. Основой является сравнение следующего кадра с предыдущими на наличие изменений. То есть если фон не менялся или не сильные изменения (колыхание листва, движение облаков и т.д.), то данный метод, не выделит данные области на кадре и видео. Так же существует огромное количество внутренних алгоритмов, на которые основывается Background subtraction, которые по-разному определяют изменения. Некоторые алгоритмы, очень чувствительные к изменениям, то есть небольшой дождь, не сильные изменения крон деревьев из-за ветра, все эти объекты будут заметны на маске алгоритма. Другие алгоритмы строят маски очень грубо, объединяя множество пикселей в одни объекты, то есть два рядом движущихся человека, будут определятся как один человек, поэтому важно подобрать нужный алгоритм для вашей задачи и попробовать различные настройки (количество кадров для сравнения, граница для отсекания областей и т.д.)
Так же существуют различные настройки внутри алгоритма, которые позволяют улучшить качество, и конечная маска выглядит намного лучше, для определения объектов.
После дополнительных настроек и написания дополнительного кода, для выделения изменяемых областей и дальнейшего подсчета клиентопотока, получилось добиться хорошего результата в плане подсчета количества людей, так же это был первый опыт работы с методами библиотеки CV2 python, без использования нейронных сетей.
К сожалению данный метод имеет свои недостатки, это выделение некоторых артефактов, плюс имеет ограниченный функционал и узкую сферу использования, но как опыт и знакомство с возможностями Computer Vision отличная возможность.
Предлагаю воспользоваться моим опытом по использованию открытых инструментов и сервисов, позволяющих решать задачи компьютерного зрения.
===========
Источник:
habr.com
===========
Похожие новости:
- [Искусственный интеллект, Машинное обучение] Deep Learning: как это работает? Часть 3 — архитектуры CNN
- [DevOps, Python, Анализ и проектирование систем, Искусственный интеллект, Машинное обучение] Общий обзор архитектуры сервиса для оценки внешности на основе нейронных сетей
- [Искусственный интеллект, Машинное обучение] Как видит компьютер
- [Open source, Облачные сервисы, Обработка изображений, Учебный процесс в IT] 10 open source альтернатив Google Photos (перевод)
- [Data Mining, Машинное обучение, Исследования и прогнозы в IT] Портрет российского специалиста Data Science от MADE и hh.ru
- [Машинное обучение] Предварительная обработка данных
- [Обработка изображений, Разработка веб-сайтов] Как мы решили оптимизировать картинки — а в процессе переделали сайт, админку и подход к интерфейсу
- [Big Data, Data Engineering, Карьера в IT-индустрии, Машинное обучение] Дата-инженеры в бизнесе: кто они и чем занимаются?
- [Машинное обучение, Программирование, Учебный процесс в IT] Data Science, ИИ и машинное обучение без программирования (перевод)
- [Natural Language Processing, Искусственный интеллект, Машинное обучение] Искусственный интеллект в области юриспруденции. Статья 2
Теги для поиска: #_mashinnoe_obuchenie (Машинное обучение), #_obrabotka_izobrazhenij (Обработка изображений), #_computer_vision, #_obrabotka_izobrazhenij (обработка изображений), #_mashinnoe_obuchenie (
Машинное обучение
), #_obrabotka_izobrazhenij (
Обработка изображений
)
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Текущее время: 23-Ноя 01:11
Часовой пояс: UTC + 5
Автор | Сообщение |
---|---|
news_bot ®
Стаж: 6 лет 9 месяцев |
|
Стояла задача проанализировать и подсчитать поток клиентов в офисе. Для похожих задач существует множество решений, как с использованием сверточных нейронных сетей (Convolution Neural Network, CNN), таких как YOLO (You Only Look Once), SSD (Single Shot Detection), R-CNN и т.д. Но так как входными данными были видео фрагменты различного разрешения и формата, в зависимости от модели регистраторов и выставленных настроек, было принято решение попробовать метод Background Subtraction. Так же хотелось попробовать данный алгоритм, потому что до этого не сталкивался с ним и было интересно на что он способен. Данный метод основывается на фоне, как видно из названия. Основой является сравнение следующего кадра с предыдущими на наличие изменений. То есть если фон не менялся или не сильные изменения (колыхание листва, движение облаков и т.д.), то данный метод, не выделит данные области на кадре и видео. Так же существует огромное количество внутренних алгоритмов, на которые основывается Background subtraction, которые по-разному определяют изменения. Некоторые алгоритмы, очень чувствительные к изменениям, то есть небольшой дождь, не сильные изменения крон деревьев из-за ветра, все эти объекты будут заметны на маске алгоритма. Другие алгоритмы строят маски очень грубо, объединяя множество пикселей в одни объекты, то есть два рядом движущихся человека, будут определятся как один человек, поэтому важно подобрать нужный алгоритм для вашей задачи и попробовать различные настройки (количество кадров для сравнения, граница для отсекания областей и т.д.) Так же существуют различные настройки внутри алгоритма, которые позволяют улучшить качество, и конечная маска выглядит намного лучше, для определения объектов. После дополнительных настроек и написания дополнительного кода, для выделения изменяемых областей и дальнейшего подсчета клиентопотока, получилось добиться хорошего результата в плане подсчета количества людей, так же это был первый опыт работы с методами библиотеки CV2 python, без использования нейронных сетей. К сожалению данный метод имеет свои недостатки, это выделение некоторых артефактов, плюс имеет ограниченный функционал и узкую сферу использования, но как опыт и знакомство с возможностями Computer Vision отличная возможность. Предлагаю воспользоваться моим опытом по использованию открытых инструментов и сервисов, позволяющих решать задачи компьютерного зрения. =========== Источник: habr.com =========== Похожие новости:
Машинное обучение ), #_obrabotka_izobrazhenij ( Обработка изображений ) |
|
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Текущее время: 23-Ноя 01:11
Часовой пояс: UTC + 5