Facial recognition video analytics is evolving. Trends

Системы видеоаналитики — это программное обеспечение на основе искусственного интеллекта, которое позволяет распознавать лица и другие объекты в видеопотоке и анализировать различные данные по ним. Глобальный рынок видеоаналитики сегодня оценивается в $ 5,9 млрд, а к 2026 году достигнет $ 14,9 млрд — такие прогнозы сделали в MarketsandMarkets [1].

Не только безопасность

Системы видеонаблюдения перестают быть только инструментом обеспечения безопасности. Новые сценарии использования предполагают встраивание технологий видеоаналитики в умный дом, умный завод, умный порт или умный город с комфортной средой для всех, включая людей с ограниченными возможностями.

Речь идет, например, о системах, способных распознать падение человека на улице и направить сигнал экстренным службам. Другой пример: городские камеры, которые могут собирать и анализировать дорожную обстановку.

Так благодаря видеоаналитике можно выяснить, что на определенном участке дороги переходом часто пользуются дети, и для безопасности там следует разместить «лежачего полицейского», дополнительные знаки или «островок безопасности». Для таких сценариев распознавать лица не нужно, достаточно детекции силуэта.

Алгоритмы переходят в продукты

На ранних этапах истории компьютерного зрения разработчики создавали алгоритмы видеоаналитики в академических условиях, на синтетических данных. Фактически — в вакууме, что было вполне оправданно — стояла задача разобраться, работает ли технология в принципе. Сегодня разработка намного теснее связана с практикой: компании сразу создают алгоритмы для задач из реальной жизни и выпускают на их основе продукты. Например, кассы самообслуживания с возможностью оплаты по лицу.

Такая продуктизация идет во всех направлениях — в биометрии, в распознавании автомобилей, в анализе медицинских изображений, таких как рентгеновские снимки. Даже в исследовательских институтах инженеры и аналитики сегодня стараются решать задачи на реальных данных и фокусируются на практическом применении.

Много алгоритмов в одном продукте

Первые алгоритмы видеоаналитики разрабатывались и использовались по отдельности. Системы по распознаванию лиц, автомобилей, реагирования на ситуации, работали каждая сама по себе. Сейчас в интересах потребителей компании несколько алгоритмов объединяют в комплексный продукт и связывают аналитики между собой. Синергетический эффект в таких случаях открывает новые, недоступные ранее возможности применения.

Современные программные продукты охватывают распознавание лиц, силуэтов, машин и других объектов (а в будущем к этому добавится ещё и распознаваний действий). Работа со всеми типами объектов осуществляется в одном интерфейсе, а разные типы объектов распознаются на одних и тех же камерах.

Оптимизация вычислительных ресурсов

Среди алгоритмов видеоаналитики есть немало таких, которые корректно и стабильно работают, но требуют слишком много вычислительных ресурсов. Это устраивает не всех заказчиков, и на сегодняшнем этапе развития технологии встает вопрос оптимизации. Оборудование для крупных проектов требует значительных вложений, поэтому разработчики оптимизируют алгоритмы для достаточно быстрой работы на среднем «железе». Для заказчиков — это возможность сэкономить миллионы рублей. Чем менее требовательны алгоритмы к вычислительным ресурсам, тем больше клиентов сможет позволить себе это решение.

Растут и требования к удобству новых решений. Уже не нужно долго настраивать систему: достаточно купить продукт, нажат несколько кнопок, и все заработает.

Предсказание агрессии — миф

Хотя крупные мегаполисы в целом становятся всё более безопасными для жизни, будь то Нью-Йорк [2] или Москва [3], 2021-й год запомнится рядом громких случаев насилия с применением оружия, как на улицах крупных городов, так и в стенах учебных заведений по всему миру. В результате атаки стрелков на школу в Казани и университет в Перми погибли и пострадали десятки человек. Это привело к значительному росту интереса к системам по распознаванию оружия и агрессивного поведения, а также предсказанию агрессии.

Распознавать оружие и опасные действия, такие как драки и падение человека на улице, можно уже сегодня. И мы ожидаем, что эти системы заработают в реальных условиях уже в следующем году с точностью, достаточной, чтобы отвечать поставленным задачам.

Однако предсказать агрессию, по крайней мере по анализу видео, искусственный интеллект пока не может. Хотя такие предиктивные разработки существуют, они не применимы в жизни из-за большого количества ложных срабатываний.

ИСТОЧНИКИ:

1) www.marketsandmarkets.com/Market-Reports/intelligent-video-analytics-market-778.html
2) www.nytimes.com/2021/03/16/upshot/murder-rate-usa.html
3) www.tass.ru/obschestvo/8984151