05.02.2019 admin

6 сценариев применения компьютерного зрения

Human eye viewing data on virtual screen — Biometrics concept

Что такое компьютерное зрение?

Как часть искусственного интеллекта, компьютерное зрение позволяет извлекать информацию из визуальных данных, таких как фотографии и видео. Только благодаря достижениям в области глубокого обучения были достигнуты впечатляющие результаты с точки зрения точности и скорости распознавания изображений. Типичные задачи компьютерного зрения можно разделить на следующие отдельные области:

1. Обнаружение объекта.

Один или несколько объектов распознаются на изображении и помечаются рамкой («Ограничивающая рамка»). Еще один вариант маркировки объектов – это так называемая сегментация объектов, при которой объект окрашивается (почти) точно в пиксель.

2. Классификация объектов.

Классификация объектов – это распределение объектов по категориям, таким как «самолет», «грузовик» или «автомобиль», например, для маркировки отдельных изображений или видеопоследовательностей.

3. Анализ движения.

Анализ движения объектов в видеопоследовательности распознает направление движения объекта или конкретные действия человека.

Сценарии применения компьютерного зрения

1. Обследование мостов и высотных зданий.

Предыдущие методы проверки мостов или высоких зданий, требуют много времени и средств. Летающие дроны могут летать вокруг объекта, создавая изображения поверхностей объекта с высоким разрешением, которые можно анализировать на предмет аномалий или повреждений с помощью компьютерного зрения. При необходимости результаты можно сравнить с данными предыдущих проверок.

2. Обеспечение качества в производстве печатных плат.

Проблема при проверке печатных плат заключается в разнообразных возможных поверхностных дефектах, таких как отсутствующие или неправильно расположенные компоненты, разомкнутые цепи, короткие замыкания и чрезмерный или недостаточный припой. По сравнению с традиционными методами промышленной обработки изображений система контроля, основанная на алгоритмах глубокого обучения, может анализировать сложные изображения в режиме реального времени и с большей точностью. Кроме того, можно выполнить автоматическую классификацию ошибок и добавить новые типы ошибок.

3. Обнаружение инородного тела в производстве продуктов питания.

Производители продуктов питания должны отзывать продукты, если они небезопасны. В большинстве случаев это микробиологические загрязнители и инородные тела. Наиболее часто поражаются мясо и мясные продукты, за которыми следуют молоко и молочные продукты. Благодаря сочетанию технологии гиперспектральной камеры и алгоритмов глубокого обучения, после обучения соответствующих моделей, можно распознавать как материалы, так и химические составы. Это означает, что по сравнению с используемыми в настоящее время рентгеновскими аппаратами можно идентифицировать не только металлические детали, но также стекло, пластиковые фрагменты и бумажные отходы. Алгоритмы глубокого обучения также способны комбинировать пиксели со схожими спектральными профилями, например, для обнаружения того, что инородные тела находятся под поверхностью слоя сахара.

4. Интеллектуальный мониторинг трафика.

Камеры дорожного движения уже давно используются для мониторинга дорожного движения, а также для городского планирования, например, для подсчета количества участников дорожного движения на транспортных развязках. При использовании традиционных методов обработки изображений, таких как контрастные фильтры и алгоритмы распознавания контуров объектов, изменения в условиях освещения и погодных условиях являются главной проблемой для точности распознавания объектов. Алгоритмы на основе ИИ, такие как Mask R-CNN, не только обеспечивают высокоскоростное и точное распознавание объектов, но также улучшают качество захваченных данных. Кроме того, может быть реализована категоризация в различных классах транспортных средств, таких как автомобили, грузовики, мотоциклы и т. д., с соответствующей подготовкой алгоритма глубокого обучения.

5. Распознавание транспортных средств для маркетингового анализа.

С помощью глубокого изучения могут быть распознаны не только классы транспортных средств, но и более детальная демография транспортного средства (год выпуска, марка и модель), которые могут быть определены путем углубленной подготовки алгоритмов ИИ. Рекламодатели могут затем использовать эти данные для размещения, например, контекстной рекламы на щитах на основе сегментов транспортных средств в конкретных городских районах.

6. Автоматизированный мониторинг парковки.

Около 30% всего городского движения обусловлено поиском места для парковки. Интересным умным городским приложением является мониторинг больших парковочных площадок или даже отдельных улиц с точки зрения их загруженности припаркованными транспортными средствами. В то же время веб-камеры, установленные на зданиях, обеспечивают изображения в режиме реального времени, на которых алгоритм на основе ИИ распознает свободные и занятые парковочные места. В видео вы можете увидеть четкие изменения в условиях освещения, такие как тени от деревьев и зданий. Поскольку используются классические методы распознавания изображений с контрастными фильтрами и т. д., такие изменения контраста всегда являются большой проблемой, но не для алгоритмов глубокого обучения.