Компьютерное зрение

Что такое компьютерное зрение

Компьютерное зрение (англ. computer vision, CV) — это область искусственного интеллекта. Способность «видеть» у компьютера появилась благодаря глубокому обучению (англ. deep learning) — разновидности машинного обучения, которое использует для решения задач нейронные сети.

Задача специалистов в области компьютерного зрения — научить компьютер воспринимать изображения как человек.

Все приложения и устройства, использующие компьютерное зрение, должны иметь камеры, радары или лидары (измеряют расстояние с помощью лазера), а также специализированное программное обеспечение.

Любое компьютерное зрение создаётся с помощью технологий машинного обучения — сначала собирается огромное количество данных, потом искусственный интеллект анализирует, выделяет признаки и их комбинации для дальнейшей идентификации других объектов.

Таким образом, компьютерное зрение — это не совсем подобие человеческого интеллекта и зрения. Это сложный комплекс устройств и программных алгоритмов, анализирующих информацию на основе имеющейся.

Применение компьютерного зрения

Безопасность.

Кроме Face ID компьютерное зрение используют для распознавания лиц в банках и метро, оплатах с помощью биометрии. Сейчас модели компьютерного зрения научились делать это даже несмотря на маску на лице человека. Камеры видеонаблюдения на дорогах — тоже результат работы компьютерного зрения.

Промышленность.

При постройке зданий компьютерное зрение может определять дефекты металла, незаметные человеческому глазу. Изображение подаётся в нейросеть, чтобы узнать процент дефекта материалов с большей точностью, чем смог бы определить специалист.

Медицина.

Компьютерное зрение помогает с классификацией: сканирует раковые опухоли и определяет их злокачественность. С этой задачей обученные нейросети справляются очень хорошо.

Распознавание текста.

Модель компьютерного зрения может извлечь текст из изображения или прочитать документ и резюмировать то, что в нём написано. Специалисты экономят время, читать многостраничную документацию не придётся.

Главные тренды в компьютерном зрении

Во многих областях от космических исследований до промышленности  компьютерное зрение участвует в экспериментальных разработках. Вот некоторые из них:

  • Беспилотные автомобили

Нейросети учатся детектировать объекты и ситуацию на дороге каждую секунду и выдавать верное решение: тормозить, разгоняться, поворачивать налево или направо. Маленькие роботы-курьеры путешествуют из точки А в точку Б и не врезаются в прохожих, используя компьютерное зрение.

  • Роботы

Внутри некоторых роботов, в том числе и роботов-курьеров, тоже «сидят» алгоритмы, которые обучаются не на базе данных, а на ходу. Компьютерное зрение изучает полученное изображение, а дальше дело за deep reinforcement learning — обучением с подкреплением, которое работает благодаря нейросетям. Они учатся, взаимодействуя с окружением, а не на основе датасета.

  • Космические исследования

Учёные используют нейросети, чтобы определять стадии звездообразования в галактиках благодаря изображениям из космоса.

  • Распознавание эмоций

Например, «умные очки» Google Glass помогают нейроотличным людям распознавать эмоции окружающих, показывают подсказки.

  • Обработка аудиосигналов

Когда управляемый голосом человека умный дом получает команду включить свет, компьютер может оцифровать аудиозапись и преобразовать её в спектрограмму — те самые волны, которые можно увидеть на аудиозаписи. Анализ спектрограммы с помощью компьютерного зрения даёт даже более точные результаты при исполнении задач, чем анализ аудио.