Что такое компьютерное зрение
Компьютерное зрение (англ. computer vision, CV) — это область искусственного интеллекта. Способность «видеть» у компьютера появилась благодаря глубокому обучению (англ. deep learning) — разновидности машинного обучения, которое использует для решения задач нейронные сети.
Задача специалистов в области компьютерного зрения — научить компьютер воспринимать изображения как человек.
Все приложения и устройства, использующие компьютерное зрение, должны иметь камеры, радары или лидары (измеряют расстояние с помощью лазера), а также специализированное программное обеспечение.
Любое компьютерное зрение создаётся с помощью технологий машинного обучения — сначала собирается огромное количество данных, потом искусственный интеллект анализирует, выделяет признаки и их комбинации для дальнейшей идентификации других объектов.
Таким образом, компьютерное зрение — это не совсем подобие человеческого интеллекта и зрения. Это сложный комплекс устройств и программных алгоритмов, анализирующих информацию на основе имеющейся.
Применение компьютерного зрения
Безопасность.
Кроме Face ID компьютерное зрение используют для распознавания лиц в банках и метро, оплатах с помощью биометрии. Сейчас модели компьютерного зрения научились делать это даже несмотря на маску на лице человека. Камеры видеонаблюдения на дорогах — тоже результат работы компьютерного зрения.
Промышленность.
При постройке зданий компьютерное зрение может определять дефекты металла, незаметные человеческому глазу. Изображение подаётся в нейросеть, чтобы узнать процент дефекта материалов с большей точностью, чем смог бы определить специалист.
Медицина.
Компьютерное зрение помогает с классификацией: сканирует раковые опухоли и определяет их злокачественность. С этой задачей обученные нейросети справляются очень хорошо.
Распознавание текста.
Модель компьютерного зрения может извлечь текст из изображения или прочитать документ и резюмировать то, что в нём написано. Специалисты экономят время, читать многостраничную документацию не придётся.
Главные тренды в компьютерном зрении
Во многих областях от космических исследований до промышленности компьютерное зрение участвует в экспериментальных разработках. Вот некоторые из них:
- Беспилотные автомобили
Нейросети учатся детектировать объекты и ситуацию на дороге каждую секунду и выдавать верное решение: тормозить, разгоняться, поворачивать налево или направо. Маленькие роботы-курьеры путешествуют из точки А в точку Б и не врезаются в прохожих, используя компьютерное зрение.
- Роботы
Внутри некоторых роботов, в том числе и роботов-курьеров, тоже «сидят» алгоритмы, которые обучаются не на базе данных, а на ходу. Компьютерное зрение изучает полученное изображение, а дальше дело за deep reinforcement learning — обучением с подкреплением, которое работает благодаря нейросетям. Они учатся, взаимодействуя с окружением, а не на основе датасета.
- Космические исследования
Учёные используют нейросети, чтобы определять стадии звездообразования в галактиках благодаря изображениям из космоса.
- Распознавание эмоций
Например, «умные очки» Google Glass помогают нейроотличным людям распознавать эмоции окружающих, показывают подсказки.
- Обработка аудиосигналов
Когда управляемый голосом человека умный дом получает команду включить свет, компьютер может оцифровать аудиозапись и преобразовать её в спектрограмму — те самые волны, которые можно увидеть на аудиозаписи. Анализ спектрограммы с помощью компьютерного зрения даёт даже более точные результаты при исполнении задач, чем анализ аудио.