Компьютерное зрение – Научно-Техническое Отделение

Что такое компьютерное зрение

Компьютерное зрение (англ. computer vision, CV) — это область искусственного интеллекта. Способность «видеть» у компьютера появилась благодаря глубокому обучению (англ. deep learning) — разновидности машинного обучения, которое использует для решения задач нейронные сети.

Задача специалистов в области компьютерного зрения — научить компьютер воспринимать изображения как человек.

Все приложения и устройства, использующие компьютерное зрение, должны иметь камеры, радары или лидары (измеряют расстояние с помощью лазера), а также специализированное программное обеспечение.

Любое компьютерное зрение создаётся с помощью технологий машинного обучения — сначала собирается огромное количество данных, потом искусственный интеллект анализирует, выделяет признаки и их комбинации для дальнейшей идентификации других объектов.

Таким образом, компьютерное зрение — это не совсем подобие человеческого интеллекта и зрения. Это сложный комплекс устройств и программных алгоритмов, анализирующих информацию на основе имеющейся.

Применение компьютерного зрения

Безопасность.

Кроме Face ID компьютерное зрение используют для распознавания лиц в банках и метро, оплатах с помощью биометрии. Сейчас модели компьютерного зрения научились делать это даже несмотря на маску на лице человека. Камеры видеонаблюдения на дорогах — тоже результат работы компьютерного зрения.

Промышленность.

При постройке зданий компьютерное зрение может определять дефекты металла, незаметные человеческому глазу. Изображение подаётся в нейросеть, чтобы узнать процент дефекта материалов с большей точностью, чем смог бы определить специалист.

Медицина.

Компьютерное зрение помогает с классификацией: сканирует раковые опухоли и определяет их злокачественность. С этой задачей обученные нейросети справляются очень хорошо.

Распознавание текста.

Модель компьютерного зрения может извлечь текст из изображения или прочитать документ и резюмировать то, что в нём написано. Специалисты экономят время, читать многостраничную документацию не придётся.

Главные тренды в компьютерном зрении

Во многих областях от космических исследований до промышленности компьютерное зрение участвует в экспериментальных разработках. Вот некоторые из них:

Беспилотные автомобили

Нейросети учатся детектировать объекты и ситуацию на дороге каждую секунду и выдавать верное решение: тормозить, разгоняться, поворачивать налево или направо. Маленькие роботы-курьеры путешествуют из точки А в точку Б и не врезаются в прохожих, используя компьютерное зрение.

Роботы

Внутри некоторых роботов, в том числе и роботов-курьеров, тоже «сидят» алгоритмы, которые обучаются не на базе данных, а на ходу. Компьютерное зрение изучает полученное изображение, а дальше дело за deep reinforcement learning — обучением с подкреплением, которое работает благодаря нейросетям. Они учатся, взаимодействуя с окружением, а не на основе датасета.

Космические исследования

Учёные используют нейросети, чтобы определять стадии звездообразования в галактиках благодаря изображениям из космоса.

Распознавание эмоций

Например, «умные очки» Google Glass помогают нейроотличным людям распознавать эмоции окружающих, показывают подсказки.

Обработка аудиосигналов

Когда управляемый голосом человека умный дом получает команду включить свет, компьютер может оцифровать аудиозапись и преобразовать её в спектрограмму — те самые волны, которые можно увидеть на аудиозаписи. Анализ спектрограммы с помощью компьютерного зрения даёт даже более точные результаты при исполнении задач, чем анализ аудио.