Техническое зрение в MATLAB
Секция: Технические науки
XLIV Студенческая международная заочная научно-практическая конференция «Молодежный научный форум: технические и математические науки»
Техническое зрение в MATLAB
Проведен обзор распознавания объектов с помощью Matlab и применение их систем инструментов для разработки технического зрения.
В современном мире автоматизации, человечество пытается заменить человеческий труд машинным во всех отраслях жизни, где это возможно. И наблюдательная способность человека не исключение. Человеческое зрение призваны заменить видеодетекторы. Однако, следует заметить, что видеодетекторы не способны полностью заменить человека, но помочь ему, они объективно могут. Поэтому во всем мире большое внимание уделяют системам технического зрения. Данная статья посвящена локализации и распознаванию объектов и применения программы MATLAB для данной задачи. Данное направление, несомненно, актуальна на сегодняшний день, так как существенно поможет упростить жизнь человеку в некоторых ее областях. Одно из направлений это создание авторобота. Контроль над транспортными средствами в нашей стране оставляет желать лучшего, и видеодетекторы могут помочь в этом. С их помощью можно контролировать, например, скоростной режим или выезд за двойную сплошную линию. Также для обеспечения безопасности в производственных отраслях, где техника безопасности играет важную роль, применение технического зрения может обеспечить правильную эксплуатацию станков, оборудования и предотвратить экстренную ситуацию.
Обработка изображений применяется во многих сферах деятельности человека. Развитие информационных технологий способствует повышению качества уровня анализа данных, прогресс компьютерной техники влияет на быстродействие и достоверность такой обработки. На данном этапе развитие технической диагностики непрерывно связано с визуализацией внутренних структур объекта. Существует много различных видов алгоритмов визуализации. Возникают новые методы, но они не заменяют уже существующие, а лишь дополняют их.
Техническое зрение – это научное направление в области искусственного интеллекта, в частности робототехники, и связанные с ним технологии получения изображений объектов реального мира, их обработки и использования полученных данных для решения разного рода прикладных задач без участия (полного или частичного) человека.
Системы технического зрения запрограммированы для выполнения узкоспециализированных задач, таких как подсчет объектов на конвейере, детектирование объектов на изображении, чтение серийных номеров или поиск поверхностных дефектов. Польза системы визуальной инспекции на основе технического зрения заключается в высокой скорости работы, возможности 24-часовой работы и точности повторяемых измерений. Так же преимущество машин перед людьми заключается в отсутствии утомляемости, болезней или невнимательности.
Компьютеры не могут «видеть» таким же образом, как это делает человек. Фотокамеры не эквивалентны системе зрения человека, и в то время как люди могут опираться на догадки и предположения, системы технического зрения должны «видеть» путем изучения отдельных пикселей изображения, обрабатывая их и пытаясь сделать выводы с помощью базы знаний и набора функций таких, как устройство распознавания образов.
Архитектура систем машинного зрения состоит из трех базовых элементов: фотокамера, формирующая изображение, плата, преобразующая аналоговый сигнал в цифровой (АЦП), и программное обеспечение, выполняющее анализ данных (Рисунок 1).
Рисунок 1. Стандартная система машинного зрения
Скорость обработки данных играет немало важную роль в системах реального времени. Это отражается, в первую очередь на экономических показателях системы. Так, при грамотно написанных алгоритмах, потребуется в несколько раз меньше вычислительных ресурсов, и, следовательно, может сократить стоимость системы во время разработки алгоритма и реализации продукта.
Для разработки алгоритмов технического зрения рассмотрим прикладной пакет программ программирования MATLAB. Язык MATLAB – это высокоуровневый язык для технических расчетов. Он включает в себя вычисления, визуализацию и программирование в удобной среде, где задачи и решения выражаются в форме, приближенный к математической. Программа MATLAB широко используется в таких областях, как: обработка сигналов и связи, обработка изображений и видео, системы управления, научная и инженерная графика.
MATLAB – это интерактивная система, в которой основным элементом данных является массив. Это позволяет решать различные задачи, которые связаны с техническими вычислениями, особенно в тех задачах, в которых используются матрицы и вектора, в несколько раз быстрее, чем при написании программ с использованием «скалярных» языков программирования, таких как Си. В MATLAB важная роль отводится специализированным группам программ, называемых toolboxes. Они очень важны для большинства пользователей MATLAB, так как позволяют изучать и применять специализированные методы. Toolboxes - это всесторонняя коллекция функций MATLAB (М-файлов), которые позволяют решать частные классы задач. Toolboxes применяются для обработки сигналов, систем контроля, нейронных сетей, моделирования и т.д.,
Пакет, Image Processing Toolbox, Computer Vision System Toolbox, Image Acquisition Toolbox предоставляет ученым, инженерам широкий спектр средств инструментов для цифровой обработки и анализа изображений при разработке технического зрения. Данные пакеты освобождают от выполнения длительных операций кодирования и отладки алгоритмов, которые, позволяют сконцентрироваться на решении основной научной или практической части задачи. Эти пакеты содержат алгоритмы и инструменты для разработки и моделирования систем компьютерного зрения и обработки видео. Пакеты включает алгоритмы выявления деталей, детектирования движения, обнаружения и отслеживания объектов, стереозрения, обработки и анализа видео. Приложение поддерживает различные операции обработки изображений, включая: пространственные преобразования изображений, морфологические операции, скользящую и блочную, обработку, анализ и улучшение изображений, обработка области интереса.
Обнаружение, объекта – это процесс нахождения реальных объектов таких, как лица, людей на дороге, дорожные знаки и номерные знаки.
Рисунок 2. Пример обнаружения лица на изображения с помощью Matlab
С помощью предоставленных алгоритмов и инструментов в Matlab можно заниматься разработкой систем распознавания объектов и создания технического зрения для автомобилей, разработки авторобота и других систем, где возможно применение запрограммированных систем под определенные задачи, требуемые человеку. Данная программа успешно применяется концерном BMW и Scania для создания авторобота.