СВЕРТОЧНЫЕ НЕЙРОННЫЕ СЕТИ ДЛЯ ОБНАРУЖЕНИЯ ТРЕЩИН НА ГИБКИХ ДОРОЖНЫХ ПОКРЫТИЯХ
Конференция: CCVI Студенческая международная научно-практическая конференция «Молодежный научный форум»
Секция: Технические науки
CCVI Студенческая международная научно-практическая конференция «Молодежный научный форум»
СВЕРТОЧНЫЕ НЕЙРОННЫЕ СЕТИ ДЛЯ ОБНАРУЖЕНИЯ ТРЕЩИН НА ГИБКИХ ДОРОЖНЫХ ПОКРЫТИЯХ
Аннотация. Трещины на дорожном покрытии могут привести к угрозе безопасности, увеличению затрат на техническое обслуживание и сокращению срока службы дороги. Чтобы решить эту проблему, исследователи разработали подход, основанный на глубоком обучении, с использованием сверточных нейронных сетей (CNNS) для обнаружения трещин на гибких дорожных покрытиях. CNN - это тип нейронных сетей, которые особенно эффективны для задач распознавания изображений. В случае обнаружения трещин CNN обучается на наборе данных изображений дорожного покрытия, причем каждое изображение помечено как либо содержащее трещину, либо нет. Сеть учится распознавать узоры на изображениях, которые соответствуют наличию трещин. Чтобы повысить производительность CNN, исследователи также использовали методы увеличения данных, такие как поворот, переворачивание и масштабирование изображений, чтобы увеличить размер обучающего набора данных и уменьшить переобучение. Результаты экспериментов показали, что CNNS может достигать высокой точности при обнаружении трещин на гибких дорожных покрытиях, причем некоторые модели достигают точности до 98%. Такой подход потенциально может значительно повысить эффективность обнаружения трещин и их технического обслуживания, что приведет к повышению безопасности и долговечности дорог.
Ключевые слова: Сверточные нейронные сети (CNNs), обнаружение трещин, гибкие дорожные покрытия, глубокое обучение, распознавание изображений, увеличение объема данных, поддержка, безопасность дорожного движения, продолжительность жизни.
Введение
Гибкие дорожные покрытия, такие как асфальт и бетон, обычно используются для строительства дорог и другой транспортной инфраструктуры. Со временем на этих поверхностях могут образоваться трещины из-за различных факторов, таких как дорожное движение, погода и износ. Эти трещины могут привести к угрозе безопасности, снижению качества езды, увеличению затрат на техническое обслуживание и сокращению срока службы дороги. Традиционные методы обнаружения трещин на дорожных покрытиях обычно включают ручной осмотр обученным персоналом, что может отнимать много времени и быть дорогостоящим. Чтобы решить эту проблему, исследователи обратились к методам глубокого обучения, в частности к сверточным нейронным сетям (CNNS), для разработки автоматизированных систем обнаружения трещин. CNN - это тип нейронных сетей, которые особенно эффективны в задачах распознавания изображений, что делает их хорошо подходящими для обнаружения трещин на дорожных покрытиях. Обучая CNN набору данных изображений дорожного покрытия, сеть может научиться распознавать узоры на изображениях, соответствующие наличию трещин. В этой статье мы рассмотрим использование CNNS для обнаружения трещин на гибких дорожных покрытиях. Мы обсудим архитектуру и подготовку CNN для выполнения этой задачи, а также методы расширения данных, которые могут повысить их производительность. В статье рассмотрены экспериментальные результаты, демонстрирующие эффективность CNNS для обнаружения трещин и их потенциальное влияние на повышение безопасности дорожного движения и технического обслуживания.
Проверка состояния дорожного покрытия и сбор данных по-прежнему являются преимущественно ручным процессом, проводимым персоналом на местах [1]. Помимо его трудоемкого характера, подверженности риску персонала, низкой эффективности обнаружения и заторов на дорогах во время проверки [2]. Ручной подход привносит человеческую субъективность и ошибки, что приводит к различиям в интерпретации дорожных данных от человека к человеку [2-3]. На протяжении многих лет предпринимались многочисленные попытки внедрить различные технологии в процесс дорожного контроля с основными целями противодействия человеческой изменчивости, повышения скорости выполнения обследования и снижения подверженности персонала риску на месте.
Исследовательские усилия, направленные на внедрение определенного уровня автоматизации в эту область, сосредоточены на применении технологий обработки изображений и компьютерного зрения [4, 5]. Достижения в области глубокого обучения и его возросшая доступность
привели к внедрению методов глубокого обучения во многих областях, включая инспекцию дорожного покрытия. Однако на сегодняшний день не существует всеобъемлющего сравнения эффективности различных методов глубокого обучения. Наличие реалистичных наборы данных о дорожных трещинах высокой четкости также остаются ограниченными.
Одним из наиболее распространенных дефектов, которым подвержены дорожные покрытия, являются трещины, которые со временем развиваются в основном из-за одного или нескольких из следующих факторов: повторяющаяся транспортная нагрузка, неблагоприятные экологические или климатические условия и качество строительства [4-5]. Эти факторы способствуют процессу старения дорожного покрытия и влияют на его структурную целостность [5]. В данном исследовании трещины рассматриваются как надежный визуальный индикатор состояния поверхности дорожного покрытия, и поэтому исследуются целесообразность использования сверточных нейронных сетей (CNNS) вместе с обучением передаче для обнаружения трещин в дорожном покрытии.
Происхождение
Трещины на гибких дорожных покрытиях являются распространенной проблемой, которая может привести к угрозе безопасности, увеличению затрат на техническое обслуживание и сокращению срока службы дороги. Традиционные методы обнаружения трещин на дорожных покрытиях предполагают ручной осмотр обученным персоналом, что может отнимать много времени и быть дорогостоящим. В результате возникает потребность в автоматизированных системах, способных эффективно и точно обнаруживать трещины на дорожных покрытиях[6].
Методы машинного обучения, в частности сверточные нейронные сети (CNNS), показали многообещающие результаты в решении этой проблемы. CNN - это тип нейронных сетей, которые особенно эффективны для задач распознавания изображений. Обучая CNN набору данных изображений дорожного покрытия, сеть может научиться распознавать узоры на изображениях, соответствующие наличию трещин.
В этом исследовании CNNs применяется с целью обнаружения трещин в реальном наборе данных. CNN - это класс искусственных нейронных сетей, особенно полезных в задачах компьютерного зрения, таких как распознавание объектов [7], благодаря своей способности извлекать высокоуровневые объекты из изображений и тем самым надежно распознавать различные объекты после обучения модели. CNNS устраняет необходимость в ручном извлечении объектов, на которое опираются примитивные методы обработки изображений, и вместо этого извлекает элементы изображения и характеристики непосредственно из входных данных; таким образом, значительно сокращаются затраты на предварительную обработку. Трансфертное обучение - это метод машинного обучения, который использует ранее обученную модель в качестве отправной точки для обучения модели новой задаче [8].Он использует прошлые знания для извлечения ценных функций из нового набора данных быть использованным. В случае успеха это должно позволить ускорить обучение модели и повысить производительность. Обучение с нуля требует больших вычислительных затрат и, как правило, требует больших наборов данных для достижения приемлемой производительности.
Методы:
Использование CNNs для обнаружения трещин на гибких дорожных покрытиях обычно включает следующие этапы: Собирается набор данных изображений дорожного покрытия, причем каждое изображение помечено как содержащее трещину или нет. Набор данных должен быть разнообразным и отражать различные типы и степень серьезности трещин, которые могут возникнуть на дорожных покрытиях. Изображения в наборе данных подвергаются предварительной обработке для обеспечения согласованности и оптимизации производительности CNN. Это может включать в себя изменение размера изображений, регулировку их яркости и контрастности, а также преобразование их в оттенки серого. Выбрана и настроена архитектура CNN для задачи обнаружения трещин. Архитектура обычно состоит из нескольких сверточных слоев для извлечения объектов и слоев объединения для понижающей дискретизации, за которыми следуют полностью связанные слои для классификации. CNN обучается на основе набора данных с использованием подхода контролируемого обучения. Процесс обучения включает в себя загрузку изображений в сеть и корректировку весов и смещений сети на основе ошибки между прогнозируемыми и фактическими метками. Процесс обучения может[9] повторяться несколько раз с целью минимизации ошибки и максимизации точности CNN. Производительность CNN оценивается на основе отдельного проверочного набора данных, который не использовался для обучения. Показатели оценки обычно включают точность, прецизионность, отзывчивость и оценку F1.
Чтобы повысить производительность CNN и уменьшить переобучение, к набору данных могут быть применены методы увеличения данных. Это может включать поворот, переворачивание и масштабирование изображений, а также добавление шума и размытия для имитации реальных изменений изображений дорожного покрытия. После того, как CNN будет обучен и оценен, его можно будет развернуть в реальных условиях для автоматического обнаружения трещин на гибких дорожных покрытиях.
Набор данных:
Качество и разнообразие набора данных является критическим фактором эффективности CNNS для обнаружения трещин на гибких дорожных покрытиях. Набор данных должен включать ряд изображений дорожного покрытия с различными типами и серьезностью трещин, а также изображения без трещин для сравнения. Набор данных также должен быть достаточно большим, чтобы обеспечить достаточное количество обучающих данных для CNN, и он должен отражать реальные условия и различия в изображениях дорожного покрытия. Существует несколько общедоступных наборов данных для обнаружения трещин на дорожных покрытиях, таких как CRACK500 и CRA-Net datasets. Однако исследователи также могут собирать свои собственные наборы данных, используя различные методы, такие как ручной осмотр, камеры, установленные на дроне или транспортном средстве, или другие датчики. Качество и согласованность набора данных должны тщательно контролироваться, чтобы обеспечить точность и надежность CNN для обнаружения трещин на гибких дорожных покрытиях.
Модели машинного обучения:
Для обнаружения трещин на дорожных покрытиях с использованием машинного обучения лучше использовать модель компьютерного зрения (Computer Vision), так как она специализируется на анализе изображений. Конкретная модель будет зависеть от различных факторов, таких как доступность и количество данных, тип изображений, наличие помех и т.д. Одна из наиболее распространенных и успешных моделей в задачах компьютерного зрения - это сверточные нейронные сети (Convolutional Neural Networks, CNN). Они способны эффективно выделять признаки из изображений и смоделировать сложные зависимости между изображениями и их классами. Кроме того, для обучения такой модели нужны размеченные данные, т.е. изображения дорожных покрытий с размеченными трещинами и без них[10]. Если размеченные данные недоступны, можно использовать методы обучения без учителя, такие как генеративные состязательные сети (Generative Adversarial Networks, GANs) или автоэнкодеры (Autoencoders). Для обнаружения трещин на дорожных покрытиях с использованием сверточных нейронных сетей, можно использовать различные архитектуры, такие как VGG, ResNet, Inception и другие. Эти архитектуры имеют предобученные модели на больших наборах данных, таких как ImageNet, которые можно использовать как основу для обучения моделей обнаружения трещин. Кроме того, можно использовать алгоритмы обработки изображений, такие как фильтры, морфологические операции, преобразование Хафа(Hough transform), для предварительной обработки изображений и улучшения точности обнаружения трещин. Важным аспектом при обучении модели для обнаружения трещин является выбор подходящего набора данных. Данные должны быть достаточно разнообразными, чтобы модель могла обнаруживать трещины разных размеров, форм и типов. Кроме того, данные должны содержать как изображения с трещинами, так и без них, чтобы модель могла научиться различать между ними. Использование машинного обучения для обнаружения трещин на дорожных покрытиях имеет много преимуществ. Это позволяет автоматизировать процесс обнаружения трещин, повысить точность и скорость обнаружения, а также уменьшить затраты на ручную проверку дорожных покрытий. Было разработано несколько моделей глубокого обучения для обнаружения трещин на гибких дорожных покрытиях с использованием CNNs. Эти модели отличаются по своей архитектуре и методам обучения, но все они направлены на достижение высокой точности обнаружения трещин при минимизации ложных срабатываний. Некоторые из обычно используемых моделей для этой задачи включают:
LeNet-5 - это классическая архитектура CNN, которая была разработана для распознавания рукописных цифр. Он состоит из нескольких сверточных слоев, объединяющих слоев и полностью связанных слоев. LeNet-5 был адаптирован для обнаружения трещин на дорожных покрытиях путем модификации входного слоя для обработки изображений большего размера и настройки количества фильтров в сверточных слоях.
VGG16 - это глубокая архитектура CNN, которая была разработана для распознавания объектов. Он состоит из 16 сверточных слоев, за которыми следуют три полностью соединенных слоя. VGG16 использовался для обнаружения трещин на дорожных покрытиях путем адаптации входного слоя и регулировки количества фильтров в сверточных слоях.
ResNet - это глубокая архитектура CNN, которая была разработана для решения проблемы исчезающих градиентов в очень глубоких сетях. Он состоит из остаточных блоков, которые позволяют сети изучать остаточные сопоставления вместо непосредственного изучения базового сопоставления. ResNet использовался для обнаружения трещин на дорожных покрытиях с изменениями входного слоя и количества остаточных блоков.
U-Net - это глубокая архитектура CNN, которая была разработана для сегментации медицинских изображений. Он состоит из сужающегося контура и расширяющегося контура, что позволяет точно локализовать объекты на изображении. U-Net была адаптирована для обнаружения трещин на дорожных покрытиях путем изменения входного слоя и количества фильтров в сверточных слоях. Эти модели достигли высокой точности в обнаружении трещин на дорожных покрытиях, причем некоторые модели достигают более 90% точности в валидационных наборах данных. Однако производительность моделей может варьироваться в зависимости от качества и разнообразия набора данных, а также от конкретных параметров и используемых методов обучения. Необходимы дальнейшие исследования для определения оптимальных моделей глубокого обучения и методов обучения для обнаружения трещин на гибких дорожных покрытиях.
Результаты:
Использование моделей глубокого обучения для обнаружения трещин на гибких дорожных покрытиях показало многообещающие результаты в достижении высокой точности и эффективности обнаружения трещин. В нескольких исследованиях сообщалось о более чем 90%-ной точности обнаружения трещин с использованием моделей глубокого обучения, что значительно выше, чем традиционные методы ручного контроля или визуального контроля экспертами-людьми.
Например, в исследовании Guo et al. (2020) использовалась модель глубокого обучения, основанная на архитектуре ResNet, для обнаружения трещин на поверхностях асфальтового покрытия. Модель достигла точности обнаружения трещин в 94,3% при точности 93,5% и отзыве 95,2%. В другом исследовании Zhang et al. (2019) использовалась модель глубокого обучения, основанная на архитектуре VGG16, для обнаружения трещин на бетонных поверхностях дорожного покрытия. Модель достигла точности обнаружения трещин в 91,7%, при этом точность составила 89,6%, а отзыв - 94,3%.
Эти результаты демонстрируют потенциал моделей глубокого обучения для повышения точности и эффективности обнаружения трещин на гибких дорожных покрытиях. Автоматизируя процесс обнаружения, модели глубокого обучения могут сократить время и затраты, связанные с ручным осмотром, и повысить безопасность и техническое обслуживание дорожного покрытия. Однако необходимы дальнейшие исследования для оптимизации производительности моделей глубокого обучения для обнаружения трещин в различных условиях и подтверждения их эффективности в реальных условиях.