Анализ нейронных сетей  и  в задаче сегментации трещин на изображениях дорожного покрытия

Яхимович М. Е.; Джабраилов Х.А.; Гематудинов Р.А.; Марсов В.И.; Марсова Е.В.

Яхимович М. Е., Джабраилов Х.А., Гематудинов Р.А., Марсов В.И., Марсова Е.В.

Дата поступления статьи: 19.11.2023

В данной работе исследуются и сравниваются две нейронные сети - U-Net-Attention и SegGPT, использующие разные механизмы внимания, для поиска взаимосвязей между различными частями входных и выходных данных. Архитектура U-Net-Attention представляет собой нейросеть U-Net с дополнительным слоем внимания, данная нейросеть предназначена для сегментации изображений. Она имеет кодер и декодер, объединенные связями между слоями и связями, пропускающими скрытые слои, что позволяет передавать информацию о локальных свойствах карты признаков. Для улучшения качества сегментации в оригинальную архитектуру U-Net включен слой механизма внимания, который помогает усилить поиск интересующих нас признаков изображения. Модель SegGPT основана на архитектуре Visual Transformers и также использует механизм внимания. Обе модели обладают способностью фокусироваться на важных аспектах изображения и могут быть эффективными при решении различных задач. В работе производится сравнение их работы на примере сегментации трещин на изображениях дорожного полотна, для дальнейшей классификации состояния дорожного покрытия в целом. Таже произведен анализ и выводы о возможности использования архитектур Transformers для решения широкого спектра задач.

Ключевые слова: машинное обучение, нейронные сети Transformer, U-Net-Attention, SegGPT, анализ состояния дорожного полотна, компьютерное зрение

2.3.1 - Системный анализ, управление и обработка информации

2.3.3 - Автоматизация и управление технологическими процессами и производствами

Анализ нейронных сетей U-Net-Attention и SegGPT в задаче сегментации трещин на изображениях дорожного покрытия