Анализ нейронных сетей U-Net-Attention и SegGPT в задаче сегментации трещин на изображениях дорожного покрытия
Аннотация
Дата поступления статьи: 19.11.2023В данной работе исследуются и сравниваются две нейронные сети - U-Net-Attention и SegGPT, использующие разные механизмы внимания, для поиска взаимосвязей между различными частями входных и выходных данных. Архитектура U-Net-Attention представляет собой нейросеть U-Net с дополнительным слоем внимания, данная нейросеть предназначена для сегментации изображений. Она имеет кодер и декодер, объединенные связями между слоями и связями, пропускающими скрытые слои, что позволяет передавать информацию о локальных свойствах карты признаков. Для улучшения качества сегментации в оригинальную архитектуру U-Net включен слой механизма внимания, который помогает усилить поиск интересующих нас признаков изображения. Модель SegGPT основана на архитектуре Visual Transformers и также использует механизм внимания. Обе модели обладают способностью фокусироваться на важных аспектах изображения и могут быть эффективными при решении различных задач. В работе производится сравнение их работы на примере сегментации трещин на изображениях дорожного полотна, для дальнейшей классификации состояния дорожного покрытия в целом. Таже произведен анализ и выводы о возможности использования архитектур Transformers для решения широкого спектра задач.
Ключевые слова: машинное обучение, нейронные сети Transformer, U-Net-Attention, SegGPT, анализ состояния дорожного полотна, компьютерное зрение
2.3.1 - Системный анализ, управление и обработка информации
2.3.3 - Автоматизация и управление технологическими процессами и производствами
.