Комбинированный метод реферирования русскоязычных текстов
Аннотация
Дата поступления статьи: 30.06.2025Статья посвящена разработке комбинированного метода реферирования русскоязычных текстов, объединяющего экстрактивные и абстрактивные подходы для преодоления ограничений существующих методов. Предлагаемому методу предшествуют этапы: предобработка текста, комплексный лингвистический анализ с использованием RuBERT, кластеризация на основе семантической близости. Метод включает экстрактивное реферирование через алгоритм TextRank и абстрактивную доработку с помощью нейросетевой модели RuT5. Эксперименты на новостном корпусе Газета.Ру подтвердили преимущество метода по точности, полноте, F-мере и метрикам ROUGE. Результаты показали превосходство комбинированного подхода над чисто экстрактивными методами, такими как TF-IDF и статистический, и абстрактивными методами, такими как RuT5 и mBART.
Ключевые слова: комбинированный метод, реферирование, русскоязычные тексты, TextRank, RuT5
1.2.2 - Математическое моделирование, численные методы и комплексы программ
.