Машинное обучение прогнозных моделей на несбалансировнных данных по опасным астероидам
Аннотация
Дата поступления статьи: 21.03.2023Анализируется набор данных по потенциально опасным для Земли астероидам. С помощью моделей машинного обучения астероиды из базы классифицируются на опасные и неопасные. Используются методы логистической регрессии, k-ближайших соседей; дерева решений и другие. С помощью перекрестной проверки находится наилучший метод, затем определяются его оптимальные гиперпараметры. Качество работы модели-классификатора оценивается по метрикам полноты и ее стандартного отклонения, а также с помощью матрицы ошибок и средней абсолютной ошибки в процентах. Приведены результаты анализа и моделирования в Python, демонстрирующие высокую точность прогнозирования полученной модели.
Ключевые слова: машинное обучение, прогнозная модель, анализ данных, несбалансированные данные, логистическая регрессия, метод k-ближайших соседей, дерево решений, случайный лес, метод опорных векторов, перекрестная проверка
1.2.2 - Математическое моделирование, численные методы и комплексы программ
.