Использование критерия среднего расстояния для выявления новизны в данных
Аннотация
Дата поступления статьи: 02.08.2021В статье рассмотрены особенности выявления новизны в данных, а также общие методы ее выявления. Поскольку отсутствие шума в обучающей информации является определяющим фактором для построения на ней качественных классификаторов в машинном обучении с учителем, то рассмотрен такой практически важный частный случай поиска новизны, когда она определяется в отдельных классах обучающих данных после того, как в этих данных устранены все выбросы. Для большей определенности при поиске новизны предложена ее геометрическая интерпретация в пространстве значений признаков объектов в виде изображающей объект класса точки, находящейся снаружи минимальной гиперокружности, описанной вокруг остальных изображающих точек объектов класса.
Ключевые слова: обучающие данные, классификатор, выбросы, новизна, обнаружение новизны, геометрический подход, статистический критерий
05.13.06 - Автоматизация и управление технологическими процессами и производствами (по отраслям)
.