ivdon3@bk.ru
В статье рассмотрены особенности выявления новизны в данных, а также общие методы ее выявления. Поскольку отсутствие шума в обучающей информации является определяющим фактором для построения на ней качественных классификаторов в машинном обучении с учителем, то рассмотрен такой практически важный частный случай поиска новизны, когда она определяется в отдельных классах обучающих данных после того, как в этих данных устранены все выбросы. Для большей определенности при поиске новизны предложена ее геометрическая интерпретация в пространстве значений признаков объектов в виде изображающей объект класса точки, находящейся снаружи минимальной гиперокружности, описанной вокруг остальных изображающих точек объектов класса.
Ключевые слова: обучающие данные, классификатор, выбросы, новизна, обнаружение новизны, геометрический подход, статистический критерий
05.13.06 - Автоматизация и управление технологическими процессами и производствами (по отраслям)
Рассмотрен шум в обучающих выборках, основную часть которого составляют выбросы и новизна. Дан анализ основных причин возникновения выбросов в обучающих выборках. Рассмотрена сущность основных существующих подходов к определению выбросов в обучающих выборках. На основе использования метода ближайших соседей предложена модифицированная методика сравнения обобщенных расстояний от объектов до классов. Для основных видов метрик, применяемых в пространствах значений признаков, найдены обоснованные значения коэффициентов запаса, используемые в данной методике. Для программной оценки качества обучающей выборки и обоснованного выбора способа коррекции выбросов в ней предложено применение допустимых долей корректируемых и удаляемых выбросов. Дан алгоритм анализа наличия выбросов в наборе обучающей примеров. Приведена оценка сложности алгоритма по длине входа задачи. Разработан алгоритм оценки и коррекции обучающих выборок.
Ключевые слова: задача классификации, классификатор, решающая функция, обучающая выборка, прецедент, ошибочные данные, анализ, коррекция, искусственный интеллект, гипотеза компактности, новизна, обучение
05.13.06 - Автоматизация и управление технологическими процессами и производствами (по отраслям)
Изучено влияние условий хранения и транспортировки на гигроскопичность, статическую и динамическую прочность, степень уплотнения и слеживаемость гранулированного и мелкозернистого хлорида калия. Показано, что в процессе хранения и транспортировки удобрений насыпью происходит изменение товарных характеристик продукта.
Ключевые слова: Калийные удобрения, хранение и транспортировка, гигроскопичность, слеживаемость, степень уплотнения. Товарные характеристика удобрения
В статье рассмотрен метод детектирования искажений на архивных фотодокументах с помощью текстурного анализа на основе локальных бинарных окрестностей. Предлагаемый подход состоит из следующих этапов: предварительная обработка и обнаружение царапин. Предварительная обработка используется для уменьшения влияния шума и устранения небольших дефектов на изображении. Для распознавания класса дефектов используется метод опорных векторов. Показана эффективность нового подхода на нескольких примерах при обнаружении дефектов.
Ключевые слова: цифровая обработка изображений, обнаружение дефектов, архивные фотографии, локальные бинарные окрестности
05.13.01 - Системный анализ, управление и обработка информации (по отраслям) , 05.13.05 - Элементы и устройства вычислительной техники и систем управления , 05.13.18 - Математическое моделирование, численные методы и комплексы программ
Статья посвящена актуальной проблеме построения классификаторов объектов, задаваемых точками в многомерном пространстве значений признаков.Принцип линейной нормальной классификации объектов в многомерных пространствах признаков может быть использован для построения классификаторов в случае множеств сложной структуры, неразделимые в общем случае одной гиперплоскостью. В таких случаях предложено использовать совокупность иерархически связанных нормальных разделяющих гиперплоскостей, которая названа иерархическим нормальным классификатором.
Ключевые слова: распознавание, классификация, пространство признаков, геометрический метод
05.13.01 - Системный анализ, управление и обработка информации (по отраслям)
Статья посвящена актуальной проблеме построения классификаторов объектов, задаваемых точками в многомерном пространстве значений признаков. Предлагается вариант геометрического разделения множеств при помощи гиперплоскостей, нормальных к межцентровому расстоянию данных множеств.Данный подход к построению разделяющих плоскостей сокращает объем выполняемых расчетных операций.
Ключевые слова: распознавание, классификация, пространство признаков, геометрический метод
05.13.01 - Системный анализ, управление и обработка информации (по отраслям)
Сведения об авторах выпуска №2 (2013)
Ключевые слова: авторы
Сведения об авторах выпуска №4 (часть 1), 2012
Ключевые слова: авторы
Рассмотрены технология и техника, обеспечивающие расчистку лесных площадей, подготовку их для лесовосстановительных работ и заготовку пнево-корневой древесины для использования в биоэнергетике и целлюлозно-бумажном производстве.
Ключевые слова: биологическое топливо, корчевка, пнево-корневая древесина, разделка, техника, технология, энергетическая древесина.
Ключевые слова:
05.21.01 - Технология и машины лесозаготовок и лесного хозяйства