ivdon3@bk.ru
В статье описываются возможности, достоинства и отличия систем машинного обучения без учителя от обучения по шаблонам. Также дается определение понятию кластеризации с указанием основных методов и задач, решаемых данным алгоритмом машинного обучения. Подробно расписывается алгоритм распознавания данных из документов посредством технологии OCR, формируются цели и задачи использования технологии OCR в бизнес – процессах IT – компаний. Далее приводятся инструменты решения проблемы распознавания и кластеризации данных из сканов документов PDF посредством библиотек машинного обучения Nanonets и Tesseract. В заключении к данной статье описываются достоинства и недостатки использования данных библиотек в решении проблемы распознавания и кластеризации данных из сканов документов.
Ключевые слова: машинное обучение, кластеризация, распознавание данных, библиотека Nanonets, библиотека Tesseract
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
Представлен алгоритм и листинг кода разработанного самообучающегося чат-бота, способного поддерживать беседу с пользователем, переходить в режим обучения в случае отсутствия нужной информации, проводить анализ контекста беседы на «запрещенные» слова. А также реализована дополнительная опция «Решать арифметические задачи» в случае запроса от пользователя. При реализации последней опции использовался алгоритм рекурсивного спуска на основе трех вложенных рекурсивных функций. Разработана функция для разделения входящей строки на токены. Код чат-бота разработан на языке С++/С# .
Ключевые слова: искусственный интеллект, машинное обучение, голосовой помощник чат-бот, режим обучения, токены, рекурсивный спуск, бинарное дерево
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
В работе рассматривается процесс проведения работ по ремонту и обслуживанию серверного оборудования, используемого для формирования ведомственной информационной инфраструктуры. Процесс осуществления ремонтных работ множества серверов описан с применением теории массового обслуживания. Сформулирована задача оптимального управления надежностью серверного оборудования с учетом наличия ограничений на используемые ресурсы. Получены необходимые условия оптимальности в поставленной задаче в форме принципа максимума Понтрягина. Приведена краевая задача принципа максимума. В целях получения алгоритма построения приближенного решения градиентными методами задача сведена к дискретной задаче оптимального управления, для решения которой доступен широкий спектр численных методов.
Ключевые слова: информационная инфраструктура, серверное оборудование, надежность, оптимальное управление, необходимые условия оптимальности, принцип максимума
Современному металлургическому производству необходимо не только обеспечивать высокое качество выпускаемой продукции, но и быть энергоэффективным. Для достижения данной цели необходимо свести к минимуму перерасход ресурсов, в частности, на этапе непрерывной разливки. В данной работе предложена методика расчета параметров раскроя сляба перед порезкой, позволяющая уменьшить расход металла и повысить выход годного. Данная методика создана на основе математической модели усадки сляба при охлаждении, и может быть использована для автоматизации рабочего места оператора машины газовой резки цеха разливки конвертерной стали.
Ключевые слова: усадка, сляб, математическая модель, коэффициент раскроя, порезка, теплофизические свойства
2.3.1 - Системный анализ, управление и обработка информации , 2.6.2 - Металлургия черных, цветных и редких металлов
Решение проектных задач в области управления территориальными системами основано на необходимости автоматизированного анализа больших массивов геопространственных данных, в том числе, материалов космической съемки. Целью статьи является изучение и разработка эффективных методов семантической сегментации изображений, содержащих геопространственные данные. Методы и материалы. В работе изучаются и используются методы и алгоритмы увеличения точности и быстродействия работы нейронной сети архитектуры U-Net. Результаты. Проведены комплексные исследования конфигурирования сверточной нейронной сети U-Net, в частности, восстановления изображения интерполированным методом ближайшего соседа, добавление в архитектуру слоев прореживания. Выводы. Представленные подходы конфигурирования нейронной сети U-Net позволили повысить точность распознавания по метрике Жаккара на 2-3% и в 2 раза увеличить скорость работы.
Ключевые слова: искусственные нейронные сети, машинное обучение, глубокое обучение, сверточные нейронные сети, U-net, семантическая сегментация, распознавание образов, геопространственные данные
В статье подтверждена необходимость системного подхода к научному обоснованию безопасности систем электронного документооборота (СЭД) и актуальность исследования, приведены результаты анализа руководящих документов в части разработки математических моделей и имеющегося опыта, обобщен порядок научного обоснования безопасности СЭД, выделены основные тенденции в моделировании на сегодняшний день, предложен новый подход к построению моделей безопасности СЭД, определена его роль и место в существующей теории и практике.
Ключевые слова: модели безопасности компьютерных систем, политика безопасности, система электронного документооборота, системный подход
2.3.1 - Системный анализ, управление и обработка информации , 2.3.6 - Методы и системы защиты информации, информационная безопасность
Несмотря на существующую дифференциацию регионов Российской Федерации по природно-климатическим условиям и уровню социально-экономического развития, основной принцип государственной кадастровой оценки направлен на единообразие ее проведения. Исследование в данной работе направлено на раскрытие понятия «региональные особенности», как фактора, приводящего к расхождению методологии определения кадастровой стоимости объектов недвижимости на региональном уровне. В статье выделены факторы региональной специфики, формирующие особенности проведения оценочных работ по определению кадастровой стоимости земельных участков в 2022 году на территории Санкт-Петербурга и Пермского края, а также даны рекомендации для усовершенствования существующей единой методологии.
Ключевые слова: государственная кадастровая оценка, массовая оценка, налогообложение, кадастровая стоимость, рыночная стоимость, дифференциация регионов, региональная особенность, объект недвижимости, земельный участок
2.3.1 - Системный анализ, управление и обработка информации , 5.2.2 - Математические, статистические и инструментальные методы в экономике
Работа посвящена применению алгоритма симплекс-оптимизации в области магнитных измерений, а именно в измерении кривой размагничивания высококоэрцитивных магнитных материалов. Алгоритм нашёл своё место в реализации нового метода, основанного на натурно-модельном подходе и модели гистерезиса Джилса-Аттертона, суть которого также описана в работе. Ожидается, что новый метод даст возможность более точно определять кривую размагничивания постоянных магнитов за счёт применения измерителей напряжения тока вместо классических индукционных датчиков, что позволит избежать накопления ошибки. Алгоритм симплекс-оптимизации позволяет оптимизировать параметры модели Джилса-Аттертона таким образом, чтобы смоделированная математическая модель высококоэрцитивного магнитного материала наиболее соответствовала измеряемому магнитному материалу. Метод опробован на мультифизической модели, построенной в программном пакете COMSOL Multiphysics, и включает в себя расчёты индуктора и постоянного высококоэрцитивного магнита.
Ключевые слова: постоянный магнит, неодимовый магнит, высококоэрцитивный материал, магнитный материал, разложение Фурье-Бесселя, аппроксимация, импульс, оптимизация, симплекс, алгоритм Нелдера-Мида, математическая модель, коэрцитивная сила, гистерезис
2.2.4 - Приборы и методы измерения , 2.3.1 - Системный анализ, управление и обработка информации
Показана возможность оценки качества лакокрасочных покрытий путем анализа состояния поверхности изделий цифровыми методами. В условиях промышленного предприятия проведен сравнительный анализ состояния покрытий АК-1301 и Tikkurila Metallista, подвергнутых воздействию агрессивных сред: воды, бензина. По цифровым изображениям поверхности проведена оценка адгезионной прочности и поверхностной пористости покрытий в состоянии «до-после» воздействия сред. Показано, что наиболее высокой адгезионной прочностью и химической стойкостью к воде и бензину обладает автоэмаль АК-1301.
Ключевые слова: лакокрасочное покрытие, адгезия, поверхностная пористость, агрессивная среда, цифровое изображение, пиксель
2.1.5 - Строительные материалы и изделия , 2.3.1 - Системный анализ, управление и обработка информации
Работа посвящена разработке нового метода определения кривой размагничивания высококоэрцитивных постоянных магнитов, например, магнитов из сплава NeFeB. Ожидается, что новый метод даст возможность более точно определять кривую размагничивания постоянных магнитов за счёт применения измерителей напряжения и тока вместо классических индукционных датчиков, что позволит избежать накопления ошибки, возникающей при интегрировании сигнала с индукционных датчиков. В работе подробно описан алгоритм работы нового метода определения кривой размагничивания, даны ссылки на методы и алгоритмы, применяющиеся при разработке нового метода. Метод опробован на мультифизической модели постоянного магнита и намагничивающей установки, построенной в программном пакете COMSOL Multiphysics.
Ключевые слова: постоянный магнит, неодимовый магнит, высококоэрцитивный материал, магнитный материал, разложение Фурье-Бесселя, аппроксимация, импульс, оптимизация, симплекс, алгоритм Нелдера-Мида, математическая модель, коэрцитивная сила, гистерезис
2.2.8 - Методы и приборы контроля и диагностики материалов, изделий, веществ и природной среды , 2.3.1 - Системный анализ, управление и обработка информации
В статье рассмотрена формализованная модель данных программного комплекса автоматизации учета деятельности центра работы с животными, включающего две подсистемы: «Подсистема информационного сопровождения деятельности приюта для бездомных животных» и «Подсистема автоматизации учета деятельности гостиницы для животных». Формализованная модель позволяет структурировать предметную область, выделить основные компоненты, их свойства и взаимосвязи между ними (клиенты, питомцы, вольеры, заявки на бронирование, волонтеры, задачи и т.д.), что в дальнейшем было использовано для алгоритмизации решения и программной реализации комплексного инструментария на платформе «1С:Предприятие».
Ключевые слова: формализованная модель, приют для животных, бездомные животные, гостиница для животных, 1С:Предприятие, автоматизация, учет деятельности, животные, программный комплекс, информационная система
2.3.1 - Системный анализ, управление и обработка информации , 4.2.2 - Санитария, гигиена, экология, ветеринарно-санитарная экспертиза и биобезопасность
Классификация играет большую роль в современном мире. Классификация текстов применяется в решении множества задач, таких как: распознавание эмоциональной окраски содержимого, определение тематической принадлежности, содержания. В статье рассматриваются различные методы классификации текстов с помощью машинного обучения, их достоинства и недостатки.
Ключевые слова: классификация текстов, машинное обучение, метод опорных векторов, метод Байеса, метод ближайших соседей
В статье изучена актуальность интернет-репетиторства, рассмотрены различные существующие системы организации онлайн-репетиторства, определены их сильные и слабые стороны, а также выявлены наиболее актуальные функции рассмотренных сервисов. Рассмотрено проектирование архитектуры разрабатываемого программного продукта. Определены цели для дальнейшего исследования.
Ключевые слова: онлайн-репетиторство, репетитор, онлайн-обучение, шаблоны проектирования, архитектура приложения, информационная система
Рассматривается основное содержание диверсификации производства как деятельность субъектов хозяйствования. проявляющаяся в покупке действующих предприятий, организаций новых предприятий,в данной статье предложен метод использования ГИС для оптимизации сточной канализации критичных участков. В качестве участка работы была выбрана близлежащая территория стадиона Волгоград – Арена.
Ключевые слова: ГИС, анализ, топография, сточная канализация, моделирование
2.1.7 - Технология и организация строительства , 2.3.1 - Системный анализ, управление и обработка информации
Рассмотрена специфика веб-ориентированных информационных систем, определены этапы жизненного цикла с учетом их специфики. Проведен анализ современных облачных интернет-технологий, обеспечивающих хранение, управление и распределенный совместный доступ к информационным ресурсам. Представлены примеры облачных интернет-сервисов и определено их назначение на каждом этапе жизненного цикла веб-ориентированных информационных систем.
Ключевые слова: веб-ориентированная информационная система, жизненный цикл, модель жизненного цикла, планирование, проектирование, дизайн, разработка, тестирование, облачный интернет-сервис, распределенная команда
Английский язык относится к группе аналитических языков, поэтому важное значение для понимания предложений и словосочетаний имеет порядок слов. Для отработки навыка упорядочивания прилагательных требуется постоянная практика с получением обратной связи. Так как время учителя на проверку заданий ограничено, предлагается использовать обучающую систему с возможностью генерации пошаговой обратной связи, которая поможет студентам довести до автоматизма навык расстановки прилагательных в корректном порядке.
Ключевые слова: обучающая система, онтологическое моделирование, обработка естественного языка, английский язык, порядок прилагательных, гиперонимы, автоматизированная проверка ответов обучаемых
2.3.1 - Системный анализ, управление и обработка информации , 5.8.7 - Методология и технология профессионального образования
В этой статье проведен анализ проблем пространственной, временной и фазовой синхронизации в некооперативном пассивном бистатическом радиолокационном измерителе координат, которые затрудняют обнаружение слабых объектов. Исследован метод временной и фазовой синхронизации, основанный на оценке параметров сигнала прямой волны и способ обнаружения слабых объектов, который состоит из длительного когерентного накопления параметров сигнала. Предложен универсальный алгоритм, который состоит из двух этапов: извлечение импульсов прямой волны и оценки параметров. На основе оценки параметров и формы волны дается алгоритм обнаружения слабых целей, основанный на обобщенном преобразовании Фурье.
Ключевые слова: некооперативный пассивный бистатический радиолокационный измеритель координат, алгоритм, синхронизация, импульс, обобщенное преобразование Фурье
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
В представленной работе предлагается гибридная нейросеть, которая объединяет в себе квантовые и классические вычисления, и предназначается для использования с целью классификации изображений. Гибридная нейросеть реализована на основе классической сверточной нейросети с использованием квантовой схемы. Также в рамках данного исследования выполнено сравнение различных конфигураций гибридной нейросети, в которых использовалось различное количество кубитов. Конфигурации гибридной нейросети были обучены и протестированы на наборах данных CIFAR10 и CIFAR100. Сравнение производительности гибридной нейросети для мультиклассовой классификации осуществлялось для разного количества классов (от 2 до 10) с соответствующим количеством кубитов (от 2 до 4). Полученные в ходе экспериментов результаты подтвердили возможность применения гибридной нейросети для решения задачи мультиклассовой классификации.
Ключевые слова: машинное обучение, глубокое обучение, квантовое машинное обучение, квантовые вычисления, гибридная нейронная сеть, классификация изображений, сверточная нейронная сеть, квантовая схема
Поиск ортогональных и квазиортогональных матриц рассматривается как последовательность задания начальных условий, выбора метода реализации, фильтрации набора сгенерированных последовательностей. Предлагается ускорение поиска матриц за счет предварительных фиксации их структуры и фильтрация сгенерированных последовательностей с использованием спектра Фурье. Фиксация структуры предполагает использование свойств симметрии искомых матриц. Фильтрация позволяет исключить последовательности с явными выбросами спектра при формировании блоков симметричных матриц.
Ключевые слова: майнинг матриц, матрицы Адамара, конструкция Пропус, фильтрация последовательностей
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
В статье проведен анализ влияния транспортного средства на воздушной подушке, как источника запыленности на общую и локальную картину пылевой обстановки в промышленном помещении и оценки значимости прироста концентрации пылевых частиц в пылегазовой среде. Предложена модель измерения запыленности рабочей зоны производственных помещений с использованием специального набора высокочастотных полосовых фильтров и ПЭВМ. Определение запыленности в производственных помещениях осуществляется по полученному спектру акустического сигнала, который представляет собой «частотный портрет» содержания концентрации пылевых части в пылегазовой среде.
Ключевые слова: производственные помещения, транспортное средство, концентрация пылевых частиц, измерительный комплекс, ультразвуковой сигнал, спектрограмма запыленности
2.1.10 - Экологическая безопасность строительства и городского хозяйства , 2.3.1 - Системный анализ, управление и обработка информации
Пьезоэлектрический элемент являются одним из наиболее популярных в использовании электронных компонентов, которые применяются в составе многих электронных устройств. Эти устройства весьма эффективно используются в медицине, образовании, строительстве, нефтегазовой отрасли, военной технике, метрологии и многих других. Они входят в состав приборов, обеспечивающих диагностику различных органов человека, замер расхода перекачиваемых жидкостей и газов, утилизирующих механическую энергию человека и транспортных средств с целью последующего ее преобразования в электрическую энергию. С целью получения пьезоэлектрического эффекта необходимо оказать на кристалл определенные воздействия. К таким воздействиям относятся: приложение избыточного давления; сжатие; растяжение; кручение. Ниже рассмотрены критерии, которые влияют на эффективность многослойных пьезопреобразователей.
Ключевые слова: пьезоэлектрический эффект, Пьезоэлементы, Matlab, технические характеристики, эксплуатационные свойства
В работе рассмотрена задача построения единой системы металлургического предприятия, обеспечивающей интеграцию разнородных информационных систем предприятия, различного назначения (КИС, MES, ERP, АСУ ТП). Обмен данными с различными автоматизированными системами предприятия осуществляет специальный модуль обмена данными с автоматизированными системами предприятия (ОДАСП), который реализуется как web-сервис. ОДАСП направлен на обеспечение гарантированного обмена информацией между информационными системами и сохранение информации в единое хранилище данных.
Ключевые слова: информационная система, технологический процесс, металлургическое предприятие, интеграция, web-сервис
2.3.1 - Системный анализ, управление и обработка информации , 2.6.2 - Металлургия черных, цветных и редких металлов
В данной работе рассмотрены актуальные архитектуры нейронных сетей, применяемые для классификации рака молочной железы по гистологическим микрофотографиям. Главной целью исследования было проведение расширенного тестирования обученных моделей на данных, которые принципиально будут отличаться от обучающего датасета. В качестве данных для обучения был выбран крупный российский датасет с классификацией гистологических микрофотографий по характеру поражения, а в качестве тестовых данных выступили данные из этого же датасета, но с измененными параметрами. Для обучения были выбраны модели ResNet 152, DenseNet 121, Inception_resnet_v2. Для обучения был применен подход transfer learning. Предобработка изображений перед обучением состояла в нормализации значений всех каналов изображения в диапазоне от 0 до 1. По итогу тестирования была выявлена проблема с классификацией изображений с изменениями в балансе цвета, контрастности и яркости. Эти изменения привели к значительному ухудшению метрик. Из проведенных тестов сделан вывод, что для качественного обучения моделей с целью классификации рака молочной железы недостаточно элементарной нормализации, ведь она делает модели неустойчивыми к изменениям изображений, которые могут встретиться на практике.
Ключевые слова: нейронная сеть, модель, машинное обучение, рак молочной железы, классификация рака, искусственный интеллект, transfer learning, гистологическая микрофотография
2.3.1 - Системный анализ, управление и обработка информации , 3.1.6 - Онкология, лучевая терапия
В статье рассмотрена практическая часть варианта реализации задачи определения актуальности направлений подготовки, на примере направления «Прикладная информатика», возможных профессий и компаний для трудоустройства выпускников с помощью сопоставления получаемых в рамках обучения навыков и требований рынка труда. Результаты практической апробации формализованной модели будут использоваться в составе модуля цифрового инструментария дистанционной профориентации.
Ключевые слова: запросы к сервисам, вакансии, востребованность направлений подготовки, профориентация, цифровизация профориентационной деятельности, сервисы поиска вакансий
Задачей данного исследования является определение закономерностей развития новых информационных технологий в отрасли и формулировка главных барьеров на пути их введения в проектную деятельность. Изучение вопроса проводилось на основании научных публикаций отечественных и зарубежных исследователей. Использованы основные теоретические методы: анализ, классификация, аналогия и синтез. В данной статье сделан сравнительный анализ использования современных технологий в европейских странах по схеме «центр-периферия» и показаны сходства информационных процессов между Россией и странами Европы. Успешность продвижения инновационных разработок в строительной сфере зависит от: наличия крупных игроков на строительном рынке, государственной поддержки, внедрения новых образовательных стандартов, стандартизации информационного моделирования.
Ключевые слова: технологии информационного моделирования, государственный заказ, стандартизация BIM, строительное образование, инновации, международный опыт