×

Вы используете устаревший браузер Internet Explorer. Некоторые функции сайта им не поддерживаются.

Рекомендуем установить один из следующих браузеров: Firefox, Opera или Chrome.

Контактная информация

+7-863-218-40-00 доб.200-80
ivdon3@bk.ru

Формирование поискового запроса для поиска информации в предметной области с применением Закона Ципфа и правила трёх сигм

Аннотация

Вакурин И.С., Тремасова Л.А., Алёшинцев А.В. , Гадасин Д.В.

Дата поступления статьи: 30.12.2024

Ежегодный рост нагрузки на центры обработки данных увеличивается в многократных размерах, что обусловлено возрастающим ростом пользователей информационно-телекоммуникационной сети Интернет. Пользователи обращаются к различным ресурсам и источникам, используя для этого поисковые системы и сервисы. Установка оборудования, которое обрабатывает телекоммуникационный трафик быстрее, требует значительных финансовых затрат, а так же может существенно увеличить время простоя центра обработки данных за счет возможных проблем во время проведения регламентных технических работ. Целесообразнее сосредоточить ресурс на улучшении программной, а не аппаратной части оборудования. В статье приводится алгоритм, за счёт которого возможно снизить нагрузку на телекоммуникационное оборудование за счет поиска информации внутри определённой предметной области, а также путём использования особенностей естественного языка и процесса образования в нём слов, предложений и текстов. Анализировать запрос предложено на основании формирования префиксного дерева и кластеризации, а также путём расчета вероятности возникновения нужного слова на основе правила трёх сигм и Закона Ципфа.

Ключевые слова: правило трёх сигм, Закон Ципфа, кластеры, анализ языка, морфемы, префиксное дерево, распределение вероятностей

2.3.1 - Системный анализ, управление и обработка информации

.