ivdon3@bk.ru
Статья посвящена построению и расширению лингвистических ресурсов, таких как словари и тезаурусы, при помощи краудсорсинга на основе выполнения микрозадач. Описаны подходы к априорной оценке сложности микрозадач, оценке производительности участника, адаптивному назначению микрозадач участникам. Представлен комплекс программ, спроектированный на основе трёхзвенной архитектуры, позволяющий использовать краудсорсинг для выполнения микрозадач. Описанные подходы доступны в составе представленного комплекса программ.
Ключевые слова: лингвистический ресурс, языковой ресурс, краудсорсинг, синсет, связь, микрозадача, вычислительная семантика, обработка естественного языка, человеко-машинная система, анализ данных, программное обеспечение
05.13.11 - Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей , 05.13.17 - Теоретические основы информатики
В статье осуществляется анализ метода, позволяющего выявлять синонимические ряды, описывающие одинаковые понятия. Получена оценка качества этого метода на основании опроса носителей русского языка; точность метода составляет 73 %. Применение данного метода к данным открытого тезауруса русского языка YARN выявило необходимость в повышении качества синонимических рядов.
Ключевые слова: лексический ресурс, словарь, Викисловарь, краудсорсинг, тезаурус, синонимия, синонимический ряд, семантические отношения, мера сходства, русский язык
05.13.01 - Системный анализ, управление и обработка информации (по отраслям) , 05.13.18 - Математическое моделирование, численные методы и комплексы программ
В статье рассматриваются возможные направления для использования результатов жанровой классификации Веб документов в поисковых системах. Предложенные методы могут повысить качество поисковых систем.
Ключевые слова: классификация Веб документов, текстовые документы, поисковые системы, поисковая выдача, качество поиска, разнообразие
05.13.18 - Математическое моделирование, численные методы и комплексы программ
Сведения об авторах выпуска №4 ч.2 (2012)
Ключевые слова: авторы