Применение нечетких деревьев решений для рубрицирования неструктурированных текстовых документов небольшого размера. М. И. Дли

Техническая литература. Прикладная информатика. Научные статьи

Скачать книгу
Читать онлайн

Применение нечетких деревьев решений для рубрицирования неструктурированных текстовых документов небольшого размера


Год выпуска 2019

isbn

Автор произведения М. И. Дли

Жанр Техническая литература

Серия Прикладная информатика. Научные статьи

Издательство Синергия


Ежедневно на Интернет-порталы органов государственной власти поступает большое количество электронных обращений (заявлений, предложений или жалоб), представленных в неструктурированном текстовом виде. Качество и скорость автоматической обработки указанных сообщений напрямую зависит от правильности их классификации (отнесения к конкретной предметной области), в основе которой лежат их отличительные особенности. Однако специфика таких сообщений (небольшой размер, наличие ошибок, отсутствие четкой структуры и т.д.) не позволяет использовать известные методы рубрицирования текстовых документов. Авторами разработана модель рубрицирования электронных неструктурированных текстовых документов с учетом синтаксических связей и ролей слов в предложениях на основе нечеткого дерева решений. Построение дерева решений основано на анализе степени пересечений словарей рубрик, а также расстояний между рубриками в n-мерном пространстве признаков. Данная модель позволяет более точно рубрицировать электронные неструктурированные текстовые документы в условиях взаимосвязанных рубрик, а также повысить оперативность обработки поступивших документов.