DOI

Для решения задачи автоматической стилевой классификации текстов были применены методы дискриминантного анализа. В качестве возможных факторов классификации рассматривались индекс триграмм (ИТ), индекс биграмм (ИБ), их отношение (ИТ/ИБ), индекс сжимаемости текстов (Deflate), а также информационные индексы: соотношение порядка и хаоса в системе – так называемая R-функция (Rf), и функция развития (Df). Найдены оптимальные сочетания индексов для решения этой задачи. Удалось добиться значительного улучшения качества классификации текстов при одновременном уменьшении количества используемых индексов по сравнению с предыдущими работами.
Переведенное названиеIMPROVING THE QUALITY OF STYLISTIC CLASSIFICATION OF RUSSIAN-LANGUAGE TEXTS BASED ON STATISTICAL INDEXES: book chapter
Язык оригиналаРусский
Название основной публикацииERGO... ПРОБЛЕМЫ МЕТОДОЛОГИИ МЕЖДИСЦИПЛИНАРНЫХ ИССЛЕДОВАНИЙ И КОМПЛЕКСНОГО ОБЕСПЕЧЕНИЯ НАУЧНО-ИССЛЕДОВАТЕЛЬСКОЙ ДЕЯТЕЛЬНОСТИ
Подзаголовок основной публикациисборник статей
РедакторыП.П. Трескова
Место публикацииЕкатеринбург
ИздательООО "Издательство УМЦ УПИ"
Страницы74-84
Число страниц11
ISBN (печатное издание)978-5-8295-0848-7
DOI
СостояниеОпубликовано - 2022

    ГРНТИ

  • 20.19.27 Автоматизация знаковой обработки текста

ID: 42057884