Методы автоматической классификации текстов на естественном языке
Шевелёв О.Г.
В учебном пособии дастся подробное описание некоторых признаковых и потоковых методов классификации текстов. Приводятся примеры классификации текстов по авторству, жанровому типу, источникам. Затрагиваются смежные проблемы: предобработка текстов, выбор признаков, определение и тестирование качества классификации, влияние объемов текстовых фрагментов на качество классификации, эффективное построение суффиксных деревьев.Для программистов, лингвистов, а также всех, кто интересуется автоматическим анализом текстов и знаком с основами математической статистики и программирования.