Предложен подход для реализации высокорелевантного поиска и автоматической категоризации интернет-ресурсов. Рассматривается механизм индексации интернет-ресурсов, т.е. преобразования их в единый формат посредством выделения терминов и присвоения им весовых коэффициентов, что позволяет достаточно быстро и эффективно оценить содержимое интернет-ресурса. Рассматривается задача, связанная с автоматической категоризацией интернет-ресурсов, обучением системы и отнесением текстовой информации к заранее определенной категории за счет использования степени соответствия между категорией и интернет-ресурсом