2.4 от 29.09.1999. Полнотекстовое индексирование

2.4. Полнотекстовое индексирование

Если рассматривать классификаторы как средства поиска правовой информации, с учетом также того, что в настоящей работе будут обсуждаться принципы построения именно поисковых систем, представляется необходимым ввести еще понятие полнотекстового индексирования.

Полнотекстовое индексирование - автоматическая, компьютерная обработка текстов документов, при которой все слова, встречающиеся в текстах, заносятся в особый словарь с указанием номера документа, где встретилось данное слово. Такой словарь структурирован в алфавитном порядке, но отличается от алфавитного указателя тем, что в него автоматически включаются все слова из текстов (естественно, без союзов, междометий и т.п.), а не специально отбираемые отдельные правовые термины. Соответственно, полнотекстовый поиск по словам и словосочетаниям - автоматический поиск, основанный на использовании словаря указанного типа.

Среди специалистов нет единого мнения, следует ли считать словари этого типа также классификаторами или нет. Однако для целей и задач настоящей работы нет необходимости уточнять этот вопрос; достаточно, что полнотекстовое индексирование как специальный поисковый инструмент существует и может быть использовано в тех же целях, что и классификаторы. Это важно для дальнейшего описания концепции классификации. Поэтому для простоты изложения, употребляя термин "классификаторы", мы включаем в него и этот поисковый инструмент.