parser

Написать ответ на текущее сообщение

 

 
   команды управления поиском

Ответ

Никита Козин 23.10.2007 12:04

«Путин» и «путин» не совпадет )

А вообще я так вижу алгоритм реализации:

1. Делаем ^string.lower[]
2. Делаем ^string.replace[] и убираем из текста все знаки препинания.
3. ^string.split[] по пробельному символу.
4. Переводим таблицу в хеш ^table.hash[][$.distinct[tables]]
5. Крутим таблицу тегов: ^table.menu{ ^if( $hash.field ) … }

На больших объемах будет медленно.

И еще надо приводить слова к первоначальной форме, чтобы к словам «Путину», «Путина» и т.д. привязывался бы тег «путин».