ВУЗ:
Составители:
Рубрика:
ИПС, работающие с булевой моделью поиска, имеют ряд недостатков [, ].
1.Обычные булевы запросы затрудняют варьирование глубины поиска с целью
выдачи большего или меньшего количества документов в зависимости от требова-
ний пользователя. Для получения желаемого уровня эффективности необходимо
найти правильную формулировку запроса: не слишком широкую и не слишком узкую.
Оператор AND может привести к резкому сокращению числа найденных документов,
а оператор OR, напротив, может чрезмерно расширить запрос и выделить нужную
информацию из информационного шума будет трудно. Результат поиска также силь-
но зависит от того, насколько типичными для базы данных ключевых слов являются
термины запроса. Поэтому для успешного применения булевой модели следует хо-
рошо ориентироваться в предметной лексике. Для повышения результативности со-
здаются специальные словари - тезаурусы, которые содержат информацию о связи
терминов друг с другом.
2.При использовании булевой логики нельзя получить эффект от функций сов-
падения векторов, которые дают непрерывный спектр совпадений (полных, частич-
ных или нулевых) между запросами поисковыми образами документов. Это обстоя-
тельство приводит к жесткому требованию "все или ничего" на выходе.
3.Еще одним минусом является тот факт, что множество выданных документов
не может быть представлено пользователю в ранжированном
1
виде, например в по-
рядке уменьшения сходства между документом и запросом. Документ либо полно-
стью соответствует запросу, либо не соответствует совсем. Эта проблема может
быть решена с помощью взвешенного булева поиска, при котором производится ча-
стичное ранжирование с использованием весов терминов
i
W
. Результаты поиска
располагаются в порядке уменьшения весов совпавших терминов [, , ].
Несмотря на описанные недостатки, булева модель поиска широко применяет-
ся в современных ИПС из-за простоты ее реализации.
1.2. Функции подобия "документ-запрос"
Негативные свойства, характерные для булевого алгоритма поиска, обусловле-
ны употреблением в запросе логических операторов, приводящих к жестким услови-
ям поиска. Одним из решений этой проблемы является отказ от их использования и,
как следствие, разработка каких-либо других алгоритмов поиска.
Многие современные ИПС реализуют модели поиска информации, основанные
на вычислении мер близости документов и запросов []. ИПЯ, используемые в таких
1
Ранжирование – упорядочение результатов поиска по некоторому критерию соответствия их инфор-
мационной потребности пользователя.
6
Страницы
- « первая
- ‹ предыдущая
- …
- 6
- 7
- 8
- 9
- 10
- …
- следующая ›
- последняя »