Введение в информационно-поисковые системы. Иванов В.К - 11 стр.

UptoLike

Составители: 

Нерелевантные документы, которые сравниваются с релевантными, иногда на-
зываются шумом, по аналогии с теорией передачи информации К. Шеннона. Реле-
вантные документы в таком случае можно называть сигналом, а эффективность по-
иска оценивать по соотношению "сигнал - шум".
Слишком большой шум затрудняет выделение пертинентных документов из
множества найденных, а слишком малый не даёт уверенности в достаточной полно-
те поиска. Практика показывает, что пользователь, который ищет информацию, по-
лагает число найденных документов удовлетворительным, когда количество непер-
тинентных документов лежит в интервале 10–30% от общего числа найденных [].
Важно отметить, что в результате анализа статистики запросов большого числа
пользователей к известным поисковым системам выяснилось, что средняя длина
запроса не превышает двух слов, и пользователи, как правило, используют самую
простую форму запроса. Поэтому нельзя рассчитывать на то, что пользователь по-
исковой системы будет формулировать достаточно сложные эффективные запросы.
Современная поисковая система должна самостоятельно выявлять информацион-
ные потребности конкретного пользователя и учитывать их при поиске [, ].
1.4. Общая схема процесса поиска
Существует два базовых подхода к поиску информации [, ]. Один из них заклю-
чается в использовании специальных тематических каталогов и реализуется в клас-
сификационных ИПС. Для поиска документа в этом случае используются его назва-
ние, выходные данные, тематика и другие реквизиты.
Второй подход, применяемый в словарных ИПС, использует для поиска слова-
ри, составленные из терминов, описывающих содержание индексированных доку-
ментов, с которыми работают программные средства, называемые поисковыми ма-
шинами. Наиболее продуктивной схемой поиска является комплексное использова-
ние обоих основных подходов.
Независимо от типа поисковой системы
1
, все операции информационного поис-
ка можно разбить на четыре группы []:
информационный анализ,
хранение информации,
поисковые операции,
выдача информации.
Общая схема процесса поиска в информационно-поисковой системе представ-
лена на рис. Рис. 3.
1
Подробнее о типах современных ИПС см. Часть 2 методических указаний.
11