ВУЗ:
Составители:
Рубрика:
Основы работы в Internet 21
• поисковый механизм и интерфейс для взаимодействия с базой данных.
Принципы определения соответствия запроса найденному документу
(релевантности):
1) Количество слов запроса в текстовом содержимом документа (т.е. в HTML-
коде).
2) Тэги, в которых эти слова располагаются (например, в <title>)
3) Местоположение искомых слов в документе (например, в начале страницы).
4) Время
- как долго страница находится в базе поискового сервера.
5) Индекс цитируемости - как много ссылок на данную страницу ведет с других
страниц, зарегистрированных в базе поисковой системы.
На запрос пользователя поисковая система формирует упорядоченный список
документов в соответствии с перечисленными принципами.
3.2. Организация и проведение поиска информации в Internet
Метапоисковая информационно-
поисковая система - поддерживающая поиск
нескольких индексов поискового механизма одновременно (Search www.search.com
;
MetaCrawler www.Metacrawler.com
).
Главная задача информационно-поисковой системы - поиск информации,
релевантной информационным потребностям пользователя.
Язык поисковых запросов – язык формирования запроса для информационно-
поисковой системы. Поисковый запрос может состоять из одного или нескольких
слов, в нем могут присутствовать знаки препинания. В общем случае, регистр
написания поисковых слов и операторов значения не имеет, то есть
дом и ДОМ, Not и nOt
воспринимаются одинаково. Рассмотрим язык запросов на примере поисковой системы
Rambler (www.rambler.ru).
Операторы. Запрос, состоящий из нескольких слов, может содержать операторы.
Поиск операторов в документе не производится, они служат лишь инструкцией
поисковой машине. Все операторы поисковой машины бинарные, то есть имеют
левую и правую часть, каждая из которых
также является запросом (по умолчанию
состоящим из одного слова). Для изменения сферы действия операторов
(группировки нескольких слов запроса в аргумент оператора) применяются скобки и
кавычки.
Два запроса, соединенные оператором AND (логическое И) образуют сложный
запрос, которому удовлетворяют только те документы, которые одновременно
удовлетворяют обоим этим запросам. Иными словами, по запросу <собака
AND
кошка> найдутся только те документы, которые содержат и слово <собака>, и
слово <кошка>.
Каждый из операторов имеет сокращенное обозначение.
Оператор Сокращенное обозначение
AND &
OR |
NOT !
Страницы
- « первая
- ‹ предыдущая
- …
- 19
- 20
- 21
- 22
- 23
- …
- следующая ›
- последняя »