ВУЗ:
Составители:
Поисковые системы обычно состоят из трех следующих компонентов.
• Агент (паук, кроулер, робот), который сканирует сеть и собирает
информацию. Программы сканирования сети также предназначены для:
o ведения баз данных World Wide Web,
o создания "зеркал",
o поиска информационных ресурсов,
o комбинированного использования.
• База данных, которая содержит всю информацию, собираемую агентами.
• Поисковый механизм, который используют как интерфейс взаимодействия с
БД.
Индексирование – это оптимизация поиска данных в информационном
пространстве по различным критериям путем введения индексов.
Средства поиска типа агентов, пауков, кроулеров и роботов используются для
сбора информации о документах, находящихся в Интернет. Это специальные программы,
которые занимаются поиском страниц в сети, извлекают гипертекстовые ссылки на этих
страницах и автоматически индексируют информацию, которую они находят для
построения базы данных. Каждый поисковый механизм имеет набор правил,
определяющих, как собирать документы. Некоторые следуют за ссылкой на каждой
найденной странице и затем исследуют каждую ссылку на каждой из новых страниц и так
далее. Некоторые игнорируют ссылки, которые ведут к графическим и звуковым файлам,
файлам мультипликации; другие игнорируют ссылки к ресурсам типа баз данных WAIS;
другие проинструктированы, что нужно просматривать только наиболее популярные
страницы.
Существуют следующие поисковые механизмы.
Search engine (поисковая машина) – это поисковый WWW-сервер,
отрабатывающий запросы на поиск WWW-адресов документов по ключевым словам.
Примером может быть поисковая система Altavista. Для поисковых систем важна
конструкция документа. Большое значение имеют заголовки и содержимое страницы.
Каталоги или Index sites (индексные архивы) – это WWW-сервера, содержащие
большое количество ссылок на другие сервера или на WWW-документы. Могут быть
специализированными или универсальными. Если предметная область универсальна, то
ссылки обычно иерархически классифицированы, в другом случае они упорядочены по
алфавиту. От Search engines WWW индексные архивы отличаются ограниченным числом
ссылок, их подбором и отсутствием поиска по ключевым словам. В каталог, в отличие от
поисковых машин, информация заносится по инициативе человека. Добавляемая страница
должна быть привязана к принятым в каталоге категориям. Примером каталога может
служить Yahoo. Конструкция страниц значения не имеет. Каталоги ресурсов - глобальные,
локальные, специализированные - представляют собой базы данных с адресами ресурсов и
разным масштабом накопленной информации и охватом тематики.
Метапоисковые системы. Метапоисковая система может быть реализована как в
сети, так и в виде локальной клиентской программы. Система не обладает собственной
индексной базой данных, но выступает в качестве шлюза, который передает запросы на
автономные машины и каталоги и возвращает результаты поиска.
Поисковые машины (search engines).
Поисковые WWW-сервера позволяют найти WWW-документы, относящиеся к
заданным тематикам или снабженные ключевыми словами или их комбинациями. На
Поисковые системы обычно состоят из трех следующих компонентов. • Агент (паук, кроулер, робот), который сканирует сеть и собирает информацию. Программы сканирования сети также предназначены для: o ведения баз данных World Wide Web, o создания "зеркал", o поиска информационных ресурсов, o комбинированного использования. • База данных, которая содержит всю информацию, собираемую агентами. • Поисковый механизм, который используют как интерфейс взаимодействия с БД. Индексирование – это оптимизация поиска данных в информационном пространстве по различным критериям путем введения индексов. Средства поиска типа агентов, пауков, кроулеров и роботов используются для сбора информации о документах, находящихся в Интернет. Это специальные программы, которые занимаются поиском страниц в сети, извлекают гипертекстовые ссылки на этих страницах и автоматически индексируют информацию, которую они находят для построения базы данных. Каждый поисковый механизм имеет набор правил, определяющих, как собирать документы. Некоторые следуют за ссылкой на каждой найденной странице и затем исследуют каждую ссылку на каждой из новых страниц и так далее. Некоторые игнорируют ссылки, которые ведут к графическим и звуковым файлам, файлам мультипликации; другие игнорируют ссылки к ресурсам типа баз данных WAIS; другие проинструктированы, что нужно просматривать только наиболее популярные страницы. Существуют следующие поисковые механизмы. Search engine (поисковая машина) – это поисковый WWW-сервер, отрабатывающий запросы на поиск WWW-адресов документов по ключевым словам. Примером может быть поисковая система Altavista. Для поисковых систем важна конструкция документа. Большое значение имеют заголовки и содержимое страницы. Каталоги или Index sites (индексные архивы) – это WWW-сервера, содержащие большое количество ссылок на другие сервера или на WWW-документы. Могут быть специализированными или универсальными. Если предметная область универсальна, то ссылки обычно иерархически классифицированы, в другом случае они упорядочены по алфавиту. От Search engines WWW индексные архивы отличаются ограниченным числом ссылок, их подбором и отсутствием поиска по ключевым словам. В каталог, в отличие от поисковых машин, информация заносится по инициативе человека. Добавляемая страница должна быть привязана к принятым в каталоге категориям. Примером каталога может служить Yahoo. Конструкция страниц значения не имеет. Каталоги ресурсов - глобальные, локальные, специализированные - представляют собой базы данных с адресами ресурсов и разным масштабом накопленной информации и охватом тематики. Метапоисковые системы. Метапоисковая система может быть реализована как в сети, так и в виде локальной клиентской программы. Система не обладает собственной индексной базой данных, но выступает в качестве шлюза, который передает запросы на автономные машины и каталоги и возвращает результаты поиска. Поисковые машины (search engines). Поисковые WWW-сервера позволяют найти WWW-документы, относящиеся к заданным тематикам или снабженные ключевыми словами или их комбинациями. На
Страницы
- « первая
- ‹ предыдущая
- …
- 21
- 22
- 23
- 24
- 25
- …
- следующая ›
- последняя »