Информационные технологии в учебном процессе: Часть 2. Кревский И.Г. - 23 стр.

UptoLike

Составители: 

Поисковые системы обычно состоят из трех следующих компонентов.
Агент (паук, кроулер, робот), который сканирует сеть и собирает
информацию. Программы сканирования сети также предназначены для:
o ведения баз данных World Wide Web,
o создания "зеркал",
o поиска информационных ресурсов,
o комбинированного использования.
База данных, которая содержит всю информацию, собираемую агентами.
Поисковый механизм, который используют как интерфейс взаимодействия с
БД.
Индексированиеэто оптимизация поиска данных в информационном
пространстве по различным критериям путем введения индексов.
Средства поиска типа агентов, пауков, кроулеров и роботов используются для
сбора информации о документах, находящихся в Интернет. Это специальные программы,
которые занимаются поиском страниц в сети, извлекают гипертекстовые ссылки на этих
страницах и автоматически индексируют информацию, которую они находят для
построения базы данных. Каждый поисковый механизм имеет набор правил,
определяющих, как собирать документы. Некоторые следуют за ссылкой на каждой
найденной странице и затем исследуют каждую ссылку на каждой из новых страниц и так
далее. Некоторые игнорируют ссылки, которые ведут к графическим и звуковым файлам,
файлам мультипликации; другие игнорируют ссылки к ресурсам типа баз данных WAIS;
другие проинструктированы, что нужно просматривать только наиболее популярные
страницы.
Существуют следующие поисковые механизмы.
Search engine (поисковая машина) это поисковый WWW-сервер,
отрабатывающий запросы на поиск WWW-адресов документов по ключевым словам.
Примером может быть поисковая система Altavista. Для поисковых систем важна
конструкция документа. Большое значение имеют заголовки и содержимое страницы.
Каталоги или Index sites (индексные архивы) это WWW-сервера, содержащие
большое количество ссылок на другие сервера или на WWW-документы. Могут быть
специализированными или универсальными. Если предметная область универсальна, то
ссылки обычно иерархически классифицированы, в другом случае они упорядочены по
алфавиту. От Search engines WWW индексные архивы отличаются ограниченным числом
ссылок, их подбором и отсутствием поиска по ключевым словам. В каталог, в отличие от
поисковых машин, информация заносится по инициативе человека. Добавляемая страница
должна быть привязана к принятым в каталоге категориям. Примером каталога может
служить Yahoo. Конструкция страниц значения не имеет. Каталоги ресурсов - глобальные,
локальные, специализированные - представляют собой базы данных с адресами ресурсов и
разным масштабом накопленной информации и охватом тематики.
Метапоисковые системы. Метапоисковая система может быть реализована как в
сети, так и в виде локальной клиентской программы. Система не обладает собственной
индексной базой данных, но выступает в качестве шлюза, который передает запросы на
автономные машины и каталоги и возвращает результаты поиска.
Поисковые машины (search engines).
Поисковые WWW-сервера позволяют найти WWW-документы, относящиеся к
заданным тематикам или снабженные ключевыми словами или их комбинациями. На
      Поисковые системы обычно состоят из трех следующих компонентов.

         •   Агент (паук, кроулер, робот), который сканирует сеть и собирает
             информацию. Программы сканирования сети также предназначены для:
                       o ведения баз данных World Wide Web,
                       o создания "зеркал",
                       o поиска информационных ресурсов,
                       o комбинированного использования.
         •   База данных, которая содержит всю информацию, собираемую агентами.
         •   Поисковый механизм, который используют как интерфейс взаимодействия с
             БД.

       Индексирование – это оптимизация поиска данных в информационном
пространстве по различным критериям путем введения индексов.
       Средства поиска типа агентов, пауков, кроулеров и роботов используются для
сбора информации о документах, находящихся в Интернет. Это специальные программы,
которые занимаются поиском страниц в сети, извлекают гипертекстовые ссылки на этих
страницах и автоматически индексируют информацию, которую они находят для
построения базы данных. Каждый поисковый механизм имеет набор правил,
определяющих, как собирать документы. Некоторые следуют за ссылкой на каждой
найденной странице и затем исследуют каждую ссылку на каждой из новых страниц и так
далее. Некоторые игнорируют ссылки, которые ведут к графическим и звуковым файлам,
файлам мультипликации; другие игнорируют ссылки к ресурсам типа баз данных WAIS;
другие проинструктированы, что нужно просматривать только наиболее популярные
страницы.

       Существуют следующие поисковые механизмы.
       Search engine (поисковая машина) – это поисковый WWW-сервер,
отрабатывающий запросы на поиск WWW-адресов документов по ключевым словам.
Примером может быть поисковая система Altavista. Для поисковых систем важна
конструкция документа. Большое значение имеют заголовки и содержимое страницы.
       Каталоги или Index sites (индексные архивы) – это WWW-сервера, содержащие
большое количество ссылок на другие сервера или на WWW-документы. Могут быть
специализированными или универсальными. Если предметная область универсальна, то
ссылки обычно иерархически классифицированы, в другом случае они упорядочены по
алфавиту. От Search engines WWW индексные архивы отличаются ограниченным числом
ссылок, их подбором и отсутствием поиска по ключевым словам. В каталог, в отличие от
поисковых машин, информация заносится по инициативе человека. Добавляемая страница
должна быть привязана к принятым в каталоге категориям. Примером каталога может
служить Yahoo. Конструкция страниц значения не имеет. Каталоги ресурсов - глобальные,
локальные, специализированные - представляют собой базы данных с адресами ресурсов и
разным масштабом накопленной информации и охватом тематики.
       Метапоисковые системы. Метапоисковая система может быть реализована как в
сети, так и в виде локальной клиентской программы. Система не обладает собственной
индексной базой данных, но выступает в качестве шлюза, который передает запросы на
автономные машины и каталоги и возвращает результаты поиска.

      Поисковые машины (search engines).

      Поисковые WWW-сервера позволяют найти WWW-документы, относящиеся к
заданным тематикам или снабженные ключевыми словами или их комбинациями. На