Сетевые технологии. Учебное пособие. Баканов В.М. - 94 стр.

UptoLike

Составители: 

94
поисковых машин. Так же многие поисковые системы содержат не только
интерфейс для работы с индексом, но и каталоги.
К наиболее известным поисковым системам относятся AltaVista (разработ-
ка фирмы DEC, рис.7.13), Яndex (CompTek International), RAMBLER (Stack
Ltd., ориентирована на русскоязычный InterNet, рис.7.14), каталог YAHOO,
синтез каталога и поисковой машины Lycos и др. Всего в Сети имеется око-
ло 600
систем поиска (см.
http://www.beaucoup.com/engines.html
), доступ к не-
которым наиболее известным поисковым системам возможен по адресу
http://pilger.mgapi.ru/right_7.htm#lab_4
).
При просмотре сайтов как раз и происходит накопление ключевых слов.
Многие поисковые системы учитывают информацию из тега
<meta
name=keywords content=...>
(заполняемого разработчиком WEB-страницы) при
создании массива ключевых слов. Поисковая машина RAMBLER, например,
игнорирует содержимое этого тега и осуществляет сканирование HTML-
текста в поисках ключевых слов с учетом расположения и частоты их встре-
чаемости, разработчики RAMBLER’а считают, что такой подход повышает
релевантность (уровень соответствия между текстом запроса и документа, к
которому этот запрос
направлен) при поиске по ключевым словам.
Таким образом, поисковые системы постоянно накапливают информацию
о ресурсах сети InterNet и используют ее при запросах на поиск.
Применяются следующие модели индексирования и поиска - векторная
модель информационного потока, основанная на теории нечетких множеств
модель, вероятностная модель. Используются следующие типы информаци-
онно поисковых языков (ИПЯ
) - традиционные ИПЯ, системы взвешивания
терминов, ИПЯ типа ‘Like this’. В качестве способов коррекции результатов
поиска применяются методы фильтрации, коррекции по релевантности, кла-
стеризации. Используются следующие механизмы улучшения запроса - про-
стой запрос, сложный запрос, нормализация лексики, ранжирование, кор-
рекция по релевантности.
поисковых машин. Так же многие поисковые системы содержат не только
интерфейс для работы с индексом, но и каталоги.
   К наиболее известным поисковым системам относятся AltaVista (разработ-
ка фирмы DEC, рис.7.13), Яndex (CompTek International), RAMBLER (Stack
Ltd., ориентирована на русскоязычный InterNet, рис.7.14), каталог YAHOO,
синтез каталога и поисковой машины Lycos и др. Всего в Сети имеется око-
ло 600 систем поиска (см. http://www.beaucoup.com/engines.html), доступ к не-
которым наиболее известным поисковым системам возможен по адресу
http://pilger.mgapi.ru/right_7.htm#lab_4).
   При просмотре сайтов как раз и происходит накопление ключевых слов.
Многие поисковые системы учитывают информацию из тега  (заполняемого разработчиком WEB-страницы) при
создании массива ключевых слов. Поисковая машина RAMBLER, например,
игнорирует содержимое этого тега и осуществляет сканирование HTML-
текста в поисках ключевых слов с учетом расположения и частоты их встре-
чаемости, разработчики RAMBLER’а считают, что такой подход повышает
релевантность (уровень соответствия между текстом запроса и документа, к
которому этот запрос направлен) при поиске по ключевым словам.
   Таким образом, поисковые системы постоянно накапливают информацию
о ресурсах сети InterNet и используют ее при запросах на поиск.
   Применяются следующие модели индексирования и поиска - векторная
модель информационного потока, основанная на теории нечетких множеств
модель, вероятностная модель. Используются следующие типы информаци-
онно поисковых языков (ИПЯ) - традиционные ИПЯ, системы взвешивания
терминов, ИПЯ типа ‘Like this’. В качестве способов коррекции результатов
поиска применяются методы фильтрации, коррекции по релевантности, кла-
стеризации. Используются следующие механизмы улучшения запроса - про-
стой запрос, сложный запрос, нормализация лексики, ранжирование, кор-
рекция по релевантности.




                                    94