ВУЗ:
Составители:
Рубрика:
Заголовки
(названия) страниц
pageID
заголовок
Адреса страниц
(URL)
pageID
URL
Дата модификации
страниц
pageID
дата индексации
дата модификации
Прямой
список
pageID
kwdID
вес термина
в документе
Ключевые слова
kwdID
термин
Инвертированный
список
kwdID
pageID
позиция термина
в документе
Ссылки страниц
pageID
входящие ссылки
(pageID)
исходящие
ссылки (pageID)
Рис. 10. Структура базы данных поисковых образов
Таблица адресов страниц содержит уникальные идентификаторы (pageID) и ад-
реса страниц (URL
1
).
Таблица ключевых слов содержит термины и их уникальные идентификаторы
(kwdID).
Таблица с заголовками страниц ставит в соответствие каждому идентификато-
ру страниц pageID название этой страницы.
Таблица с датами изменения страниц фиксирует для каждой страницы pageID
дату последнего посещения этой страницы индексационным роботом (т. е. дату ин-
дексации этой страницы). Она используется при обновлении базы данных: если со-
держание страницы изменилось со времени последней индексации, ее следует
проиндексировать заново. В этой таблице также хранятся даты модификации стра-
1
URL – сокр. от англ. Uniform Resource Locator – унифицированный указатель информационного ре-
сурса (стандартизованная строка символов, указывающая местонахождение документа в сети Интер-
нет).
32
Страницы
- « первая
- ‹ предыдущая
- …
- 30
- 31
- 32
- 33
- 34
- …
- следующая ›
- последняя »