ВУЗ:
Составители:
Рубрика:
(d
3
, r
1
), ..., (d
n
, r
2
, r
5
). Из этого выражения видно, что
дескрипторы d
1
и d
3
входят в один фрагмент ПОД, в
то же время d
1
совместно с d
n
входит в другой
фрагмент; совместно используются d
2
и d
n
. Отсутст-
вие или наличие фрагментирования, а также типы,
грамматик являются одними из критериев классифи-
каций ИПС.
Итак, на основании проведенного выше теоретико-
множественного анализа логико-лингвистических уни-
версалий ИПЯ построена классификация поисковых
языков по признакам тех или иных частей общей,
теоретико-множественной модели ИПЯ. Теперь нам
необходимо описать отношения (функцию индексиро-
вания и критерии соответствия), входящие как эле-
менты в теоретико-множественную модель ИПС.
Цель процесса индексирования в ИПС — приписать
каждой единице хранения некоторое множество иден-
тификаторов, отражающих содержание документов.
Способы индексирования с применением методов
математической логики были описаны ранее в § 6
(см. также [22], гл. 4, п. 5). Обычно процесс индекси-
рования включает в себя одну или несколько из сле-
дующих операций:
— отбор терминов (дескрипторов п т. д.), харак
теризующих содержание данного документа;
— приписывание этим терминам некоторого веса,
отражающего их предполагаемую важность;
— отнесение каждого термина к определенному
классу свойств, объектов и т. д.;
— определение отношений между терминами (си
нонимических, лексикографических, иерархических и
т. д.).
Если ПОД состоит из одной лексической единицы
ИПЯ, например, одного классификационного индекса,
то имеем одноаспектное индексирование. Пусть D
= {d
1
, d
2
, ..., d
n
} —множество документов, в котором
производится поиск, a S= {s
1
, s
2
, ..., s
m
} —лексический
состав ИПЯ. При многоаспектном индексировании
каждому документу однозначно соответствует
некоторый набор лексических единиц из S, образую-
щих ПОД. Иными словами, элементы множества D
отображаются в множество S: d
i
→ ПОД = {s
i1
, s
i2
,
..., ..., s
ir
}. В множестве D может содержаться
несколько документов, имеющих одинаковый образ в
S. Поэто-
12* 179
(d3, r1), ..., (dn, r2, r5). Из этого выражения видно, что
дескрипторы d1 и d3 входят в один фрагмент ПОД, в
то же время d1 совместно с dn входит в другой
фрагмент; совместно используются d2 и dn. Отсутст-
вие или наличие фрагментирования, а также типы,
грамматик являются одними из критериев классифи-
каций ИПС.
Итак, на основании проведенного выше теоретико-
множественного анализа логико-лингвистических уни-
версалий ИПЯ построена классификация поисковых
языков по признакам тех или иных частей общей,
теоретико-множественной модели ИПЯ. Теперь нам
необходимо описать отношения (функцию индексиро-
вания и критерии соответствия), входящие как эле-
менты в теоретико-множественную модель ИПС.
Цель процесса индексирования в ИПС — приписать
каждой единице хранения некоторое множество иден-
тификаторов, отражающих содержание документов.
Способы индексирования с применением методов
математической логики были описаны ранее в § 6
(см. также [22], гл. 4, п. 5). Обычно процесс индекси-
рования включает в себя одну или несколько из сле-
дующих операций:
— отбор терминов (дескрипторов п т. д.), харак
теризующих содержание данного документа;
— приписывание этим терминам некоторого веса,
отражающего их предполагаемую важность;
— отнесение каждого термина к определенному
классу свойств, объектов и т. д.;
— определение отношений между терминами (си
нонимических, лексикографических, иерархических и
т. д.).
Если ПОД состоит из одной лексической единицы
ИПЯ, например, одного классификационного индекса,
то имеем одноаспектное индексирование. Пусть D
= {d1, d2, ..., dn} —множество документов, в котором
производится поиск, a S= {s1, s2, ..., sm} —лексический
состав ИПЯ. При многоаспектном индексировании
каждому документу однозначно соответствует
некоторый набор лексических единиц из S, образую-
щих ПОД. Иными словами, элементы множества D
отображаются в множество S: d i → ПОД = {s i1 , s i2 ,
..., ..., sir}. В множестве D может содержаться
несколько документов, имеющих одинаковый образ в
S. Поэто-
12* 179
Страницы
- « первая
- ‹ предыдущая
- …
- 177
- 178
- 179
- 180
- 181
- …
- следующая ›
- последняя »
