ВУЗ:
Составители:
Рубрика:
В информационном поиске стандартные оценки,
определяющие долю выданных релевантных докумен-
тов, а также долю релевантных документов в выдаче,
не всегда достаточны для оценки эффективности
поисковой системы. Дело в том, что эти показатели
не учитывают усилий, затрачиваемых на поиск доку-
ментов, в то время как в различных ИПС эти затра-
ты существенно различны. Поэтому полезно ввести
коэффициент трудозатрат потребителя, определяемый
следующим образом:
Чтобы обеспечить достаточную степень сравнимости
различных систем, нужно значение коэффициента h
оставлять фиксированным в пределах данного про-
цесса оценки. Другие показатели эффективности
информационного поиска см. в ([22], гл. 4, п. 8).
В заключение настоящего пункта опишем матема-
тическую модель систем избирательного распределе-
ния информации (ИРИ). Они призваны решить проб-
лему избирательности и оперативности поиска и
применяются в сравнительно небольших массивах
предварительно подобранных документов, причем
запросы, или профили интересов потребителей, более
или менее длительное время сохраняются в системе.
Идея индивидуального обслуживания, при котором
отдельные потребители или группы потребителей
оповещаются о наличии потенциально полезной для
них литературы, была формализована X. Луном в
фирме ИБМ. При этом интересы потребителей опи-
сываются посредством слов или словосочетаний
(т. е. создается профиль интересов потребителей).
Если документы при вводе их в фонд описываются
на стадии индексирования аналогичным образом, то
полученные таким способом ПОД можно сопоставить
с профилями интересов потребителей. Когда имеет
место совпадение профилей в каких-то заранее уста-
новленных пределах, потребитель извещается о нали-
чии документа, предположительно релевантного его
интересам. В системе ИРИ, в отличие от ИПС рет-
роспективного поиска, мы индексируем не документы
и запросы, а документы и интересы потребителей.
При этом весьма важно наличие определенного
235
В информационном поиске стандартные оценки, определяющие долю выданных релевантных докумен- тов, а также долю релевантных документов в выдаче, не всегда достаточны для оценки эффективности поисковой системы. Дело в том, что эти показатели не учитывают усилий, затрачиваемых на поиск доку- ментов, в то время как в различных ИПС эти затра- ты существенно различны. Поэтому полезно ввести коэффициент трудозатрат потребителя, определяемый следующим образом: Чтобы обеспечить достаточную степень сравнимости различных систем, нужно значение коэффициента h оставлять фиксированным в пределах данного про- цесса оценки. Другие показатели эффективности информационного поиска см. в ([22], гл. 4, п. 8). В заключение настоящего пункта опишем матема- тическую модель систем избирательного распределе- ния информации (ИРИ). Они призваны решить проб- лему избирательности и оперативности поиска и применяются в сравнительно небольших массивах предварительно подобранных документов, причем запросы, или профили интересов потребителей, более или менее длительное время сохраняются в системе. Идея индивидуального обслуживания, при котором отдельные потребители или группы потребителей оповещаются о наличии потенциально полезной для них литературы, была формализована X. Луном в фирме ИБМ. При этом интересы потребителей опи- сываются посредством слов или словосочетаний (т. е. создается профиль интересов потребителей). Если документы при вводе их в фонд описываются на стадии индексирования аналогичным образом, то полученные таким способом ПОД можно сопоставить с профилями интересов потребителей. Когда имеет место совпадение профилей в каких-то заранее уста- новленных пределах, потребитель извещается о нали- чии документа, предположительно релевантного его интересам. В системе ИРИ, в отличие от ИПС рет- роспективного поиска, мы индексируем не документы и запросы, а документы и интересы потребителей. При этом весьма важно наличие определенного 235
Страницы
- « первая
- ‹ предыдущая
- …
- 233
- 234
- 235
- 236
- 237
- …
- следующая ›
- последняя »