Основы прикладной лингвистики. Шилихина К.М. - 16 стр.

UptoLike

Составители: 

Рубрика: 

16
Запрос вербально выраженная потребность пользователя в
определенной информации.
Документ - любой осмысленный текст , который обладает определенной
логической завершенностью и содержит сведения о его источнике и создателе.
Документы хранятся в базе данных ИПС.
Информационно - поисковый язык формальный язык, предназначенный
для описания отдельных аспектов содержания документов, а также
формулировки запроса для информационно-поисковой системы.
Дескрипторы - лексические единицы информационно-поискового языка .
Дескриптор ставится в однозначное соответствие группе ключевых слов
естественного языка , отобранных из текста определенной предметной области.
Например, в качестве дескриптора может быть выбрано любое
(предпочтительно наиболее часто используемое или короткое) ключевое слово
или словосочетание или же цифровой код . Многозначному слову естественного
языка соответствует несколько дескрипторов, а нескольким синонимичным
словам и выражениям - один дескриптор.
Тезаурус - специально организованный нормативный словарь
лексических единиц информационно-поискового и естественного языка .
Назначение тезауруса помочь пользователю сформулировать
информационный запрос так, чтобы он был правильно понят системой.
Тезаурус учитывает семантические связи между словами: антонимию,
синонимию, родовидовые отношения, ассоциации.
Индексирование выражение центральной темы какого - либо текста или
описание какого - либо объекта на информационно-поисковом языке.
Поисковый образ документа определенный информационный код ,
который в результате индексирования присваивается каждому документу,
входящему в базу данных конкретной информационно-поисковой системы.
Поисковое предписание текст на информационно-поисковом языке,
содержащий признаки документов, затребованных пользователем в запросе.
Формальная релевантность Соответствие поискового образа документа
поисковому предписанию
Смысловая релевантность Действительное соответствие содержания
выданного документа содержанию запроса
Точность поиска отношение между количеством выданных
релевантных текстов к общему количеству выданных системой текстов.
Полнота поиска соотношение между количеством выданных
релевантных текстов или документов к общему количеству релевантных
документов, имеющихся в данной информационной системе. В идеальном
случае количественное выражение полного и точного поиска равно единице.
Классификация ИПС
По характеру поискового массива и выдаваемой информации ИПС
подразделяют на документальные и фактографические .
Документальная ИПС предназначена для поиска документов (статей,
книг, отчетов, описаний к авторским свидетельствам и патентам), содержащих
необходимую информацию. Поисковый массив такой ИПС состоит из
                                             16
         За прос – верб а льн о выра ж ен н а я потреб н ост ь          пользова т еля        в
опред елен н ой ин ф орм а ции.
         Докум е нт - люб ой осм ыслен н ый т екст , который об ла д а ет опред елен н ой
логической за верш ен н ост ью и сод ерж ит свед ен ияо его источн ике и созд а теле.
Д оку м ен т ы хра н ятсяв б а зе д а н н ых И П С.
         И нформ а ционно-поис ков ый я зык – ф орм а льн ый язык, пред н а зн а чен н ый
д ля описа н ия отд ельн ых а спект ов сод ерж а н ия д оку м ен т ов, а т а кж е
ф орм у лировки за проса д ляин ф орм а цион н о-поисковой систем ы.
         Де с крипт оры - лексические ед ин ицы ин ф орм а цион н о-поискового языка .
Д ескриптор ст а вится в од н озн а чн ое соот вет ст вие гру ппе ключевых слов
ест ест вен н ого языка , отоб ра н н ых изт екст а опред елен н ой пред м етн ой об ла сти.
Н а прим ер, в ка чест ве д ескрипт ора                 м ож ет б ыт ь выб ра н о люб ое
(пред почт ительн о н а иб олее ча сто использу ем ое или короткое) ключевое слово
или словосочета н ие или ж е циф ровой код . М н огозн а чн ом у слову ест ест вен н ого
языка соот ветст ву ет н есколько д ескрипторов, а н ескольким син он им ичн ым
слова м и выра ж ен иям - од ин д ескрипт ор.
         Т е за урус     - специа льн о орга н изова н н ый н орм а тивн ый слова рь
лексических ед ин иц ин ф орм а цион н о-поискового и ест ест вен н ого языка .
Н а зн а чен ие       т еза у ру са     –     пом очь    пользова т елю     сф орм у лирова ть
ин ф орм а цион н ый за прос т а к, чт об ы он б ыл пра вильн о пон ят сист ем ой.
Теза у ру с у чит ыва ет сем а н тические связи м еж д у слова м и: а н тон им ию,
син он им ию, род овид овые от н ош ен ия, а ссоциа ции.
         И нде кс иров а ние – выра ж ен ие цен тра льн ой т ем ы ка кого-либ о текста или
описа н ие ка кого-либ о об ъ ект а н а ин ф орм а цион н о-поисковом языке.
         П оис ков ый обра з докум е нт а – опред елен н ый ин ф орм а цион н ый код ,
кот орый в резу льт а т е ин д ексирова н ия присва ива ется ка ж д ом у д оку м ен т у ,
вход ящем у в б а зу д а н н ых кон кретн ой ин ф орм а цион н о-поисковой сист ем ы.
         П оис ков ое пре дпис а ние – т екст н а ин ф орм а цион н о-поисковом языке,
сод ерж а щий призн а ки д оку м ен т ов, за треб ова н н ых пользова т елем в за просе.
         Форм а л ьна я ре л е в а нт нос т ь– Соот ветствие поискового об ра за д оку м ен т а
поисковом у пред писа н ию
         См ыс л ов а я ре л е в а нт нос т ь – Д ействит ельн ое соот ветст вие сод ерж а н ия
выд а н н ого д оку м ен т а сод ерж а н ию за проса
         Т очнос т ь поис ка – от н ош ен ие м еж д у количест вом выд а н н ых
релева н т н ых текстов к об щем у количест ву выд а н н ых сист ем ой т екстов.
         П ол нот а поис ка – соотн ош ен ие м еж д у количеством выд а н н ых
релева н т н ых т екстов или д оку м ен т ов к об щем у количест ву релева н т н ых
д оку м ен т ов, им еющихся в д а н н ой ин ф орм а цион н ой сист ем е. В ид еа льн ом
слу ча е количест вен н ое выра ж ен ие полн ого и точн ого поиска ра вн о ед ин ице.
         К л а с с ифика ция И П С
     П о ха ра кт еру поискового м а ссива и выд а ва ем ой ин ф орм а ции И П С
под ра зд еляют н а докум е нт а л ьные и фа кт огра фиче с кие .
        Докум е нт а л ьна я И П С пред н а зн а чен а д ля поиска д оку м ен тов (ст а т ей,
кн иг, от четов, описа н ий к а вт орским свид етельст ва м и па т ен т а м ), сод ерж а щих
н еоб ход им у ю ин ф орм а цию. П оисковый м а ссив т а кой И П С сост оит из