ВУЗ:
Составители:
44
Назначение тезаурусов
Для описания какой-либо
предметной области всегда используется
определенный набор терминов, каждый из
которых обозначает или описывает какое-
либо понятие или концепцию из данной
предметной области. Совокупность
терминов, описывающих данную
предметную область, с указанием
семантических отношений (связей) между
ними является тезаурусом. Такие
отношения в тезаурусе всегда указывают
на наличие смысловой (семантической)
связи между терминами.
Основным отношением (связью)
между терминами в тезаурусе является связь
между более широкими (более
выразительными) и более узкими (более
специализированными) понятиями. Часто
выделяют 2 подвида этого отношения:
− один термин обозначает
понятие, являющееся частью понятия,
обозначаемого другим термином
(например, «наука» и «математика»,
«математика» и «теория чисел»);
− один термин обозначает
элемент класса, обозначаемого другим
термином («горные районы» и «Кавказ»).
Это отношение на множестве
терминов является отношением
частичного порядка, то есть множество
терминов с такими связями образует
ациклический граф, или
полииерархическую структуру.
Существуют также и другие связи
между терминами. Например, одно
понятие или концепция может быть
обозначено несколькими терминами,
являющимися синонимами. Некоторые
термины могут быть антонимами для
других. Часто среди терминов,
относящихся к одному понятию,
выделяют единственный (для каждого
языка тезауруса) наиболее
предпочтительный (наиболее
подходящий) термин, который наиболее
хорошо характеризует, или обозначает
данное понятие. Остальные термины
являются менее предпочтительными
(менее подходящими).
Помимо вышеописанных, между
терминами могут существовать также и
другие, ассоциативные связи, если
понятия, обозначаемые этими терминами,
как-либо связаны между собою по своему
смыслу, за исключением описанных выше
иерархических связей.
В многоязычных тезаурусах
существуют также связи эквивалентности
между терминами на разных языках.
Выделяют полную (строгую)
эквивалентность, и несколько видов
частичной (нестрогой) смысловой
эквивалентности терминов на разных
языках.
Тезаурус часто содержит комментарии
к терминам, раскрывающие для пользователя
смысл термина, а также поясняющие, как
следует его использовать.
Тезаурусы применяются, прежде
всего, для классификации и поиска
информационных ресурсов. При этом
каждому ресурсу при классификации
могут быть сопоставлены одно или более
понятий, описываемых терминами в
тезаурусе, а пользователь,
осуществляющий поиск, может по
тезаурусу найти интересующие его
понятия в данной предметной области, а
также все характеризующие их термины.
То есть на основе связей тезауруса
происходит расширение поискового
запроса (расширение слов запроса
синонимичными, более общими или более
частными по смыслу терминами).
Навигация по связям тезауруса помогает
четче сформулировать сам запрос.
Кроме "общих" словарей, как при
изучении языка, так и при его
практическом использовании бывают
нужны словари идиом, сленга, синонимов,
эвфемизмов, аббревиатур, личных имен,
словоупотребления, а также словари
Назначение тезаурусов Для описания какой-либо данное понятие. Остальные термины предметной области всегда используется являются менее предпочтительными определенный набор терминов, каждый из (менее подходящими). которых обозначает или описывает какое- Помимо вышеописанных, между либо понятие или концепцию из данной терминами могут существовать также и предметной области. Совокупность другие, ассоциативные связи, если терминов, описывающих данную понятия, обозначаемые этими терминами, предметную область, с указанием как-либо связаны между собою по своему семантических отношений (связей) между смыслу, за исключением описанных выше ними является тезаурусом. Такие иерархических связей. отношения в тезаурусе всегда указывают В многоязычных тезаурусах на наличие смысловой (семантической) существуют также связи эквивалентности связи между терминами. между терминами на разных языках. Основным отношением (связью) Выделяют полную (строгую) между терминами в тезаурусе является связь эквивалентность, и несколько видов между более широкими (более частичной (нестрогой) смысловой выразительными) и более узкими (более эквивалентности терминов на разных специализированными) понятиями. Часто языках. выделяют 2 подвида этого отношения: Тезаурус часто содержит комментарии − один термин обозначает к терминам, раскрывающие для пользователя понятие, являющееся частью понятия, смысл термина, а также поясняющие, как обозначаемого другим термином следует его использовать. (например, «наука» и «математика», Тезаурусы применяются, прежде «математика» и «теория чисел»); всего, для классификации и поиска − один термин обозначает информационных ресурсов. При этом элемент класса, обозначаемого другим каждому ресурсу при классификации термином («горные районы» и «Кавказ»). могут быть сопоставлены одно или более Это отношение на множестве понятий, описываемых терминами в терминов является отношением тезаурусе, а пользователь, частичного порядка, то есть множество осуществляющий поиск, может по терминов с такими связями образует тезаурусу найти интересующие его ациклический граф, или понятия в данной предметной области, а полииерархическую структуру. также все характеризующие их термины. Существуют также и другие связи То есть на основе связей тезауруса между терминами. Например, одно происходит расширение поискового понятие или концепция может быть запроса (расширение слов запроса обозначено несколькими терминами, синонимичными, более общими или более являющимися синонимами. Некоторые частными по смыслу терминами). термины могут быть антонимами для Навигация по связям тезауруса помогает других. Часто среди терминов, четче сформулировать сам запрос. относящихся к одному понятию, Кроме "общих" словарей, как при выделяют единственный (для каждого изучении языка, так и при его языка тезауруса) наиболее практическом использовании бывают предпочтительный (наиболее нужны словари идиом, сленга, синонимов, подходящий) термин, который наиболее эвфемизмов, аббревиатур, личных имен, хорошо характеризует, или обозначает словоупотребления, а также словари 44