Теоретическая и практическая лексикография. Шилихина К.М. - 52 стр.

UptoLike

Составители: 

Рубрика: 

52
Что касается собственно автоматических словарей и
лексикографи-ческих баз данных, то первые электронные словари
появились вместе с первыми системами автоматического перевода это
были базы данных по двум языкам, причем каждая система машинного
перевода имела свой собственный словарь , составленный для тех текстов,
которые переводились данной программой. Словарь был ядром любой
программы машинного перевода, в которой была заложена стратегия
прямого перевода. Программа обращалась к словарю , чтобы на выходе
выдать пользователю переводной эквивалент. Сегодня электронные
словари используются как составные части многих приложений,
направленных на обработку естественного языка : в информационно-
поисковых системах, программах автоматического перевода, системах
распознавания и синтеза речи. Помимо этого , многие традиционные
словари сегодня имеют электронные аналоги . Самым известным
реализованным проектом является издание Oxford English Dictionary (12
томов на одном компакт -диске) и New Oxford English Dictionary.
Электронные версии позволяют пользователю осуществлять быстрый
поиск по разным параметрам.
Создатели электронных версий бумажных словарей столкнулись с
рядом проблем . Во - первых, необходимо было стандартизировать пометы и
сокращения. Оказалось, что в бумажных версиях словарей лексикографы
допускали различные варианты написания одних и тех же помет и
сокращений. В результате компьютер оказывался неспособным к поиску
информации в условиях вариативности.
Следующая проблема состояла в том , чтобы сделать дефиниции
однотипных понятий стандартными. Это нужно для того , чтобы при
необходимости пользователь мог получить названия и дефиниции всех
таких понятий по одному запросу (например, если система получает
запрос «речная рыба», то ответом может быть список всех речных рыб из
словаря). Для решения этой проблемы были испробованы различные
технологии, например, создание тезаурусов или перекрестных ссылок в
базе данных.
Еще одна проблема, с которой пришлось столкнуться первым
создателям электронных вариантов традиционных словарей, заключалась в
том , что при формировании типографского макета словаря пришлось
игнорировать те приемы, которые используются в печатном деле, а вместо
них использовать логические ограничители полей в базах данных. Сегодня
эта проблема практически решена, поскольку новые словари изначально
создаются как базы данных, а уже на их основе формируются
типографские макеты словарей.
Таким образом , перевод в машинную форму ранее опубликованных
книжных словарей позволяет «разложить по полочкам» содержимое
каждого из них. Только так можно осуществить эффективный контроль
полноты и последовательности заполнения полей в статьях словаря, а
также эффективно использовать и контролировать информацию в
                                          52
          Ч т о ка са ет ся соб ст вен н о а вт ом а тических         слова рей        и
лексикогра ф и-ческих б а з д а н н ых, то первые элект рон н ые слова ри
появились вм есте с первым и сист ем а м и а втом а тического перевод а – эт о
б ыли б а зы д а н н ых по д ву м языка м , причем ка ж д а ясист ем а м а ш ин н ого
перевод а им ела свой соб ст вен н ый слова рь, сост а влен н ый д лят ех т екст ов,
кот орые перевод ились д а н н ой програ м м ой. Слова рь б ыл яд ром лю б ой
програ м м ы м а ш ин н ого перевод а , в кот орой б ыла за лож ен а ст ра т егия
прям ого перевод а . П рогра м м а об ра ща ла сь к слова рю , чтоб ы н а выход е
выд а т ь пользова т елю перевод н ой эквива лен т. Сегод н я элект рон н ые
слова ри использу ю т ся ка к сост а вн ые ча ст и м н огих прилож ен ий,
н а пра влен н ых н а об ра б от ку ест ест вен н ого языка : в ин ф орм а цион н о-
поисковых сист ем а х, програ м м а х а втом а тического перевод а , сист ем а х
ра спозн а ва н ия и син т еза речи. П ом им о этого, м н огие т ра д ицион н ые
слова ри сегод н я им ею т элект рон н ые а н а логи. Са м ым известн ым
реа лизова н н ым проект ом являет сяизд а н ие Oxford English Dictionary (12
т ом ов н а од н ом ком па кт -д иске) и New Oxford English Dictionary.
Э лект рон н ые версии позволяю т пользова т елю осу щест влять б ыстрый
поиск по ра зн ым па ра м етра м .
         Созд а т ели элект рон н ых версий б у м а ж н ых слова рей столкн у лись с
ряд ом проб лем . Во-первых, н еоб ход им о б ыло ста н д а рт изирова т ь пом ет ы и
сокра щен ия. О ка за лось, что в б у м а ж н ых версиях слова рей лексикогра ф ы
д опу ска ли ра зличн ые ва риа н ты н а писа н ия од н их и т ех ж е пом ет и
сокра щен ий. В резу льт а т е ком пью т ер ока зыва лсян еспособ н ым к поиску
ин ф орм а ции в у словиях ва риа т ивн ост и.
         След у ю ща я проб лем а состояла в т ом , чтоб ы сд ела т ь д еф ин иции
од н от ипн ых пон ятий ст а н д а ртн ым и. Э то н у ж н о д ля т ого, чт об ы при
н еоб ход им ост и пользова т ель м ог полу чит ь н а зва н ия и д еф ин иции всех
т а ких пон ятий по од н ом у за просу (н а прим ер, если сист ем а полу ча ет
за прос «речн а ярыб а », т о от вет ом м ож ет б ыт ь список всех речн ых рыб из
слова ря). Д ля реш ен ия эт ой проб лем ы б ыли испроб ова н ы ра зличн ые
т ехн ологии, н а прим ер, созд а н ие теза у ру сов или перекрест н ых ссылок в
б а зе д а н н ых.
         Еще од н а проб лем а , с которой приш лось столкн у т ься первым
созд а телям элект рон н ых ва риа н т ов тра д ицион н ых слова рей, за клю ча ла сь в
т ом , что при ф орм ирова н ии типогра ф ского м а кет а слова ря приш лось
игн орирова т ь т е прием ы, кот орые использу ю тсяв печа тн ом д еле, а вм есто
н их использова т ь логические огра н ичит ели полей в б а за х д а н н ых. Сегод н я
эт а проб лем а пра кт ически реш ен а , поскольку н овые слова ри изн а ча льн о
созд а ю т ся ка к б а зы д а н н ых, а у ж е н а их осн ове ф орм иру ю т ся
т ипогра ф ские м а кет ы слова рей.
         Та ким об ра зом , перевод в м а ш ин н у ю ф орм у ра н ее опу б ликова н н ых
кн иж н ых слова рей позволяет «ра злож ит ь по полочка м » сод ерж им ое
ка ж д ого из н их. Только т а к м ож н о осу щест вит ь эф ф ект ивн ый кон троль
полн оты и послед ова т ельн ости за полн ен ия полей в ст а т ьях слова ря, а
т а кж е эф ф ект ивн о использова т ь и кон тролирова т ь ин ф орм а цию в