Теоретическая и практическая лексикография. Шилихина К.М. - 53 стр.

UptoLike

Составители: 

Рубрика: 

53
последующей лексикографической работе над новыми версиями
данного словаря.
Примером подобного рода развивающейся лексикографической базы
данных может служить «Словарь русского языка» С.И . Ожегова (под
редакцией Н.Ю . Шведовой; в последних изданиях в соавторстве с ней).
Эта база создана в Институте русского языка РАН в 1990 году, и с тех пор
она постоянно пополняется, на ее основе переиздаются обновляемые
версии этого словаря, а также проводятся лексикологические исследования
Создание электронного словаря : основные проблемы и приемы.
При определении структуры автоматического словаря необходимо
решить три основные задачи: 1) определение формы заглавной единицы; 2)
определение объема информации, которая будет включаться в описание
лексической единицы; 3) выбор оптимального способа организации
словарной статьи в базе .
Существенное значение для электронного словаря имеет выбор
основной единицы его словника . Для крупных словарей общей лексики
основной единицей является слово. Словосочетания даются обычно в
составе статей на отдельные слова .
Что касается автоматических словарей в системах машинного
перевода , то там дело с выбором единицы обстоит несколько иначе. До
80% их лексических массивов составляют словосочетания. Крупные
системы машинного перевода содержат объемные терминологические
банки данных и используются как терминологические словари . Верхняя
граница словосочетания в таких системах может быть размыта настолько,
что в качестве самостоятельных статей в них могут быть включены
отдельные предложения и даже более крупные текстовые фрагменты. В
определенных ситуациях такое решение оказывается весьма удобным . При
использовании автоматических переводных словарей для
полуавтоматического перевода (с последующим редактированием )
стандартных текстов (сопроводительной документации или юридических
текстов), где определенные фрагменты регулярно повторяются, удобно
переводить именно фрагментами.
Структура словарной статьи в различных электронных словарях
может выглядеть по - разному, объем статьи может колебаться от 10 до 99
зон , в которых фиксируется разнотипная лингвистическая и
экстралингвистическая информация. Стандартный набор включает в себя
следующие сведения: заголовочное слово, один или несколько
иноязычных эквивалентов (если речь идет о переводном словаре ),
информацию о тематической принадлежности данного слова ,
грамматическую информацию, дефиницию , контексты, информацию о
лексической сочетаемости, семантические иерархические связи заглавного
слова , информацию о стилистических характеристиках слова , источники,
фамилию автора словарной статьи, дату поступления в базу данных и
другую служебную информацию.
                                           53
послед у ю щей лексикогра ф ической ра б от е н а д                н овым и версиям и
д а н н ого слова ря.
          П рим ером под об н ого род а ра звива ю щейсялексикогра ф ической б а зы
д а н н ых м ож ет слу ж ит ь «Слова рь ру сского языка » С.И . О ж егова (под
ред а кцией Н.Ю . Ш вед овой; в послед н их изд а н иях в соа вт орст ве с н ей).
Э т а б а за созд а н а в И н ст ит у т е ру сского языка РА Н в 1990 год у , и с т ех пор
он а постоян н о пополн яет ся, н а ее осн ове переизд а ю тся об н овляем ые
версии этого слова ря, а т а кж е провод ятсялексикологические исслед ова н ия
          С оз да ни е э лек т ронного слова ря: основные проблемы и при емы.
          П ри опред елен ии ст ру кт у ры а вт ом а т ического слова рян еоб ход им о
реш ит ь т ри осн овн ые за д а чи: 1) опред елен ие ф орм ы за гла вн ой ед ин ицы; 2)
опред елен ие об ъем а ин ф орм а ции, котора яб у д ет вклю ча т ьсяв описа н ие
лексической ед ин ицы; 3) выб ор опт им а льн ого способ а орга н иза ции
слова рн ой ст а тьи в б а зе.
          Су щест вен н ое зн а чен ие д ля элект рон н ого слова ря им еет выб ор
осн овн ой ед ин ицы его словн ика . Д лякру пн ых слова рей об щей лексики
осн овн ой ед ин ицей являет ся слово. Словосочет а н ия д а ю т ся об ычн о в
сост а ве ста т ей н а отд ельн ые слова .
          Ч т о ка са ет ся а втом а т ических слова рей в си ст ема х ма ши нного
перевода , то т а м д ело с выб ором ед ин ицы об стоит н есколько ин а че. Д о
80% их лексических м а ссивов сост а вляю т словосочет а н ия. Кру пн ые
сист ем ы м а ш ин н ого перевод а сод ерж а т об ъем н ые терм ин ологические
б а н ки д а н н ых и использу ю т сяка к т ерм ин ологические слова ри. Верхн яя
гра н ица словосочета н ияв т а ких сист ем а х м ож ет б ыт ь ра зм ыт а н а столько,
чт о в ка чест ве са м остоятельн ых ст а т ей в н их м огу т б ыт ь вклю чен ы
от д ельн ые пред лож ен ияи д а ж е б олее кру пн ые т екст овые ф ра гм ен ты. В
опред елен н ых сит у а циях т а кое реш ен ие ока зыва ет сявесьм а у д об н ым . П ри
использова н ии              а вт ом а тических      перевод н ых     слова рей        д ля
полу а вт ом а т ического перевод а (с послед у ю щим ред а кт ирова н ием )
ст а н д а рт н ых т екст ов (сопровод ит ельн ой д оку м ен т а ции или ю рид ических
т екст ов), гд е опред елен н ые ф ра гм ен ты регу лярн о повторяю т ся, у д об н о
перевод ит ь им ен н о ф ра гм ен та м и.
          Ст ру кт у ра слова рн ой ста т ьи в ра зличн ых элект рон н ых слова рях
м ож ет выгляд ет ь по-ра зн ом у , об ъем ст а т ьи м ож ет колеб а т ьсяот 10 д о 99
зон , в которых ф иксиру ет ся ра зн отипн а я лин гвист ическа я и
экст ра лин гвистическа яин ф орм а ция. Ст а н д а ртн ый н а б ор вклю ча ет в себ я
след у ю щие свед ен ия: за головочн ое слово, од ин или н есколько
ин оязычн ых эквива лен т ов (если речь ид ет о перевод н ом слова ре),
ин ф орм а цию          о тем а т ической прин а д леж н ости д а н н ого слова ,
гра м м а т ическу ю ин ф орм а цию , д еф ин ицию , кон т екст ы, ин ф орм а цию о
лексической сочет а ем ости, сем а н тические иера рхические связи за гла вн ого
слова , ин ф орм а цию о ст илистических ха ра кт ерист ика х слова , источн ики,
ф а м илию а втора слова рн ой ст а т ьи, д а т у пост у плен ия в б а зу д а н н ых и
д ру гу ю слу ж еб н у ю ин ф орм а цию .