ВУЗ:
Составители:
Рубрика:
53
последующей лексикографической работе над новыми версиями
данного словаря.
Примером подобного рода развивающейся лексикографической базы
данных может служить «Словарь русского языка» С.И . Ожегова (под
редакцией Н.Ю . Шведовой; в последних изданиях в соавторстве с ней).
Эта база создана в Институте русского языка РАН в 1990 году, и с тех пор
она постоянно пополняется, на ее основе переиздаются обновляемые
версии этого словаря, а также проводятся лексикологические исследования
Создание электронного словаря : основные проблемы и приемы.
При определении структуры автоматического словаря необходимо
решить три основные задачи: 1) определение формы заглавной единицы; 2)
определение объема информации, которая будет включаться в описание
лексической единицы; 3) выбор оптимального способа организации
словарной статьи в базе .
Существенное значение для электронного словаря имеет выбор
основной единицы его словника . Для крупных словарей общей лексики
основной единицей является слово. Словосочетания даются обычно в
составе статей на отдельные слова .
Что касается автоматических словарей в системах машинного
перевода , то там дело с выбором единицы обстоит несколько иначе. До
80% их лексических массивов составляют словосочетания. Крупные
системы машинного перевода содержат объемные терминологические
банки данных и используются как терминологические словари . Верхняя
граница словосочетания в таких системах может быть размыта настолько,
что в качестве самостоятельных статей в них могут быть включены
отдельные предложения и даже более крупные текстовые фрагменты. В
определенных ситуациях такое решение оказывается весьма удобным . При
использовании автоматических переводных словарей для
полуавтоматического перевода (с последующим редактированием )
стандартных текстов (сопроводительной документации или юридических
текстов), где определенные фрагменты регулярно повторяются, удобно
переводить именно фрагментами.
Структура словарной статьи в различных электронных словарях
может выглядеть по - разному, объем статьи может колебаться от 10 до 99
зон , в которых фиксируется разнотипная лингвистическая и
экстралингвистическая информация. Стандартный набор включает в себя
следующие сведения: заголовочное слово, один или несколько
иноязычных эквивалентов (если речь идет о переводном словаре ),
информацию о тематической принадлежности данного слова ,
грамматическую информацию, дефиницию , контексты, информацию о
лексической сочетаемости, семантические иерархические связи заглавного
слова , информацию о стилистических характеристиках слова , источники,
фамилию автора словарной статьи, дату поступления в базу данных и
другую служебную информацию.
53 послед у ю щей лексикогра ф ической ра б от е н а д н овым и версиям и д а н н ого слова ря. П рим ером под об н ого род а ра звива ю щейсялексикогра ф ической б а зы д а н н ых м ож ет слу ж ит ь «Слова рь ру сского языка » С.И . О ж егова (под ред а кцией Н.Ю . Ш вед овой; в послед н их изд а н иях в соа вт орст ве с н ей). Э т а б а за созд а н а в И н ст ит у т е ру сского языка РА Н в 1990 год у , и с т ех пор он а постоян н о пополн яет ся, н а ее осн ове переизд а ю тся об н овляем ые версии этого слова ря, а т а кж е провод ятсялексикологические исслед ова н ия С оз да ни е э лек т ронного слова ря: основные проблемы и при емы. П ри опред елен ии ст ру кт у ры а вт ом а т ического слова рян еоб ход им о реш ит ь т ри осн овн ые за д а чи: 1) опред елен ие ф орм ы за гла вн ой ед ин ицы; 2) опред елен ие об ъем а ин ф орм а ции, котора яб у д ет вклю ча т ьсяв описа н ие лексической ед ин ицы; 3) выб ор опт им а льн ого способ а орга н иза ции слова рн ой ст а тьи в б а зе. Су щест вен н ое зн а чен ие д ля элект рон н ого слова ря им еет выб ор осн овн ой ед ин ицы его словн ика . Д лякру пн ых слова рей об щей лексики осн овн ой ед ин ицей являет ся слово. Словосочет а н ия д а ю т ся об ычн о в сост а ве ста т ей н а отд ельн ые слова . Ч т о ка са ет ся а втом а т ических слова рей в си ст ема х ма ши нного перевода , то т а м д ело с выб ором ед ин ицы об стоит н есколько ин а че. Д о 80% их лексических м а ссивов сост а вляю т словосочет а н ия. Кру пн ые сист ем ы м а ш ин н ого перевод а сод ерж а т об ъем н ые терм ин ологические б а н ки д а н н ых и использу ю т сяка к т ерм ин ологические слова ри. Верхн яя гра н ица словосочета н ияв т а ких сист ем а х м ож ет б ыт ь ра зм ыт а н а столько, чт о в ка чест ве са м остоятельн ых ст а т ей в н их м огу т б ыт ь вклю чен ы от д ельн ые пред лож ен ияи д а ж е б олее кру пн ые т екст овые ф ра гм ен ты. В опред елен н ых сит у а циях т а кое реш ен ие ока зыва ет сявесьм а у д об н ым . П ри использова н ии а вт ом а тических перевод н ых слова рей д ля полу а вт ом а т ического перевод а (с послед у ю щим ред а кт ирова н ием ) ст а н д а рт н ых т екст ов (сопровод ит ельн ой д оку м ен т а ции или ю рид ических т екст ов), гд е опред елен н ые ф ра гм ен ты регу лярн о повторяю т ся, у д об н о перевод ит ь им ен н о ф ра гм ен та м и. Ст ру кт у ра слова рн ой ста т ьи в ра зличн ых элект рон н ых слова рях м ож ет выгляд ет ь по-ра зн ом у , об ъем ст а т ьи м ож ет колеб а т ьсяот 10 д о 99 зон , в которых ф иксиру ет ся ра зн отипн а я лин гвист ическа я и экст ра лин гвистическа яин ф орм а ция. Ст а н д а ртн ый н а б ор вклю ча ет в себ я след у ю щие свед ен ия: за головочн ое слово, од ин или н есколько ин оязычн ых эквива лен т ов (если речь ид ет о перевод н ом слова ре), ин ф орм а цию о тем а т ической прин а д леж н ости д а н н ого слова , гра м м а т ическу ю ин ф орм а цию , д еф ин ицию , кон т екст ы, ин ф орм а цию о лексической сочет а ем ости, сем а н тические иера рхические связи за гла вн ого слова , ин ф орм а цию о ст илистических ха ра кт ерист ика х слова , источн ики, ф а м илию а втора слова рн ой ст а т ьи, д а т у пост у плен ия в б а зу д а н н ых и д ру гу ю слу ж еб н у ю ин ф орм а цию .
Страницы
- « первая
- ‹ предыдущая
- …
- 51
- 52
- 53
- 54
- 55
- …
- следующая ›
- последняя »