Интеллектуальные информационные системы. Дубровин А.Д. - 188 стр.

UptoLike

Составители: 

223
не
примерах
),
считая
,
что
традиционно
переводчики
-
люди
используют
подход
,
основанный
на
правилах
(«rule based translation»).
Концепция
М
.
Нагао
имеет
много
общего
с
другой
,
появившейся
чуть
позднее
,
концепцией
,
получившей
название
«
память
переводчика
»
(translation memory).
В
соответствии
с
этим
подходом
перевод
массива
текстов
определенной
тематики
вначале
делается
опытным
переводчиком
человеком
,
а
затем
оригиналы
текстов
и
их
переводы
расчленяются
на
предложения
или
фрагменты
предложений
.
Из
этих
элементов
создается
база
переводных
эквивалентов
,
которая
загружается
в
память
машины
.
С
помощью
специальной
поисковой
программы
любой
новый
фрагментированный
текст
такой
же
тематики
может
быть
переведен
автоматически
на
основе
сопоставления
с
переводными
эквивалентами
,
имеющимися
в
базе
данных
.
По
мере
перевода
новых
документов
происходит
обогащение
такой
базы
данных
.
Как
уже
было
отмечено
,
система
RETRANS
существенно
превосходит
представленные
на
российском
рынке
продукты
аналогичного
назначения
.
Столь
высокие
характеристики
ее
работы
обусловлены
не
только
положительными
сторонами
концепции
ФП
.
Дело
в
том
,
что
для
эффективного
функционирования
системы
ФП
необходимы
машинные
словари
большого
объема
.
Они
должны
создаваться
на
основе
машинной
обработки
двуязычных
текстов
,
являющихся
взаимными
переводами
в
процессе
функционирования
системы
.
Наряду
с
основным
политематическим
фразеологическим
словарем
(
ОПФС
)
большого
объема
(
не
менее
2–
х
миллионов
словосочетаний
«
длиной
»
от
17
до
1
единиц
речи
)
в
системе
используются
дополнительные
тематические
словари
(
ДТС
)
меньшего
объема
.
Дополнительные
словари
должны
содержать
только
ту
специальную
фразеологию
соответствующей
тематики
,
которой
не
может
быть
в
ОФПС
.
Помимо
ОФПС
и
ДТС
в
системе
RETRANS
могут
желанию
пользователя
создаваться
пользовательские
фразеологические
словари
(
ПФС
).
Эти
словари
играют
особую
роль
.
Дело
в
том
,
что
помимо
автоматического
режима
,
система
может
работать
и
в
интерактивном
режиме
,
когда
пользователь
имеет
возможность
управлять
процессом
,
наделяя
память
системы
,
во
-
первых
,
своими
знаниями
или
образцами
своего
научного
творчества
,
а
во
-
вторых
, -
и
примерами
своей
интеллектуальной
способности
как
переводчика
-
специалиста
.
Основным
средством
разрешения
полисемии
(
многозначности
)
слов
в
системе
RETRANS
является
использование
семантически
идентифицированных
фразеологических
словосочетаний
.
Дополнительным
средством
аналогичного
назначения
служат
ДТС
,
в
которых
для
каждого
многозначного
слова
или
словосочетания
указывается
его
приоритетный
переводной
эквивалент
,
принятый
в
данной
тематической
области
.
Большую
роль
в
системе
RETRANS
играют
разработанные
школой
Г
.
Г
.
Белоногова
алгоритмы
процедур
автоматического
морфологического
и
синтаксического
анализа
и
синтеза
русских
и
английских
текстов
,
построенные
на
основе
принципа
аналогии
.
Эти
процедуры
позволяют
отказаться
от
хранения
в
массивах
словарей
больших
объемов
грамматической
информации
,
а
порождать
ее
,
по
мере
необходимости
,
автоматически
,
непосредственно
в
ходе
рабочего
процесса
.
Такая
технология
делает
систему
открытой
,
то
есть
способной
обрабатывать
тексты
с
незнакомой
лексикой
.
Как
уже
отмечалось
,
система
RETRANS
была
выпущена
в
виде
промышленной
версии
в
1993
г
.
И
с
этого
времени
стала
использоваться
не
только
в
России
,
но
и
в
ряде
государственных
учреждений
Франции
,
Англии
и
США
.
До
1998
г
.
Все
версии
системы
были
настроены
на
работу
в
среде
MS DOS,
а
к
2000
г
.
Система
была
адаптирована
также
к
Windows 9x/NT
и
ко
всем
версиям
UNIX.
Последняя
версия
системы
(
выпущена
в
2001
г
.)
может
работать
с
любыми
форматами
текстового
процессора
MS Word (
любых
версий
),
в
среде
Web-
браузера
MS Internet Explorer
и
с
любыми
Windows-
приложениями
,
способными
копировать
тексты
в
буфер
обмена
(Clipboard).
В
настоящее
время
последняя
версия
системы
реализована
в
трех
модификациях
.
не примерах), считая, что традиционно переводчики-люди используют подход, основанный
на правилах («rule based translation»). Концепция М.Нагао имеет много общего с другой,
появившейся чуть позднее, концепцией, получившей название «память переводчика»
(translation memory). В соответствии с этим подходом перевод           массива текстов
определенной тематики вначале делается опытным переводчиком – человеком, а затем
оригиналы текстов и их переводы расчленяются на предложения или фрагменты
предложений. Из этих элементов создается база переводных эквивалентов, которая
загружается в память машины. С помощью специальной поисковой программы любой новый
фрагментированный текст такой же тематики может быть переведен автоматически на
основе сопоставления с переводными эквивалентами, имеющимися в базе данных. По мере
перевода новых документов происходит обогащение такой базы данных.
        Как уже было отмечено, система RETRANS существенно превосходит
представленные на российском рынке продукты аналогичного назначения. Столь высокие
характеристики ее работы обусловлены не только положительными сторонами концепции
ФП. Дело в том, что для эффективного функционирования системы ФП необходимы
машинные словари большого объема. Они должны создаваться на основе машинной
обработки двуязычных текстов, являющихся взаимными переводами в процессе
функционирования системы.
        Наряду с основным политематическим фразеологическим словарем (ОПФС)
большого объема (не менее 2–х миллионов словосочетаний «длиной» от 17 до 1 единиц
речи) в системе используются дополнительные тематические словари (ДТС) меньшего
объема. Дополнительные словари должны содержать только ту специальную фразеологию
соответствующей тематики, которой не может быть в ОФПС.
        Помимо ОФПС и ДТС в системе RETRANS могут желанию пользователя создаваться
пользовательские фразеологические словари (ПФС). Эти словари играют особую роль. Дело
в том, что помимо автоматического режима, система может работать и в интерактивном
режиме, когда пользователь имеет возможность управлять процессом, наделяя память
системы, во-первых, своими знаниями или образцами своего научного творчества, а во-
вторых, - и примерами своей интеллектуальной способности как переводчика-специалиста.
        Основным средством разрешения полисемии (многозначности) слов в системе
RETRANS является использование семантически идентифицированных фразеологических
словосочетаний. Дополнительным средством аналогичного назначения служат ДТС, в
которых для каждого многозначного слова или словосочетания указывается его
приоритетный переводной эквивалент, принятый в данной тематической области.
        Большую роль в системе RETRANS играют разработанные школой Г.Г.Белоногова
алгоритмы процедур автоматического морфологического и синтаксического анализа и
синтеза русских и английских текстов, построенные на основе принципа аналогии. Эти
процедуры позволяют отказаться от хранения в массивах словарей больших объемов
грамматической информации, а порождать ее, по мере необходимости, автоматически,
непосредственно в ходе рабочего процесса. Такая технология делает систему открытой, то
есть способной обрабатывать тексты с незнакомой лексикой.
        Как уже отмечалось, система RETRANS была выпущена в виде промышленной
версии в 1993 г. И с этого времени стала использоваться не только в России, но и в ряде
государственных учреждений Франции, Англии и США. До 1998 г. Все версии системы
были настроены на работу в среде MS DOS, а к 2000 г. Система была адаптирована также к
Windows 9x/NT и ко всем версиям UNIX. Последняя версия системы (выпущена в 2001 г.)
может работать с любыми форматами текстового процессора MS Word (любых версий), в
среде Web-браузера MS Internet Explorer и с любыми Windows-приложениями, способными
копировать тексты в буфер обмена (Clipboard). В настоящее время последняя версия
системы реализована в трех модификациях.



                                                                                   223