Интеллектуальные информационные системы. Дубровин А.Д. - 31 стр.

UptoLike

Составители: 

35
хотели бы общаться с системой естественным для них способом, не обязательно одним и
тем же.
Разработка систем автоматического (машинного) перевода речевой и (или)
текстовой информации с одного естественного языка на другой сложный и
трудоемкий процесс. Поэтому, естественно, возникает вопрос: каким образом можно
снизить (минимизировать) затраты на их создание? Если считать, что такие системы
должны создаваться для каждой пары языков, то даже при 20 различных языках
потребуется разработать 190 таких систем. Считается (2), что одно из возможных решений
здесь может быть в том, что из всех языков мира выбирается один языкпосредник, а для
каждого национального языка создается только одна система машинного перевода. Она
будет осуществлять перевод между данным языком и языкомпосредником. Тогда число
различных систем перевода будет на единицу меньше числа различных языков. Но и это
решение чревато возможными негативными последствиями. Если учитывать, что даже
при высоком качестве перевода с одного естественного языка на другой может
происходить некоторое смещение смысла перевода относительно смысла оригинала, то
при использовании языка-посредника такое смещение будет возрастать. Важное значение
этой задаче придает и международное сообщество в лице ООН, связывая с ней решение
проблемы построения открытого Информационного Общества на планете Земля.
Третий класс задач автоматический концептуальный анализ информации. Он
связан с разработкой алгоритмов поиска информации и программ её точного прочтения,
распознания её структуры и главное с выявлением фрагментов информации (терминов,
понятий, концептов), отображающих смысловые аспекты информации, на каком бы языке
(вплоть до естественного) и в каком бы виде (текст, речь, мультимедиа) она ни была
представлена. Исполнителем таких алгоритмов должен быть конечный автомат, например
современный или построенный на совершенно других принципах компьютер. В
результате концептуального анализа исходная информация должна быть представлена
системой классификации, распределяющей её семантически значимые фрагменты по
классам на основе признаков сходства и различия, которые отражают наиболее
существенные черты смыслового содержания исходной информации. Классификация
данных одна из сложнейших интеллектуальных задач. По мнению Г.Г.Белоногова (2) её
решение (например, для определения смыслового содержания научно-технических
текстов) с помощью универсальной ЭВМ в настоящее время возможно лишь на путях
формализации семантико-синтаксической структуры информации. Как аналитический
процесс, классификация существенным образом способствует выявлению смыслового
содержания текстовой информации и включает процедуры её морфологического и
семантико-синтаксического анализа. Первый применяется для определения
грамматических характеристик слов, а второй для распознавания смысловых значений
понятий, образованных словами и словосочетаниями.
Как аналитический процесс, автоматический поиск в массиве естественно-язычной
информации по запросам, так же составленным на естественном языке, в упрощенном
варианте связан с распознаванием «смысла» запроса и с последующим сопоставлением
его со «смыслом» информации. В более сложном варианте, когда информация и запрос
представлены на разных языках, потребуется «попутно» решить еще и задачу
автоматического перевода либо информации, либо запроса с одного естественного языка
на другой. И сделать это необходимо без искажения смысла оригинала.
Рассмотрим последнюю составляющую этого класса задач интерпретацию
информации. Как комплексный (связанный с анализом и синтезом) процесс,
интерпретация исходной информации характерна своей многоаспектностью и
многовариантностью. Особенно в тех случаях, когда объект интерпретации имеет
свойства абстрактных знаний или знаний из совершенно другой предметной области, чем
хотели бы общаться с системой естественным для них способом, не обязательно одним и
тем же.
     Разработка систем автоматического (машинного) перевода речевой и (или)
текстовой информации с одного естественного языка на другой – сложный и
трудоемкий процесс. Поэтому, естественно, возникает вопрос: каким образом можно
снизить (минимизировать) затраты на их создание? Если считать, что такие системы
должны создаваться для каждой пары языков, то даже при 20 различных языках
потребуется разработать 190 таких систем. Считается (2), что одно из возможных решений
здесь может быть в том, что из всех языков мира выбирается один язык–посредник, а для
каждого национального языка создается только одна система машинного перевода. Она
будет осуществлять перевод между данным языком и языком–посредником. Тогда число
различных систем перевода будет на единицу меньше числа различных языков. Но и это
решение чревато возможными негативными последствиями. Если учитывать, что даже
при высоком качестве перевода с одного естественного языка на другой может
происходить некоторое смещение смысла перевода относительно смысла оригинала, то
при использовании языка-посредника такое смещение будет возрастать. Важное значение
этой задаче придает и международное сообщество в лице ООН, связывая с ней решение
проблемы построения открытого Информационного Общества на планете Земля.
     Третий класс задач – автоматический концептуальный анализ информации. Он
связан с разработкой алгоритмов поиска информации и программ её точного прочтения,
распознания её структуры и главное – с выявлением фрагментов информации (терминов,
понятий, концептов), отображающих смысловые аспекты информации, на каком бы языке
(вплоть до естественного) и в каком бы виде (текст, речь, мультимедиа) она ни была
представлена. Исполнителем таких алгоритмов должен быть конечный автомат, например
современный или построенный на совершенно других принципах компьютер. В
результате концептуального анализа исходная информация должна быть представлена
системой классификации, распределяющей её семантически значимые фрагменты по
классам на основе признаков сходства и различия, которые отражают наиболее
существенные черты смыслового содержания исходной информации. Классификация
данных – одна из сложнейших интеллектуальных задач. По мнению Г.Г.Белоногова (2) её
решение (например, для определения смыслового содержания научно-технических
текстов) с помощью универсальной ЭВМ в настоящее время возможно лишь на путях
формализации семантико-синтаксической структуры информации. Как аналитический
процесс, классификация существенным образом способствует выявлению смыслового
содержания текстовой информации и включает процедуры её морфологического и
семантико-синтаксического      анализа.   Первый     применяется      для   определения
грамматических характеристик слов, а второй – для распознавания смысловых значений
понятий, образованных словами и словосочетаниями.
    Как аналитический процесс, автоматический поиск в массиве естественно-язычной
информации по запросам, так же составленным на естественном языке, в упрощенном
варианте связан с распознаванием «смысла» запроса и с последующим сопоставлением
его со «смыслом» информации. В более сложном варианте, когда информация и запрос
представлены на разных языках, потребуется «попутно» решить еще и задачу
автоматического перевода либо информации, либо запроса с одного естественного языка
на другой. И сделать это необходимо без искажения смысла оригинала.
    Рассмотрим последнюю составляющую этого класса задач – интерпретацию
информации. Как комплексный (связанный с анализом и синтезом) процесс,
интерпретация исходной информации           характерна своей многоаспектностью и
многовариантностью. Особенно в тех случаях, когда объект интерпретации имеет
свойства абстрактных знаний или знаний из совершенно другой предметной области, чем


                                                                                     35