Естественно-языковые системы. Евдокимова И.С. - 48 стр.

UptoLike

Составители: 

48
предложены способы, позволяющие ослаблять действие грамматических правил. Однако это
возможно только в ограниченном классе грамматических отклонений. Кроме того,
предпринимались попытки добавить в ATN-сеть дополнительные специфические дуги,
которые имеют дело с проблематичными входными предложениями. Некоторые из этих дуг
выполняют функцию сопоставления по образцу (см. ниже). Тот факт, что для обработки
неграмматичных предложений приходится осуществлять радикальные преобразования ATN-
техники, говорит о ее малой пригодности для обработки высказываний, имеющих место в
реальных, естественных диалогах.
Один из возможных подходов к преодолению хрупкости традиционных анализаторов
состоит в одновременном применении нескольких подграмматик. Каждая из подграмматик
предназначена для анализа частных конструкций какого-либо одного вида. Применение
подграмматик осуществляется независимо, поэтому неудача одной подграмматики не влияет
на возможности других. Впервые подобный подход был реализован в системе PLANES,
которая имеет подграмматики для каждого типа известных систем сущностей. При данном
подходе предложение в процессе разбора разбивается на несколько независимых
фрагментов. В этом случае в задачу анализатора входит построение общей (объединенной)
интерпретации предложения. Если проблемная область достаточно ограничена (как это
имеет место в системе PLANES), то интерпретация фрагментов всегда уникальна, однако в
общем случае эта задача не имеет единственного решения и может стать трудноразрешимой.
Концептуальные анализаторы
Анализаторы данного типа используют методы разбора, направляемые значениями
базовых событий, обнаруженных в анализируемых предложениях. Наиболее известными
разновидностями данного подхода являются анализаторы, основанные на модели
концептуальной зависимости и на модели управления. Анализатор первого типа был
впервые реализован в системе MAPGE, а второго - в системе ПОЭТ. Концептуальные
анализаторы не разрабатывались специально для анализа неграмматичных предложений.
Однако заложенные в них идеи в принципе позволяют этим алгоритмам работать в условиях
пропусков и повторов слов. Такие системы, как FRUMP, IPP, RESEARCHER, SNUKA с
концептуальными анализаторами обладают иммунитетом к ошибкам, так как они
игнорируют непонятные им слова, а понятные приспосабливают (даже если в них есть
ошибки) к базовым событиям обрабатываемого предложения.
Анализаторы, использующие сопоставление по образцам
Анализаторы данного класса основаны на том, что в простейшем случае анализ
сводится к сопоставлению предложения с некоторым множеством образцов,
представляющих собой последовательности из одного или нескольких слов. Подобные
анализаторы широко применялись в ранних ЕЯ-системах. Многие методы анализа,
основанные на сопоставлении по образцам, содержат в образце не только константы, но и
переменные. При этом предполагается, что переменные образца могут сопоставляться с
любой строкой символов. Гибкость анализаторов определяется гибкостью процесса
предложены способы, позволяющие ослаблять действие грамматических правил. Однако это
возможно только в ограниченном классе грамматических отклонений. Кроме того,
предпринимались попытки добавить в ATN-сеть дополнительные специфические дуги,
которые имеют дело с проблематичными входными предложениями. Некоторые из этих дуг
выполняют функцию сопоставления по образцу (см. ниже). Тот факт, что для обработки
неграмматичных предложений приходится осуществлять радикальные преобразования ATN-
техники, говорит о ее малой пригодности для обработки высказываний, имеющих место в
реальных, естественных диалогах.
     Один из возможных подходов к преодолению хрупкости традиционных анализаторов
состоит в одновременном применении нескольких подграмматик. Каждая из подграмматик
предназначена для анализа частных конструкций какого-либо одного вида. Применение
подграмматик осуществляется независимо, поэтому неудача одной подграмматики не влияет
на возможности других. Впервые подобный подход был реализован в системе PLANES,
которая имеет подграмматики для каждого типа известных систем сущностей. При данном
подходе предложение в процессе разбора разбивается на несколько независимых
фрагментов. В этом случае в задачу анализатора входит построение общей (объединенной)
интерпретации предложения. Если проблемная область достаточно ограничена (как это
имеет место в системе PLANES), то интерпретация фрагментов всегда уникальна, однако в
общем случае эта задача не имеет единственного решения и может стать трудноразрешимой.

     Концептуальные анализаторы
     Анализаторы данного типа используют методы разбора, направляемые значениями
базовых событий, обнаруженных в анализируемых предложениях. Наиболее известными
разновидностями данного подхода являются анализаторы, основанные на модели
концептуальной зависимости и на модели управления. Анализатор первого типа был
впервые реализован в системе MAPGE, а второго - в системе ПОЭТ. Концептуальные
анализаторы не разрабатывались специально для анализа неграмматичных предложений.
Однако заложенные в них идеи в принципе позволяют этим алгоритмам работать в условиях
пропусков и повторов слов. Такие системы, как FRUMP, IPP, RESEARCHER, SNUKA с
концептуальными анализаторами обладают иммунитетом к ошибкам, так как они
игнорируют непонятные им слова, а понятные приспосабливают (даже если в них есть
ошибки) к базовым событиям обрабатываемого предложения.

     Анализаторы, использующие сопоставление по образцам
     Анализаторы данного класса основаны на том, что в простейшем случае анализ
сводится к сопоставлению предложения с некоторым множеством образцов,
представляющих собой последовательности из одного или нескольких слов. Подобные
анализаторы широко применялись в ранних ЕЯ-системах. Многие методы анализа,
основанные на сопоставлении по образцам, содержат в образце не только константы, но и
переменные. При этом предполагается, что переменные образца могут сопоставляться с
любой строкой символов. Гибкость анализаторов определяется гибкостью процесса


                                             48