Естественно-языковые системы. Евдокимова И.С. - 84 стр.

UptoLike

Составители: 

84
в процессе анализа предложения, не может быть отвергнута, иными словами, если связь
порождена, она должна присутствовать в синтаксической структуре, являющейся
результатом работы синтаксического анализатора.
Эта стратегия используется в системах ЯИП, САГА и другие. Синтаксический
анализатор, разработанный в группе Г.Г. Белоногова, в целом также может быть отнесен к
этому типу, хотя локально он допускает пересмотр уже установленных связей.
Стратегии, о которых шла речь выше, на этапе порождения связей используют лишь
часть информации, к которой имеет доступ синтаксический анализатор. Неполнота касается,
прежде всего, сведений о контексте, которые учитываются в полной мере после того, как
связи порождены: при фильтрации связей или оценке приемлемости построенной
синтаксической структуры. Стратегия детерминированного анализа не использует подобного
деления на этапы: вся информация, которая в построенном синтаксическом анализаторе
может повлиять на установление связи между конкретными текстовыми единицами,
привлекается одномоментно. Укажем еще одну отличительную характеристику стратегии
детерминизма: при установлении каждой связи должны соблюдаться такие условия, которые
гарантировали бы получение связной синтаксической структуры предложения на выходе.
Для окончательного вывода о наличии связи определенного вида между двумя
текстовыми единицами (ТЕ) необходимо проверить, помимо условий на сочетаемость,
соблюдение некоторого количества контекстуальных условий (наличие или отсутствие в
фиксированной позиции других ТЕ с заданными характеристиками, наличие или отсутствие
в фиксированной позиции тех или иных знаков препинания и т.п.). Такие условия могут быть
сформулированы не для конкретной пары ТЕ, а для большого класса таких пар. В этом
случае очевидно, что набор таких условий, заданный в обобщенном виде, описывает
синтаксическую ситуацию, диагностичную для расстановки связей. В основе стратегии
детерминированного анализа лежит инвентарь синтаксических ситуаций, которые
учитываются данной моделью синтаксического анализа. Описание ситуации может быть
задано в декларативном или процедурном видеэто зависит от языка программирования.
Синтаксические ситуации привязаны к тому или иному грамматическому явлению:
поиск и установление связей однородных членов, поиск подлежащего, выявление
определительного номинатива и поиск его хозяина и прочее. Каждому грамматическому
явлению сопоставлен набор синтаксических ситуаций. Алгоритм проверяет, какая из
предусмотренных ситуаций реализована в анализируемом предложении, и в соответствии с
этим устанавливает синтаксические связи. Так как стратегия в принципе ориентирована на
построение одного варианта грамматического разбора, описание синтаксической ситуации
задано с той степенью подробности, которая позволяет разработчикам принимать решение
об однозначной расстановке связей.
Однако не исключены ситуации, в которых синтаксический анализатор не имеет
достаточной информации для однозначного выбора, а статистические наблюдения не
позволяют уверенно предпочесть одно решение другому. Система ЯИП и система группы
Г.Г. Белоногова в таких ситуациях все равно делает однозначный выбор на основе
в процессе анализа предложения, не может быть отвергнута, иными словами, если связь
порождена, она должна присутствовать в синтаксической структуре, являющейся
результатом работы синтаксического анализатора.
     Эта стратегия используется в системах ЯИП, САГА и другие. Синтаксический
анализатор, разработанный в группе Г.Г. Белоногова, в целом также может быть отнесен к
этому типу, хотя локально он допускает пересмотр уже установленных связей.
     Стратегии, о которых шла речь выше, на этапе порождения связей используют лишь
часть информации, к которой имеет доступ синтаксический анализатор. Неполнота касается,
прежде всего, сведений о контексте, которые учитываются в полной мере после того, как
связи порождены: при фильтрации связей или оценке приемлемости построенной
синтаксической структуры. Стратегия детерминированного анализа не использует подобного
деления на этапы: вся информация, которая в построенном синтаксическом анализаторе
может повлиять на установление связи между конкретными текстовыми единицами,
привлекается одномоментно. Укажем еще одну отличительную характеристику стратегии
детерминизма: при установлении каждой связи должны соблюдаться такие условия, которые
гарантировали бы получение связной синтаксической структуры предложения на выходе.
     Для окончательного вывода о наличии связи определенного вида между двумя
текстовыми единицами (ТЕ) необходимо проверить, помимо условий на сочетаемость,
соблюдение некоторого количества контекстуальных условий (наличие или отсутствие в
фиксированной позиции других ТЕ с заданными характеристиками, наличие или отсутствие
в фиксированной позиции тех или иных знаков препинания и т.п.). Такие условия могут быть
сформулированы не для конкретной пары ТЕ, а для большого класса таких пар. В этом
случае очевидно, что набор таких условий, заданный в обобщенном виде, описывает
синтаксическую ситуацию, диагностичную для расстановки связей. В основе стратегии
детерминированного анализа лежит инвентарь синтаксических ситуаций, которые
учитываются данной моделью синтаксического анализа. Описание ситуации может быть
задано в декларативном или процедурном виде – это зависит от языка программирования.
     Синтаксические ситуации привязаны к тому или иному грамматическому явлению:
поиск и установление связей однородных членов, поиск подлежащего, выявление
определительного номинатива и поиск его хозяина и прочее. Каждому грамматическому
явлению сопоставлен набор синтаксических ситуаций. Алгоритм проверяет, какая из
предусмотренных ситуаций реализована в анализируемом предложении, и в соответствии с
этим устанавливает синтаксические связи. Так как стратегия в принципе ориентирована на
построение одного варианта грамматического разбора, описание синтаксической ситуации
задано с той степенью подробности, которая позволяет разработчикам принимать решение
об однозначной расстановке связей.
     Однако не исключены ситуации, в которых синтаксический анализатор не имеет
достаточной информации для однозначного выбора, а статистические наблюдения не
позволяют уверенно предпочесть одно решение другому. Система ЯИП и система группы
Г.Г. Белоногова в таких ситуациях все равно делает однозначный выбор на основе


                                              84