Естественно-языковые системы. Евдокимова И.С. - 41 стр.

UptoLike

Составители: 

41
взятого предложения дерево его вывода по правилам грамматики, и если таких выводов
несколько, то перечислить их. Такой алгоритм, представляющий собой формальную (в
математическом смысле) систему, называется анализатором. Описание грамматики служит
для анализатора, обладающего универсальностью, таким же входом, как и анализируемое
предложение. Анализаторы строятся для классов грамматик, хотя учет специфических
особенностей грамматики может повысить эффективность анализатора.
Грамматики синтаксического уровня наиболее разработанная часть и с точки зрения
лингвистики, и с точки зрения их обеспечения формализмами. Укажем основные типы
грамматик и реализующих их алгоритмов (в литературе по МП их часто описывают как одну
совокупность).
Цепочечная грамматика фиксирует порядок следования элементов, т. е. линейные
структуры предложения, задавая их в терминах грамматических классов слов
(артикль+существительное+предлог...) или в терминах функциональных элементов
(подлежащее+сказуемое). Примером реализации такой языковой модели является
предсказуемостный синтаксический анализ: идентифицированная грамматическая категория
слова предсказывает (с определенной долей вероятности) появление грамматической
категории следующего за ним слова. Стратегия анализа — «слева направо»: перебор слов,
проверка предсказаний, их изменение и добавление новых предсказаний регулируются
механизмом «магазинной памяти» (last in first out).
Грамматика составляющих (или грамматика непосредственно составляющих - НСГ)
фиксирует лингвистическую информацию о группировке грамматических элементов,
например, именная группа (состоит из существительного, артикля, прилагательного и
других модификаторов), предложная группа (состоит из предлога и именной группы) и т.
д. до уровня предложения. Грамматика строится как набор правил подстановки, или
исчисление продукций вида А →В→...С. НСГ представляют собой грамматики
порождающего типа и могут использоваться как при анализе, так и при синтезе:
предложения языка порождаются многократным применением таких правил.
Грамматика зависимостей (ГЗ) задает иерархию отношений элементов предложения
(главное слово определяет форму зависимых). Анализатор в ГЗ основан на идентификации
хозяев и их зависимых (слуг). Главным в предложении является глагол в личной форме, так
как он определяет число и характер зависимых существительных. Стратегия анализа в ГЗ
сверху вниз (top-down): сначала идентифицируются хозяева, затем слуги, или снизу вверх:
(bottom-up): хозяева определяются процессом подстановки.
Новым и, сразу завоевавшим популярность, методом грамматического описания
является лексико-функциональная грамматика (ЛФГ). Она устраняет необходимость
трансформационных правил. Хотя ЛФГ основывается на КСГ, проверочные условия в ней
отделены от правил подстановки и «решаются» как автономные уравнения.
Лекция 3. Методы реализации ЕЯ-систем
Приведем методы реализации основных функциональных компонент, получившие
наиболее широкое распространение в практике создания ЕЯ-систем.
взятого предложения дерево его вывода по правилам грамматики, и если таких выводов
несколько, то перечислить их. Такой алгоритм, представляющий собой формальную (в
математическом смысле) систему, называется анализатором. Описание грамматики служит
для анализатора, обладающего универсальностью, таким же входом, как и анализируемое
предложение. Анализаторы строятся для классов грамматик, хотя учет специфических
особенностей грамматики может повысить эффективность анализатора.
      Грамматики синтаксического уровня — наиболее разработанная часть и с точки зрения
лингвистики, и с точки зрения их обеспечения формализмами. Укажем основные типы
грамматик и реализующих их алгоритмов (в литературе по МП их часто описывают как одну
совокупность).
      Цепочечная грамматика фиксирует порядок следования элементов, т. е. линейные
структуры предложения, задавая их в терминах грамматических классов слов
(артикль+существительное+предлог...) или в терминах функциональных элементов
(подлежащее+сказуемое). Примером реализации такой языковой модели является
предсказуемостный синтаксический анализ: идентифицированная грамматическая категория
слова предсказывает (с определенной долей вероятности) появление грамматической
категории следующего за ним слова. Стратегия анализа — «слева направо»: перебор слов,
проверка предсказаний, их изменение и добавление новых предсказаний регулируются
механизмом «магазинной памяти» (last in first out).
      Грамматика составляющих (или грамматика непосредственно составляющих - НСГ)
фиксирует лингвистическую информацию о группировке грамматических элементов,
например, именная группа (состоит из существительного, артикля, прилагательного       и
других модификаторов), предложная группа (состоит из предлога и именной группы) и т.
д. до уровня предложения. Грамматика строится как набор правил подстановки, или
исчисление продукций вида А →В→...С. НСГ представляют собой грамматики
порождающего типа и могут использоваться как при анализе, так и при синтезе:
предложения языка порождаются многократным применением таких правил.
      Грамматика зависимостей (ГЗ) задает иерархию отношений элементов предложения
(главное слово определяет форму зависимых). Анализатор в ГЗ основан на идентификации
хозяев и их зависимых (слуг). Главным в предложении является глагол в личной форме, так
как он определяет число и характер зависимых существительных. Стратегия анализа в ГЗ —
сверху вниз (top-down): сначала идентифицируются хозяева, затем слуги, или снизу вверх:
(bottom-up): хозяева определяются процессом подстановки.
      Новым и, сразу завоевавшим популярность, методом грамматического описания
является лексико-функциональная грамматика (ЛФГ). Она устраняет необходимость
трансформационных правил. Хотя ЛФГ основывается на КСГ, проверочные условия в ней
отделены от правил подстановки и «решаются» как автономные уравнения.

                         Лекция 3. Методы реализации ЕЯ-систем
     Приведем методы реализации основных функциональных компонент, получившие
наиболее широкое распространение в практике создания ЕЯ-систем.

                                            41