Естественно-языковые системы. Евдокимова И.С. - 53 стр.

UptoLike

Составители: 

53
трансляции формализованного представления смысла в предложения на английском языке,
разработаны системные грамматики и механизмы их употребления для порождения текста,
предложены критерии для отбора слов из общего словаря системы. Для генерации
высказываний на русском языке были разработаны и внедрены в ряде ЕЯ-систем и систем
машинного перевода методы морфологического и синтаксического синтеза.
По сравнению с задачами второго этапа, для решения которых существуют
апробированные методы, задачи, решаемые на первом этапе генерации, изучены гораздо
меньше. Поэтому в большинстве действующих ЕЯ-систем решение задач генерации смысла
осуществляется, как правило, в упрощенной или сильно ограниченной постановке, что
приводит к упрощению, а иногда и к вырождению задач синтеза высказываний на ЕЯ.
Наиболее простым методом генерации высказываний является метод, который основан
на использовании заранее заготовленных шаблонов, содержащих текст на ЕЯ и переменные,
вместо которых подставляются конкретные данные (описания сущностей). Как показала
практика, данный метод особенно удобен для генерации высказываний типа
диагностического сообщения, простого вопроса, альтернативного вопроса и вопроса с
фиксированной структурой ответа в определенных стандартных ситуациях, не зависящих от
проблемной области, в которой используется ЕЯ-система. В подобных ситуациях текущей
целью системы является предупреждение или устранение типовых локальных неудач,
вызванных, например, такими факторами: наличие в высказывании пользователя незнакомых
системе слов; несоответствие пресуппозиций в высказывании пользователя знаниям
системы; многозначная или неудовлетворительная интерпретация высказывания
пользователя и т. п.
При методе шаблонов генерация высказываний осуществляется, строго говоря,
совместно с диалоговым компонентом, который идентифицирует стандартную ситуацию (т.
е., генерирует соответствующую этой ситуации цель) и определяет, какая информация (т. е.
описания каких сущностей) должна быть включена в высказывание. Компонент генерации
высказываний в этом случае выбирает подходящий формат для представления высказывания
и конкретизирует его соответствующими данными, возможно, производя при этом
морфологический синтез словоформ.
Аналогичный метод может применяться и при генерации большинства отчетов, т. е.
высказываний, выражающих результаты решения задач, полученные ЕЯ - системой. Отличие
состоит в том, что вместо заранее заготовленных шаблонов используются шаблоны, которые
порождаются компонентом генерации высказываний на основе метазнаний, т. е. описаний
данных, включаемых в ответ. Заметим, что в ряде случаев, например в системах ЕЯ-общения
с базами данных, результатом решения задачи часто является множество данных, формат
представления которых определяется средствами генерации отчетов СУБД. Очевидно, что в
этих случаях необходимость в компоненте генерации высказывании ЕЯ-системы вообще не
возникает.
Генерация высказываний, которые не могут быть описаны с помощью шаблонов,
представляет собой более сложную и недостаточно исследованную задачу. К таким
трансляции формализованного представления смысла в предложения на английском языке,
разработаны системные грамматики и механизмы их употребления для порождения текста,
предложены критерии для отбора слов из общего словаря системы. Для генерации
высказываний на русском языке были разработаны и внедрены в ряде ЕЯ-систем и систем
машинного перевода методы морфологического и синтаксического синтеза.
      По сравнению с задачами второго этапа, для решения которых существуют
апробированные методы, задачи, решаемые на первом этапе генерации, изучены гораздо
меньше. Поэтому в большинстве действующих ЕЯ-систем решение задач генерации смысла
осуществляется, как правило, в упрощенной или сильно ограниченной постановке, что
приводит к упрощению, а иногда и к вырождению задач синтеза высказываний на ЕЯ.
      Наиболее простым методом генерации высказываний является метод, который основан
на использовании заранее заготовленных шаблонов, содержащих текст на ЕЯ и переменные,
вместо которых подставляются конкретные данные (описания сущностей). Как показала
практика, данный метод особенно удобен для генерации высказываний типа
диагностического сообщения, простого вопроса, альтернативного вопроса и вопроса с
фиксированной структурой ответа в определенных стандартных ситуациях, не зависящих от
проблемной области, в которой используется ЕЯ-система. В подобных ситуациях текущей
целью системы является предупреждение или устранение типовых локальных неудач,
вызванных, например, такими факторами: наличие в высказывании пользователя незнакомых
системе слов; несоответствие пресуппозиций в высказывании пользователя знаниям
системы; многозначная или неудовлетворительная интерпретация высказывания
пользователя и т. п.
      При методе шаблонов генерация высказываний осуществляется, строго говоря,
совместно с диалоговым компонентом, который идентифицирует стандартную ситуацию (т.
е., генерирует соответствующую этой ситуации цель) и определяет, какая информация (т. е.
описания каких сущностей) должна быть включена в высказывание. Компонент генерации
высказываний в этом случае выбирает подходящий формат для представления высказывания
и конкретизирует его соответствующими данными, возможно, производя при этом
морфологический синтез словоформ.
      Аналогичный метод может применяться и при генерации большинства отчетов, т. е.
высказываний, выражающих результаты решения задач, полученные ЕЯ - системой. Отличие
состоит в том, что вместо заранее заготовленных шаблонов используются шаблоны, которые
порождаются компонентом генерации высказываний на основе метазнаний, т. е. описаний
данных, включаемых в ответ. Заметим, что в ряде случаев, например в системах ЕЯ-общения
с базами данных, результатом решения задачи часто является множество данных, формат
представления которых определяется средствами генерации отчетов СУБД. Очевидно, что в
этих случаях необходимость в компоненте генерации высказывании ЕЯ-системы вообще не
возникает.
      Генерация высказываний, которые не могут быть описаны с помощью шаблонов,
представляет собой более сложную и недостаточно исследованную задачу. К таким


                                              53