Естественно-языковые системы. Евдокимова И.С. - 51 стр.

UptoLike

Составители: 

51
задачу, а подцели состоят в заполнении слотов, т. е. в идентификации сущностей через
описания, представленные в результатах анализа входных высказываний.
В общем случае процесс идентификации некоторой сущности может иметь три исхода:
1 исход: однозначный - данному описанию сопоставляется единственная сущность;
2 исход: многозначный - описанию сопоставляется более чем одна сущность;
3 исход: неудовлетворительный - описанию не сопоставляется ни одна сущность.
Последние два исхода рассматриваются как неудачи буквальной интерпретации и
служат сигналами о необходимости установления подцелей более глубокого уровня,
предусматривающих устранение неудачи. При этом в диалоговый компонент кроме
сообщения о неудаче и типе неудачи передаются исходные данные, позволяющие
сформировать (с помощью компонента генерации высказываний) действие системы по
перехвату инициативы и открытию уточняющего поддиалога, преследующего новую
подцель.
В случае многозначной интерпретации вместе с сообщением о неудаче передаются
возможные варианты сопоставления, что позволяет системе генерировать альтернативный
вопрос. При неудовлетворительной интерпретации от компонента понимания требуется
указать причины, по которым рассматриваемое описание является неудовлетворительным. В
большинстве случаев причины неудовлетворительной интерпретации сводятся к
неудовлетворительным (неполным или неоднозначным) результатам анализа входных
высказываний и к несоответствию пресуппозиций пользователя знаниям системы.
При решении задач интерпретации важную роль играет имеющееся в системе
представление общей точки зрения на то, о чем идет речь в текущий момент. Эту точку
зрения часто называют фокусом (или фокусом внимания). Разделяемый участниками фокус
позволяет им повысить компактность диалога за счет того, что сущности, находящиеся в
фокусе, могут либо вообще не упоминаться в высказывании (эллипсис), либо упоминаться в
виде кратких описаний (ссылок). Покажем, как используется фокус для установления
референтов ссылок и восстановления эллипсиса.
В работе предлагается приравнять фокус к текущей подцели, преследуемой
участниками общения. Подобная трактовка рассматривает фокус как набор сущностей, на
которые в текущий момент направлено внимание участников, при этом текущая подцель
может быть определена как множество сущностей, соответствующих этой подцели. Ясно,
что данная трактовка фокуса обеспечивает решение задач установления референтов ссылок и
восстановления эллипсиса. Поясним это на примере следующего диалога (Ппользователь,
Ссистема):
П1: Какая зарплата у Петрова?
С1: Вы имеете в виду Алексея Петрова или Николая Петрова?
П2: Я имею в виду Николая.
В данном диалоге пользователь ссылается на Николая Петрова (П2). Референт этой
ссылки может быть легко идентифицирован. Действительно, высказывание П1 генерирует
подцель «заполнить слот личность». Вследствие многозначной интерпретации система
задачу, а подцели состоят в заполнении слотов, т. е. в идентификации сущностей через
описания, представленные в результатах анализа входных высказываний.
     В общем случае процесс идентификации некоторой сущности может иметь три исхода:
     1 исход: однозначный - данному описанию сопоставляется единственная сущность;
     2 исход: многозначный - описанию сопоставляется более чем одна сущность;
     3 исход: неудовлетворительный - описанию не сопоставляется ни одна сущность.
      Последние два исхода рассматриваются как неудачи буквальной интерпретации и
служат сигналами о необходимости установления подцелей более глубокого уровня,
предусматривающих устранение неудачи. При этом в диалоговый компонент кроме
сообщения о неудаче и типе неудачи передаются исходные данные, позволяющие
сформировать (с помощью компонента генерации высказываний) действие системы по
перехвату инициативы и открытию уточняющего поддиалога, преследующего новую
подцель.
     В случае многозначной интерпретации вместе с сообщением о неудаче передаются
возможные варианты сопоставления, что позволяет системе генерировать альтернативный
вопрос. При неудовлетворительной интерпретации от компонента понимания требуется
указать причины, по которым рассматриваемое описание является неудовлетворительным. В
большинстве случаев причины неудовлетворительной интерпретации сводятся к
неудовлетворительным (неполным или неоднозначным) результатам анализа входных
высказываний и к несоответствию пресуппозиций пользователя знаниям системы.
     При решении задач интерпретации важную роль играет имеющееся в системе
представление общей точки зрения на то, о чем идет речь в текущий момент. Эту точку
зрения часто называют фокусом (или фокусом внимания). Разделяемый участниками фокус
позволяет им повысить компактность диалога за счет того, что сущности, находящиеся в
фокусе, могут либо вообще не упоминаться в высказывании (эллипсис), либо упоминаться в
виде кратких описаний (ссылок). Покажем, как используется фокус для установления
референтов ссылок и восстановления эллипсиса.
     В работе предлагается приравнять фокус к текущей подцели, преследуемой
участниками общения. Подобная трактовка рассматривает фокус как набор сущностей, на
которые в текущий момент направлено внимание участников, при этом текущая подцель
может быть определена как множество сущностей, соответствующих этой подцели. Ясно,
что данная трактовка фокуса обеспечивает решение задач установления референтов ссылок и
восстановления эллипсиса. Поясним это на примере следующего диалога (П – пользователь,
С – система):
     П1: Какая зарплата у Петрова?
     С1: Вы имеете в виду Алексея Петрова или Николая Петрова?
     П2: Я имею в виду Николая.
     В данном диалоге пользователь ссылается на Николая Петрова (П2). Референт этой
ссылки может быть легко идентифицирован. Действительно, высказывание П1 генерирует
подцель «заполнить слот личность». Вследствие многозначной интерпретации система


                                             51