Естественно-языковые системы. Евдокимова И.С. - 31 стр.

UptoLike

Составители: 

31
ориентированной парадигме. Вторая сложностьтипичные естественно-языковые запросы,
которые, как правило, не имеют правильных синтаксических конструкций. На это влияют
вольное словоизменение и словообразование в виде неологизмов сетевой общественности,
большой процент имен собственных и сокращений, игнорирование правил пунктуации, что
приводит к тому, что от естественного языка во всем его многообразии иногда остается лишь
лексика, причудливым образом исковерканная. И, наконец, необходимые в этом подходе
семантические словариочень трудоемкая составляющая, для многих предметных
областей они просто отсутствуют, а их разработка требует высокой квалификации.
Третий подход к анализу естественно-языковых запросов основан на шаблонах. Он
появился самым первым и с точки зрения программной реализации наиболее прост. Суть его
в том, что возможные запросы покрываются набором шаблонов-конструкций, позволяющих
отождествляться с запросом и выдавать в результате предопределенные конструкции.
Для примера рассмотрим таблицу базы данных, содержащую информацию о странах
(табл. 2):
Таблица 2
Пример таблица базы данных
Страна Столица Язык
Россия Москва русский
Италия Рим итальянский
... ... ...
Простейшую основанную на шаблонах систему можно построить с помощью
следующих правил:
Шаблон: ... "столица"..., <страна>
Действие: Вывести столицу в строке, в которой поле страна = <страна>
Шаблон: . . . "столица" . . . "страна"
Действие: Вывести столицу и страну для каждой строки
Согласно первому правилу, если ЕЯ-запрос содержит слово "столица" перед названием
страны (т.е. значением поля Страна), то система найдет записи, содержащие это название
страны, и выведет соответствующую столицу. Например, для запроса "Какая столица
Италии?" будет использовано первое правило, и ответ будет "Рим". То же самое правило
применится для запроса "Напечатать столицу Италии", "Подскажите мне, пожалуйста,
столицу Италии?" и т.д. Во всех этих случаях ответ будет одинаковым.
В соответствии со вторым правилом, любой ЕЯ-запрос, в котором слово "столица"
предшествует слову "страна", вернет столицу каждой страны в соответствии с содержимым
таблицы. Так, запросы "Какая столица в каждой из стран?", "Вывести на печать столицу
любой страны.", "Столицы и страны, пожалуйста." будут подходить под второе правило.
Главным достоинством шаблонного подхода является его простота - здесь отсутствуют
сложные модули синтаксического разбора и интерпретации, такую систему, основанную на
шаблонах, легко реализовать. Однако простота подхода имеет оборотную сторону - такие
системы сложно портировать, и их надежность понимания запросов оставляет желать
ориентированной парадигме. Вторая сложность — типичные естественно-языковые запросы,
которые, как правило, не имеют правильных синтаксических конструкций. На это влияют
вольное словоизменение и словообразование в виде неологизмов сетевой общественности,
большой процент имен собственных и сокращений, игнорирование правил пунктуации, что
приводит к тому, что от естественного языка во всем его многообразии иногда остается лишь
лексика, причудливым образом исковерканная. И, наконец, необходимые в этом подходе
семантические словари — очень трудоемкая составляющая, для многих предметных
областей они просто отсутствуют, а их разработка требует высокой квалификации.
      Третий подход к анализу естественно-языковых запросов основан на шаблонах. Он
появился самым первым и с точки зрения программной реализации наиболее прост. Суть его
в том, что возможные запросы покрываются набором шаблонов-конструкций, позволяющих
отождествляться с запросом и выдавать в результате предопределенные конструкции.
      Для примера рассмотрим таблицу базы данных, содержащую информацию о странах
(табл. 2):
                                                       Таблица 2
                                Пример таблица базы данных
                            Страна    Столица             Язык
                          Россия      Москва        русский
                          Италия      Рим           итальянский
                          ...         ...           ...


     Простейшую основанную на шаблонах систему можно построить с помощью
следующих правил:
     Шаблон: ... "столица"..., <страна>
     Действие: Вывести столицу в строке, в которой поле страна = <страна>
     Шаблон: . . . "столица" . . . "страна"
     Действие: Вывести столицу и страну для каждой строки
     Согласно первому правилу, если ЕЯ-запрос содержит слово "столица" перед названием
страны (т.е. значением поля Страна), то система найдет записи, содержащие это название
страны, и выведет соответствующую столицу. Например, для запроса "Какая столица
Италии?" будет использовано первое правило, и ответ будет "Рим". То же самое правило
применится для запроса "Напечатать столицу Италии", "Подскажите мне, пожалуйста,
столицу Италии?" и т.д. Во всех этих случаях ответ будет одинаковым.
     В соответствии со вторым правилом, любой ЕЯ-запрос, в котором слово "столица"
предшествует слову "страна", вернет столицу каждой страны в соответствии с содержимым
таблицы. Так, запросы "Какая столица в каждой из стран?", "Вывести на печать столицу
любой страны.", "Столицы и страны, пожалуйста." будут подходить под второе правило.
     Главным достоинством шаблонного подхода является его простота - здесь отсутствуют
сложные модули синтаксического разбора и интерпретации, такую систему, основанную на
шаблонах, легко реализовать. Однако простота подхода имеет оборотную сторону - такие
системы сложно портировать, и их надежность понимания запросов оставляет желать

                                               31