ВУЗ:
Составители:
Рубрика:
31
ориентированной парадигме. Вторая сложность — типичные естественно-языковые запросы,
которые, как правило, не имеют правильных синтаксических конструкций. На это влияют
вольное словоизменение и словообразование в виде неологизмов сетевой общественности,
большой процент имен собственных и сокращений, игнорирование правил пунктуации, что
приводит к тому, что от естественного языка во всем его многообразии иногда остается лишь
лексика, причудливым образом исковерканная. И, наконец, необходимые в этом подходе
семантические словари — очень трудоемкая составляющая, для многих предметных
областей они просто отсутствуют, а их разработка требует высокой квалификации.
Третий подход к анализу естественно-языковых запросов основан на шаблонах. Он
появился самым первым и с точки зрения программной реализации наиболее прост. Суть его
в том, что возможные запросы покрываются набором шаблонов-конструкций, позволяющих
отождествляться с запросом и выдавать в результате предопределенные конструкции.
Для примера рассмотрим таблицу базы данных, содержащую информацию о странах
(табл. 2):
Таблица 2
Пример таблица базы данных
Страна Столица Язык
Россия Москва русский
Италия Рим итальянский
... ... ...
Простейшую основанную на шаблонах систему можно построить с помощью
следующих правил:
Шаблон: ... "столица"..., <страна>
Действие: Вывести столицу в строке, в которой поле страна = <страна>
Шаблон: . . . "столица" . . . "страна"
Действие: Вывести столицу и страну для каждой строки
Согласно первому правилу, если ЕЯ-запрос содержит слово "столица" перед названием
страны (т.е. значением поля Страна), то система найдет записи, содержащие это название
страны, и выведет соответствующую столицу. Например, для запроса "Какая столица
Италии?" будет использовано первое правило, и ответ будет "Рим". То же самое правило
применится для запроса "Напечатать столицу Италии", "Подскажите мне, пожалуйста,
столицу Италии?" и т.д. Во всех этих случаях ответ будет одинаковым.
В соответствии со вторым правилом, любой ЕЯ-запрос, в котором слово "столица"
предшествует слову "страна", вернет столицу каждой страны в соответствии с содержимым
таблицы. Так, запросы "Какая столица в каждой из стран?", "Вывести на печать столицу
любой страны.", "Столицы и страны, пожалуйста." будут подходить под второе правило.
Главным достоинством шаблонного подхода является его простота - здесь отсутствуют
сложные модули синтаксического разбора и интерпретации, такую систему, основанную на
шаблонах, легко реализовать. Однако простота подхода имеет оборотную сторону - такие
системы сложно портировать, и их надежность понимания запросов оставляет желать
ориентированной парадигме. Вторая сложность — типичные естественно-языковые запросы, которые, как правило, не имеют правильных синтаксических конструкций. На это влияют вольное словоизменение и словообразование в виде неологизмов сетевой общественности, большой процент имен собственных и сокращений, игнорирование правил пунктуации, что приводит к тому, что от естественного языка во всем его многообразии иногда остается лишь лексика, причудливым образом исковерканная. И, наконец, необходимые в этом подходе семантические словари — очень трудоемкая составляющая, для многих предметных областей они просто отсутствуют, а их разработка требует высокой квалификации. Третий подход к анализу естественно-языковых запросов основан на шаблонах. Он появился самым первым и с точки зрения программной реализации наиболее прост. Суть его в том, что возможные запросы покрываются набором шаблонов-конструкций, позволяющих отождествляться с запросом и выдавать в результате предопределенные конструкции. Для примера рассмотрим таблицу базы данных, содержащую информацию о странах (табл. 2): Таблица 2 Пример таблица базы данных Страна Столица Язык Россия Москва русский Италия Рим итальянский ... ... ... Простейшую основанную на шаблонах систему можно построить с помощью следующих правил: Шаблон: ... "столица"..., <страна> Действие: Вывести столицу в строке, в которой поле страна = <страна> Шаблон: . . . "столица" . . . "страна" Действие: Вывести столицу и страну для каждой строки Согласно первому правилу, если ЕЯ-запрос содержит слово "столица" перед названием страны (т.е. значением поля Страна), то система найдет записи, содержащие это название страны, и выведет соответствующую столицу. Например, для запроса "Какая столица Италии?" будет использовано первое правило, и ответ будет "Рим". То же самое правило применится для запроса "Напечатать столицу Италии", "Подскажите мне, пожалуйста, столицу Италии?" и т.д. Во всех этих случаях ответ будет одинаковым. В соответствии со вторым правилом, любой ЕЯ-запрос, в котором слово "столица" предшествует слову "страна", вернет столицу каждой страны в соответствии с содержимым таблицы. Так, запросы "Какая столица в каждой из стран?", "Вывести на печать столицу любой страны.", "Столицы и страны, пожалуйста." будут подходить под второе правило. Главным достоинством шаблонного подхода является его простота - здесь отсутствуют сложные модули синтаксического разбора и интерпретации, такую систему, основанную на шаблонах, легко реализовать. Однако простота подхода имеет оборотную сторону - такие системы сложно портировать, и их надежность понимания запросов оставляет желать 31
Страницы
- « первая
- ‹ предыдущая
- …
- 29
- 30
- 31
- 32
- 33
- …
- следующая ›
- последняя »