Методы и алгоритмы трансляции естественно-языковых запросов к базе данных в SQL-запросы. Найханова Л.В - 8 стр.

UptoLike

8
1. Обзор и анализ методов решения задачи
Попытки формализовать интеллектуальную деятельность человека привели к
постановке фундаментальной лингвистической задачи [1], состоящей в моделировании его
языкового поведения, т.е. в построении функциональной модели естественного языка.
Естественный язык служит человеку для выражения собственных мыслей и для понимания
мыслей других людей. Первому виду языковой деятельности соответствует синтез
естественно-языковых текстов, а второму - понимание таких текстов, который и
рассматривается в данной работе.
Формальные модели языка рассматриваются как компоненты различных прикладных
систем. Компонента системы, реализующая формальную лингвистическую модель и
способная работать с естественным языком во всем его объеме, называется
лингвистическим процессором (ЛП). В связи с тем, что поставленная задача касается
реализации функции лингвистического процессора, связанной с пониманием предложений
естественного языка, то в дальнейшем будем рассматривать только лингвистический
анализатор.
Цель анализа предложения на естественном языке - перевод их на машинный язык
вычислительной системы. При этом анализатор осуществляет следующие функции [2]:
- распознавание правильно построенных предложений естественного языка;
- декомпозицияразбивка») предложения на составляющие (фрагменты) и
построение соответствующей синтаксической структуры предложения;
- семантическая интерпретация фрагментов предложения естественного языка во
фрагменты М-языка;
- композициясборка») фрагментов М-языка в структуру, описывающую ситуацию
проблемной среды.
Реализация этих функций осуществляется на этапах морфологического и
синтаксического анализов, семантической интерпретации и проблемного анализа. Часто
два последних этапа объединяются в один этап семантического и проблемного анализов.
1.1. Структура лингвистического анализатора
Со стороны своего внутреннего устройства лингвистический анализатор представляет
собой многоуровневый преобразователь [3,4], состоящий из трех уровней пофразного
представления текстаморфологического, синтаксического и семантического. Каждый из
уровней обслуживается соответствующим компонентом моделимассивом правил и
определенными словарями. На каждом из уровней предложение имеет формальный образ,
именуемый в дальнейшем его структуройморфологической, синтаксической и
семантической структурами.
Под морфологической структурой понимается последовательность входящих в
анализируемое предложение слов с указанием части речи и морфологических
характеристик (падежа, числа, рода, одушевленности, вида и т.п.).
Под синтаксической структурой понимается дерево зависимостей, в узлах которого
стоят слова данного естественного языка с указанием части речи и грамматических
характеристик, а дуги соответствуют специфичным для данного естественного языка
отношениям синтаксического подчинения.
Под семантической структурой понимается дерево зависимостей, в узлах которого
              1. Обзор и анализ методов решения задачи
     Попытки формализовать интеллектуальную деятельность человека привели к
постановке фундаментальной лингвистической задачи [1], состоящей в моделировании его
языкового поведения, т.е. в построении функциональной модели естественного языка.
Естественный язык служит человеку для выражения собственных мыслей и для понимания
мыслей других людей. Первому виду языковой деятельности соответствует синтез
естественно-языковых текстов, а второму - понимание таких текстов, который и
рассматривается в данной работе.
     Формальные модели языка рассматриваются как компоненты различных прикладных
систем. Компонента системы, реализующая формальную лингвистическую модель и
способная работать с естественным языком во всем его объеме, называется
лингвистическим процессором (ЛП). В связи с тем, что поставленная задача касается
реализации функции лингвистического процессора, связанной с пониманием предложений
естественного языка, то в дальнейшем будем рассматривать только лингвистический
анализатор.
     Цель анализа предложения на естественном языке - перевод их на машинный язык
вычислительной системы. При этом анализатор осуществляет следующие функции [2]:
     - распознавание правильно построенных предложений естественного языка;
     - декомпозиция («разбивка») предложения на составляющие (фрагменты) и
построение соответствующей синтаксической структуры предложения;
     - семантическая интерпретация фрагментов предложения естественного языка во
фрагменты М-языка;
     - композиция («сборка») фрагментов М-языка в структуру, описывающую ситуацию
проблемной среды.
     Реализация этих функций осуществляется на этапах морфологического и
синтаксического анализов, семантической интерпретации и проблемного анализа. Часто
два последних этапа объединяются в один этап семантического и проблемного анализов.
1.1. Структура лингвистического анализатора
     Со стороны своего внутреннего устройства лингвистический анализатор представляет
собой многоуровневый преобразователь [3,4], состоящий из трех уровней пофразного
представления текста – морфологического, синтаксического и семантического. Каждый из
уровней обслуживается соответствующим компонентом модели – массивом правил и
определенными словарями. На каждом из уровней предложение имеет формальный образ,
именуемый в дальнейшем его структурой – морфологической, синтаксической и
семантической структурами.
     Под морфологической структурой понимается последовательность входящих в
анализируемое предложение слов с указанием части речи и морфологических
характеристик (падежа, числа, рода, одушевленности, вида и т.п.).
     Под синтаксической структурой понимается дерево зависимостей, в узлах которого
стоят слова данного естественного языка с указанием части речи и грамматических
характеристик, а дуги соответствуют специфичным для данного естественного языка
отношениям синтаксического подчинения.
     Под семантической структурой понимается дерево зависимостей, в узлах которого

                                         8