Методы и алгоритмы трансляции естественно-языковых запросов к базе данных в SQL-запросы. Найханова Л.В - 21 стр.

UptoLike

21
для реализации полной схемы анализа и синтеза модели «Смысл-текст» придется учесть
индивидуальные свойства сотен тысяч словарных, морфологических и лексических единиц
и индивидуальные свойства громадного числа пар единиц. Их полное формальное
описание представляет собой громадную и объемную теоретическую работу, поставленную
в лингвистике в последнее время и еще далекую от решения.
Модель контекстного фрагментирования разрабатывалась для анализа и синтеза
естественно-языкового предложения, но ее проработка касается в основном анализа. Задача
лингвистической трансляции естественно-языкового текста рассматривается отдельно от
других задач общения на естественном языке и от задач самой вычислительной системы.
Анализ и трансляция текста осуществляются при наличии достаточно мощных средств
описания и фрагментации лингвистических знаний. Основу модели контекстного
фрагментирования составляет трехуровневая система: лингвистическая модель, базовые
механизмы обработки предложений и ассоциированные процедуры. Лингвистическая
модель содержит информацию о морфологии, синтаксисе и семантике подмножества
естественного языка. В модели выполняется очень глубокий синтаксический анализ с
одновременным преобразованием распознаваемых синтаксических отношений в
семантические. Достоинством данного метода является то, что существует возможность
динамически изменять стратегию обработки естественно-языкового текста в зависимости
от необходимой глубины и последовательности этапов трансляции и расширять метод при
включении новых конструкций естественного языка и редуцировать его для упрощенных
подмножеств естественного языка и проблемных областей.
В заключение обзора различных подходов и направлений реализации моделей
лингвистического процессора можно сделать вывод о том, что к настоящему времени
модели способны:
- извлекать знания из заданного текста и строить правильные предложения
естественного языка по заданным значениям смысла;
- перефразировать эти предложения;
- оценивать их с точки зрения связности и выполнять ряд других задач.
Главным средством решения всех этих задач является специальный семантический
язык для записи содержания высказываний, а также механизмы задания соответствия
между предложениями естественного и семантического языков.
Анализ показал, что разработанные модели имеют достоинства, но и не лишены
недостатков. Многие из них (модели «Семантик предпочтения», «Концептуальной
зависимости» и др.) в основном ориентированы на анализ, в них слабо продуман процесс
преобразования смысла входного высказывания на знания системы, что может привести к
некорректным умозаключениям. Также выделяется класс моделей, в которых отсутствует
или слабо реализован блок морфологического или синтаксического анализов, что
оказывает существенное влияние на качество анализа.
1.5. Выводы по первой главе
Естественно-языковый интерфейс с базами данных не предполагает использование
сложных предложений естественного языка в запросе пользователя. Тем не менее для его
распознавания необходимо строить лингвистический анализатор как преобразователь,
состоящий из трех уровней пофразного представления текста - морфологического,
синтаксического и семантического. Для каждого уровня требуется соответствующий
для реализации полной схемы анализа и синтеза модели «Смысл-текст» придется учесть
индивидуальные свойства сотен тысяч словарных, морфологических и лексических единиц
и индивидуальные свойства громадного числа пар единиц. Их полное формальное
описание представляет собой громадную и объемную теоретическую работу, поставленную
в лингвистике в последнее время и еще далекую от решения.
     Модель контекстного фрагментирования разрабатывалась для анализа и синтеза
естественно-языкового предложения, но ее проработка касается в основном анализа. Задача
лингвистической трансляции естественно-языкового текста рассматривается отдельно от
других задач общения на естественном языке и от задач самой вычислительной системы.
Анализ и трансляция текста осуществляются при наличии достаточно мощных средств
описания и фрагментации лингвистических знаний. Основу модели контекстного
фрагментирования составляет трехуровневая система: лингвистическая модель, базовые
механизмы обработки предложений и ассоциированные процедуры. Лингвистическая
модель содержит информацию о морфологии, синтаксисе и семантике подмножества
естественного языка. В модели выполняется очень глубокий синтаксический анализ с
одновременным преобразованием распознаваемых синтаксических отношений в
семантические. Достоинством данного метода является то, что существует возможность
динамически изменять стратегию обработки естественно-языкового текста в зависимости
от необходимой глубины и последовательности этапов трансляции и расширять метод при
включении новых конструкций естественного языка и редуцировать его для упрощенных
подмножеств естественного языка и проблемных областей.
     В заключение обзора различных подходов и направлений реализации моделей
лингвистического процессора можно сделать вывод о том, что к настоящему времени
модели способны:
     - извлекать знания из заданного текста и строить правильные предложения
естественного языка по заданным значениям смысла;
     - перефразировать эти предложения;
     - оценивать их с точки зрения связности и выполнять ряд других задач.
     Главным средством решения всех этих задач является специальный семантический
язык для записи содержания высказываний, а также механизмы задания соответствия
между предложениями естественного и семантического языков.
     Анализ показал, что разработанные модели имеют достоинства, но и не лишены
недостатков. Многие из них (модели «Семантик предпочтения», «Концептуальной
зависимости» и др.) в основном ориентированы на анализ, в них слабо продуман процесс
преобразования смысла входного высказывания на знания системы, что может привести к
некорректным умозаключениям. Также выделяется класс моделей, в которых отсутствует
или слабо реализован блок морфологического или синтаксического анализов, что
оказывает существенное влияние на качество анализа.
1.5. Выводы по первой главе
     Естественно-языковый интерфейс с базами данных не предполагает использование
сложных предложений естественного языка в запросе пользователя. Тем не менее для его
распознавания необходимо строить лингвистический анализатор как преобразователь,
состоящий из трех уровней пофразного представления текста - морфологического,
синтаксического и семантического. Для каждого уровня требуется соответствующий
                                          21