Методы и алгоритмы трансляции естественно-языковых запросов к базе данных в SQL-запросы. Найханова Л.В - 11 стр.

UptoLike

11
модели в форме открытой системы уравнений, позволяющих путем вычисления
осуществлять нормализацию словоформ, получение грамматической информации и синтез
словоформ. Одной из таких моделей является модель Ю. П. Шабанова-Кушнаренко [24],
моделирующая процессы русского языка посредством языка алгебры конечных
предикатов, с помощью которого может быть математически описан любой аспект
морфологии русского языка.
1.3. Аналитический обзор методов синтаксического анализа
В отличие от морфологического анализа текста синтаксический анализ (СА) -
развивающаяся область прикладной лингвистики. Цель синтаксического анализа -
автоматическое построение функционального дерева фразы, т.е. нахождение
взаимозависимостей между разноуровневыми элементами предложения [9-14]. Существует
достаточно много различных способов синтаксического анализа естественно-языковых
текстов, которые можно проанализировать с различных точек зрения. Общая структура
классификации способов синтаксического анализа приведена в таблице 1.
Таблица 1 - Классификация способов синтаксического анализа
п/п
Основание классификации Группа методов
1 Тип цели
Одноцелевые
Многоцелевые
2 Синтаксическая структура
Построение графа зависимостей
Построение дерева непосредственных
составляющих
3
Формальные теории описания
естественного языка
Формально-грамматические методы
Вероятностно-статистические методы
С точки зрения цели синтаксического анализа можно выделить два основных
подхода: одноцелевой и многоцелевой. При первом подходе для фразы требуется
построить одно синтаксическое представление, этот подход характерен для первых
алгоритмов синтаксического анализа, когда считалось, что синтаксических средств
достаточно для того, чтобы обеспечить правильный анализ фразы, хотя бы для
большинства фраз. При втором подходе для фразы требуется получить все те
синтаксические представления, которые удовлетворяют определенным соглашениям (все
«правильно построенные» представления). Вопрос о том, какое из этих представлений
является не только правильно построенным, но и правильным, т.е. соответствующим
смыслу анализируемой фразы, в рамках синтаксического анализа не решается.
Одним из основных компонентов лингвистической базы знаний, осуществляющей
автоматический синтаксический анализ, является описательная модель синтаксической
структуры предложения [9]. Такая модель в значительной степени передает концепцию
разработчиков относительно синтаксического уровня анализа: какая именно информация
об элементах предложения и их взаимосвязях должна выявляться в процессе анализа,
присутствовать в его результатах и какие формы представления ей адекватны. Наиболее
общим для разработчиков синтаксических анализаторов является взгляд, что
синтаксическое строение предложения можно представить некоторым частично
упорядоченным множеством бинарных связей между элементами. Виды и свойства
модели в форме открытой системы уравнений, позволяющих путем вычисления
осуществлять нормализацию словоформ, получение грамматической информации и синтез
словоформ. Одной из таких моделей является модель Ю. П. Шабанова-Кушнаренко [24],
моделирующая процессы русского языка посредством языка алгебры конечных
предикатов, с помощью которого может быть математически описан любой аспект
морфологии русского языка.
1.3. Аналитический обзор методов синтаксического анализа
     В отличие от морфологического анализа текста синтаксический анализ (СА) -
развивающаяся область прикладной лингвистики. Цель синтаксического анализа -
автоматическое построение функционального дерева фразы, т.е. нахождение
взаимозависимостей между разноуровневыми элементами предложения [9-14]. Существует
достаточно много различных способов синтаксического анализа естественно-языковых
текстов, которые можно проанализировать с различных точек зрения. Общая структура
классификации способов синтаксического анализа приведена в таблице 1.

       Таблица 1 - Классификация способов синтаксического анализа
 №
         Основание классификации            Группа методов
 п/п
                                           Одноцелевые
 1       Тип цели
                                           Многоцелевые
                                           Построение графа зависимостей
 2       Синтаксическая структура          Построение дерева непосредственных
                                           составляющих
         Формальные      теории   описания Формально-грамматические методы
 3
         естественного языка               Вероятностно-статистические методы

     С точки зрения цели синтаксического анализа можно выделить два основных
подхода: одноцелевой и многоцелевой. При первом подходе для фразы требуется
построить одно синтаксическое представление, этот подход характерен для первых
алгоритмов синтаксического анализа, когда считалось, что синтаксических средств
достаточно для того, чтобы обеспечить правильный анализ фразы, хотя бы для
большинства фраз. При втором подходе для фразы требуется получить все те
синтаксические представления, которые удовлетворяют определенным соглашениям (все
«правильно построенные» представления). Вопрос о том, какое из этих представлений
является не только правильно построенным, но и правильным, т.е. соответствующим
смыслу анализируемой фразы, в рамках синтаксического анализа не решается.
     Одним из основных компонентов лингвистической базы знаний, осуществляющей
автоматический синтаксический анализ, является описательная модель синтаксической
структуры предложения [9]. Такая модель в значительной степени передает концепцию
разработчиков относительно синтаксического уровня анализа: какая именно информация
об элементах предложения и их взаимосвязях должна выявляться в процессе анализа,
присутствовать в его результатах и какие формы представления ей адекватны. Наиболее
общим для разработчиков синтаксических анализаторов является взгляд, что
синтаксическое строение предложения можно представить некоторым частично
упорядоченным множеством бинарных связей между элементами. Виды и свойства

                                           11