ВУЗ:
Составители:
Рубрика:
23
2. Модель лингвистического транслятора
Анализ и трансляция текста осуществляются при наличии достаточно мощных
средств описания и фрагментации лингвистических знаний. Схема отображения ЕЯ-текста
адекватна трансляции ЕЯ-запросов на проблемную область в базе данных. Инвариантность
проблемной области достаточно точно отражается в словаре базы данных. Словарь БД
предполагает наличие в них всех концептов проблемной области и включает в себя, как
минимум, имя концепта и его определение.
2.1. Математическая модель транслятора
Основу модели контекстного фрагментирования составляет трехуровневая система:
лингвистическая модель, базовые механизмы обработки предложений и ассоциированные
процедуры. В модели выполняется синтаксический анализ с одновременным
преобразованием распознаваемых синтаксических отношений в семантические.
Структуру системы общения с базами данных можно представить в виде тройки:
Z = <M, В, K>,
(1.1)
где М – лингвистическая модель;
В – базовые механизмы обработки предложений;
К – ассоциированные процедуры.
Лингвистическая модель М содержит информацию о морфологии, синтаксисе и
семантике подмножества естественного языка. Семантика определяется как интерпретация
компонентов текста естественного языка компонентами проблемной среды.
Лингвистическая модель представляется в виде:
M = <M
1
, M
2
, M
3
>,
(1.2)
где M
1
– грамматическая модель;
M
2
– интерпретационная модель;
M
3
– модель трансляции, включающая семантический и проблемный анализы.
Структура лингвистической модели определяется выбором языка представления
знаний и реализуемой схемой трансляции, а ее наполнение – используемым
подмножеством естественного языка и моделью проблемной среды.
Грамматическая модель, в свою очередь, состоит из кортежа:
>
′
′
′
=
<
111
, MMM
,
(1.3)
где M
1
′
- модель морфологического анализа;
M
1
′′
- модель синтаксического анализа.
Интерпретационная модель
М
2
задается в виде вектора:
>
′
′
′
=<
222
, MMM ,
(1.4)
где
2
M
′
– модель метаописания базы данных;
2
M
′
′
- модель проблемной среды.
Базовые механизмы В реализуют четыре основных отображения: Ψ
1
: T → X
(морфологический разбор); Ψ
2
: Х→G (синтаксический разбор); Ψ
3
: G→G
~
(семантический и
проблемный анализы), Ψ
4
: G
~
→Q (трансляция), где Т – текст естественного языка в виде
множества лексем, X - множество лексем с векторами морфологической информации v, G -
граф зависимостей, в вершинах которого располагаются словоформы (лексемы), а дуги
отображают связь от вершины “предок” к вершине “потомок”, G
~
- граф, в вершинах
которого располагаются термины физической модели базы данных, Q – SQL-запрос в виде
2. Модель лингвистического транслятора
Анализ и трансляция текста осуществляются при наличии достаточно мощных
средств описания и фрагментации лингвистических знаний. Схема отображения ЕЯ-текста
адекватна трансляции ЕЯ-запросов на проблемную область в базе данных. Инвариантность
проблемной области достаточно точно отражается в словаре базы данных. Словарь БД
предполагает наличие в них всех концептов проблемной области и включает в себя, как
минимум, имя концепта и его определение.
2.1. Математическая модель транслятора
Основу модели контекстного фрагментирования составляет трехуровневая система:
лингвистическая модель, базовые механизмы обработки предложений и ассоциированные
процедуры. В модели выполняется синтаксический анализ с одновременным
преобразованием распознаваемых синтаксических отношений в семантические.
Структуру системы общения с базами данных можно представить в виде тройки:
Z = , (1.1)
где М – лингвистическая модель;
В – базовые механизмы обработки предложений;
К – ассоциированные процедуры.
Лингвистическая модель М содержит информацию о морфологии, синтаксисе и
семантике подмножества естественного языка. Семантика определяется как интерпретация
компонентов текста естественного языка компонентами проблемной среды.
Лингвистическая модель представляется в виде:
M = , (1.2)
где M1 – грамматическая модель;
M2 – интерпретационная модель;
M3 – модель трансляции, включающая семантический и проблемный анализы.
Структура лингвистической модели определяется выбором языка представления
знаний и реализуемой схемой трансляции, а ее наполнение – используемым
подмножеством естественного языка и моделью проблемной среды.
Грамматическая модель, в свою очередь, состоит из кортежа:
M1 =< M1′ , M1′′ > (1.3)
,
где M1′- модель морфологического анализа;
M1′′ - модель синтаксического анализа.
Интерпретационная модель М2 задается в виде вектора:
M 2 =< M 2′ , M 2′′ > , (1.4)
где M 2′ – модель метаописания базы данных; M 2′′ - модель проблемной среды.
Базовые механизмы В реализуют четыре основных отображения: Ψ1: T → X
~
(морфологический разбор); Ψ2: Х→G (синтаксический разбор); Ψ3: G→ G (семантический и
~
проблемный анализы), Ψ4: G →Q (трансляция), где Т – текст естественного языка в виде
множества лексем, X - множество лексем с векторами морфологической информации v, G -
граф зависимостей, в вершинах которого располагаются словоформы (лексемы), а дуги
~
отображают связь от вершины “предок” к вершине “потомок”, G - граф, в вершинах
которого располагаются термины физической модели базы данных, Q – SQL-запрос в виде
23
Страницы
- « первая
- ‹ предыдущая
- …
- 21
- 22
- 23
- 24
- 25
- …
- следующая ›
- последняя »
