Естественно-языковые системы. Евдокимова И.С. - 61 стр.

UptoLike

Составители: 

61
РАЗДЕЛ 2. ЛИНГВИСТИЧЕСКИЙ ПРОЦЕССОР - ЯДРО ЕЯ-СИСТЕМЫ
Лекция 5. Лингвистический процессор
Назначение лингвистического процессора
Попытки формализовать интеллектуальную деятельность человека привели к
постановке фундаментальной лингвистической задачи, состоящей в моделировании его
языкового поведения, т.е. в построении функциональной модели естественного языка.
Естественный язык служит человеку для выражения собственных мыслей и для понимания
мыслей других людей. Первому виду языковой деятельности соответствует производство
ЕЯ-текстов, а второму - понимание таких текстов. Если обозначить множество текстов через
{Т}, а множество выражаемых ими смыслов через {С}, то модель естественного языка
можно определить как транслятор, устанавливающий соответствие между этими двумя
множествами: {Т} {С}.
Формальные модели языка рассматриваются как компоненты различных прикладных
ЕЯ-систем. Компонента системы, реализующая формальную лингвистическую модель и
способная работать с ЕЯ во всем его объеме, называется лингвистическим процессором (ЛП).
Две основные функции ЛП состоят в извлечении смысла из заданного текста и в
выражении заданного смысла текстом на ЕЯ, иначе это функции:
моделирования понимания (анализ);
моделирования производства текстов (синтез).
Формальная модель, лежащая в основе ЛП, является наиболее полной моделью класса
«Смысл
Текст». Такая модель обеспечивает получение связных синтаксических структур
для всех предложений обрабатываемых текстов, независимо от степени их сложности, и
переработку текстов на естественном языке без смысловых потерь.
Структура и состав лингвистического процессора
Со стороны своего внутреннего устройства лингвистический процессор представляет
собой многоуровневый преобразователь. В нем различаются три уровня пофразного
представления текста - морфологический, синтаксический и семантический. Каждый из
уровней обслуживается соответствующим компонентом модели - массивом правил и
определенным словарем. На каждом из уровней предложение имеет формальный образ,
именуемый в дальнейшем его структурой - морфологической (МорфС), синтаксической
(СинтС) и семантической (СемС). Синтез представляет собой обратный переход от СемС
предложения к его записи в обычном орфографическом виде. Структура лингвистического
процессора представлена на рисунке 12.
Под морфологической структурой понимается последовательность входящих в
анализируемое предложение слов с указанием части речи и морфологических характеристик
(падежа, числа, рода, одушевленности, вида и т.п.).
Под синтаксической структурой понимается дерево зависимостей, в узлах которого
стоят слова данного естественного языка с указанием части речи и грамматических
характеристик, а дуги соответствуют специфичным для данного естественного языка
      РАЗДЕЛ 2. ЛИНГВИСТИЧЕСКИЙ ПРОЦЕССОР - ЯДРО ЕЯ-СИСТЕМЫ

                           Лекция 5. Лингвистический процессор

Назначение лингвистического процессора
     Попытки формализовать интеллектуальную деятельность человека привели к
постановке фундаментальной лингвистической задачи, состоящей в моделировании его
языкового поведения, т.е. в построении функциональной модели естественного языка.
Естественный язык служит человеку для выражения собственных мыслей и для понимания
мыслей других людей. Первому виду языковой деятельности соответствует производство
ЕЯ-текстов, а второму - понимание таких текстов. Если обозначить множество текстов через
{Т}, а множество выражаемых ими смыслов через {С}, то модель естественного языка
можно определить как транслятор, устанавливающий соответствие       между этими двумя
множествами: {Т} ⇔ {С}.
     Формальные модели языка рассматриваются как компоненты различных прикладных
ЕЯ-систем. Компонента системы, реализующая формальную лингвистическую модель и
способная работать с ЕЯ во всем его объеме, называется лингвистическим процессором (ЛП).
     Две основные функции ЛП состоят в извлечении смысла из заданного текста и в
выражении заданного смысла текстом на ЕЯ, иначе это функции:
        ƒ моделирования понимания (анализ);
        ƒ моделирования производства текстов (синтез).
     Формальная модель, лежащая в основе ЛП, является наиболее полной моделью класса
«Смысл ⇔ Текст». Такая модель обеспечивает получение связных синтаксических структур
для всех предложений обрабатываемых текстов, независимо от степени их сложности, и
переработку текстов на естественном языке без смысловых потерь.

Структура и состав лингвистического процессора
     Со стороны своего внутреннего устройства лингвистический процессор представляет
собой многоуровневый преобразователь. В нем различаются три уровня пофразного
представления текста - морфологический, синтаксический и семантический. Каждый из
уровней обслуживается соответствующим компонентом модели - массивом правил и
определенным словарем. На каждом из уровней предложение имеет формальный образ,
именуемый в дальнейшем его структурой - морфологической (МорфС), синтаксической
(СинтС) и семантической (СемС). Синтез представляет собой обратный переход от СемС
предложения к его записи в обычном орфографическом виде. Структура лингвистического
процессора представлена на рисунке 12.
     Под морфологической структурой понимается последовательность входящих в
анализируемое предложение слов с указанием части речи и морфологических характеристик
(падежа, числа, рода, одушевленности, вида и т.п.).
     Под синтаксической структурой понимается дерево зависимостей, в узлах которого
стоят слова данного естественного языка с указанием части речи и грамматических
характеристик, а дуги соответствуют специфичным для данного естественного языка

                                              61