ВУЗ:
Составители:
Рубрика:
8
1. Обзор и анализ методов решения задачи
Попытки формализовать интеллектуальную деятельность человека привели к
постановке фундаментальной лингвистической задачи [1], состоящей в моделировании его
языкового поведения, т.е. в построении функциональной модели естественного языка.
Естественный язык служит человеку для выражения собственных мыслей и для понимания
мыслей других людей. Первому виду языковой деятельности соответствует синтез
естественно-языковых текстов, а второму - понимание таких текстов, который и
рассматривается в данной работе.
Формальные модели языка рассматриваются как компоненты различных прикладных
систем. Компонента системы, реализующая формальную лингвистическую модель и
способная работать с естественным языком во всем его объеме, называется
лингвистическим процессором (ЛП). В связи с тем, что поставленная задача касается
реализации функции лингвистического процессора, связанной с пониманием предложений
естественного языка, то в дальнейшем будем рассматривать только лингвистический
анализатор.
Цель анализа предложения на естественном языке - перевод их на машинный язык
вычислительной системы. При этом анализатор осуществляет следующие функции [2]:
- распознавание правильно построенных предложений естественного языка;
- декомпозиция («разбивка») предложения на составляющие (фрагменты) и
построение соответствующей синтаксической структуры предложения;
- семантическая интерпретация фрагментов предложения естественного языка во
фрагменты М-языка;
- композиция («сборка») фрагментов М-языка в структуру, описывающую ситуацию
проблемной среды.
Реализация этих функций осуществляется на этапах морфологического и
синтаксического анализов, семантической интерпретации и проблемного анализа. Часто
два последних этапа объединяются в один этап семантического и проблемного анализов.
1.1. Структура лингвистического анализатора
Со стороны своего внутреннего устройства лингвистический анализатор представляет
собой многоуровневый преобразователь [3,4], состоящий из трех уровней пофразного
представления текста – морфологического, синтаксического и семантического. Каждый из
уровней обслуживается соответствующим компонентом модели – массивом правил и
определенными словарями. На каждом из уровней предложение имеет формальный образ,
именуемый в дальнейшем его структурой – морфологической, синтаксической и
семантической структурами.
Под морфологической структурой понимается последовательность входящих в
анализируемое предложение слов с указанием части речи и морфологических
характеристик (падежа, числа, рода, одушевленности, вида и т.п.).
Под синтаксической структурой понимается дерево зависимостей, в узлах которого
стоят слова данного естественного языка с указанием части речи и грамматических
характеристик, а дуги соответствуют специфичным для данного естественного языка
отношениям синтаксического подчинения.
Под семантической структурой понимается дерево зависимостей, в узлах которого
1. Обзор и анализ методов решения задачи Попытки формализовать интеллектуальную деятельность человека привели к постановке фундаментальной лингвистической задачи [1], состоящей в моделировании его языкового поведения, т.е. в построении функциональной модели естественного языка. Естественный язык служит человеку для выражения собственных мыслей и для понимания мыслей других людей. Первому виду языковой деятельности соответствует синтез естественно-языковых текстов, а второму - понимание таких текстов, который и рассматривается в данной работе. Формальные модели языка рассматриваются как компоненты различных прикладных систем. Компонента системы, реализующая формальную лингвистическую модель и способная работать с естественным языком во всем его объеме, называется лингвистическим процессором (ЛП). В связи с тем, что поставленная задача касается реализации функции лингвистического процессора, связанной с пониманием предложений естественного языка, то в дальнейшем будем рассматривать только лингвистический анализатор. Цель анализа предложения на естественном языке - перевод их на машинный язык вычислительной системы. При этом анализатор осуществляет следующие функции [2]: - распознавание правильно построенных предложений естественного языка; - декомпозиция («разбивка») предложения на составляющие (фрагменты) и построение соответствующей синтаксической структуры предложения; - семантическая интерпретация фрагментов предложения естественного языка во фрагменты М-языка; - композиция («сборка») фрагментов М-языка в структуру, описывающую ситуацию проблемной среды. Реализация этих функций осуществляется на этапах морфологического и синтаксического анализов, семантической интерпретации и проблемного анализа. Часто два последних этапа объединяются в один этап семантического и проблемного анализов. 1.1. Структура лингвистического анализатора Со стороны своего внутреннего устройства лингвистический анализатор представляет собой многоуровневый преобразователь [3,4], состоящий из трех уровней пофразного представления текста – морфологического, синтаксического и семантического. Каждый из уровней обслуживается соответствующим компонентом модели – массивом правил и определенными словарями. На каждом из уровней предложение имеет формальный образ, именуемый в дальнейшем его структурой – морфологической, синтаксической и семантической структурами. Под морфологической структурой понимается последовательность входящих в анализируемое предложение слов с указанием части речи и морфологических характеристик (падежа, числа, рода, одушевленности, вида и т.п.). Под синтаксической структурой понимается дерево зависимостей, в узлах которого стоят слова данного естественного языка с указанием части речи и грамматических характеристик, а дуги соответствуют специфичным для данного естественного языка отношениям синтаксического подчинения. Под семантической структурой понимается дерево зависимостей, в узлах которого 8
Страницы
- « первая
- ‹ предыдущая
- …
- 6
- 7
- 8
- 9
- 10
- …
- следующая ›
- последняя »