ВУЗ:
Составители:
Рубрика:
22
компонент модели со своим массивом правил и словарями и построением формального
образа запроса – морфологической, синтаксической и семантической структурами. Следует
отметить, что для решения поставленной задачи полный семантический анализ не
требуется, он необходим для классификации лексем с целью выполнения проблемного
анализа. Поэтому лингвистический анализатор целесообразнее называть лингвистическим
транслятором. Для описания математической модели транслятора будем использовать
модель контекстного фрагментирования.
Как показала практика, для достижения приемлемого качества обработки
естественно-языковых запросов к базе данных не требуется полный грамматический анализ
фразы. Достаточно выделить наиболее информативные единицы текста – ключевые слова,
словосочетания и фрагменты. Поэтому более подходящей моделью лингвистического
анализатора для реализации таких систем является модель контекстного
фрагментирования, так как в ней довольно четко продуманы основные вопросы
морфологии, синтаксиса и отображения естественно-языкового текста на формальный язык
представления знаний базы данных.
Несмотря на то, что исследованиям в области обработки естественно-языковых
предложений посвящено много работ, окончательно теоретический аппарат ещё не
сформирован. В работе необходимо построить модели морфологического и
синтаксического анализов на основе использования известных методов морфологического
и синтаксического анализов. С учетом специфики поставленной цели для трансляции
необходимо разработать соответствующие методы и алгоритмы.
В данной работе в качестве исходной оперативной информации будем рассматривать
запрос пользователя к SQL-ориентированной базе данных, на написание которого
накладываются следующие ограничения:
1. Запрос может состоять из одного или нескольких простых предложений на
русском языке.
2. Если запрос содержит несколько простых предложений, то каждое последующее
предложение должно содержать существительное, приведенное в одном из предыдущих
предложений.
3. В запросе должна затребываться информация, релевантная рассматриваемой базе
данных.
4. Затребываемая в запросе информация должна иметь четкий характер, т.е. не
должны использоваться указательные местоимения я, ты (вы), он (она, оно), они, этот, тот,
такой, таков, столько и т.п., частицы «ли», «либо», «то» и другие.
5. Рекомендуется начинать запрос со специальных слов: Выдать, Показать,
Перечислить, Как, Когда, Где, В какое время, Какой, Куда, Откуда.
При решении задачи будем считать заданными описание концептуальной схемы базы
данных, словари для морфологического, синтаксического анализов, словари синонимов,
словари антонимов.
компонент модели со своим массивом правил и словарями и построением формального образа запроса – морфологической, синтаксической и семантической структурами. Следует отметить, что для решения поставленной задачи полный семантический анализ не требуется, он необходим для классификации лексем с целью выполнения проблемного анализа. Поэтому лингвистический анализатор целесообразнее называть лингвистическим транслятором. Для описания математической модели транслятора будем использовать модель контекстного фрагментирования. Как показала практика, для достижения приемлемого качества обработки естественно-языковых запросов к базе данных не требуется полный грамматический анализ фразы. Достаточно выделить наиболее информативные единицы текста – ключевые слова, словосочетания и фрагменты. Поэтому более подходящей моделью лингвистического анализатора для реализации таких систем является модель контекстного фрагментирования, так как в ней довольно четко продуманы основные вопросы морфологии, синтаксиса и отображения естественно-языкового текста на формальный язык представления знаний базы данных. Несмотря на то, что исследованиям в области обработки естественно-языковых предложений посвящено много работ, окончательно теоретический аппарат ещё не сформирован. В работе необходимо построить модели морфологического и синтаксического анализов на основе использования известных методов морфологического и синтаксического анализов. С учетом специфики поставленной цели для трансляции необходимо разработать соответствующие методы и алгоритмы. В данной работе в качестве исходной оперативной информации будем рассматривать запрос пользователя к SQL-ориентированной базе данных, на написание которого накладываются следующие ограничения: 1. Запрос может состоять из одного или нескольких простых предложений на русском языке. 2. Если запрос содержит несколько простых предложений, то каждое последующее предложение должно содержать существительное, приведенное в одном из предыдущих предложений. 3. В запросе должна затребываться информация, релевантная рассматриваемой базе данных. 4. Затребываемая в запросе информация должна иметь четкий характер, т.е. не должны использоваться указательные местоимения я, ты (вы), он (она, оно), они, этот, тот, такой, таков, столько и т.п., частицы «ли», «либо», «то» и другие. 5. Рекомендуется начинать запрос со специальных слов: Выдать, Показать, Перечислить, Как, Когда, Где, В какое время, Какой, Куда, Откуда. При решении задачи будем считать заданными описание концептуальной схемы базы данных, словари для морфологического, синтаксического анализов, словари синонимов, словари антонимов. 22
Страницы
- « первая
- ‹ предыдущая
- …
- 20
- 21
- 22
- 23
- 24
- …
- следующая ›
- последняя »