Естественно-языковые системы. Евдокимова И.С. - 33 стр.

UptoLike

Составители: 

33
S Æ Specimen question | Spacecraft question
Specimen question Æ Specimen Emits info |
Specimen Contains info
Specimen Æ "which rock" | "which specimen"
Emits info Æ "emits" Radiation
Radiation Æ "radiation" | "light"
Contains info Æ "contains" Substance
Substance Æ "magnesium" | "calcium"
Spacecraft question Æ Spacecraft Depart info |
Spacecraft Arrive info
Spacecraft Æ "which vessel" | "which spacecraft"
Depart info Æ "was launched on" Date | "departed
on" Date
Arrive info Æ "returns on" Date | "arrives on" Date
К настоящему времени существующие естественно-языковые системы используют в
основном два последних подхода. Второй подход реализован в достаточно распространенной
системе ЗАПСИБ, разработанной в середине 80-х годов [10]. Система позволяет вести
общение на ограниченном подмножестве естественного языка. Развитием проекта является
система InterBase, вышедшая в 1990 году. Система основана на семантически-
ориентированном анализе и продолжает ряд естественно-языковых технологий лаборатории
искусственного интеллекта ВЦ АН Новосибирска, затем фирмы «Интеллектуальные
технологии», а теперь РосНИИ искусственного интеллекта. В 2001 году эта система была
переработана и получила название InBASE в виде коммерческого продукта. В настоящее
время система представляет собой библиотеку COM-компонентов и среду настройки
естественно-языковых интерфейсов. Существенным отличием от старой версии является
появление промежуточного уровня запросов — Q-языка, являющегося подмножеством языка
объектных запросов OQL и уровня описания предметной области в виде диаграммы классов
UML. В полном соответствии с особенностями семантически-ориентированной парадигмы
InBASE позволяет строить естественно-языковые интерфейсы ко многим языкамдля
русского и для английского используется один и тот же Л-процессор. Интересной
особенностью InBASE является возможность моделирования предметной области на
естественном языке: с помощью класса словарных статей «Толкование» смысл слова можно
описать простой фразой. Это позволяет настраивать естественно-языковые интерфейсы
людям, не обладающим навыками инженеров знаний. Основным недостатком данной
системы является то, что кортежи базы данных продублированы в словаряхотдельных
файлах. В базах данных больших объемов этот недостаток может стать проблемой.
Ярким представителем третьего подхода является система English Query. Система
English Query от Microsoft основана на синтаксически-ориентированных шаблонах,
связываемых с моделью предметной области, и через нее - со схемой базы данных. При
настройке необходимо задать модель базы данных и предметной области, а затем для
каждого отношения в базе данных (а отношением считается и связь между классом и его
which rock
S
Specimen question
Contains info
S
p
ecimen
contains
Substance
ma
g
nesium
Рис. 8. Дерево разбора в
семантической грамматике
 S Æ Specimen question | Spacecraft question
 Specimen question Æ Specimen Emits info |                                S
 Specimen Contains info                                           Specimen question
 Specimen Æ "which rock" | "which specimen"
 Emits info Æ "emits" Radiation
 Radiation Æ "radiation" | "light"                           Specimen         Contains info
 Contains info Æ "contains" Substance
 Substance Æ "magnesium" | "calcium"
                                                            which rock   contains Substance
 Spacecraft question Æ Spacecraft Depart info |
 Spacecraft Arrive info
 Spacecraft Æ "which vessel" | "which spacecraft"                                magnesium
 Depart info Æ "was launched on" Date | "departed
 on" Date
 Arrive info Æ "returns on" Date | "arrives on" Date
                                                                 Рис. 8. Дерево разбора в
                                                                семантической грамматике



      К настоящему времени существующие естественно-языковые системы используют в
основном два последних подхода. Второй подход реализован в достаточно распространенной
системе ЗАПСИБ, разработанной в середине 80-х годов [10]. Система позволяет вести
общение на ограниченном подмножестве естественного языка. Развитием проекта является
система InterBase, вышедшая в 1990 году. Система основана на семантически-
ориентированном анализе и продолжает ряд естественно-языковых технологий лаборатории
искусственного интеллекта ВЦ АН Новосибирска, затем фирмы «Интеллектуальные
технологии», а теперь РосНИИ искусственного интеллекта. В 2001 году эта система была
переработана и получила название InBASE в виде коммерческого продукта. В настоящее
время система представляет собой библиотеку COM-компонентов и среду настройки
естественно-языковых интерфейсов. Существенным отличием от старой версии является
появление промежуточного уровня запросов — Q-языка, являющегося подмножеством языка
объектных запросов OQL и уровня описания предметной области в виде диаграммы классов
UML. В полном соответствии с особенностями семантически-ориентированной парадигмы
InBASE позволяет строить естественно-языковые интерфейсы ко многим языкам — для
русского и для английского используется один и тот же Л-процессор. Интересной
особенностью InBASE является возможность моделирования предметной области на
естественном языке: с помощью класса словарных статей «Толкование» смысл слова можно
описать простой фразой. Это позволяет настраивать естественно-языковые интерфейсы
людям, не обладающим навыками инженеров знаний. Основным недостатком данной
системы является то, что кортежи базы данных продублированы в словарях – отдельных
файлах. В базах данных больших объемов этот недостаток может стать проблемой.
      Ярким представителем третьего подхода является система English Query. Система
English Query от Microsoft основана на синтаксически-ориентированных шаблонах,
связываемых с моделью предметной области, и через нее - со схемой базы данных. При
настройке необходимо задать модель базы данных и предметной области, а затем для
каждого отношения в базе данных (а отношением считается и связь между классом и его


                                                       33