Методы искусственного интеллекта для машинного перевода текстов. Роганов В.Р - 9 стр.

UptoLike

9
саниями их структуры. Наиболее широко используемый тип формальной грам-
матикитак называемая порождающая грамматика, или грамматика Хомско-
го.
Для начала определим формальный язык
Λ
как множество цепочек в ал-
фавите Σ (т. е.
Λ
⊆ Σ∗), выделенных с помощью некоторого конечного множе-
ства правил.
Тогда проблема определения того или иного формального языка может
быть сведена к проблеме определения соответствующих правил и указания
способа выделения цепочек с помощью этих правил. Заметим, что речь идет об
однозначности
толкования таких цепочек.
Для этого предложим общий тип правилтак называемые «правила
подстановки», и укажем, как ими пользоваться.
Для обоснования выбора правил рассмотрим задачу анализа предложения
«(The) (man) (ate) (the) (tomato)» (Рис.1).
Рис.1. Одно из возможных деревьев для анализа предложений
Один из возможных вариантов анализа этого предложения изображен на
рисунке, где символ
σ
обозначает «предложение», (NP) — «именную группу»,
саниями их структуры. Наиболее широко используемый тип формальной грам-
матики — так называемая порождающая грамматика, или грамматика Хомско-
го.
      Для начала определим формальный язык Λ как множество цепочек в ал-
фавите Σ (т. е. Λ ⊆ Σ∗), выделенных с помощью некоторого конечного множе-
ства правил.
      Тогда проблема определения того или иного формального языка может
быть сведена к проблеме определения соответствующих правил и указания
способа выделения цепочек с помощью этих правил. Заметим, что речь идет об
однозначности толкования таких цепочек.
      Для этого предложим общий тип правил — так называемые «правила
подстановки», и укажем, как ими пользоваться.
      Для обоснования выбора правил рассмотрим задачу анализа предложения
«(The) (man) (ate) (the) (tomato)» (Рис.1).




               Рис.1. Одно из возможных деревьев для анализа предложений


      Один из возможных вариантов анализа этого предложения изображен на
рисунке, где символ σ обозначает «предложение», (NP) — «именную группу»,



                                                                           9