Методы искусственного интеллекта для машинного перевода текстов. Роганов В.Р - 10 стр.

UptoLike

10
(VP) — «группу глагола», T — «артикль», N — «существительное», V — «гла-
гол».
Правило 1. Для того, чтобы подчеркнуть, что имеем дело с неделимыми
последовательностями символов, будем заключать их в скобки, например,
«man», «VP».
Правило 2. Рисунок показывает, что последовательность неделимых объ-
ектов «(The) (man)» является именной группой, «(ate) (the) (tomato)» — группой
глагола и т.д. Мы можем предположить, что искомая грамматика
состоит (хотя
бы частично) из правил вида
σ
(NP) (VP), (NP) TN, V (ate) и т. д., где
символы, стоящие слева от , могут быть заменены на символы, стоящие спра-
ва от (на рисунке символы, стоящие справа от , расположены над симво-
лами, стоящими слева от ). Приняв такое допущение, можно считать, что дан-
ное предложение
порождается с помощью «правил подстановки» по следую-
щей схеме (на каждом этапе применяется в точности одно правило):
σ
(NP)(VP) TN (VP) (The) N (VP) (The)(man) (VP)
(The)(man) V (NP) (The) (man) (ate) (NP) (The) (man) (ate) TN (The)
(man) (ate) (the) N (The) (man) (ate) (the) (tomato).
Символ имеет следующий смысл: если один из неделимых объектов
слева от заменить, а остальные переписать без изменения, то получится це-
почка неделимых объектов, расположенная справа от
.
Дадим теперь строгое определение понятий, о которых шла речь в преды-
дущем абзаце.
Определение. Порождающей грамматикой (или системой подстановок)
называется упорядоченная четверка G = (V, Σ, P, σ),
где Vконечный алфавит;
Σ ⊆ Vконечный алфавит;
Pконечное множество упорядоченных пар вида (u, v),
u (VΣ)* — {ε} и
v V*;
σ ∈ VΣ.
(VP) — «группу глагола», T — «артикль», N — «существительное», V — «гла-
гол».
        Правило 1. Для того, чтобы подчеркнуть, что имеем дело с неделимыми
последовательностями символов, будем заключать их в скобки, например,
«man», «VP».
        Правило 2. Рисунок показывает, что последовательность неделимых объ-
ектов «(The) (man)» является именной группой, «(ate) (the) (tomato)» — группой
глагола и т.д. Мы можем предположить, что искомая грамматика состоит (хотя
бы частично) из правил вида σ → (NP) (VP), (NP) → TN, V → (ate) и т. д., где
символы, стоящие слева от →, могут быть заменены на символы, стоящие спра-
ва от → (на рисунке символы, стоящие справа от →, расположены над симво-
лами, стоящими слева от →). Приняв такое допущение, можно считать, что дан-
ное предложение порождается с помощью «правил подстановки» по следую-
щей схеме (на каждом этапе применяется в точности одно правило):
        σ ⇒ (NP)(VP) ⇒ TN (VP) ⇒ (The) N (VP) ⇒ (The)(man) (VP) ⇒
(The)(man) V (NP) ⇒ (The) (man) (ate) (NP) ⇒ (The) (man) (ate) TN ⇒ (The)
(man) (ate) (the) N ⇒ (The) (man) (ate) (the) (tomato).
        Символ ⇒ имеет следующий смысл: если один из неделимых объектов
слева от ⇒ заменить, а остальные переписать без изменения, то получится це-
почка неделимых объектов, расположенная справа от ⇒.
        Дадим теперь строгое определение понятий, о которых шла речь в преды-
дущем абзаце.
        Определение. Порождающей грамматикой (или системой подстановок)
называется упорядоченная четверка G = (V, Σ, P, σ),
где V — конечный алфавит;
   Σ ⊆ V — конечный алфавит;
   P — конечное множество упорядоченных пар вида (u, v),
   u ∈ (V — Σ)* — {ε} и v ∈ V*;
   σ ∈ V — Σ.

                                                                            10