Методы искусственного интеллекта для машинного перевода текстов. Роганов В.Р - 14 стр.

UptoLike

14
английский, получим «Once during a severe winter time I have left a wood»,
потом с английского на русский «Однажды в течение серьезного зимнего
времени» — как видите, результат не очень удачный.
Существует еще один раздел искусственного интеллекта, уточняющий
правила создания алгоритмов перевода. Это конечные автоматы и регулярные
множества.
1.2. Конечные автоматы и регулярные множества
Определение. Конечным автоматом называется упорядоченная пятерка
(K, Σ,
δ,
p
0
, F).
1. Kнепустое конечное множество (множество состояний).
2. Σалфавит (множество входных символов).
3.
δ
отображение множества K × Σ во множество K (функция перехо-
дов).
4. p
0
выделенный элемент множества K (начальное состояние).
5. Fподмножество множества K (множество заключительных со-
стояний).
Определение. Пусть А = (K, Σ,
δ
, p
0
, F) — произвольный конечный авто-
мат. Множество Т (A) = {x ∈ Σ∗⏐
δ
( p
0
, x) F} называется множеством цепо-
чек, допускаемых конечным автоматом А.
Определение. Множество U ∈ Σ* называется регулярным, если существу-
ет конечный автомат А, такой, что U = Т (A).
Замечание. Поскольку регулярные множества являются КСязыками и
распознаются устройствами, имеющими «конечную память», их называют ино-
гда «языками с конечным числом
состояний».
Пусть Rрегулярное множество. Тогда R получается из конечных мно-
жеств цепочек, т.е. из конечных объединений цепочекодноцепочных мно-
жеств») конечным числом применений операций ∪, и *. Если в конечном объ-
единении цепочек мы заменим каждый элемент из множества Σ на регулярное
английский, получим «Once during a severe winter time I have left a wood»,
потом с английского на русский «Однажды в течение серьезного зимнего
времени» — как видите, результат не очень удачный.
        Существует еще один раздел искусственного интеллекта, уточняющий
правила создания алгоритмов перевода. Это конечные автоматы и регулярные
множества.


        1.2. Конечные автоматы и регулярные множества
        Определение. Конечным автоматом называется упорядоченная пятерка
(K, Σ, δ, p0, F).
        1. K — непустое конечное множество (множество состояний).
        2. Σ — алфавит (множество входных символов).
        3. δ —отображение множества K × Σ во множество K (функция перехо-
дов).
        4. p0 — выделенный элемент множества K (начальное состояние).
        5. F — подмножество множества K (множество заключительных со-
стояний).
        Определение. Пусть А = (K, Σ, δ, p0, F) — произвольный конечный авто-
мат. Множество Т (A) = {x ∈ Σ∗⏐ δ( p0, x) ∈ F} называется множеством цепо-
чек, допускаемых конечным автоматом А.
        Определение. Множество U ∈ Σ* называется регулярным, если существу-
ет конечный автомат А, такой, что U = Т (A).
        Замечание. Поскольку регулярные множества являются КС–языками и
распознаются устройствами, имеющими «конечную память», их называют ино-
гда «языками с конечным числом состояний».
        Пусть R — регулярное множество. Тогда R получается из конечных мно-
жеств цепочек, т.е. из конечных объединений цепочек («одноцепочных мно-
жеств») конечным числом применений операций ∪, ⋅ и *. Если в конечном объ-
единении цепочек мы заменим каждый элемент из множества Σ на регулярное


                                                                           14