Человек - интерфейс - компьютер. Будко В.Н. - 56 стр.

UptoLike

Составители: 

Пример структуры компилятора.
Фильтр и ЦАП управляются от ЗУ, куда заранее из памяти образцов заносится
выбранное устройством управления описание сообщения как последовательности кадров.
Каждый кадр содержит параметры: громкости , частоты основного тока , длительности
синтезируемого звука и др .
Кадры опрашиваются с интервалом дискретизации времени 20 мс.
Модулируя основной тон по таблице музыкальных нот, можно синтезировать
пение .
В универсальных синтезаторах стремятся получить функциональную модель
речеобразования, адекватную реально существующим языковым и акустическим
особенностям. Речь формируется по правилам фонетики языка (фонетический метод).
На входе такой модели орфографический или фонемный текст произвольного
содержания. На выходе звучащая речь. По существу - это кибернетическая
функциональная модель чтения текста человеком. В базе знаний синтезатора хранится как
информация об элементарных единицах речи (эталоны фонем, аллофонов и интонем), так
и алгоритмы правил их модификации в зависимости от конкретного контекста звуковой
реализации. Процесс применения этих правил реализуется лингвистическим процессором.
Достоинства универсальных синтезаторов: малый расход памяти на один элемент
речи и неограниченность словаря синтезируемых сообщений. Расплата аппаратная
сложность и трудность получения высоко качества слитной речи.
Сравним методы синтеза по объему необходимой памяти на примере слова «алло»,
длящегося 0,3 с и резерва памяти N=48 Кбайт.
Скорость чтения из ПЗУ Объем памяти
слова «алло»
n, байт
v = n/0,3 байт/с бит/с
Время звучания,
Т=N/v
Формирование речи
1800 6000 48 000 8 с Прямая запись/чтение речи
6000 отсчетов/с по 1 байту
f=3 кГц
СИНТЕЗАТОР
устройство
управления
выборкой и
синхронизацией
память
образцов
ЗУ кадров
коммутатор
генератор f
основного тока
генератор
шума
переключате
ль
Многозвенн
ый цифровой
управляемы
ЦАП
У
У
У
от ПК
f
осн
выбор
   Пример структуры компилятора.
 от ПК      устройство                память                ЗУ кадров
            управления                образцов
            выборкой и
            синхронизацией
         выбор

fосн        коммутатор


                                                                   У
            генератор f
            основного тока                                    Многозвенн
                                          У
                                                                                            У
                                  переключате                 ый цифровой
                                  ль                                                    ЦАП
            генератор                                         управляемы
            шума
                                                 СИНТЕЗАТОР




          Фильтр и ЦАП управляются от ЗУ, куда заранее из памяти образцов заносится
   выбранное устройством управления описание сообщения как последовательности кадров.
   Каждый кадр содержит параметры: громкости, частоты основного тока, длительности
   синтезируемого звука и др.
          Кадры опрашиваются с интервалом дискретизации времени 20 мс.
          Модулируя основной тон по таблице музыкальных нот, можно синтезировать
   пение.
          В универсальных синтезаторах стремятся получить функциональную модель
   речеобразования, адекватную реально существующим языковым и акустическим
   особенностям. Речь формируется по правилам фонетики языка (фонетический метод).
          На входе такой модели – орфографический или фонемный текст произвольного
   содержания. На выходе – звучащая речь. По существу - это кибернетическая
   функциональная модель чтения текста человеком. В базе знаний синтезатора хранится как
   информация об элементарных единицах речи (эталоны фонем, аллофонов и интонем), так
   и алгоритмы правил их модификации в зависимости от конкретного контекста звуковой
   реализации. Процесс применения этих правил реализуется лингвистическим процессором.
          Достоинства универсальных синтезаторов: малый расход памяти на один элемент
   речи и неограниченность словаря синтезируемых сообщений. Расплата – аппаратная
   сложность и трудность получения высоко качества слитной речи.
          Сравним методы синтеза по объему необходимой памяти на примере слова «алло»,
   длящегося 0,3 с и резерва памяти N=48 Кбайт.




   Объем памяти    Скорость чтения из ПЗУ        Время звучания,        Формирование речи
   слова «алло»                                  Т=N/v
                   v = n/0,3 байт/с    бит/с
   n, байт
         1800            6000          48 000          8с               Прямая запись/чтение речи
                                                                        6000 отсчетов/с по 1 байту
                                                                        ∆ f=3 кГц