Составители:
Рубрика:
  16
кодека  как  средняя  оценка  качества  большой  группой  слушателей  по  пятибалльной 
шкале.  Для  прослушивания  экспертам  предъявляются  разные  звуковые  фрагменты – 
речь,  музыка,  речь  на  фоне  различного  шума  и  т.д.  Оценки  интерпретируют 
следующим образом: 
o  4-5 – высокое качество; аналогично качеству передачи речи в ISDN, или 
еще выше. 
o  3.5-4 – качество  ТфОП (toll quality); аналогично  качеству
  речи, 
передаваемой  с помощью кодека ADPCM при скорости 32 Кбит/с. Такое качество 
обычно обеспечивается при большинстве телефонных разговоров. Мобильные сети 
обеспечивают качество чуть ниже toll quality. 
o  3-3.5 – качество  речи,  по-прежнему,  удовлетворительно,  однако  его 
ухудшение хорошо заметно на слух. 
o  2.5-3 – речь  разборчива,  однако  требует  концентрации  внимания  для 
понимания. Такое качество обычно 
обеспечивается  в системах связи специального 
применения (например, в вооруженных силах). 
В  рамках  существующих  технологий  качество  ТфОП (toll quality) невозможно 
обеспечить при скоростях менее 5 Кбит/с. 
Подавление периодов молчания (VAD, CNG, DTX) 
При  диалоге  один  его  участник  говорит,  в  среднем,  только 35 процентов 
времени.  Таким  образом,  если  применить  алгоритмы,  которые  позволяют  уменьшить 
объем информации, передаваемой  в периоды  молчания, то  можно  значительно сузить 
необходимую  полосу  пропускания.  В  двустороннем  разговоре  такие  меры  позволяют 
достичь  сокращения  объема  передаваемой  информации  до 50%, а  в 
децентрализованных  многоадресных  конференциях (за  счет  большего  количества 
говорящих) – и  более.  Технология  подавления  таких  периодов  имеет  три  важные 
составляющие. 
Нужно  отметить,  что  определение  границ  пауз  в  речи  очень  существенно  для 
эффективной  синхронизации  передающей  и  приемной  сторон:  приемник  может, 
незначительно  изменяя  длительности  пауз,  производить  подстройку  скорости 
воспроизведения  для  каждого  отдельного  сеанса  связи,  что  исключает  необходимость 
синхронизации  тактовых  генераторов  всех  элементов  сети,  как  это  имеет  место  в 
ТфОП. 
Детектор речевой  активности  (Voice Activity Detector – VAD) необходим для 
определения  периодов  времени,  когда  пользователь  говорит.  Детектор VAD должен 
обладать  малым  временем  реакции,  чтобы  не  допускать  потерь  начальных  слов  и  не 
Страницы
- « первая
- ‹ предыдущая
- …
- 14
- 15
- 16
- 17
- 18
- …
- следующая ›
- последняя »
