Организация вычислительных систем и сетей. Халабия Р.Ф. - 61 стр.

UptoLike

Составители: 

61
Модуль предсказания переходов (Branch Logic). Назначение этого
модуля, как следует из его названия, состоит в предсказании возможных
переходов.
Во всех "старых процессорах AMD, Модуль вычислений с плавающей
точкой был неконвейерным, что не позволяло начать выполнять новую команду
пока не закончиться выполнение предыдущей. Это приводит к сильному
падению производительности всей системы. До сих пор
разработчики AMD не
вносили никаких изменений в FPU, рассчитывая на свой блок 3Dnow!
В Athlone AMD (рис. 4.17) впервые представляет новый, полностью
конвейерный FPU модуль, позволяюший выполнять до трех операций за такт.
Обратите внимание на три вычислительных блока и на то, как модули
Stack Map, Registry Rename, Scheduler с 36 входами и FPU Register File с 88
входами позволяют разделить вычисления между ними (рис. 4.18).
Рабочая схема модуля вычислений с плавающей точкой
Рис. 4.18.
FPU в процессорах Pentium III и Celeron разделен на два модуля FADD и
FMUL; первый, полностью конвейерный, выполняет простые вычисления, в то
время как второй выполняет более сложные вычисления и не полностью
конвейерный. Естественно, что наличие трех, полностью конвейерных
модулей, вместо двух, из которых только один
Instruction Control Unit
FPU Stack Map
FPU Register Rename
FPU Scheduler (36-entry)
Fstore
FADD
MMX
3Dnow!
FMULL
MMX
3Dnow!
FPU Register File (88-Entry)
      Модуль предсказания переходов (Branch Logic). Назначение этого
модуля, как следует из его названия, состоит в предсказании возможных
переходов.
      Во всех "старых процессорах AMD, Модуль вычислений с плавающей
точкой был неконвейерным, что не позволяло начать выполнять новую команду
пока не закончиться выполнение предыдущей. Это приводит к сильному
падению производительности всей системы. До сих пор разработчики AMD не
вносили никаких изменений в FPU, рассчитывая на свой блок 3Dnow!
      В Athlone AMD (рис. 4.17) впервые представляет новый, полностью
конвейерный FPU модуль, позволяюший выполнять до трех операций за такт.
      Обратите внимание на три вычислительных блока и на то, как модули
Stack Map, Registry Rename, Scheduler с 36 входами и FPU Register File с 88
входами позволяют разделить вычисления между ними (рис. 4.18).

            Рабочая схема модуля вычислений с плавающей точкой

                  Instruction Control Unit


                                                                     FPU Stack Map



                                                                   FPU Register Rename



                                                               FPU Scheduler (36-entry)



                                                             FPU Register File (88-Entry)



                                                          Fstore          FADD           FMULL
                                                                          MMX             MMX
                                                                         3Dnow!          3Dnow!




                                             Рис. 4.18.

     FPU в процессорах Pentium III и Celeron разделен на два модуля FADD и
FMUL; первый, полностью конвейерный, выполняет простые вычисления, в то
время как второй выполняет более сложные вычисления и не полностью
конвейерный. Естественно, что наличие трех, полностью конвейерных
модулей, вместо двух, из которых только один




                                             61