ВУЗ:
Составители:
количество однотипных вычислений (а к ним, помимо обработки потоков данных в какой-то
мере относятся и 3D-игры), получали существенный прирост производительности.
SSE2 же оперирует с теми же самыми регистрами XMM и обратно совместим с SSE
процессора Pentium III. А расширение набора команд Pentium 4 вызвано тем, что теперь
операции со 128-битными регистрами могут выполняться не только с четверками
вещественных чисел одинарной точности, но и с парами вещественных чисел двойной
точности. Процессор может работать также с шестнадцатью однобайтовыми целыми, с
восемью короткими двухбайтовыми целыми, с четырьмя четырехбайтовыми целыми, с
двумя восьми байтовыми целыми. То есть, теперь SSE2-расширение представляет собой
симбиоз MMX и SSE и позволяет работать с любыми типами данных, вмещающимися в 128-
битные регистры.
Блок SSE2 инструкций реализован по архитектуре OKMD (SIMD) и относится к
классу векторных конвейеров. Он поддерживает операции над двумерными векторами,
элементами которых являются 64-разрядные числа с плавающей запятой двойной точностью.
Использование этого блока позволяет Pentium 4 выполнять две операции с плавающей
запятой двойной точности за 1 такт.
К недостаткам реализации SSE2 Pentium 4 можно отнести следующее: 80-разрядное
представление чисел с плавающей точкой, используемые в x87-инструкциях, заменяется на
64-разрядное. Такая замена диктует необходимость перекомпиляции программного кода x87
инструкций. Неполная конвейеризация арифметических операций (64-разрядное умножение,
сложение) приводит к пропуску одного такта между соседними инструкциями.
Файл регистров Pentium 4 играет роль накопителя, где хранятся операнды,
участвующие при выполнении микроопераций и их результаты. Он содержит 128 регистров
и разделяется на два файла: файла целочисленных регистров и файла регистров с
плавающей запятой. Из них 48 регистров служат для загрузки операндов, 24 регистра для
записи в память, а остальные для хранения результатов и переименования регистров.
Завершающая часть процесса обеспечивает изымание результатов закончивших выполнение
микроопераций из файла регистров и «сборку» из них результатов в порядке, задаваемом
исходными программными кодами в соответствии с правилами архитектуры IA-32.
Фронтальная часть
Увеличение эффективной частоты системной шины до 400 МГц повысило
максимальную, допустимую пропускную способность оперативной памяти до 3,2 Гбайт/сек.
Это связано с увеличением тактовой частоты процессора и предполагает использование
более дорогой быстродействующей памяти Rambus.
От системной шины данные и команды попадают в интегрированный в Pentium 4 кэш
второго уровня емкостью 256 Кбайт, который по своим техническим характеристикам
близок к используемому в Pentium III. Оба кэша работают на частоте ядра и являются 8-
канальными наборно-ассоциативными, реализующий алгоритм обратной записи. Однако в
Pentium 4 увеличена длина строки кэш L2-до 128 байт (2 сектора по 64 байт).
Задержка по обращению в кэш второго уровня составляет 7 тактов. Пропускная
способность кэш L2 при частоте 1,5 ГГц составляет 48 Гбайт/сек. Для замещения
информации в кэш L2 используется алгоритм псевдо-LRU. При непопадании в кэш L2
требуется 12 тактов процессора на организацию взаимодействия с системной шиной, и еще
не менее 6-12 тактов шины (если она свободна) на доступ в подсистему оперативной памяти.
Кэш первого уровня является 4-канальным наборно-ассоциативным, использующий
алгоритм сквозной записи, и имеет длину строки 64 байт. Емкость его уменьшилась вдвое по
сравнению с Pentium III и составляет 8 Кбайт. Это уменьшение вызвано тем, чтобы
обеспечить задержку выборки из кэша L2, равную 2 тактам (в предыдущих процессорах Intel
она равнялась 3 тактам).
количество однотипных вычислений (а к ним, помимо обработки потоков данных в какой-то мере относятся и 3D-игры), получали существенный прирост производительности. SSE2 же оперирует с теми же самыми регистрами XMM и обратно совместим с SSE процессора Pentium III. А расширение набора команд Pentium 4 вызвано тем, что теперь операции со 128-битными регистрами могут выполняться не только с четверками вещественных чисел одинарной точности, но и с парами вещественных чисел двойной точности. Процессор может работать также с шестнадцатью однобайтовыми целыми, с восемью короткими двухбайтовыми целыми, с четырьмя четырехбайтовыми целыми, с двумя восьми байтовыми целыми. То есть, теперь SSE2-расширение представляет собой симбиоз MMX и SSE и позволяет работать с любыми типами данных, вмещающимися в 128- битные регистры. Блок SSE2 инструкций реализован по архитектуре OKMD (SIMD) и относится к классу векторных конвейеров. Он поддерживает операции над двумерными векторами, элементами которых являются 64-разрядные числа с плавающей запятой двойной точностью. Использование этого блока позволяет Pentium 4 выполнять две операции с плавающей запятой двойной точности за 1 такт. К недостаткам реализации SSE2 Pentium 4 можно отнести следующее: 80-разрядное представление чисел с плавающей точкой, используемые в x87-инструкциях, заменяется на 64-разрядное. Такая замена диктует необходимость перекомпиляции программного кода x87 инструкций. Неполная конвейеризация арифметических операций (64-разрядное умножение, сложение) приводит к пропуску одного такта между соседними инструкциями. Файл регистров Pentium 4 играет роль накопителя, где хранятся операнды, участвующие при выполнении микроопераций и их результаты. Он содержит 128 регистров и разделяется на два файла: файла целочисленных регистров и файла регистров с плавающей запятой. Из них 48 регистров служат для загрузки операндов, 24 регистра для записи в память, а остальные для хранения результатов и переименования регистров. Завершающая часть процесса обеспечивает изымание результатов закончивших выполнение микроопераций из файла регистров и «сборку» из них результатов в порядке, задаваемом исходными программными кодами в соответствии с правилами архитектуры IA-32. Фронтальная часть Увеличение эффективной частоты системной шины до 400 МГц повысило максимальную, допустимую пропускную способность оперативной памяти до 3,2 Гбайт/сек. Это связано с увеличением тактовой частоты процессора и предполагает использование более дорогой быстродействующей памяти Rambus. От системной шины данные и команды попадают в интегрированный в Pentium 4 кэш второго уровня емкостью 256 Кбайт, который по своим техническим характеристикам близок к используемому в Pentium III. Оба кэша работают на частоте ядра и являются 8- канальными наборно-ассоциативными, реализующий алгоритм обратной записи. Однако в Pentium 4 увеличена длина строки кэш L2-до 128 байт (2 сектора по 64 байт). Задержка по обращению в кэш второго уровня составляет 7 тактов. Пропускная способность кэш L2 при частоте 1,5 ГГц составляет 48 Гбайт/сек. Для замещения информации в кэш L2 используется алгоритм псевдо-LRU. При непопадании в кэш L2 требуется 12 тактов процессора на организацию взаимодействия с системной шиной, и еще не менее 6-12 тактов шины (если она свободна) на доступ в подсистему оперативной памяти. Кэш первого уровня является 4-канальным наборно-ассоциативным, использующий алгоритм сквозной записи, и имеет длину строки 64 байт. Емкость его уменьшилась вдвое по сравнению с Pentium III и составляет 8 Кбайт. Это уменьшение вызвано тем, чтобы обеспечить задержку выборки из кэша L2, равную 2 тактам (в предыдущих процессорах Intel она равнялась 3 тактам).
Страницы
- « первая
- ‹ предыдущая
- …
- 158
- 159
- 160
- 161
- 162
- …
- следующая ›
- последняя »