Организация микропроцессорных систем. Учебное пособие. Могнонов П.Б. - 167 стр.

UptoLike

Составители: 

табл. 6.4). В IA-64 предикатных регистров в два раза больше, так как в них хранятся пары
предикат и его отрицание. В IA-64 поля предикатов всегда представлены в команде, а в Е2К -
могут отсутствовать.
Предикаты могут использоваться в канале АЛУ или в канале доступа к массивам, для
этого используется условные слоги, содержащие маски предикатов и ФУ. Всего в этих
слогах может кодироваться до 6 предикатов, указывающих на то, нужно ли выполнять
соответствующие операции из «широкой» команды.
Если условие перехода удается вычислить до выполнения этого перехода, компилятор
стремится применить предикатные вычисления, чтобы обойтись без переходов вообще. Если
это не удается, компилятор порождает явные спекулятивные коды.
Компилятор Е2К порождает коды для обеих ветвей программы, возникающих при
условном переходе, и, пользуясь большим числом ФУ и регистров, заставляет процессор
выполнять обе ветви программы. Эта же процедура применяется и в IA-64. До тех пор, пока
условие остается неизвестным, обе ветви выполняются спекулятивно. Как только условие
выполнится, выбираются нужные результаты. Признак спекулятивного выполнения
взводится при этом в спекулятивном бите кода операций соответствующего слога. При
возникновении ситуации исключения результат снабжается тегом недействительного
значения. В этом случае ненужная ветвь программы должна быть удалена.
В суперскалярных процессорах останавливается конвейер, очищается буфер
предварительной выборки, после чего начинается загрузка новых команд. Накладные
расходы в подобных случаях велики, например у Р6 составляет 10-15 тактов.
Для сохранения накладных расходов в Е2К применяется так называемая операция
подготовки переходов. Она считывает команды из кэша по адресу перехода и может быть
выполнена заранее. Когда переход происходит, команды по новому адресу частично будут
выполнены. Е2К может выполнять одновременно до трех операций подготовки перехода.
В настоящее время разработка Е2К еще не завершена, она находится на уровни, так
называемого Verilog-описания, что позволяет проводитьэмуляционное исполнение кодов
со скоростью порядка 10 команд в секунду. При этом заявленная тактовая частота составляет
1,2 ГГц при 0,18-микронной технологии изготовления.
Разработчики Е2К привели полученные ими оценки производительности:
SPECintT95/FP95=135/350, что можно сопоставить с оценками SPECint95/fp95=45/70 для
Merced (IA-64) с частотой 800 мГц. Площадь Е2К оценивается в 126 кв.мм при
тепловыделении 35 Вт соответственно.
Таким образом, повышение производительности современных микропроцессоров
возможно за счет совершенствования полупроводниковой технологии и применение новых
архитектурных решений.
Совершенствование полупроводниковой технологии осуществляется в направлении
увеличения степени интеграции сверхбольших интегральных схем (СБИС). Степень
интеграции СБИС зависит от размера кристалла и количества помещенных на нем
транзисторов. Основным фактором, определяющим возможность увеличения числа
транзисторов в СБИС, являются минимальные топологические размеры элементов,
называемые проектными нормами. По мере уменьшения проектных норм может быть
увеличена и тактовая частота работы микропроцессора. Однако потребляемая мощность при
этом является одним из основных факторов, ограничивающих сложность кристалла.
В свое время высокие уровни быстродействия и степени интеграции связывались
главным образом с арсенид-галлиевыми полупроводниковыми приборами. Однако высокая
стоимость и большая рассеиваемая мощность ограничивает области их применения. В
настоящее время большие надежды связываются с так называемой кремниево-германиевой
технологией, которая является улучшенной разновидностью биполярной КМОП-технологии
(BICMOS), но обеспечивает низкий уровень энергопотребления, присущий обычному
производственному процессу CMOS.
табл. 6.4). В IA-64 предикатных регистров в два раза больше, так как в них хранятся пары –
предикат и его отрицание. В IA-64 поля предикатов всегда представлены в команде, а в Е2К -
могут отсутствовать.
       Предикаты могут использоваться в канале АЛУ или в канале доступа к массивам, для
этого используется условные слоги, содержащие маски предикатов и ФУ. Всего в этих
слогах может кодироваться до 6 предикатов, указывающих на то, нужно ли выполнять
соответствующие операции из «широкой» команды.
       Если условие перехода удается вычислить до выполнения этого перехода, компилятор
стремится применить предикатные вычисления, чтобы обойтись без переходов вообще. Если
это не удается, компилятор порождает явные спекулятивные коды.
       Компилятор Е2К порождает коды для обеих ветвей программы, возникающих при
условном переходе, и, пользуясь большим числом ФУ и регистров, заставляет процессор
выполнять обе ветви программы. Эта же процедура применяется и в IA-64. До тех пор, пока
условие остается неизвестным, обе ветви выполняются спекулятивно. Как только условие
выполнится, выбираются нужные результаты. Признак спекулятивного выполнения
взводится при этом в спекулятивном бите кода операций соответствующего слога. При
возникновении ситуации исключения результат снабжается тегом недействительного
значения. В этом случае ненужная ветвь программы должна быть удалена.
       В суперскалярных процессорах останавливается конвейер, очищается буфер
предварительной выборки, после чего начинается загрузка новых команд. Накладные
расходы в подобных случаях велики, например у Р6 составляет 10-15 тактов.
       Для сохранения накладных расходов в Е2К применяется так называемая операция
подготовки переходов. Она считывает команды из кэша по адресу перехода и может быть
выполнена заранее. Когда переход происходит, команды по новому адресу частично будут
выполнены. Е2К может выполнять одновременно до трех операций подготовки перехода.
       В настоящее время разработка Е2К еще не завершена, она находится на уровни, так
называемого Verilog-описания, что позволяет проводить ”эмуляционное” исполнение кодов
со скоростью порядка 10 команд в секунду. При этом заявленная тактовая частота составляет
1,2 ГГц при 0,18-микронной технологии изготовления.
       Разработчики Е2К привели полученные ими оценки производительности:
SPECintT95/FP95=135/350, что можно сопоставить с оценками SPECint95/fp95=45/70 для
Merced (IA-64) с частотой 800 мГц. Площадь Е2К оценивается в 126 кв.мм при
тепловыделении 35 Вт соответственно.
       Таким образом, повышение производительности современных микропроцессоров
возможно за счет совершенствования полупроводниковой технологии и применение новых
архитектурных решений.
       Совершенствование полупроводниковой технологии осуществляется в направлении
увеличения степени интеграции сверхбольших интегральных схем (СБИС). Степень
интеграции СБИС зависит от размера кристалла и количества помещенных на нем
транзисторов. Основным фактором, определяющим возможность увеличения числа
транзисторов в СБИС, являются минимальные топологические размеры элементов,
называемые проектными нормами. По мере уменьшения проектных норм может быть
увеличена и тактовая частота работы микропроцессора. Однако потребляемая мощность при
этом является одним из основных факторов, ограничивающих сложность кристалла.
       В свое время высокие уровни быстродействия и степени интеграции связывались
главным образом с арсенид-галлиевыми полупроводниковыми приборами. Однако высокая
стоимость и большая рассеиваемая мощность ограничивает области их применения. В
настоящее время большие надежды связываются с так называемой кремниево-германиевой
технологией, которая является улучшенной разновидностью биполярной КМОП-технологии
(BICMOS), но обеспечивает низкий уровень энергопотребления, присущий обычному
производственному процессу CMOS.