MO401 – Arquitetura de Computadores I
2º Semestre - 2005
Prof. Responsável: Rodolfo J. de Azevedo
Processador Pentium 4
Sandro Rogério Pereira
RA 028352
[email protected]
1
PROCESSADORES
 História
 Arquitetura Intel
 Motor de execução rápida
Tecnologia de Hyper-Pipelined
 Trace Cache
 Cache de L1
 Instruções SSE/SSE 2
 Transferência avançada de cache nível 2
 Barramento de sistema ( Front Side Bus )
 Memória de Duplo canal
 HyperThreading
 Previsão de Desvios (Execução Dinâmica Avançada)
 Métricas de Desempenho
 Conclusão
2
História
•
Pentium 4: Sétima Geração da Arquitetura X86
Antecessores
Pentium Pro
Pentium II
Pentium III
 Baseado no mesmo núcleo (Microarquitetura).
 Difere pelo tamanho de cache e técnicas de implementações.
 Presença de Instruções SSE.
 Mecanismos de proteção
 Clock de 8 MHz.
Novembro de 2000 : Pentium 4 “Willamette ”
 CPU totalmente redesenhada.
 Clock de 1,4 GHz à 1,5 GHz.
 Motivação: Pouco ganho de desempenho com o aumento da frequência na CPU
3
Arquitetura Intel
Motor de execução rápida :
 Capacidade de duplicar a velocidade das
ALU (Aritmetics Logic Unit)  Maior
performance e diminuição dos tempos e
intervalos de execução entre cálculos e
processamentos.
 A Unidade Lógica Aritmética pode trabalhar
com o dobro do clock interno do processador
para aumentar o desempenho em cálculos
usando números inteiros.
 Duas ULAs processam instruções mais
simples
 Duas AGUs se encarregam de ler e gravar
dados.
 Uma terceira ULA é encarregada de
decodificar/processar as instruções mais
complexas.
4
Arquitetura Intel
Tecnologia hyper-pipelined:
Vantagens
 Duplica a capacidade de sequência para 20 etapas.
 Execução comando é dividida em partes menores  Mais fácil e mais rápido de
executar.
Desvantagens:
 Mais fases para se executar  tempo global requerido para cada operação
aumenta.
 Pipeline mais profundo  Maior tempo de recuperação de um desvio errado ou
perdido.
5
Arquitetura Intel
Trace Cache:
 O Pentium 4 usa uma cache especial para armazenar instruções já decodificadas.
 Evita decodificação repetida das instruções de x86.
 Retêm a ordem de execução de micro-operações armazenadas.
6
Arquitetura Intel
Cache de L1 :
 Write-through.
 4-way set associative.
 Alteração no tamanho e retrição para armazenamento de dados apenas.
Objetivo:
“Torná-lo ainda menor por causa do grande tamanho do encapsulamento”.
 Novos algoritmos de acesso à cache de L1  Latência baixou para 2 clock
(Pentium III consumia 3 clock).
 Miniaturização do núcleo do processador  Cache de L1 maiores.
7
Arquitetura Intel
Instruções SSE/SSE 2 :
 Aumentam a tecnologia MMX™ e SSE existente no seu antecessor PIII, contem
ainda cerca de 114 novas instruções novas para a tecnologia MMX, já existente.
8
Arquitetura Intel
Tranferência Avançada de Cache L2 :
 Canal de comunicação de dados mais rápido entre a cache nível 2 e o núcleo do
processador.
 Armazena cópias da cache L1 em modo Imperativo (Não exclusivo).
 Planejado para processar fluxo de dados  caminho de dados entre o cache L2 e
o núcleo do processador foi duplicado.
Resultados:
Pentium 4 de 1.4 GHz  Taxa de transferência de dados de 44.8GB/s.
Pentium III de 1 GHz  Taxa de transferência de dados de 16GB/s.
9
Arquitetura Intel
Barramento de sistema (Front Side Bus) :
 Aumento de Performance em conjunto aos novos sistema de execução dinâmica
e calculo de ponto flutuante.
 Pentium 4 (Quad Pumped)  Largura de Banda três vezes maior que a largura da
banda do barramento Pentium III.
 Reduz a latência da CPU enquanto espera pelos novos conjuntos de dados.
 Implementado fisicamente com uma freqüência básica (100 MHz) trabalhando de
forma quadruplicada  400 MHz.
10
Arquitetura Intel
Memória de Duplo canal :
 Novas versões do Pentium 4 possum FSB de 800 MHz.
Problema:
Memória ainda é lenta !
Solução:
Dois módulos de memória (400 MHz cada) operam em paralelo para para
oferecer desempenho equivalente a 800 MHz.
11
Arquitetura Intel
Suporte à tecnologia HiperThreading :
 Lançamento: Abril de 2003.
 Parceria entre Intel + Principled
TechnologiesSM (PT).
Vantagens:
- Maior utilização do tempo ocioso do
-
processador ao executar instruções de
um outro processo.
Comportamento semelhante a uma
máquina de dois processadores.
Ganho de desempenho de até 30% no
processador.
Desvantagens:
-
Alguns ambientes operacionais como
Windows 98/SE/ME e XP Home não
fazem uso do Hyper Threading
(recurso desativado).
12
Arquitetura Intel
Previsão de Desvios (Execução Dinâmica Avançada) :
 Pentium 4 adota uma política de previsão dinâmica de desvios, baseada num
histórico das condições passadas, que é guardado no Branch Target Buffer (BTB).
 Uma previsão de desvio errada provoca a perda de um nº maior de instruções
(execução especulativa)
Considerando:
14% das instruções são de desvio
errando 50% = desempenho 30% inferior ao Pentium III
 Alterações feitas tentam diminuir a perda de desempenho trazida pelo maior nº de
estágios.
 Capacidade de previsão de desvio 33% maior que do Pentium III.
 Média de 90-95% de predições corretas.
13
Métrica de Desempenho
 Um aumento de 40% a 50% na freqüência resultou em um de ganho de 20% no
desempenho em testes com inteiros e de 20% a 70% de ganho em testes com ponto
flutuante/aplicações multimídia .
 Pentium 4 obteve maior ganho de performance que o seu antecessor Pentium III em
função do aumento da freqüência, novos componentes e técnicas avançadas
14
Conclusão




Aumento da velocidade do clock.
Novos componentes.
Novas técnicas
Resultado: Diminuição da latência do processador  Melhor
desempenho.
15
Dúvidas ???
16
Download

Apr