MO401 – Arquitetura de Computadores I 2º Semestre - 2005 Prof. Responsável: Rodolfo J. de Azevedo Processador Pentium 4 Sandro Rogério Pereira RA 028352 [email protected] 1 PROCESSADORES História Arquitetura Intel Motor de execução rápida Tecnologia de Hyper-Pipelined Trace Cache Cache de L1 Instruções SSE/SSE 2 Transferência avançada de cache nível 2 Barramento de sistema ( Front Side Bus ) Memória de Duplo canal HyperThreading Previsão de Desvios (Execução Dinâmica Avançada) Métricas de Desempenho Conclusão 2 História • Pentium 4: Sétima Geração da Arquitetura X86 Antecessores Pentium Pro Pentium II Pentium III Baseado no mesmo núcleo (Microarquitetura). Difere pelo tamanho de cache e técnicas de implementações. Presença de Instruções SSE. Mecanismos de proteção Clock de 8 MHz. Novembro de 2000 : Pentium 4 “Willamette ” CPU totalmente redesenhada. Clock de 1,4 GHz à 1,5 GHz. Motivação: Pouco ganho de desempenho com o aumento da frequência na CPU 3 Arquitetura Intel Motor de execução rápida : Capacidade de duplicar a velocidade das ALU (Aritmetics Logic Unit) Maior performance e diminuição dos tempos e intervalos de execução entre cálculos e processamentos. A Unidade Lógica Aritmética pode trabalhar com o dobro do clock interno do processador para aumentar o desempenho em cálculos usando números inteiros. Duas ULAs processam instruções mais simples Duas AGUs se encarregam de ler e gravar dados. Uma terceira ULA é encarregada de decodificar/processar as instruções mais complexas. 4 Arquitetura Intel Tecnologia hyper-pipelined: Vantagens Duplica a capacidade de sequência para 20 etapas. Execução comando é dividida em partes menores Mais fácil e mais rápido de executar. Desvantagens: Mais fases para se executar tempo global requerido para cada operação aumenta. Pipeline mais profundo Maior tempo de recuperação de um desvio errado ou perdido. 5 Arquitetura Intel Trace Cache: O Pentium 4 usa uma cache especial para armazenar instruções já decodificadas. Evita decodificação repetida das instruções de x86. Retêm a ordem de execução de micro-operações armazenadas. 6 Arquitetura Intel Cache de L1 : Write-through. 4-way set associative. Alteração no tamanho e retrição para armazenamento de dados apenas. Objetivo: “Torná-lo ainda menor por causa do grande tamanho do encapsulamento”. Novos algoritmos de acesso à cache de L1 Latência baixou para 2 clock (Pentium III consumia 3 clock). Miniaturização do núcleo do processador Cache de L1 maiores. 7 Arquitetura Intel Instruções SSE/SSE 2 : Aumentam a tecnologia MMX™ e SSE existente no seu antecessor PIII, contem ainda cerca de 114 novas instruções novas para a tecnologia MMX, já existente. 8 Arquitetura Intel Tranferência Avançada de Cache L2 : Canal de comunicação de dados mais rápido entre a cache nível 2 e o núcleo do processador. Armazena cópias da cache L1 em modo Imperativo (Não exclusivo). Planejado para processar fluxo de dados caminho de dados entre o cache L2 e o núcleo do processador foi duplicado. Resultados: Pentium 4 de 1.4 GHz Taxa de transferência de dados de 44.8GB/s. Pentium III de 1 GHz Taxa de transferência de dados de 16GB/s. 9 Arquitetura Intel Barramento de sistema (Front Side Bus) : Aumento de Performance em conjunto aos novos sistema de execução dinâmica e calculo de ponto flutuante. Pentium 4 (Quad Pumped) Largura de Banda três vezes maior que a largura da banda do barramento Pentium III. Reduz a latência da CPU enquanto espera pelos novos conjuntos de dados. Implementado fisicamente com uma freqüência básica (100 MHz) trabalhando de forma quadruplicada 400 MHz. 10 Arquitetura Intel Memória de Duplo canal : Novas versões do Pentium 4 possum FSB de 800 MHz. Problema: Memória ainda é lenta ! Solução: Dois módulos de memória (400 MHz cada) operam em paralelo para para oferecer desempenho equivalente a 800 MHz. 11 Arquitetura Intel Suporte à tecnologia HiperThreading : Lançamento: Abril de 2003. Parceria entre Intel + Principled TechnologiesSM (PT). Vantagens: - Maior utilização do tempo ocioso do - processador ao executar instruções de um outro processo. Comportamento semelhante a uma máquina de dois processadores. Ganho de desempenho de até 30% no processador. Desvantagens: - Alguns ambientes operacionais como Windows 98/SE/ME e XP Home não fazem uso do Hyper Threading (recurso desativado). 12 Arquitetura Intel Previsão de Desvios (Execução Dinâmica Avançada) : Pentium 4 adota uma política de previsão dinâmica de desvios, baseada num histórico das condições passadas, que é guardado no Branch Target Buffer (BTB). Uma previsão de desvio errada provoca a perda de um nº maior de instruções (execução especulativa) Considerando: 14% das instruções são de desvio errando 50% = desempenho 30% inferior ao Pentium III Alterações feitas tentam diminuir a perda de desempenho trazida pelo maior nº de estágios. Capacidade de previsão de desvio 33% maior que do Pentium III. Média de 90-95% de predições corretas. 13 Métrica de Desempenho Um aumento de 40% a 50% na freqüência resultou em um de ganho de 20% no desempenho em testes com inteiros e de 20% a 70% de ganho em testes com ponto flutuante/aplicações multimídia . Pentium 4 obteve maior ganho de performance que o seu antecessor Pentium III em função do aumento da freqüência, novos componentes e técnicas avançadas 14 Conclusão Aumento da velocidade do clock. Novos componentes. Novas técnicas Resultado: Diminuição da latência do processador Melhor desempenho. 15 Dúvidas ??? 16