Desempenho de Aplicativos em Computadores 32/64 bits Rodrigo Almeida dos Santos Arquitetura dos Computadores Mestrado em Computação – UFCG [email protected] Agenda Análise de Arquiteturas 32/64 bits – – Necessidades Gerais de tecnologias 64 bits Aplicações que necessitam de 64 bits – – 2 Windows ruma para 64 bits Análise de Performance – Evolução IA-32 (x86) Arquitetura Itanium 2 (IA-64) Windows Server 2003 Processamento de Heuristica Resultados Bibliografia Arquitetura dos Computadores ::Análise de Arquiteturas 32/64 bits:: ::Evolução IA-32:: (1978) A família da arquitetura IA-32 foi precedida pelos processadores de 16 bits (ex: 8086) – – – – – 3 Possui 14 registradores de 16 bits; 16 bits de barramento de dados; Barramento de endereços de 20 bits (consegue endereçar 1Mb posições de memória) Arquitetura dividida em duas unidades: Execution Unit e Business Interface Unit ; Introdução de segmentação na arquitetura IA-32. Arquitetura dos Computadores ::Análise de Arquiteturas 32/64 bits:: ::Evolução IA-32 :: (1982) Intel 286: – – – – Processador de 16 bits; Utilizava palavras de 16 bits; Permitia o uso de um coprocessador aritmético, o 80287; Modos de operação “Real” e “Protegido” 4 No modo protegido incorporava funções avançadas como acessar 16MB de memoria RAM, multitarefa e memória virtual em disco Arquitetura dos Computadores ::Análise de Arquiteturas 32/64 bits:: ::Evolução IA-32 :: (1985) Intel 386: – – – – 5 Utilizava palavras de 32 bits; Capaz de acessar até 4 gigabytes de RAM O processador também prevê um “modo virtual 8086” que permite executar aplicações desenvolvidas para processadores 8086; Paginação, com tamanho de página fixo de 4KB provendo método para gerenciamento de memória virtual; Arquitetura dos Computadores ::Análise de Arquiteturas 32/64 bits:: ::Evolução IA-32 :: (1989) Intel 486: – – – 6 Acréscimo de um cache interno (L1) de 8KB e coprocessador aritmético interno; Versões de 25Mhz, 33Mhz e 40Mhz; Recurso da multiplicação de clock: Processador trabalha à uma velocidade maior que a velocidade da placa mãe; Arquitetura dos Computadores ::Análise de Arquiteturas 32/64 bits:: ::Evolução IA-32 :: (1993) Intel Pentium: – – – 7 Introdução de um segundo pipeline de execução (duas instruções por clock) – Dois processadores de 32 bits; Memória cache L1 com 16KB; Acesso a memória com palavras de 64 bits; (1995 - 1999) A família de processadores P6 Arquitetura dos Computadores ::Análise de Arquiteturas 32/64 bits:: ::Evolução:: 8 Arquitetura dos Computadores ::Análise de Arquiteturas 32/64 bits:: ::Arquitetura Itanium 2 (IA-64) :: 9 Inicialmente chamado de Merced, em seu lançamento a Intel adotou o nome Itanium; Suporte a paralelismo explícito em hardware. Inserção da filosofia VLIW Técnica Prediction: Executa dois ou mais caminhos de um branch, até o momento em que um de 64 registradores de 1 bit associados com cada branch indique que o caminho é falso. Arquitetura dos Computadores ::Análise de Arquiteturas 32/64 bits:: ::Arquitetura Itanium 2 (IA-64) :: Formato das Instruções: – – 10 São empacotadas em grupos de 3 em uma palavra de 128 bits (x86: 8 a 128 bits); O paralelismo é determinado pelo compilador e indicado explicitamente na própria palavra de instruções. Arquitetura dos Computadores ::Análise de Arquiteturas 32/64 bits:: ::Arquitetura Itanium 2 (IA-64) :: 11 Há grande necessidade de uma boa sinergia com o compilador para otimizar características do IA-64, tais como branch hints, paralelismo explícito, operações de pilha, rotação de registradores, especulação de dados/controle e memory hints. Arquitetura dos Computadores ::Análise de Arquiteturas 32/64 bits:: ::Arquitetura Itanium 2 (IA-64) :: 12 Arquitetura dos Computadores ::Análise de Arquiteturas 32/64 bits:: ::Arquitetura Itanium 2 (IA-64) :: 13 Arquitetura dos Computadores ::Análise de Arquiteturas 32/64 bits:: ::Arquitetura Itanium 2 (IA-64) :: 14 128 registradores inteiros, 128 registradores de ponto flutuante, 64 registradores de predicados, 8 registradores de branchs; Capaz de atingir até 6 gigaflops; Até 4MB de cache L3; Capacidade de endereçamento de 16GB; A execução de operações pelas ULAs é realizada em um único ciclo de clock. A pré-busca e busca de instruções é capaz de carregar até 6 instruções por ciclo de máquina. O despacho das possíveis 6 instruções é feita para 9 portas. Arquitetura dos Computadores ::Análise de Arquiteturas 32/64 bits:: ::Arquitetura Itanium 2 (IA-64) :: 15 Arquitetura dos Computadores Necessidades Gerais de tecnologias 64 bits 16 Alto Desempenho; Grande uso de memória física e virtual; Tratamento de arquivos de grande extensão. Arquitetura dos Computadores Aplicações que necessitam de 64 bits Aplicações de criação de conteúdo digital – Grande número de usuários concorrentes – Data warehouse, ERP ... Grande espaço de endereçamento – – 17 Video streaming em tempo real; Modelagens científicas ... Aplicações com múltiplas instâncias Arquitetura dos Computadores Aplicações que necessitam de 64 bits Jogos Alta precisão em matemática de ponto flutuante – – 18 Análise financeira; ... Arquitetura dos Computadores Aplicações que necessitam de 64 bits Windows Ruma para 64 bits Windows XP Professional X64: – – – – – 19 CPUs de 64 bits; O RC1 Suporta 32GB de RAM, e 16 Terabytes de memória virtual; Traz a versão 32 bits do Media Player; Ausência do subsistema de 16 bits que capacita execução de aplicativos DOS; Ausência de protocolos de rede legados (AppleTalk e NetBEUI) Arquitetura dos Computadores Análise de Performance Windows Server 2003 Utilizado na plataforma IA-64: – – Chega a valores de 700 mil TPM; Windows Server + Itanium HP ProLiant ML370 G4 Model HPS, 2-way SMP, Intel XEON (3.6 GHz) 2)HP ProLiant DL585, 4-way SMP, AMD Opteron processor Model 852 (2.6 GHz), 1) 20 Arquitetura dos Computadores Análise de Performance Windows Server 2003 21 Arquitetura dos Computadores Análise de Performance Processamento de Heurística 22 Utilizada uma heurística de menor caminho; Análise de 200 iterações; Tabela representativa 50x500; Análise para processamento de números inteiros. Arquitetura dos Computadores Análise de Performance Processamento de Heurística Utilizada as máquinas da HP, através de seu site http://testdrive.hp.com; Máquinas escolhidas: – spe141.testdrive.hp.com: – spe147.testdrive.hp.com: – SuSE enterprise Server 9, Integrity rx 1620, Itanium II 1.6 GHz spe190.testdrive.hp.com: 23 HP Tru64 UNIX 5.1B, AlphaServer ES45, 4EV68 1GHz spe187.testdrive.hp.com: – Red Hat Ent Linux ES 4.0, ProLiant ML530, Pentium III 1 GHz SuSE enterprise Server 9, ProLiant DL145, AMD Opteron 2.2 GHz Arquitetura dos Computadores Resultados 24 Arquitetura dos Computadores Resultados 25 Arquitetura dos Computadores Conclusão 26 Os computadores de 64 bits vêm trazer um acréscimo de desempenho; O QUE JÁ EXISTE E O QUE ESTÁ PREVISTO NA ÁREA DA COMPUTAÇÃO DE 64 BITS • CPUs desktop AMD Athlon 64: setembro de 2003 • Windows XP Professional X64 Edition: primeiro semestre de 2005 • Intel X64 Pentium 4: fevereiro de 2005 • Segunda geração de CPU de notebook de 64 bits, denominada Turion, da AMD: primeiro semestre de 2005 • Longhorn X64: 2006 Arquitetura dos Computadores Bibliografia Ricardo Zenelovsky e Alexandre Mendonça, Arquitetura de 64 bits da Intel (IA-64) , acessado em http://www.clubedohardware.com.br/artigos/375 em 11/05/2005 Sérgio Bampi, Arquitetura IA-64 (EPIC) , acessado em http://www.inf.ufrgs.br/procpar/disc/inf1191/tr abs/992/IA64/ia64.html em 15/05/2005 27 Arquitetura dos Computadores Bibliografia PCWORLD OnLine – “Windows XP ruma para os 64 achado em http://pcworld.uol.com.br/AdPortalV3/adCms TesteShow.aspx?Documento=8205687 TestDrive HP – http://www.testdrive.hp.com bits” 28 Arquitetura dos Computadores Bibliografia IA-32 Architecture – Software Developer’s Manual Volume 1: Basic Architecture, Intel Corporation; 64 bit Computing com Windows server 2003, achado em http://www.microsoft.com/windowsserversyst em/64bit/bulletin.mspx 29 Arquitetura dos Computadores