V - Organização de Computadores E sta disciplina consiste no estudo dos componentes físicos que compõem o computador, cuja configuração básica e mais geral pode ser vista como na figura V.1 abaixo. Disp E Memória Disp S dados instruções UCP UAL Sinais de Controle e Status UC Figura V.1 - Organização de um Computador onde, por definição, considera-se: • computador - como sendo uma máquina eletrônica, capaz de solucionar problemas através da execução automática de instruções que lhe sejam previamente fornecidas. • hardware - constituído pelos circuitos eletrônicos que compõem o computador e que o tornam capaz de reconhecer e executar um conjunto limitado de instruções simples. • software - constituído pelo conjunto de programas necessários para tornar o hardware útil e operacional. • programa - como sendo uma peça de software constituída por uma seqüência de instruções que descrevem ao computador como executar uma determinada tarefa. • linguagem de máquina - constituída pelo conjunto básico de instruções que são reconhecidas pelo hardware e, para a qual todo programa precisa ser convertido para que possa ser executado. • tradutor - um programa que converte outros programas para a linguagem de máquina. Pode ser de três tipos: montador (para a linguagem assembly), interpretador (tradução e execução passo a passo) e compilador (tradução e execução em fases distintas). V.1 Máquina Virtual Constitui-se de uma abstração onde, dentro de um único computador hospedeiro, o universo gerado por cada linguagem define uma máquina hipotética (virtual) capaz de reconhecer e executar diretamente as instruções daquela linguagem. É a generalização do conceito de hardware. Organização de Computadores 2 Vantagens desta abordagem: 1. Um computador pode ser considerado como composto por "n" máquinas virtuais, cada uma delas com sua própria configuração e linguagem de máquina; 2. Uma pessoa, cujo trabalho seja gerar programas (aplicativos) para a máquina virtual de nível "k" ou outro qualquer, não precisa conhecer ou se preocupar com as particularidades dos níveis inferiores ao seu; 3. A estrutura de níveis permite ver o computador como um conjunto hierárquico de facilidades que possibilitam flexibilidade e independência ao usuário. " As linguagens de 4a geração - orientadas a objeto, com interfaces gráficas e super amigáveis derrubou o mistério e abriu as portas do computador ao usuário leigo e ao público em geral." Máquina Virtual Mn Ling Máq - Ln Máquina Virtual M1 Ling Máq - L1 Programas em Ln são interpretados e traduzidos por um interpretador residente na máquina Mn-1 Programas em L0 são interpretados e executados diretamente pelo hardware do computador Máquina Virtual M0 Ling Máq - L0 Figura V.2 - Máquina Virtual O Modelo Multinível Contemporâneo A maioria dos computadores modernos possui dois ou mais níveis, sendo que máquinas com seis ou mais níveis são cada vez mais comuns. Tais níveis se subdividem basicamente em Hardware, Firmware, Software Básico, Utilitários e Softwares Aplicativos. A figura V.3 abaixo, descreve um computador hipotético composto por 6 níveis, a saber: nível 0 - Lógica Digital • constitui o hardware do computador. O advento dos microprocessadores (pastilhas VLSI) e dos microcomputadores têm despertado o interesse e aberto, cada vez mais, o mundo da lógica digital aos profissionais de informática e ao público em geral. • no nível 0 encontram-se: os circuitos eletrônicos (cap. IV) e os diversos sistemas (módulos) que compõem o computador: UCP, memória, dispositivos de E/S, dispositivos de comunicação e interfaces. • o nível 0 executa diretamente as instruções (ou microinstruções) submetidas pelo nível 1. Organização de Computadores 3 Máquina Virtual M5 Orientada ao Prob. Ling. Alto Nível tradução (compilador) Software Aplicativo Máquina Virtual M4 Ling de Montagem Ling. Baixo Nível (assembly) tradução (montador) Software Básico e Utilitários Máquina Virtual M3 Sistema Operacional interpretação parcial (SO) Máquina Virtual M2 Máq. Convencional interpretação (microprograma) Firmware Máquina Virtual M1 Microprogramação execução pelo hardware Hardware Máquina Virtual M0 Lógica Digital Figura V.3 - Modelo Multinível nível 1 - Microprogramação • é o verdadeiro nível de linguagem de máquina. O microprograma, residente em memória permanente (ROM), compõe o que é conhecido por firmware e tem por função interpretar e traduzir as instruções que lhe são submetidas pelos níveis superiores. • nem todas as máquinas possuem este nível, veja as máquinas RISC por exemplo. Nas máquinas não microprogramadas, o nível 2, chamado de máquina convencional, é diretamente executado pelo hardware. • as vantagens da microprogramação são: a) facilitar o projeto e a construção dos circuitos digitais, através da implementação de parte da lógica digital dentro do firmware; b) flexibilizar e possibilitar o desenvolvimento de instruções mais potentes a nível de máquina convencional. • o conjunto de microinstruções é geralmente pequeno, no entorno de duas ou três dezenas, sendo que a maior parte delas envolvendo a movimentação de dados de uma parte da máquina para outra, ou a realização de alguns testes simples. • um mesmo computador pode suportar mais de um microprograma, cada um definindo uma máquina virtual de nível 1 diferente. Organização de Computadores 4 • o microprograma, escrito pelo microprogramador e armazenado em uma memória não volátil, tem como função interpretar (buscar, examinar e executar) cada uma das instruções de um programa em nível de máquina convencional. Para isto, o microprograma deve acessar e controlar todos os recursos de hardware (registradores, barramentos, ULAs, memórias e outros). • as microinstruções são compostas apenas por sinais de controle e o microprograma é executado por um dispositivo chamado sequenciador que, juntamente com os demais circuitos de hardware, compõe a microarquitetura. • um dos pontos de projeto da microarquitetura é a definição da largura das microinstruções ou seja, da memória do microprograma, isto é, da micromemória. Projetos do tipo horizontal fazem uso de um número relativamente pequeno de microinstruções largas, e os do tipo vertical muitas microinstruções estreitas. • outra opção de projeto é a adoção da nanoprogramação, que consiste basicamente na adoção de uma terceira memória, a nanomemória, para armazenar as instruções do nanoprograma. • com a nanoprogramação a microarquitetura fica composta da memória principal, volátil, que armazena o programa em execução, a micromemória, não volátil, que armazena o microprograma e a nanomemória, também não volátil, que armazena o nanoprograma, veja figura V.4. • a nanoprogramação se constitui na realidade, de um artifício para reduzir o tamanho do microprograma naqueles casos em que ocorra muitas repetições de uma ou mais microinstruções. O nanoprograma passa a conter o conjunto das microinstruções usadas no microprograma, armazenados sem repetição, e o microprograma matém a lógica original usando não mais as microinstruções propriamente ditas mas seus endereços na nanomemória. Log2m W bits microprograma (b) microprograma n W bits (a) nanoprograma m Figura V.4 - Microprogramação convencional (a) e nanoprogramação (b) (*) Observe na figura que, na microprogramação convencional o tamanho gasto para armazenar o microprograma é de "n x w" (número de instruções multiplicado pela largura em bits de cada microinstrução) e na nanoprogramação é de "n x log2m + m x w" (número de microinstruções multiplicado pelo logaritmo na base dois do tamanho da memória de nanoprogramação somado ao tamanho da memória de nanoprogramação. nível 2 - Máquina Convencional Organização de Computadores 5 • é, na verdade, a "máquina" vendida ao usuário genérico. Suas características técnicas, operacionais e funcionais são fornecidas através dos manuais de referência, comercializados junto com o equipamento. • é o nível onde reside o "kernel" do sistema operacional, que interpreta os utilitários, a linguagem de controle e as rotinas que residem no nível 3. • o SO pode ser interpretado pelo microprograma ou executado diretamente pelo hardware, naquelas máquinas desprovidas do nível 1. nível 3 - Sistema Operacional • é o nível em que o usuário interage diretamente (através do uso de utilitários e da linguagem de controle) ou indiretamente (através de programas aplicativos desenvolvidos em máquinas de níveis superiores). • o windows 3.1, por exemplo, é uma máquina virtual colocada acima deste nível e cuja finalidade é proporcionar ao usuário uma interface mais amigável e de mais fácil assimilação. • é geralmente, um nível híbrido, onde parte de suas instruções são interpretadas pelo "kernel" do SO (nível 2) e parte são interpretadas diretamente pelo microprograma (nível 1). nível 4 - Linguagem de Montagem • é genericamente chamada de assembly, embora cada máquina tenha seu próprio assembly, e é traduzida para o nível inferior pelo montador, comumente chamado de assembler. • o assembly já foi muito importante em épocas passadas, porém hoje é totalmente suplantado pelas linguagens de alto nível para o desenvolvimento de programas aplicativos e até utilitários. nível 5 - Linguagens Orientadas para o Problema • consiste em diferentes máquinas virtuais, cada uma definida pelo ambiente criado por sua linguagem de programação de alto nível. • as linguagens de alto nível são mais complexas que o assembly e requerem tradutores mais bem elaborados e potentes dos tipos interpretadores e compiladores. • nível 6 e superiores • constituído por sistemas projetados para criar "shells" - máquinas virtuais especialmente adequadas para certas aplicações, como por exemplo o word, o access, o excel, o lotus, etc. Em resumo, os computadores modernos são constituídos de uma série hierárquica de máquinas virtuais, cada uma projetada e construída sobre suas predecessoras. Cada nível representa um grau distinto de abstração, com a presença de diferentes recursos e operações; o que possibilita, através da supressão de detalhes irrelevantes, tornar o computador mais amigável e mais fácil de ser compreendido pelo público em geral. Na estrutura de um PC, por exemplo, conforme pode ser visto na figura V.5 abaixo, 4 níveis virtuais podem ser considerados: o dos programas aplicativos, o do sistema operacional, Organização de Computadores 6 o dos programas de interface com os dispositivos periféricos (drivers) e as rotinas de entrada e saída padrão fornecidas pela BIOS. Observe que a segurança pode ser afetada uma vez que qualquer dos níveis pode realizar acesso direto às rotinas da BIOS e, portanto, sem se submeter aos critérios e procedimentos de proteção. Programas Aplicativos SO - residente Drivers ROM BIOS Device Drivers Figura V.5 - Estrutura do MS-DOS V.2 A Unidade Central de Processamento (UCP) A Unidade Central de Processamento - UCP, é o "cérebro" do computador, e sua função é executar os programas armazenados na memória principal, buscando instruções e executando-as uma após a outra. Na figura V.6 abaixo, pode ser visto um esquema simplificado da organização interna do hardware. Observe que a UCP faz uso de um barramento para se comunicar com os demais componentes do sistema, como a memória principal e os demais dispositivos periféricos que compõem o computador. Este barramento é constituído por diversas vias paralelas por onde transitam os sinais. Grupos distintos destas vias, na prática, configuram diferentes barramentos, tais como o de dados, o de endereços e o de sinais de controle. O número de vias utilizado em cada um destes barramentos depende das características físicas de projeto do computador. UCP UC Periféricos de E/S UAL MP HD REGs Barramento (dados + endereços + controle) Figura V.6 - Organização do Hardware IMP Organização de Computadores 7 As principais considerações de projeto de um barramento, além do número de vias, são: a temporização, o mecanismo de arbitragem, o tratamento de interrupções e o tratamento de erros. Quanto a temporização, um barramento pode ser do tipo síncrono ou do tipo assíncrono. Num barramento síncrono existe um relógio temporizador que define a freqüência de operação do mesmo, chamada de ciclo de barramento. Neste tipo de barramento, toda atividade ou operação de transferência é alinhada, ou seja, sincronizada com a freqüência do barramento e sempre consome um número inteiro e conhecido destes ciclos. No barramento assíncrono não existe tal relógio, ou seja, os ciclos são variáveis e podem tomar a duração que for requerida pela operação. Na figura V.7a, por exemplo, é mostrado um barramento síncrono com um relógio de temporização de 5Mz, que produz um ciclo de 200ns, e uma operação de leitura de um byte da MP que consome 4 ciclos de barramento, ou seja, 800ns. Observe o sinal do relógio definindo o ciclo do barramento, os sinais de controle RD e MREQ definindo respectivamente a operação a ser realizada, leitura, e a requisição de uma operação de memória. O barramento de endereços disponibiliza para a MP a posição a ser lida, durante um determinado número de ciclos de barramento. Posteriormente a MP coloca no barramento de dados o conteúdo lido e a UCP, após um número prefixado de ciclos de barramento sabe que pode buscar o dado que estará estável e disponível no barramento. No barramento assíncrono, face a inexistência do relógio para disciplinar a transferência, é introduzido um processo de sinalização, conhecido por handshake, entre a UCP e o dispositivo envolvido na operação. Na figura V.7b, o handshake é representado pelos sinais MSYN - Master Synchronism (sincronismo mestre) e SSYN - Slave Synchronism (sincronismo escravo). Observe que em resposta ao MSYN a MP coloca o dado no barramento e responde ao mestre ativando o sinal SSYN, que informa o cumprimento da missão. Os barramentos assíncronos apresentam maior flexibilidade de uso e oferecem vantagens para atendimento a um conjunto heterogêneo de dispositivos (lentos e rápidos), uma vez que seus ciclos não são fixos. Por outro lado, um sistema síncrono é mais fácil de ser construído e oferece maior velocidade de operação. A maioria dos barramentos é síncrona. Mecanismos de arbitragem tem a ver com a forma como um dispositivo se torna mestre do barramento. Pode ser centralizado, onde um único árbitro, decide quem será o próximo a controlar o barramento, ou descentralizado, quando não há árbitro e sim um procedimento distribuído e observado por todos os candidatos a mestre. Sempre que a UCP compete pelo barramento ela o faz com menor prioridade, para evitar que dispositivos de E/S mais lentos fiquem prejudicados no acesso a condição de mestre. Uma vez que múltiplos dispositivos podem querer causar uma interrupção simultaneamente, o mesmo tipo de problemas de arbitragem está presente e a solução usual é assinalar prioridades aos dispositivos e usar um árbitro para controlar o problema. A organização interna da UCP varia em função do grau de sofisticação e avanço tecnológico do hardware. Sua organização genérica básica é constituída pela UC - Unidade de Controle, pela UAL - Unidade Aritmética e Lógica e por um banco de registrados. Organização de Computadores T1 8 T2 T3 T4 Endereço da Posição de Memória Dado MREQ RD tempo (a) Endereço da Posição de Memória MREQ RD MSYN Dado SSYN (b) tem- Figura V.7 - Barramento Síncrono (a) e Barramento Assíncrono (b) A UC é a parte encarregada de executar as operações de controle do ciclo de instrução e de sinalização para todos os demais componentes do sistema. A ULA se encarrega da execução de todas as operações aritméticas e lógicas decorrentes da execução dos programas. O banco de registradores serve de memória local para armazenamento dos dados em uso na UCP. A figura V.8 abaixo mostra o esquema da organização interna de uma UCP básica, onde: • barramentos • o barramento interno é a via de comunicação entre os componentes internos da UCP. • o data bus é o barramento para transferência de dados entre a UCP e os demais componentes (8, 16 e 32 bits são os mais comuns). • address bus é o barramento para endereçamento de memória (10 bits - 1Kb, 20 bits - 1 Mb, 32 bits - 4Gb). • registradores de controle e de estado • MBR - Memory Buffer Register, (RDM em português) serve de armazenamento temporário de dados no caminho de/para a MP. Organização de Computadores 9 • MAR - Memory Address Register, (REM em português) serve para armazenamento temporário do endereço do dado a ser lido ou gravado na memória. • I/O BR - serve de armazenamento temporário de dados no caminho de/para dispositivos de E/S. • I/O AR - serve para especificar um determinado dispositivo de E/S. • IR - Instruction Register, registrador para armazenamento da instrução corrente. • PC - Program Counter, registrador que contém o endereço da próxima instrução a ser executada. • PSW - Program Status Word, que contém informações sobre o estado do processamento, tais como: sign (sinal), zero, carry (vai um ou vem um), equal, overflow (estouro), interrupt enable/disable (habilitação ou não de interrupção) e supervisor (modo de execução). • registradores de dados • AC - Accumulator, registrador que, no caso apresentado na figura, armazena uma das entradas da ULA. • TR - Temporary Register • registradores de uso genérico • registradores para endereçamento • SP - Stack Pointer • SX - Segment Pointer • IX - Index Register I/O AR data bus address bus MBR MAR I/O BR barramento interno AC TR IR UC ULA Decodifcador de Instrução e Controlador do Ciclo de Máquina PC R1 sinais de controle Figura V.8 - Organização interna da UCP a. O Ciclo de Instrução A UCP executa cada instrução através de uma seqüência de pequenos passos conforme a seguir: • FETCH (busca) a) recupera da MP a próxima instrução a ser executada, isto é, a instrução apontada pelo PC e a armazena no registrador instrução IR. b) atualiza o PC para que aponte para a próxima instrução a ser executada. • DECODE (decodificação) c) interpreta a instrução armazenada em IR. • DATA FETCH (busca dos operandos) Organização de Computadores 10 d) se a instrução necessitar de dados armazenados na memória, calcula o endereço dos mesmos e, e) recupera-os armazenando nos registradores internos. • EXECUTION (execução) f) executa a instrução (aritmética, lógica ou desvio) • WRITE BACK (salva o resultado) g) salva o resultado na MP ou em um dos registradores internos e, h) retorna ao primeiro passo. V.3 A Memória Principal É o dispositivo onde são armazenados os programas e os dados de uso corrente. É organizada segundo uma matriz de células, cada uma podendo armazenar um determinado número de bits (8 / 16 / 32 / ...). Cada célula de memória é identificada por um endereço único e imutável. O acesso é aleatório e o tempo de acesso é o mesmo para qualquer célula, que também representa a unidade de acesso à memória (menor quantidade de bits que pode ser lida ou gravada). a. Conexão UCP x MP UCP M A R Address Bus M B R Data Bus MP R/W bit MREQ bit Figura V.9 - Conexão UCP x MP onde, R/W bit ⇒ especifica se a operação é de leitura "R" ou de escrita "W". MREQ bit ⇒ Memory REQuest, especifica uma ordem de acesso à memória emitida pela UCP. b. Tipos de Memória • volátil - perde o conteúdo armazenado quando não energizada. (RAM - Random Access Memory). ∗ tipos de RAM a) Estática - a gravação é estável, só se alterando através de operações de escrita (consome mais energia); b) Dinâmica - a gravação do bit "1" se descarrega com o tempo, precisando ser "refrescada" periodicamente (ciclo de refresh). • não volátil - não perde o conteúdo armazenado. (ROM, PROM, EPROM, EEPROM) Organização de Computadores 11 c) ROM - Read Only Memory (gravada de fábrica - permanente); d) PROM - Programable ROM (pode ser gravada uma única vez pelo usuário, através de equipamentos especiais); e) EPROM - Erasable PROM (pode ser apagada através de raios ultravioletas); f) EEPROM - Electrical EPROM (pode ser apagada através de sinais elétricos); g) Memória Flash - é uma memória que pode ser utilizada como apenas de leitura ou como de leitura e gravação, dependendo do driver utilizado. Geralmente é utilizada como um disco em pastilhas (chips), SSD - Solid State Disk. c. Endereçamento de Memória É realizado por lógica combinacional (cap. IV), onde os bits de endereçamento mais o sinal R/W habilitam a leitura ou gravação de uma única ou de um conjunto de células de cada vez, dependendo do tamanho do barramento de dados. d. Ordem dos Bytes A ordem em que os bytes são considerados dentro da célula é completamente transparente ao usuário, mas é de fundamental importância quanto à compatibilidade de sistemas e transportabilidade dos dados. A ordem pode ser do tipo big endian (da esquerda para a direita), usado pelos processadores Motorola, ou little endian (da direita para a esquerda), característico dos processadores Intel. A figura V.10 mostra um problema de transportabilidade de dados entre uma máquina little endian (PC486) e uma big endian (SPARC Station). Observe que a simples inversão dos dados não soluciona o problema. Byte número 3 2 1 0 0 0 0 5 Y R A M (a) Byte número 0 1 2 3 5 0 0 0 M A R Y (b) Byte número 0 1 2 3 0 0 0 5 Y R A M (c) Figura V.10 - (a) mensagem original no 486 - little endian, (b) mensagem após ser recebida pela SPARC - big endian, (c) mensagem após ser invertida (observe que a inversão pura corrige o valor numérico porém inverte o alfanumérico) e. Detecção e Correção de Erros Os sistemas de detecção e correção de erros são implementados de forma a aumentar a confiabilidade do armazenamento e da transferência de dados entre os diversos componentes do computador. Detecção Simples Organização de Computadores 12 Técnicas Detecção e Correção a) Detecção Simples Apenas detecta o erro, provocando procedimentos de regravação do dado, de mensagem de erro na recuperação de um dado gravado ou, no caso de transmissão de dados, de sua retransmissão. Um método simples, porém largamente utilizado é o da adição de um bit de paridade (VRC - Vertical Redundancy Checking) ao código base do caracter. par ⇒ soma dos bits "1" deve ser par Paridade ímpar ⇒ soma dos bits "1" deve ser ímpar ex. Paridade par adicionada ao código ASCII de 7 bits bit a caracter b c z A 1 2 3 4 5 6 7 VRC 1 1 0 0 0 0 1 1 1 1 0 0 0 1 0 1 1 0 0 0 0 0 1 0 1 1 0 0 0 1 1 0 1 1 1 1 0 1 0 1 . (*) este mecanismo de paridade não detecta um número par de erros no caracter b) Detecção e Correção b.1) Código BCC Uma técnica simples é usar uma paridade longitudinal para blocos de memória - BCC (Block Check Character) em adição ao VRC. bit a caracter b c z 1 2 3 4 5 6 7 VRC 1 1 0 0 0 0 1 1 1 1 0 0 0 1 0 1 1 1 0 0 0 1 1 0 1 1 1 1 0 1 0 1 BCC A 1 0 0 0 0 0 1 0 1 0 1 1 0 1 1 1 Organização de Computadores 13 Neste caso é garantida a detecção de erros do tipo rajada (vários bits consecutivos), que tenham comprimento menor ou no máximo igual ao tamanho do caracter. Para rajadas maiores a detecção não é garantida. A correção é possível pelo cruzamento do VCR e BCC e identificação da(s) célula(s) com erro. Ex. caracter BCC bit a b c z A 1 2 3 4 5 6 7 VRC 1 1 0 0 0 0 1 1 1 1 1 1 1 0 0 1 1 1 0 0 0 1 1 0 1 1 1 1 0 1 0 1 1 0 0 0 0 0 1 0 1 0 1 1 0 1 1 1 Neste exemplo acima, o erro de rajada na letra "b" (4 bits em negrito) pode ser detectado pela paridade horizontal. Observar que a identificação dos bits errados só é possível quando o erro puder ser detectado simultaneamente pelas paridades horizontal e vertical. bit a caracter b c z 1 2 3 4 5 6 7 VRC 1 1 0 0 0 0 1 1 1 1 0 0 0 1 0 1 1 1 0 0 0 1 1 0 1 1 1 1 0 1 1 0 BCC A 0 1 1 0 0 0 1 0 1 0 1 1 0 1 1 1 Neste outro exemplo o ruído atingiu parte das letras "Z" e "A". Observe que o erro foi detectado e ainda os bits errados de "A" puderam ser identificados. Já no exemplo abaixo você pode observar que nenhum erro foi detectado apesar da ocorrência de uma rajada de comprimento 12, maior que o comprimento de um caracter. bit a caracter b c z 1 2 3 4 5 6 7 VRC 1 1 0 0 0 0 1 1 1 1 0 0 1 0 1 0 1 1 0 0 1 0 0 1 1 1 1 1 0 1 0 1 BCC A 1 0 0 0 0 0 1 0 1 0 1 1 0 1 1 1 Organização de Computadores 14 b.2) Código de Hamming Baseia-se na distância de hamming (HD), introduzida em 1950 por Richard Hamming, que conta o número de bits diferentes entre 2 palavras de mesmo tamanho. ex. de distância de hamming ⇒ 0 1 0 1 1 0 1 1 byte A 0 0 1 0 0 1 1 0 byte B ----------------11111 1 ⇒ hd= 6 O código de Hamming consiste basicamente na introdução de vários bits de paridade em redundância que, através de um processo de exclusão combinatória, possibilitam identificar a falha e em alguns casos corrigir o bit errado. O número de bits de redundância necessários é calculado através da equação: m n 2 ( n + 1) ≤ 2 m m+ r 2 ( m + r + 1) ≤ 2 ⇒ m + r + 1 ≤2 r onde: n=m+r bits de redundância bits de dados As posições dos bits de redundância são obtidas através da fórmula: posx = 2x, x = [0, r-1]. ex. para um código ASCII com m = 7 temos que: a) (7 + r + 1) ≤2r ⇒ r ≥ 4 ( mínimo de 4 bits de redundância) b) a posição dos bits de redundância será: 1 (20), 2 (21), 4 (22) e 8 (23). X 1 X 2 3 X 4 no relativo do bit 5 6 7 X 8 9 10 11 bits de redundância Na verificação do erro, mede-se a paridade par ou ímpar, conforme tenha sido previamente definida, para cada bit de redundância aplicado sobre seu universo de atuação. Universo este obtido com base na composição do número que indica a posição relativa do bit de dado. ex. bit de redundância 1 (20) o universo de atuação do primeiro bit de paridade (bit 1) é composto pelos bits de dado pertencentes às seguintes posições: {3, 5, 7, 9 e 11}. Organização de Computadores 15 justificativa: 7 = 20 + 21 + 22 - 11 = 20 + 21 + 23 bit de redundância 2 (21) O segundo bit de paridade avalia os dados pertencentes às posições: {3, 6, 7, 10 e 11}. justificativa: 7 = 20 + 21 + 22 - 11 = 20 + 21 + 23 Em resumo, para um código de 4 bits de Hamming, o universo de atuação de cada bit de redundância é dado por: bit 1 (20) ⇒ {3,5,7,9 e 11} bit 2 (21) ⇒ {3,6,7,10 e 11} 2 bit 3 (2 ) ⇒ {5, 6 e 7} 3 bit 4 (2 ) ⇒ {9, 10 e 11} Com base nos bits de redundância e seus respectivos universos de atuação é que se realiza o processo de detecção e possível identificação do bit errado. Assim, se os bits de redundância número 1, 2 e 4 acusarem erro, então concluí-se que o bit errado é o da posição 11 porque 1 + 2 + 8 = 11 (20 + 21 + 23). A capacidade do método em detectar e corrigir erros depende da menor distância de hamming - HD obtida com a codificação adotada. A capacidade de detectar "d" erros requer um hdmin > d + 1 A capacidade de corrigir "d" erros requer um hdmin > 2d + 1 Assim, um código com hdmin = 4 é capaz de detectar erro de até 2 bits e corrigir erros de até 1 bit. hd = 4 Exemplos: a) erro no bit de posição 6 • representação do caracter ASCII "a" (1100001) com 4 bits de redundância em paridade ímpar. 0 1 1 2 1 3 0 4 1 5 0 6 0 7 0 8 0 9 0 1 10 11 ⇒ ⇒ ⇒ ⇒ 0 1 0 0 • cálculo dos bits de redundância: bit 1: {3, 5, 7, 9 e 11} bit 2: {3, 6, 7, 10 e 11} bit 3: {5, 6 e 7} bit 4: {9, 10 e 11} ≡ ≡ ≡ ≡ {1, 1, 0, 0, 1} {1, 0, 0, 0, 1} {1, 0, 0} {0, 0, 1} • um erro no bit de posição 6 terá a seguinte representação: Organização de Computadores 0 1 16 1 3 1 2 0 4 1 5 1 6 0 7 0 8 0 9 0 1 10 11 • a verificação através dos bits de redundância fornecerá: ⇒ ⇒ ⇒ ⇒ bit 1: {1, 1, 0, 0, 1} bit 2: (1, 1, 0, 0, 1} bit 3: (1, 1, 0} bit 4: {0, 0, 1} 0 0 1 0 ⇒ ⇒ ⇒ ⇒ correto errado errado correto 0 1 1 0 (610) Olhando-se de traz para a frente é possível visualizar a posição do bit errado. Lembre que este mesmo valor, conforme visto no início desta seção, pode ser obtido pela fórmula da potência de 2: (21 + 22 = 6). b) erro nos bits 6 e 9 0 1 1 3 1 2 0 4 1 5 1 6 0 7 0 8 1 9 0 1 10 11 ⇒ ⇒ ⇒ ⇒ 1 1 1 1 • verificação dos bits de redundância: ⇒ ⇒ ⇒ ⇒ bit 1: {1, 1, 0, 1, 1} bit 2: (1, 1, 0, 0, 1} bit 3: (1, 1, 0} bit 4: {1, 0, 1} 1 0 1 1 errado errado errado errado (1510) Observe que o erro foi detectado porém os bits errados não puderam ser identificados.. c) erro nos 3, 6 e 9 0 1 0 3 1 2 0 4 1 5 1 6 0 7 0 8 1 9 0 1 10 11 ⇒ ⇒ ⇒ ⇒ 0 0 1 1 • verificação dos bits de redundância: ⇒ ⇒ ⇒ ⇒ bit 1: {0, 1, 0, 1, 1} bit 2: (0, 1, 0, 0, 1} bit 3: (1, 1, 0} bit 4: {1, 0, 1} 0 1 1 1 correto correto errado errado (1210) O erro de 3 bits foi detectado porém os bits errados não puderam ser identificados. d) erro nos bits 3, 5 e 6 0 1 1 2 0 3 0 4 0 5 • verificação dos bits de redundância: 1 6 0 7 0 8 0 9 0 1 10 11 Organização de Computadores bit 1: {0, 0, 0, 0, 1} bit 2: (0, 1, 0, 0, 1} bit 3: (0, 1, 0} bit 4: {0, 0, 1} 17 ⇒ ⇒ ⇒ ⇒ 0 1 0 0 correto correto correto correto ⇒ ⇒ ⇒ ⇒ 0 0 0 0 (010) Observe que neste caso o método falhou na detecção do erro de 3 bits. V.4 Memória Secundária É utilizada para armazenar grandes volumes de dados. É constituída por diferentes dispositivos, todos mais lentos e mais baratos por byte armazenado que a memória principal. Os tipos principais de memória secundária são: disquetes discos magnéticas fitas óticas removíveis fixos rolo cassete cartucho Zip drives CDs V.4.1 Discos Magnéticos • rígidos - são discos de metal, geralmente de diâmetro entre 5 e 10 polegadas e coberto, em ambos os lados, por uma superfície magnetizável. Os discos giram a velocidades muito elevadas (da ordem de 5000 rpm) e as cabeças de leitura / gravação não tocam a superfície, flutuam a uma distância de alguns microns (10-6m). O maior risco de falha é a aterrissagem das cabeças que causa perda total do disco e, praticamente, de todos os dados gravados. • flexíveis - disco de material plástico, flexível, e coberto em ambas as faces por uma superfície magnetizável. As cabeças de leitura / gravação tocam a superfície, o que provoca um desgaste de ambas as partes. Para reduzir este desgaste, as cabeças são recolhidas e a rotação é interrompida enquanto a unidade não está lendo ou gravando. a) Formatação É a operação que subdivide o disco em cilindros, trilhas, clusters e setores. • trilhas são círculos concêntricos onde os dados são gravados magneticamente. Um disco é geralmente formatado com um valor entre 40 e algumas centenas de trilhas por superfície. Organização de Computadores 18 • setores são espaços radiais que subdividem as trilhas para endereçamento e acesso. O setor contém um determinado número de bytes, geralmente 512. Nos sistemas mais antigos representava a unidade lógica de acesso para leitura e gravação. trilha setor Figura V.11 - Formatação • clusters são utilizados nos sistemas mais modernos e representam a unidade lógica de acesso. O tamanho de um cluster depende do tipo do disco, variando desde um simples setor até um conjunto de vários setores. O sistema DOS, por exemplo, adota a seguinte formatação: Tipo do Disco 3.5" / 1.44M Tamanho do Cluster 512 bytes Tipo do Disco HD ≤16M 3.5" / 720K 1024 bytes 5.25" / 1.2M 512 bytes 513M a 1,024G 1.025 a 2,048 Tamanho do Cluster 4096 bytes (8 setores) 16K bytes (32 setores) 32K bytes (64 setores) • cilindros formados pelo conjunto de trilhas de um mesmo raio e pertencentes a diferentes superfícies. O conceito é utilizado para agilizar o acesso e a transferência de dados, pois as cabeças de leitura/gravação ficam todas simultaneamente posicionadas sobre um mesmo cilindro. A figura V.12 abaixo destaca alguns detalhes sobre a estrutura física de uma unidade de disco magnético. cabeçotes para leitura / gravação braço dos cabeçotes face superior face inferior cilindro Figura V.12 - Estrutura de um Disco Magnético Organização de Computadores 19 Cada sistema operacional implementa uma organização própria de controle e acesso aplicado sobre a formatação física da unidade de disco vista acima. No sistema DOS, por exemplo, a superfície do disco é logicamente dividida em duas partes, conforme mostrado na figura V.13 abaixo, uma para armazenamento das informações utilizadas pelo sistema operacional (área do sistema) e outra para armazenamento dos arquivos propriamente ditos (área de dados). Setor 0 Último setor Boot FATs Diretório Root Área de Dados Área do Sistema Figura V.13 - Partes de uma Estrutura DOS O Boot ocupa apenas um setor e tem por finalidade carregar o sistema operacional para a MP quando da ocasião da inicialização do computador. A FAT - File Alocation Table, é utilizada pelo sistema para armazenar a situação de cada um dos clusters que compõem o disco, se o mesmo está desocupado, ocupado ou defeituoso, por exemplo. Pela sua importância, o sistema operacional mantém uma cópia da FAT afim de dobrar a confiabilidade do disco. A terceira e última área do sistema é o Diretório Raiz (Root), que mantém uma entrada para cada arquivo ou diretório ali registrado. No sistema DOS, cada entrada em uma FAT geralmente possui comprimento de 12 (para os disquetes) ou 16 bits (para os HDs com mais de 16Mbytes). O comprimento da entrada na FAT e o tamanho adotado para o cluster definem a capacidade máxima de armazenamento do disco, como pode ser visto na tabela abaixo: Disco 16M ou menos 17M a 128M 129M a 256M 257 a 512M 513M a 1,024G 1,025G a 2,048G Cluster 4K 2K 4K 8K 16K 32K FAT (entrada) 12 bits 16 bits 16 bits 16 bits 16 bits 16 bits 212 x 4K 216 x 2K 216 x 4K 216 x 8K 216 x 16K 216 x 32K No diretório raiz, para cada entrada são reservados 32 bytes para armazenar as seguintes informações: nome e extensão do arquivo, tamanho, data e hora da última alteração, atributos de segurança e o endereço do primeiro cluster (área do disco onde inicia o arquivo). O endereço dos demais clusters ocupados pelo arquivo são obtidos diretamente na FAT, em seqüência, a partir do primeiro, como pode ser visto na figura V.14 a seguir. Organização de Computadores 20 Obtido no Root 1 ENTRADAS DA FAT 3 5 2 3 900 4 5 1005 ..... 900 end ..... 1005 ..... Figura V.14 - Encadeamento de Clusters de uma arquivo, o endereço do primeiro cluster é fornecido pela entrada no diretório do mesmo b) Taxa de Transferência É o número de bytes capaz de ser transferido do disco para a MP por unidade de segundo: tx = bytes transferidos , ta onde "ta" é o tempo de acesso, que é dado por: ta = seek + latência + tempo de transferência , sendo que: ∗ seek - é o tempo que a unidade gasta para posicionar o cabeçote de leitura e gravação sobre o cilindro desejado (um disco rígido gasta tipicamente 3ms entre trilhas adjacentes e de 20 a 100ms para ir do cilindro mais externo ao mais interno e viceversa. ∗ latência - é o tempo gasto esperando pelo setor desejado (varia de 0 a 16.67ms para discos rígidos girando a 3600rpm). ∗ tempo de transferência - é o tempo gasto na transmissão dos dados (leitura ou gravação) propriamente dita. (*) para os discos flexíveis existe mais um componente por conta do tempo de aceleração necessário para fazer com que a velocidade de cruzeiro do motor seja atingida. V.4.2 Discos Ópticos Usam tecnologia laser e possuem densidade de gravação muito superiores a dos discos magnéticos. Tipos: ∗ CDROM - Compact Disc Read Only Memory (só podem ser lidos). ∗ WORM - Write Once Read Many (admitem uma única vez). ∗ Magneto-Ópticos - combinam a tecnologia óptica com a magnética (admitem reutilização). a) CDROMs Disco plástico com uma fina camada de alumínio depositada nas superfícies, seguida por uma camada plástica transparente para proteção. Organização de Computadores 21 Trilhas em espiral Setores Figura V.15 - Disco Ótico A gravação é feita por raio laser que faz furos de aproximadamente 1 micron, em uma trilha espiralada. Os furos são chamados "pits" e as áreas não queimadas, entre os pits, são chamadas "lands". A leitura é feita através da projeção de um raio de luz, que é refletido de forma diferente pelos pits e lands, possibilitando a distinção entre ambos. A unidade de endereçamento é o setor, geralmente de 2Kbytes. O byte, por sua vez, é expandido para 14 bits pela adoção do código "reed-solomon" para detecção e correção de erros. ∗ capacidade - 650Mbytes ∗ taxa de transferência - aprox 150Kbps (uma ordem de grandeza mais lentos que os magnéticos rígidos) ∗ confiabilidade - muito mais robustos que os magnéticos quanto ao calor, sol e poeira, porém muito mais suscetíveis a erros de gravação. ∗ aplicação - para armazenamento de grandes volumes de dados que não se alteram. b) Magneto-Ópticos Representa a 3a geração de CDs, onde a superfície plástica é coberta com exóticas ligas metálicas (térbio e gadolínio) que possuem a interessante propriedade de serem insensíveis ao campo magnético quando em baixa temperatura e se tornarem sensíveis a ele quando em alta temperatura. A cabeça de leitura / gravação possui um laser e um magneto. O laser dispara uma rajada de onda ultracurta, elevando instantaneamente a temperatura do local e, a seguir, o magneto cria o campo na direção desejada ("1" ou "0"). V.4.3 - Fitas Magnéticas São dispositivos de acesso sequencial e de taxa de transferência mais baixa que os discos, mais baratas e muito utilizadas para backup. ∗ densidade de gravação - 800, 1600 e 6250 bpi ∗ formatação - na organização mais comum, é dividida em 9 trilhas longitudinais e frames verticais contendo 8 bits de dados e 1 de paridade cada. ∗ unidade de acesso - é o bloco ou registro físico. Organização de Computadores 22 ∗ IRG - é o espaço para repouso do cabeçote de leitura/gravação existente entre dois blocos consecutivos. Seu tamanho é de 3/4" e é usado para estabilizar a velocidade da fita nos períodos de aceleração e desaceleração. ∗ Um bloco pode conter um ou mais registros lógicos. O tamanho do bloco é determinado pelo programador, que deve atentar para o binômio eficiência e otimização. Tipos rolo - carretéis de 600, 1200 e 2400 pés cartucho - acondicionadas em caixas plásticas cassete - de baixa velocidade 1 9 Bloco ou Registro Físico IRG - Inter Record Gap trilhas frame Figura V.16 - Organização de uma Fita Magnética V.5 - Dispositivos de Entrada e Saída Barramento de Memória MP UCP Barramento de E/S Canal Multiplex Canal Seletor Disco Controladora de terminais Impressora Disco Disco Figura V.17 - Canais de E / S São as unidades que possibilitam a comunicação do computador com o meio externo. A interligação destes dispositivos com o restante do computador pode ser via canais de E/S - Organização de Computadores 23 processadores dedicados (característicos dos mainframes) ou através de formas mais rudimentares de E/S (características dos mini, superminis e microcomputadores). Os canais de E/S liberam a UCP para executar outras atividades enquanto eles se encarregam da comunicação com o dispositivo de E/S e a transferência dos dados. Um computador típico pode ter vários canais, cada qual atendendo um ou mais dispositivos. Existem três tipos de canais: multiplexador, seletor e bloco-multiplexador. O canal multiplexador é geralmente assíncrono e utilizado para os dispositivos de baixa ou média velocidade, transmite um byte por vez e pode atender a diversos dispositivos simultaneamente. O canal seletor é geralmente síncrono e projetado para atender uma única operação de E/S a cada instante, sendo normalmente utilizado para controlar um dispositivo de alta velocidade. O canal bloco-multiplexador combina as características dos canais multiplexador e seletor, provê conexão a diversos dispositivos de alta velocidade e transfere um bloco de dados em cada operação. Sistemas de E/S O sistema de E/S se constitui basicamente de quatro elementos: o dispositivo (device ou drive), a interface (controladora), o programa de comunicação (device driver) e as rotinas de E/S do sistema operacional. Discos read registro x Processo Rotina E/S In bloco n Disk Driver Disco x cilindro y trilha z setor w Acessa x Controla-dora x y z Figura V.18 - Sistema de E/S As rotinas de E/S pertencem à camada de mais alto nível do sistema operacional e têm por objetivo permitir ao usuário realizar operações de E/S sem se preocupar com detalhes de operação do dispositivo que está sendo acessado. Assim, quando um usuário cria um arquivo em disco, não lhe interessa saber como é a formatação do disco, nem em que trilha ou setor o arquivo será gravado. Um dos principais objetivos das rotinas de E/S é propiciar uma interface simples entre as aplicações e os dispositivos bem como entre os dispositivos e o restante do sistema operacional. Elas são também responsáveis por implementar todo um mecanismo de proteção de acesso aos dispositivos e arquivos. Organização de Computadores 24 Os device drivers são as rotinas do sistema operacional que têm como função se comunicar com os dispositivos em nível de hardware, geralmente através de placas controladoras. Elas especificam características físicas de um dispositivo. Cada device drive manipula somente um tipo de dispositivo ou um grupo de dispositivos semelhantes. Os drivers têm como função receber comandos gerais repassados pelas rotinas de E/S e traduzi-los para comandos específicos que são executados pelas controladoras. As controladoras são componentes eletrônicos, isto é, são placas instaladas nos slots da placa mãe de um PC por exemplo, responsáveis por manipular diretamente os dispositivos de E/S. Suas principais funções são: controle e temporização; comunicação com o processador; comunicação com o dispositivo externo; armazenamento temporário (bufferização) dos dados e detecção de erro. Estas placas variam em complexidade e no número de dispositivos que controlam. Geralmente possuem memória e registradores próprios para poder executar as instruções enviadas pelo device driver. Podem ser dos tipos serial ou paralela. (fig. V.19) Interface com o Dispositivo Reg. de Dados dados Reg. de Estado Dispositivo Vias de Endereço Interface com o Dispositivo Lógica de E/S Vias de Controle estado controle Figura V.19 - Diagrama de Blocos de uma Placa Controladora As formas de acionamento e execução das operações de E/S, podem ser dos seguintes tipos: 1. Programada com espera ocupada (busy wait) 2. acionada por interrupção 3. acesso direto à memória. UCP MP Vídeo Teclado Interfa-ce Serial Interfa-ce Serial Printer Interfa-ce Paralela Barramento Figura V.20 - Estrutura de um Sistema de E/S HD Interfa-ce Paralela Organização de Computadores 25 E/S programada com espera ocupada (Busy Wait) É o método mais simples possível, onde o computador possui apenas uma instrução de entrada (IN) e uma de saída (OUT). Dependendo da implementação, estas instruções podem ler e gravar diretamente na memória (caracterizando o memory-mapped I/O) ou acessar diretamente a interface do dispositivo. Em ambos os casos dois ou três buffers (registradores) são utilizados para cada dispositivo, um para status, um para entrada (read) e outro para saída (write). Um único caractere é transferido entre um registrador da UCP e o dispositivo de E/S selecionado, sendo que a UCP deve executar a instrução explícita desejada (IN ou OUT) para cada caractere transmitido ou recebido. read processo write CTL Dispositivo status UCP MP ou I/O Figura V.21 - E/S Programada Ao usar E/S programada para leitura de um caractere por exemplo, a UCP fica em loop lendo repetidamente o registrador de status, esperando que o bit que autoriza a operação seja setado pelo dispositivo. A seguir ela lê o dado colocado pelo dispositivo no buffer de leitura (read) e limpa (resseta) o bit previamente setado pelo dispositivo no buffer de status. O processo de escrita é semelhante. A principal desvantagem da E/S programada é que a UCP gasta a maior parte do seu tempo em loop, esperando um dispositivo ficar pronto. Esta prática é chamada de espera ocupada (busy wait), que é uma espera dispendiosa. Uma maneira de evitar esta perda desnecessária de capacidade de processamento da UCP é fazer com que esta não precise ficar esperando pelo dispositivo que deve, ele prórpio, informar à UCP quando do término da execução da operação solicitada. Este é o método da interrupção. E/S acionada por interrupção O termo interrupção é usado para identificar a ocorrência de um evento não-freqüente, não-esperado ou aleatório, que obriga a UCP a desviar, temporariamente, o fluxo do programa em execução para o de uma rotina que atenda a interrupção. A grande vantagem desta técnica em relação a da E/S programada, está no fato de que a UCP deixa de esperar em loop pelo dispositivo. O método mais usual de implementar a técnica de interrupção é pela ativação de um sinal de controle chamado interrupt request (IR), ao qual a UCP responde ativando uma rotina de tratamento específica para cada dispositivo (device drive). O processamento da interrupção envolve: Organização de Computadores 26 1. a UCP identifica a fonte da interrupção; 2. a UCP recupera o endereço inicial da rotina de tratamento da interrupção (interrupt table); 3. o PC (program counter) e o vetor de status do processo corrente (PSW) são salvos na pilha (stack); 4. o PC é carregado com o endereço inicial da rotina de tratamento da interrupção; 5. após a execução da rotina de tratamento, o PC e a PSW do processo interrompido são recuperados da pilha, e o processo interrompido reinicia o processamento de onde havia parado. Embora a E/S por interrupção represente um avanço em relação à E/S programada, ela está longe de ser perfeita. O problema é que ela requer a ocorrência de uma interrupção para cada caractere transmitido e processar uma interrupção é uma tarefa cara. A solução é voltar a E/S programada porém não deixar a responsabilidade de sua execução nas mãos da UCP surge então, a técnica do DMA (Acesso Direto à Memória). E/S por DMA É a transferência de dados diretamente entre o dispositivo de E/S e a MP, sem a intervenção da UCP. Na operação de DMA, a UCP atua apenas nas fases de inicialização (fornecendo o endereço e o número de bytes a ser transferido) e de finalização. Toda a transferência é feita automaticamente pela controladora de DMA. Ao receber um pedido de DMA (DMA request), a UCP interrompe suas atividades em um dos pontos permitidos dentro do ciclo de instrução (fig. V.21), e atende o DMA. ciclo de instrução ciclo de UCP fetch decode data fetch DMA breakpoints execution store IR breakpoint Figura V.21 - Ciclo de Instrução x Pontos de Interrupção A técnica de DMA pode ser implementada segundo duas filosofias: 1. block transfer ==> transfere grandes volumes de dados em uma única operação (durante a transferência dos dados a UCP pode continuar operando normalmente porém não pode acessar a MP); Organização de Computadores 27 2. cycle stealing ==> transfere apenas um ou dois bytes de cada vez, "roubando" pequenos ciclos de memória que não são sentidos pela UCP em virtude da parada do seu relógio. A pastilha de DMA possui (pelo menos) 4 registradores internos, todos podendo ser carregados pelo processo em execução na UCP. O primeiro deles contém o endereço de memória a ser lido ou escrito, o segundo contém o contador de quantos bytes (ou palavras) devem ser transferidos, o terceiro especifica o dispositivo a ser usado e o quarto informa a operação a ser realizada (leitura ou gravação). (a) UCP → I/O Comando de leitura (b) UCP → I/O (c) Comando de Comando de UCP → DMA leitura leitura ≈ I/O → UCP Verifica Estado I/O → UCP Verifica Estado Interrupção Não DMA → UCP Pronto ? Não Sim I/O → UCP Lê da Interface UCP → MP Não OK ? ≈ Lê Estado do DMA Erro Sim I/O → UCP Lê da Interface Grava na Memória Grava na Memória FIM ? FIM ? Figura V.22 - Fluxograma representativo das 3 estratégias de comunicação com dispositivos de E/S. (a) entrada e saída programada; (b) por interrupção e © por DMA V.6 Arquiteturas Paralelas Caracteriza-se pela execução em paralelo e, portanto, ao mesmo tempo, de 2 ou mais instruções de um mesmo processo ou de diferentes processos. As arquiteturas paralelas podem ser classificadas segundo Flynn em três categorias, com base no número de fluxos de dados e de instruções que elas suportam: 1) SISD - Single Instruction Single Data (fluxo único de instrução e de dado - caracterizado pelo computador seqüencial - também conhecido como Von Newman) Organização de Computadores 28 2) SIMD - Single Instruction Multiple Data (fluxo único de instrução porém múltiplo de dados - caracterizados pelas vector e array machines) 3) MIMD - Multiple Instruction Multiple Data (múltiplos fluxos de instruções e de dados - caracterizados por arquiteturas com matrizes de processadores) SISD • é a máquina convencional, com um único programa executado passo a passo por uma única UCP. • uma quantidade limitada de paralelismo pode ser alcançada com a introdução de algumas modificações na estrutura SISD básica, como por exemplo: a) pipelining Estações / instruções P1 P2 P3 P4 P5 A 1 B A 2 C B A 3 D C B A 4 E D C B A 5 F E D C B 6 t Figura V.23 - Máquina SISD com Pipeline Baseia-se no processamento do ciclo de instrução por partes, como numa linha de montagem, onde cada estação de trabalho é responsável pelo processamento de apenas uma fase do ciclo total. b) máquina com múltiplas unidades funcionais A UCP busca tantas instruções quantas forem as unidade funcionais disponíveis ou até que uma instrução dependa do resultado de outra ainda em execução. registradores + + x % Figura V.24 - Máquina SISD com Múltiplas Unidades Funcionais ÷ Organização de Computadores 29 SIMD Ideal para aplicações vetoriais e matriciais, onde uma mesma operação se repete sobre vários dados. Vetor B Vetor A ULA Vetor Resultado A+B Figura V.25 - Estrutura SIMD MIMD São vários processadores independentes, cada um executando um programa diferente. Dependendo do granularidade de integração pode caracterizar um multiprocessador, uma rede de computadores ou um sistema distribuído. V.7 Arquiteturas CISC e RISC A tecnologia RISC (Reduced Instruction Set Computer), criada nos laboratórios da IBM Research em 1987, pelo Dr. Jolm Cocke, representou uma quebra na tendência até então predominante, que era na direção de máquinas cada vez maiores e mais complexas, conhecida como tecnologia CISC (Complex Instruction Set Computer). Embora não haja uma definição precisa para RISC, os primeiros projetos nesta linha fizeram uso de um pequeno conjunto de instruções simples, que eram executadas rapidamente, em um único ciclo de máquina. Esta característica era oposta a da tecnologia CISC, onde as instruções consumiam vários ciclos de máquina. Em função desta característica, as instruções RISC podiam ter sua execução realizada diretamente pelo hardware, como nas máquinas mais antigas desprovidas de microcódigo, o que simplificava e reduzia os custos de projeto e fabricação dos computadores. Uma conseqüência do princípio de que toda instrução RISC só pode consumir um ciclo de máquina é que qualquer operação que consuma mais do que um ciclo não pode pertencer ao conjunto de instruções. Assim, muitas máquinas RISC não possuem instruções de multipli- Organização de Computadores 30 cação e de divisão. Estas e as demais instruções de ponto flutuante são executadas por um coprocessador aritmético. Em 1991 a IBM lançou a chamada 2a geração da tecnologia RISC, baseada na tecnologia pipeline e de processadores de funções múltiplas. As máquinas desta geração, como por exemplo o Power PC e o Power 2, geralmente possuem um processador de desvio, um de ponto-fixo e um de ponto-flutuante, e podem executar até quatro ou cinco operações por ciclo de máquina. Em resumo, uma máquina RISC se caracteriza por: a) ter instruções simples executadas em um ciclo de máquina; b) usar apenas as instruções Load e Store para referenciar a memória; c) fazer uso da tecnologia pipeline; d) ter instruções executadas diretamente pelo hardware; e) ter instruções com formato fixo; f) ter poucas instruções; g) delegar a complexidade para o compilador; e h) fazer uso de múltiplos conjuntos de registradores. V.8 Referências Bibliográficas • Stallings, William, Operating Systems,Ed. Acmillan Publishing Company, 1992. • Tanenbauum, Andrew S., Organização Estruturada de Computadores, Ed. Campus, 1993. • Silberschatz, Abraham e Galvin, Peter B., Operating Systems Concepts, Ed. AddisonWesley Publishing Company, 1994.