Fundamentos da Representação de Informações em Computadores Prof. Carlos H. Marcondes [email protected] Representação e magia Pinturas pré-históricas, grutas de Altamira (Espanha) e Lascaux (França) Caracter instrumental da representação • Manipula-se a representação por que é mais econômico que manipular a realidade diretamente • O resultado da manipulação da representação é subsídio para a praxis sobre a realidade • Similaridade: Representação e Realidade Manipulação = Simulação Representação de conceitos Carro Representação de conceitos no computador Realidade Representação computacional Carro Representação simbólica (codificação, linguagem) Objeto, conceito Representação por imagens Representação de informações no computador • Representação por IMAGENS – formatos “mapa-de-bits” (bitmap): .BMP, .PCX, .GIF, .TIFF, .JPEG • Representação simbólica – uso da linguagem, caracteres são CODIFICADOS – códigos ASCII e EBCDIC – Cada caracter é representado por um código de 8 bits Possibilidades de codificação de informações em função do conjunto de sinais - 1 bit : 0 - 21=2 1 - 2 bits: 00 - 22=4 10 01 11 00 - 3 bits: 000 - 23=8 100 010 001 110 101 011 111 000 Caracteres codificados permitem a busca por um padrão de bits ligados e desligados A palavra “BRASIL” 01000010-01010010-01000001-01010011-01001001-01001100 B S R I A L FORMATOS para representação de informações • Um FORMATO é um específico arranjo de informações, formando um arquivo digital • Um FORMATO contém informações voltadas para pessoas (conteúdo) e informações voltadas para os programas que processam estes conteúdos • Ex: formato WINWORD (.DOC) – Conteúdo – – Informações para o programa - o caráter “A” - tipo de fonte - cor - normal, negrito ou itálico - etc, etc, etc Formatos proprietários – exclusivos de um fabricante. Ex: .DOC, PDF X Tabela ASCII #NJoão da Silva #EPetrobras #[email protected] ## #NMaria da Conceição #EBanco do Brasil #[email protected] ## João da Silva, Petrobras e [email protected] são os Conteúdos, #N, #E, #M e ## são o Informações de codificação dos elementos do Vocabulário , de modo que minha mala direta possa ser comprendida por um programa Arquivos em formato “mapa de bits”: • Arquivos em formato “mapa de bits”: como reconhecer um caracter? A a Aa A a A a ????? a Processo de digitalização A digitalização é o processo de transformar documentos em papel em arquivos digitais de imagem tipo ¨mapa-de-bits¨ Nos arquivos de imagem tipo “mapa-de-bits” cada ponto de um documento, cada ponto de cada caracter de um documento é desenhado e não representado por um código como no conjunto de caracteres ASCII Processo de digitalização Imagens são formadas por pontos Pixel - (Picture Element) É o menor ponto de luz cuja cor e luminosidade podem ser controladas na tela. As imagens são formadas com a combinação de grande número de pixels. O termo é usado para referir-se a resolução de uma placa de vídeo ou monitor (ex: 800 x 600 pixels). Pixels são representados por 1 ou mais “bits” Bitonal ou preto-e-branco: 1 bit por pixel: pontos pretos: “1” pontos brancos: “0” Monocromático: preto-e-branco com diversas intensidades – 4 bits, 6 bits, 8 bits, por pixel) Colorido 8 bits por pixel: 256 cores 12 bits por pixel : 4096 cores 24 bits por pixel : 16.800.000 cores (“true color”) Correspondência Arquivo “mapa-debits”, imagem na tela do computador Imagem na Tela 10 X 20 Arquivo “mapa-de-bits” 0000000000 0000000000 0000000000 0111111110 0100000010 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0000000000 0000000000 0000000000 0000000000 Processo de digitalização - RESOLUÇÃO • Relação entre número de pontos de uma imagem (Pixels) / Área • Unidade: “dpi” (“dots per inch”) pontos por polegada quadrada • A resolução é uma medida da LEGIBILIDADE de uma imagem Processo de digitalização - RESOLUÇÃO • Corresponde à capacidade de detalhamento de uma imagem, quanto maior a resolução da imagem, maior será a sua capacidade de exibir detalhes. Processo de digitalização RESOLUÇÃO - aplicação da digitalização em DOCUMENTOS Arquivos de imagens ( de documentos) com baixa resolução são POUCO LEGÍVEIS (abaixo de 50 dpi) Acima de 800 dpi a vista humana NÃO DISTINGUE MAIS MELHORAS DE LEGIBILIDADE Quanto maior a resolução de uma imagem, maior o tamanho do arquivo que vai armazena-la Resolução razoável para documentos: 300 dbi Processo de digitalização • Como não existe um código único para cada caracter, as imagens dos caracteres são desenhadas! A a A a A aa A a a , • nos arquivos “mapa-de-bits” não é possível fazer busca por conteúdo Processo de digitalização • Os sistemas de gerenciamento de imagens eletrônicas de documentos – GED - associam a cada arquivo de imagem, um registro de uma base de dados com conteúdos textuais codificados, para fins de busca. • Estes sistemas são a combinação das tecnologias de bancos de dados com a digitalização de documentos através do uso de escaners Imagem digitalizada de um documento Tipo | Num. | Setor | Data | Assunto | Registro de um banco de dados: pontos de acesso para recuperação