Fundamentos da Representação
de Informações em Computadores
Prof. Carlos H. Marcondes
[email protected]
Representação e magia
Pinturas pré-históricas, grutas de
Altamira (Espanha) e Lascaux (França)
Caracter instrumental da
representação
• Manipula-se a representação por que é
mais econômico que manipular a
realidade diretamente
• O resultado da manipulação da
representação é subsídio para a praxis
sobre a realidade
• Similaridade: Representação e
Realidade
Manipulação
=
Simulação
Representação de conceitos
Carro
Representação de conceitos no
computador
Realidade
Representação
computacional
Carro
Representação simbólica
(codificação, linguagem)
Objeto,
conceito
Representação
por imagens
Representação de informações
no computador
• Representação por IMAGENS – formatos
“mapa-de-bits” (bitmap): .BMP, .PCX,
.GIF, .TIFF, .JPEG
• Representação simbólica – uso da
linguagem, caracteres são
CODIFICADOS – códigos ASCII e
EBCDIC
– Cada caracter é representado por um código
de 8 bits
Possibilidades de codificação de
informações em função do
conjunto de sinais
- 1 bit : 0 - 21=2
1
- 2 bits: 00 - 22=4
10
01
11
00
- 3 bits: 000 - 23=8
100
010
001
110
101
011
111
000
Caracteres codificados permitem a
busca por um padrão de bits ligados
e desligados
A palavra
“BRASIL”
01000010-01010010-01000001-01010011-01001001-01001100
B
S
R
I
A
L
FORMATOS para representação de
informações
• Um FORMATO é um específico arranjo de
informações, formando um arquivo digital
• Um FORMATO contém informações voltadas para
pessoas (conteúdo) e informações voltadas para os
programas que processam estes conteúdos
• Ex: formato WINWORD (.DOC)
– Conteúdo –
– Informações para o programa
- o caráter “A”
- tipo de fonte
- cor
- normal, negrito ou itálico
- etc, etc, etc
Formatos proprietários – exclusivos de um fabricante. Ex:
.DOC,
PDF X
Tabela ASCII
#NJoão da Silva
#EPetrobras
#[email protected]
##
#NMaria da Conceição
#EBanco do Brasil
#[email protected]
##
João da Silva, Petrobras e
[email protected] são os Conteúdos,
#N, #E, #M e ## são o Informações de codificação
dos
elementos do Vocabulário , de modo que
minha mala
direta possa ser comprendida por um
programa
Arquivos em formato “mapa de
bits”:
•
Arquivos em formato “mapa de
bits”: como reconhecer um
caracter?
A
a
Aa A
a A
a
?????
a
Processo de digitalização
A digitalização é o processo de transformar
documentos em papel em arquivos digitais
de imagem tipo ¨mapa-de-bits¨
Nos arquivos de imagem tipo “mapa-de-bits”
cada ponto de um documento, cada ponto de
cada caracter de um documento é
desenhado e não representado por um
código como no conjunto de caracteres
ASCII
Processo de digitalização
Imagens são formadas por pontos
Pixel - (Picture Element) É o menor ponto de luz cuja cor e luminosidade
podem ser controladas na tela. As imagens são formadas com a
combinação de grande número de pixels. O termo é usado para referir-se
a resolução de uma placa de vídeo ou monitor (ex: 800 x 600 pixels).
Pixels são representados por 1 ou mais “bits”
Bitonal ou preto-e-branco:
1 bit por pixel:
pontos pretos: “1”
pontos brancos: “0”
Monocromático: preto-e-branco com diversas intensidades – 4 bits, 6
bits, 8 bits, por pixel)
Colorido
8 bits por pixel: 256 cores
12 bits por pixel : 4096 cores
24 bits por pixel : 16.800.000 cores (“true color”)
Correspondência Arquivo “mapa-debits”, imagem na tela do computador
Imagem na Tela 10 X 20
Arquivo “mapa-de-bits”
0000000000 0000000000 0000000000 0111111110 0100000010 0100000000
0100000000 0100000000 0100000000 0100000000 0100000000 0100000000
0100000000 0100000000 0100000000 0100000000 0000000000 0000000000
0000000000 0000000000
Processo de digitalização -
RESOLUÇÃO
• Relação entre número de
pontos de uma imagem
(Pixels) / Área
• Unidade: “dpi” (“dots per
inch”) pontos por
polegada quadrada
• A resolução é uma
medida da
LEGIBILIDADE de uma
imagem
Processo de digitalização -
RESOLUÇÃO
• Corresponde à
capacidade de
detalhamento de uma
imagem, quanto maior a
resolução da imagem,
maior será a sua
capacidade de exibir
detalhes.
Processo de digitalização
RESOLUÇÃO - aplicação da digitalização em
DOCUMENTOS
Arquivos de imagens ( de documentos) com
baixa resolução são POUCO LEGÍVEIS
(abaixo de 50 dpi)
Acima de 800 dpi a vista humana NÃO
DISTINGUE MAIS MELHORAS DE
LEGIBILIDADE
Quanto maior a resolução de uma imagem,
maior o tamanho do arquivo que vai
armazena-la
Resolução razoável para documentos: 300 dbi
Processo de digitalização
• Como não existe um código único para
cada caracter, as imagens dos caracteres
são desenhadas!
A
a
A
a
A aa A a
a
,
• nos arquivos “mapa-de-bits” não é
possível fazer busca por conteúdo
Processo de digitalização
• Os sistemas de gerenciamento de imagens
eletrônicas de documentos – GED - associam a cada
arquivo de imagem, um registro de uma base de
dados com conteúdos textuais codificados, para fins
de busca.
• Estes sistemas são a combinação das tecnologias de
bancos de dados com a digitalização de documentos
através do uso de escaners
Imagem
digitalizada de
um documento
Tipo | Num. | Setor | Data | Assunto |
Registro de um banco de
dados: pontos de acesso para
recuperação
Download

Fundamentos da Representação de Informações em Computadores