1
Armazenamento de
Sinais de Áudio
Geber Ramalho ([email protected])
Jeferson Valadares ([email protected])
Ulisses Montenegro ([email protected])
UFPE
2
Gravação/Armazenamento
 Definição
• Meio pelo qual o som pode ser capturado
permanentemente e, eventualmente, re-trabalhado
• é baseada na conversão de sinais elétricos em
–
–
–
–
sinais magnéticos
padrões mecânicos
padrões óticos
sinais eletrônicos (chips)
 Plano de aula
•
•
•
•
Fita magnética e toca discos
Gravadores analógicos
Gravadores digitais e CD
Arquivos de som para computador
UFPE
3
Fitas magnéticas: contituição
 Base de poliéster
• função mecânica
• espessura  25 a 40m
 Material magnético
• Óxido de ferro Fe2O3
• Dióxido de cromo: CrO2
• Ferro puro (metal): Fe
 Material adesivo
• resina
 Solvente
N
N
S
S
N
N
S
S
N
N
S
S
UFPE
4
Fabricação de fitas: etapas
1) Moagem
• Mistura adesivo, óxido (partículas magnéticas ) e
solvente para forma uma pasta fluida
• aplica a pasta sobre a base
2) Orientação
• as partículas são orientadas
UFPE
5
Fabricação de fitas: etapas
3) Secagem
• Evaporação do solvente
• Túnel de secagem
4) Enrolamento
5) Polimento
6) Corte
• no cassete
– comprimento 45, 60, 90 e 120 minutos
– largura 3,8 mm
7) Embalagem
UFPE
6
Princípio de funcionamento
 Ciclo de histerese
• uma partícula (ponto 0)
exposta a uma força
magnética H é
magnetizada até a
saturação (ponto 1)
• Quando a força é
“desligada”, um certo
fluxo magnético
permanece (ponto 2)
• Submetida a uma força
magnética negativa, o
nível zero de
magnetização é obtido
(ponto 3)
• o ciclo continua...
UFPE
7
Característica de transferência
 A função de transferência não é linear
• as variações no sinal elétrico não são reproduzidas
fielmente pela magnetização
• implica em distorção
saída
entrada
UFPE
8
Polarização (bias)
 Solução: polarização
• idéia: forçar o sinal a “trabalhar” na
zona linear somando-se outro sinal a ele
• onda de alta freqüência (AM) que pode ser filtrada
depois
UFPE
9
Gravadores
 3 componentes
• cabeças
• eletrônica
• mecânica
UFPE
10
Cabeça de gravação
 Idéia:
• a variação de corrente na bobina induz fluxo magnético
correspondente no núcleo
• pelo fato de existir um gap no núcleo, o fluxo magnético
é forçado a atravessar a fita orientando as suas
partículas
• Ao cessar o campo, pela propriedade da remanência, o
campo magnético permanece
UFPE
11
Cabeça de apagamento
 Idéia:
• mesmo princípio da cabeça de gravação, porém
• introduz um sinal de alta freqüência de forma a
“bagunçar” o alinhamento dos domínios (partículas)
 O gap
• deve ser grande: aprox. 20 m
• para poder mudar, por exemplo, pelo menos 10 vezes
cada domínio (partícula) no curto período de tempo
em que a fita passa pela cabeça
UFPE
12
Cabeça de reprodução
 Princípio inverso da gravação
• a passagem da fita magnetizada, implica em uma
variação de fluxo magnético no núcleo, induzindo uma
corrente correspondente
• deve ter alta permeabilidade (sensível às variações de
fluxo da fita)
 Gap
• basicamente da mesma ordem do da cabeça de
gravação
• largura do gap < comprimento de onda
• se for maior, não conseguirá captar nas extremidades
do núcleo a variação de fluxo magnético
UFPE
13
Cabeças
 Fazer ajustes
• Zenite
• Azimute
 E de vez em quando desmagnetizar...
• Magnetismo => ruído
• Usar desmagnetizador (ponta de prova gerando 60
Hz)
UFPE
14
Cabeças
 3 cabeças é melhor do que 2
• cada uma pode ser projetada otimamente
UFPE
15
Velocidade
 Quanto maior a velocidade melhor a qualidade!
 Velocidade
•
•
•
•
cassete: 4,75 cm/s (1 7/8 ips)
rolo: 9,5 cm/s (3 3/4 ips)
rolo: 19 cm/s (7 1/2 ips)
rolo: 38 cm/s (15 ips)
 Exemplo
•
•
•
•
gravar freqüência de 10kHz
como  = v/f
cassete:  = 4,75/10000 = 0,5 m
rolo:  = 19/10000 = 3,8 m
UFPE
16
Pistas (tracks)
cabeça
fita
cabeça
fita
 Completa monofônica
1
2
 Meia pista monofônica
cabeça
fita
esq
dir
 Meia pista estéreo (Revox)
cabeça
 Quatro pistas mono
fita
1
2
3
4
UFPE
17
Pistas
 Quatro pistas estéreo
cabeça
fita
• cassete
 N pistas mono (estúdio)
•
•
•
•
8
16
24
32
 crosstalk
• informação de uma pista
vaza para a outra
esq
dir
dir
esq
cabeça
fita
1
2
3
4
5
6
7
8
UFPE
18
Limitações
 Analogia entre fita e amostragem
• largura do gap  taxa de amostragem
• Largura física da fita  quantificação
 Faixa dinâmica reduzida
• Saturação: não pode-se usar níveis muito elevados de
sinal, senão distorce
• Ruído branco: o ruído de fundo (hiss) impede que se
use níveis de sinal muito baixos sem serem
mascarados
• Solução
– Tipo de fita: Metal melhor
– Velocidade de gravação: mais rápido melhor
– Largura de fita: mais larga melhor
UFPE
19
Limitações das fitas
 Resposta em freqüência
• fraca nas baixas e altas freqüências
• Polarização causa cancelamentos nas altas freqüências
• Tamanho do Gap passa a ser crítico
 Soluções
• Pré-equalização para corrigir a resposta
• Velocidade de gravação: mais rápido melhor
• Tipo de fita: Metal
UFPE
20
Limitações das fitas
 Ruído
• Existe muito ruído de fundo (hiss)
• a situação é crítica nas altas freqüências onde a
energia da música é mais fraca
• a relação sinal ruído deveria ser de pelo menos 60dB
UFPE
21
Redutores de ruído
 Solução
• utilizar redutores de ruído
 idéia
• dar ênfase em certas freqüências na gravação e e
atenuá-las na reprodução
 Sistemas
• Dolby
• dbx
UFPE
22
ilustração
amp
NORMAL
ruído

música
=
freq
freq
freq
amp
Ênfase
ruído

música
=
freq
freq
freq
atenuação
freq
freq
UFPE
23
Redutores de ruído
 Sistema dbx
• enfatiza altas freqüências (taxa de 2:1) e depois
atenua com a mesma curva
• trabalha então em uma única banda
• reduz ruído em 30dB e aumenta headroom (faixa
dinâmica) em 10dB
 Dolby A
• divide o espectro em 4 bandas de freqüências que são
comprimidas e expandidas independentemente
• Além disto, Dolby só opera em passagens de baixa
energia (abaixo de -10 VU)
• consegue redução de 10dB abaixo de 5kHz e 15dB
acima de 15kHz
UFPE
24
Redutores de ruído
 Dolby B
• sistema mais barato para cassetes
• só opera nas altas freqüências reduzindo hiss em
10dB
 Dolby C
• trabalha em um espectro mais largo e reduz 20dB
 Dolby SR
• melhor dos sistemas Dolby
• atua em regiões onde o sinal tem nível baixo a médio
• redução de mais de 25dB em grande parte do
espectro audível
– ex. em 15 ips (38 m/s) é possível obter uma relação
sinal ruído de 105dB
UFPE
25
Toca-disco vinil: só curiosidades...
 Disco
• material: vinil
• velocidade: 78, 45 ou 33 rpm
 Reprodução: agulha + capsula
sinal esquerdo
induzido
sinal direito
induzido
agulha
disco
 Sulcos e codificação
mono
direito
esquerdo
d+e (em fase) d+e (em contrafase)
UFPE
26
Toca-disco vinil
 Controle motor da rotação
• Correia
• Polia
• Tração direta
 Rastreio
• para evitar erro: braço inclinado
– J, S, reto com capsula em anglo, etc.
• para compensar pressão: anti-skating
 Reposta em freqüência
• Para corrigir a fraca reprodução nas altas e nas
baixas: equalização RIAA
UFPE
27
Gravação Digital em Fita
 Idéia
• grava-se a informação digital (binária, PCM), em vez
do próprio sinal
• não é necessário polarizar
analógico
digital
 Reprodução detecta mudanças de orientação
Sinal magnético
Sinal lido
Sinal reconstituído
UFPE
28
Largura de banda
 Definição
• resolução (distância física mínima entre os picos) do
sinal
• Influencia no espectro em que se pode gravar e pode
provocar erros
 Interferência
• deturpações nas mudanças dos picos
Sinal escrito
Sinal lido
Sinal reconstruído
UFPE
29
Largura de banda
 Caso digital
• 50 vezes maior do que a de um gravador analógico
– 44,1 KHz x 16 bits = 705 Kbps
– somando-se dados para sincronização e correção de erros,
seria preciso 1Mbps para a máxima freqüência
– o problema piora para gravadores multipista
 O grande desafio
• maximizar densidade sem provocar erros!!!
 Métodos
• usar gravação vertical em vez de longitudinal
– não se está limitado ao tamanho das partículas magnéticas
– difícil de ser operacionalizado
UFPE
30
2 Tipos de Cabeças
 Estacionárias
• DASH (digital audio stationary head)
 Rotativas
• duas cabeças giram deixando, por causa do
movimento da fita, um rastro diagonal
• truque que aumenta o “tamanho útil”da fita
UFPE
31
Balanço
 Vantagens da cabeça rotativa
•
•
•
•
maior largura de banda
maior densidade de gravação (gasta menos fita)
mais fácil de sincronizar com sinais de vídeo
etc.
 Vantagens da cabeça rotativa
• em algumas aplicações particulares, difícil de fazer
edições muito precisas
– melhor usar memória - chips
• mais difícil fazer overdubbing ou puch-in e punch-out
devido a multiplexação
• menos simples de projetar e mais caras
UFPE
32
Armazenamento Digital de Áudio
Digital Audio Tape (DAT)
Compact Disc (CD)
Arquivo wave (.wav)
Arquivo de áudio da Sun (.au)
Codificação Sonora Perceptual (MPEG e MP3)
Outros formatos
UFPE
33
DAT
 Início das pesquisas em 1981
 Em 1983, dois padrões foram propostos:
• S-DAT
• R-DAT
 R-DAT foi definido como padrão em 1986, e desde
então o formato é conhecido simplesmente como
DAT
 Fita DAT:
• padronizada exclusivamente para o formato DAT
• dimensões: 73x54x10.5 mm
• capacidade de aproximadamente duas a seis horas de
áudio
• só começa a se deteriorar a partir da 200ª reprodução
UFPE
34
DAT
 O formato suporta três freqüências de
amostragem:
• 32, 44.1 e 48 kHz
 Dois níveis de bits de quantização
• 12 bits não-lineares ou 16 bits lineares
 Extensões ao padrão DAT, criadas por fabricantes
• 12 bits a 96KHz
• 24 bits a 48KHz
 Gravadores DAT apresentam entradas e saídas
digitais
• cópias digitais de alta qualidade
UFPE
35
DAT
DAT (Gravação/Reprodução)
Fita Pré-Gravada
Standard
Option 1
Option 2
Option 3
2
2
2
4
Freqüência
de Amostrag
48 KHz
32 KHz
32 KHz
32 KHz
Bits
de
quantização
16 (linear)
16 (linear)
12 (nãolinear)
12 (nãolinear)
16 (linear)
16 (linear)
Tempo
de
gravação
(minutos)
120
120
240
120
120
80
8.15
12.225
o
N Canais
Velocidade
da
fita
(mm/s)
8.15
4.075
8.15
Velocidade
angular das
cabeças
(rpm)
2000
1000
2000
2
2
44.1 KHz
2000
UFPE
36
DAT
Formato da Trilha
1 2 3 4 5 6 7 8 9
10 11 12 13 14 15 16
1
Margin
5
IBG
9
PCM
13 PLL (sub)
2
PLL (sub) 6
ATF
10 IBG
14 Sub-2
3
Sub-1
7
IBG
11 ATF
15 Post
amble
4
Post
amble
8
PLL
(PCM)
12 IBG
16 Margin
UFPE
37
DAT
Sync
ID code (PCM
block or
subcode block)
Block address
(and subcode
ID)
Parity
Data (PCM data and
parity or subcode data
and parity)
8 bits
8 bits
8 bits
8 bits
256 bits (32 symbols)
W1
W2
P
Paridade:
Block address:
P = W1  W2 ( = Mod 2)
corresponds to PCM or subcode data block,
the MSB indicates an ID bit (PCM or subcode data
UFPE
38
DAT
ID-0 (ID format)
ID-1 a ID-7
Descricao
0 0 (para audio)
ID-1 (enfase)
00: off
01: Pre-enfatizado (50/15 Sec)
10,11: reservado
ID-2 (frequencia de
amostragem)
00: 48Khz
01: 44.1KHz
10: 32KHz
11: reservado
00: 2 canais
01: 4 canais
10,11: reservado
ID-3 (numero de canais)
ID-4 (numero de bits de
quantizacao)
00: 16 bits linear
01: 12 bits não-linear
10,11: reservado
ID-5 (pitch da faixa)
00: 13,6 m
01: 20,4 m
10,11: reservado
ID-6 (inibicao de copia)
00: permissao de copia digital
01: reservado
10: inibicao de copia digital
11: SCMS flag
Pacote consiste de 32 ID-7s
ID-7
UFPE
39
DAT
UFPE
40
Compact Disc
 Armazenamento de bits baseado em princípios
óticos
 Tecnologia levou cerca de 10 anos desde
concepção ate introdução no mercado
• 1972
– Phillips introduziu o conceito de armazenamento ótico
de áudio em discos de tamanho limitado
– Sony desenvolveu técnicas de correção de erros para
discos óticos de grandes dimensões
• 1980
– padrão de Compact Disc Digital Audio foi criado e
aprovado pelo Digital Audio Disc Commitee, um grupo
representando mais de 25 empresas
UFPE
41
Compact Disc
 Tamanho da palavra e freqüência de amostragem
fixas
•
•
•
•
16 bits
44.1 kHz
dois canais (estéreo)
total de 1,41 milhões de bits por segundo de áudio
 Dados adicionais de controle
• correção de erro
• sincronização
• modulação
 Taxa total de transferência chega a 4.3218 Mbps
UFPE
42
Compact Disc
 CD-DA define tamanho máximo em 6.3109 bits
• capacidade para 74 minutos e 33 segundos de áudio
 Capacidade foi definida por sugestão de Herbert
von Karajan
• coincide com a duração de uma execução ininterrupta
da 9a Sinfonia de Beethoven
 Variações nos parâmetros físicos permitem
durações superiores a 80 minutos de áudio
 CD players de qualidade exibem resposta de
freqüência de 5Hz a 20kHz com desvio de ±0.2dB
• taxa de signal-to-noise acima dos 100dB
• distorção harmônica a 1kHZ abaixo de 0.002%
UFPE
43
Compact Disc
1,6 mm
0,6
m
0.163mm
1 frame (1/7.35 ms)
Sync
Sub
(27 bits) Code
Data
(96 bits)
Parity
Data
(32 bits) (96 bits)
Parity
(32 bits)
8 bits
P,Q,R,S,T,U,V,W
UFPE
44
Arquivos Wave
Tamanho
4 bytes
4 bytes
4 bytes
4 bytes
4 bytes
2 bytes
4 bytes
4 bytes
2 bytes
2 bytes
4 bytes
4 bytes
(n bytes)
Descrição
“RIFF”
Tamanho do arquivo (subtraído de 4)
“WAVE”
“fmt “
Tamanho da descrição do arquivo
Flag para mono (0x01) ou estéreo (0x02)
Taxa de amostragem
Bytes/sample
Alinhamento do bloco
Bits/sample
“data”
Tamanho do segmento de dados
Dados
Little-Endian Word
Esquerdo (MSB) | Direito (LSB)
UFPE
45
Arquivos Wave
 Taxa de amostragem é dada em Hz
• e.g., 44.100Hz
 Bytes/sample é calculado como
(taxa de amostragem  alinhamento de bloco)
 Alinhamento de bloco é calculado como
(canais  bits por sample)/8
 Bits por sample podem assumir apenas os
valores 8 ou 16
 Para arquivos em estéreo, o bloco de dados do
canal esquerdo é imediatamente seguido do
bloco do canal direito, em seqüência até o final
do arquivo
UFPE
46
Arquivo de áudio da Sun (.au)
 Definido pela Sun em 1992
 Várias codificações (ISDN u-law, PCM linear,
ponto flutuante IEEE), de 8 a 64 bits
 Várias taxas de amostragem (8000, 11025, 16000,
22050, 32000, 44100 e 48000 amostras/s)
 Funções para manipulação incluídas nos
sistemas operacionais da Sun e em Java
UFPE
47
Formato .au
Offset
Tamanho
0
4 bytes
4
4 bytes
8
4 bytes
12
4 bytes
16
4 bytes
20
4 bytes
24 (h-24)bytes
(h)
(s)bytes
Descrição
".snd"
<Header size (h)>
<Sample data size (s)>
<Audio file encoding>
<Sample rate>
<Number of channels>
<Comment>
<Sample data>
Big-Endian Word
Esquerdo (LSB) | Direito (MSB)
UFPE
48
Codificação Sonora Perceptual
 Antes da compressão de áudio, um minuto de
música estéreo (qualidade de CD) ocupava 10 MB!
• 44.100 amostras/s * 2 canais * 2 bytes/amostra * 60
s/min
 Caso um arquivo destes fosse transmitido pela
internet através de um modem padrão (28.8 Kbps) a
transferência de 1 minuto levaria 49 minutos!
• 10.000.000 bytes * 8 bits/byte / (28.800 bits/s * 60
s/min)
 Codificação sonora explora as propriedades do
ouvido humano para conseguir uma redução de
tamanho com pouca ou nenhuma perda perceptível
na qualidade
UFPE
49
Codificação Sonora Perceptual - MPEG
 Eficiência atingida através de algoritmos que
exploram redundância em sinais e as nãorelevâncias (mascaramento) no domínio de
freqüência baseado em um modelo do sistema
auditivo humano
• sinais redundantes e irrelevantes são perdidos na
codificação
 Ideal para ambientes que precisam de alta
qualidade com um baixo bitrate: trilhas sonoras
de jogos em CD-ROM, áudio para internet,
sistemas de transmissão de áudio digital, etc.
UFPE
50
MPEG Audio Layer-3 (MP3)
 Início do desenvolvimento em 1987 pelo IIS
 Sinais digitais sem compressão:
• 16bits, 44.1KHz - 1.400 Mbit para 1s de música
estéreo
 Através de codificação MPEG:
• redução do tamanho por um fator de 4-24 através de
técnicas de codificação sonora perceptual
– Layer 3: reduções de 10-12 vezes sem perda de
qualidade
 Padronizado pela ISO e recomendado pela ITU-R
para aplicações de broadcast que necessitem de
um bitrate de 60 kbps/s por canal
UFPE
51
MP3
 Performance
Qualidade Bandwidth
Sonora
Som de
2.5 KHz
Telefone
Melhor
que ondas 4.5 KHz
curtas
Melhor
que rádio
7.5 KHz
AM
Similar a
11 KHz
rádio FM
Quase CD
15 KHz
CD
> 15 KHz
Modo
bitrate
mono
8 kbps
Taxa de
redução
96:1
16 kbps
48:1
32 kbps
24:1
estéreo
56-64 kbps
26-24:1
estéreo
96 kbps
16:1
estéreo
112-128
kbps
14-12:1
mono
mono
UFPE
52
Outros Formatos
 AIFF (Apple/SGI)
• criado pela Apple para armazenamento de alta
qualidade de instrumentos e som
• extensão AIFC ou AIFF-C suporta compressão
 RealAudio (Real Networks)
• voltado para streaming
• compressão lossy, otimizada para baixa utilização de
banda
 IFF/8SVX (Amiga)
• versão para áudio do padrão IFF do Amiga
 VOC (Creative Labs)
• padrão criado pela Creative Labs para sua placa
Sound Blaster, com limites de taxa de amostragem e
de 8 bits de quantização
UFPE
53
Mídias para áudio digital
Mídia
Acesso
Notas
Cabeça estacionária (fita
magnética)
Serial
Fita de vídeo com cabeça
rotatória (fita magnética)
Serial
Fita de áudio com cabeça
rotatória (fita magnética)
Serial
Fita de Áudio Digital (DAT)
(fita magnética)
Serial
Gravação multitrack
profissional, vários
formatos coexistem
Vários formatos (VHS,
8mm, Beta) e codificações
(NTSC, PAL, SECAM)
Formato profissional
Nagra-D para gravações
em 4 canais
Compatibilidade mundial
Discos Rígidos
(magnéticos e óticos)
Aleatório
Disquetes (magnéticos)
Aleatório
CDs (óticos)
Aleatório
Memória (eletrônica)
Aleatório
Discos removíveis são
mais lentos, porém mais
convenientes
Baratos, convenientes,
lentos, limitados e não
confiáveis
Duráveis, vários níveis de
qualidade, lentos para uma
mídia deste tipo de acesso
Acesso rápido, excelente
para edição mas cara para
UFPE
armazenamento
54
Referências
 Ken C. Pohlman, Principles of Digital Audio, McGraw Hill,
1995, 3rd Edition
 http://home.sprynet.com/~cbagwell/AudioFormats.html
 http://www.iis.fhg.de/amm/techinf/layer3/index.html
 http://www.mp3tech.org/
 http://www.dv.co.yu/mpgscript/mpeghdr.htm
 http://home.sprynet.com/~cbagwell/sox.html
UFPE