1 Armazenamento de Sinais de Áudio Geber Ramalho ([email protected]) Jeferson Valadares ([email protected]) Ulisses Montenegro ([email protected]) UFPE 2 Gravação/Armazenamento Definição • Meio pelo qual o som pode ser capturado permanentemente e, eventualmente, re-trabalhado • é baseada na conversão de sinais elétricos em – – – – sinais magnéticos padrões mecânicos padrões óticos sinais eletrônicos (chips) Plano de aula • • • • Fita magnética e toca discos Gravadores analógicos Gravadores digitais e CD Arquivos de som para computador UFPE 3 Fitas magnéticas: contituição Base de poliéster • função mecânica • espessura 25 a 40m Material magnético • Óxido de ferro Fe2O3 • Dióxido de cromo: CrO2 • Ferro puro (metal): Fe Material adesivo • resina Solvente N N S S N N S S N N S S UFPE 4 Fabricação de fitas: etapas 1) Moagem • Mistura adesivo, óxido (partículas magnéticas ) e solvente para forma uma pasta fluida • aplica a pasta sobre a base 2) Orientação • as partículas são orientadas UFPE 5 Fabricação de fitas: etapas 3) Secagem • Evaporação do solvente • Túnel de secagem 4) Enrolamento 5) Polimento 6) Corte • no cassete – comprimento 45, 60, 90 e 120 minutos – largura 3,8 mm 7) Embalagem UFPE 6 Princípio de funcionamento Ciclo de histerese • uma partícula (ponto 0) exposta a uma força magnética H é magnetizada até a saturação (ponto 1) • Quando a força é “desligada”, um certo fluxo magnético permanece (ponto 2) • Submetida a uma força magnética negativa, o nível zero de magnetização é obtido (ponto 3) • o ciclo continua... UFPE 7 Característica de transferência A função de transferência não é linear • as variações no sinal elétrico não são reproduzidas fielmente pela magnetização • implica em distorção saída entrada UFPE 8 Polarização (bias) Solução: polarização • idéia: forçar o sinal a “trabalhar” na zona linear somando-se outro sinal a ele • onda de alta freqüência (AM) que pode ser filtrada depois UFPE 9 Gravadores 3 componentes • cabeças • eletrônica • mecânica UFPE 10 Cabeça de gravação Idéia: • a variação de corrente na bobina induz fluxo magnético correspondente no núcleo • pelo fato de existir um gap no núcleo, o fluxo magnético é forçado a atravessar a fita orientando as suas partículas • Ao cessar o campo, pela propriedade da remanência, o campo magnético permanece UFPE 11 Cabeça de apagamento Idéia: • mesmo princípio da cabeça de gravação, porém • introduz um sinal de alta freqüência de forma a “bagunçar” o alinhamento dos domínios (partículas) O gap • deve ser grande: aprox. 20 m • para poder mudar, por exemplo, pelo menos 10 vezes cada domínio (partícula) no curto período de tempo em que a fita passa pela cabeça UFPE 12 Cabeça de reprodução Princípio inverso da gravação • a passagem da fita magnetizada, implica em uma variação de fluxo magnético no núcleo, induzindo uma corrente correspondente • deve ter alta permeabilidade (sensível às variações de fluxo da fita) Gap • basicamente da mesma ordem do da cabeça de gravação • largura do gap < comprimento de onda • se for maior, não conseguirá captar nas extremidades do núcleo a variação de fluxo magnético UFPE 13 Cabeças Fazer ajustes • Zenite • Azimute E de vez em quando desmagnetizar... • Magnetismo => ruído • Usar desmagnetizador (ponta de prova gerando 60 Hz) UFPE 14 Cabeças 3 cabeças é melhor do que 2 • cada uma pode ser projetada otimamente UFPE 15 Velocidade Quanto maior a velocidade melhor a qualidade! Velocidade • • • • cassete: 4,75 cm/s (1 7/8 ips) rolo: 9,5 cm/s (3 3/4 ips) rolo: 19 cm/s (7 1/2 ips) rolo: 38 cm/s (15 ips) Exemplo • • • • gravar freqüência de 10kHz como = v/f cassete: = 4,75/10000 = 0,5 m rolo: = 19/10000 = 3,8 m UFPE 16 Pistas (tracks) cabeça fita cabeça fita Completa monofônica 1 2 Meia pista monofônica cabeça fita esq dir Meia pista estéreo (Revox) cabeça Quatro pistas mono fita 1 2 3 4 UFPE 17 Pistas Quatro pistas estéreo cabeça fita • cassete N pistas mono (estúdio) • • • • 8 16 24 32 crosstalk • informação de uma pista vaza para a outra esq dir dir esq cabeça fita 1 2 3 4 5 6 7 8 UFPE 18 Limitações Analogia entre fita e amostragem • largura do gap taxa de amostragem • Largura física da fita quantificação Faixa dinâmica reduzida • Saturação: não pode-se usar níveis muito elevados de sinal, senão distorce • Ruído branco: o ruído de fundo (hiss) impede que se use níveis de sinal muito baixos sem serem mascarados • Solução – Tipo de fita: Metal melhor – Velocidade de gravação: mais rápido melhor – Largura de fita: mais larga melhor UFPE 19 Limitações das fitas Resposta em freqüência • fraca nas baixas e altas freqüências • Polarização causa cancelamentos nas altas freqüências • Tamanho do Gap passa a ser crítico Soluções • Pré-equalização para corrigir a resposta • Velocidade de gravação: mais rápido melhor • Tipo de fita: Metal UFPE 20 Limitações das fitas Ruído • Existe muito ruído de fundo (hiss) • a situação é crítica nas altas freqüências onde a energia da música é mais fraca • a relação sinal ruído deveria ser de pelo menos 60dB UFPE 21 Redutores de ruído Solução • utilizar redutores de ruído idéia • dar ênfase em certas freqüências na gravação e e atenuá-las na reprodução Sistemas • Dolby • dbx UFPE 22 ilustração amp NORMAL ruído música = freq freq freq amp Ênfase ruído música = freq freq freq atenuação freq freq UFPE 23 Redutores de ruído Sistema dbx • enfatiza altas freqüências (taxa de 2:1) e depois atenua com a mesma curva • trabalha então em uma única banda • reduz ruído em 30dB e aumenta headroom (faixa dinâmica) em 10dB Dolby A • divide o espectro em 4 bandas de freqüências que são comprimidas e expandidas independentemente • Além disto, Dolby só opera em passagens de baixa energia (abaixo de -10 VU) • consegue redução de 10dB abaixo de 5kHz e 15dB acima de 15kHz UFPE 24 Redutores de ruído Dolby B • sistema mais barato para cassetes • só opera nas altas freqüências reduzindo hiss em 10dB Dolby C • trabalha em um espectro mais largo e reduz 20dB Dolby SR • melhor dos sistemas Dolby • atua em regiões onde o sinal tem nível baixo a médio • redução de mais de 25dB em grande parte do espectro audível – ex. em 15 ips (38 m/s) é possível obter uma relação sinal ruído de 105dB UFPE 25 Toca-disco vinil: só curiosidades... Disco • material: vinil • velocidade: 78, 45 ou 33 rpm Reprodução: agulha + capsula sinal esquerdo induzido sinal direito induzido agulha disco Sulcos e codificação mono direito esquerdo d+e (em fase) d+e (em contrafase) UFPE 26 Toca-disco vinil Controle motor da rotação • Correia • Polia • Tração direta Rastreio • para evitar erro: braço inclinado – J, S, reto com capsula em anglo, etc. • para compensar pressão: anti-skating Reposta em freqüência • Para corrigir a fraca reprodução nas altas e nas baixas: equalização RIAA UFPE 27 Gravação Digital em Fita Idéia • grava-se a informação digital (binária, PCM), em vez do próprio sinal • não é necessário polarizar analógico digital Reprodução detecta mudanças de orientação Sinal magnético Sinal lido Sinal reconstituído UFPE 28 Largura de banda Definição • resolução (distância física mínima entre os picos) do sinal • Influencia no espectro em que se pode gravar e pode provocar erros Interferência • deturpações nas mudanças dos picos Sinal escrito Sinal lido Sinal reconstruído UFPE 29 Largura de banda Caso digital • 50 vezes maior do que a de um gravador analógico – 44,1 KHz x 16 bits = 705 Kbps – somando-se dados para sincronização e correção de erros, seria preciso 1Mbps para a máxima freqüência – o problema piora para gravadores multipista O grande desafio • maximizar densidade sem provocar erros!!! Métodos • usar gravação vertical em vez de longitudinal – não se está limitado ao tamanho das partículas magnéticas – difícil de ser operacionalizado UFPE 30 2 Tipos de Cabeças Estacionárias • DASH (digital audio stationary head) Rotativas • duas cabeças giram deixando, por causa do movimento da fita, um rastro diagonal • truque que aumenta o “tamanho útil”da fita UFPE 31 Balanço Vantagens da cabeça rotativa • • • • maior largura de banda maior densidade de gravação (gasta menos fita) mais fácil de sincronizar com sinais de vídeo etc. Vantagens da cabeça rotativa • em algumas aplicações particulares, difícil de fazer edições muito precisas – melhor usar memória - chips • mais difícil fazer overdubbing ou puch-in e punch-out devido a multiplexação • menos simples de projetar e mais caras UFPE 32 Armazenamento Digital de Áudio Digital Audio Tape (DAT) Compact Disc (CD) Arquivo wave (.wav) Arquivo de áudio da Sun (.au) Codificação Sonora Perceptual (MPEG e MP3) Outros formatos UFPE 33 DAT Início das pesquisas em 1981 Em 1983, dois padrões foram propostos: • S-DAT • R-DAT R-DAT foi definido como padrão em 1986, e desde então o formato é conhecido simplesmente como DAT Fita DAT: • padronizada exclusivamente para o formato DAT • dimensões: 73x54x10.5 mm • capacidade de aproximadamente duas a seis horas de áudio • só começa a se deteriorar a partir da 200ª reprodução UFPE 34 DAT O formato suporta três freqüências de amostragem: • 32, 44.1 e 48 kHz Dois níveis de bits de quantização • 12 bits não-lineares ou 16 bits lineares Extensões ao padrão DAT, criadas por fabricantes • 12 bits a 96KHz • 24 bits a 48KHz Gravadores DAT apresentam entradas e saídas digitais • cópias digitais de alta qualidade UFPE 35 DAT DAT (Gravação/Reprodução) Fita Pré-Gravada Standard Option 1 Option 2 Option 3 2 2 2 4 Freqüência de Amostrag 48 KHz 32 KHz 32 KHz 32 KHz Bits de quantização 16 (linear) 16 (linear) 12 (nãolinear) 12 (nãolinear) 16 (linear) 16 (linear) Tempo de gravação (minutos) 120 120 240 120 120 80 8.15 12.225 o N Canais Velocidade da fita (mm/s) 8.15 4.075 8.15 Velocidade angular das cabeças (rpm) 2000 1000 2000 2 2 44.1 KHz 2000 UFPE 36 DAT Formato da Trilha 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1 Margin 5 IBG 9 PCM 13 PLL (sub) 2 PLL (sub) 6 ATF 10 IBG 14 Sub-2 3 Sub-1 7 IBG 11 ATF 15 Post amble 4 Post amble 8 PLL (PCM) 12 IBG 16 Margin UFPE 37 DAT Sync ID code (PCM block or subcode block) Block address (and subcode ID) Parity Data (PCM data and parity or subcode data and parity) 8 bits 8 bits 8 bits 8 bits 256 bits (32 symbols) W1 W2 P Paridade: Block address: P = W1 W2 ( = Mod 2) corresponds to PCM or subcode data block, the MSB indicates an ID bit (PCM or subcode data UFPE 38 DAT ID-0 (ID format) ID-1 a ID-7 Descricao 0 0 (para audio) ID-1 (enfase) 00: off 01: Pre-enfatizado (50/15 Sec) 10,11: reservado ID-2 (frequencia de amostragem) 00: 48Khz 01: 44.1KHz 10: 32KHz 11: reservado 00: 2 canais 01: 4 canais 10,11: reservado ID-3 (numero de canais) ID-4 (numero de bits de quantizacao) 00: 16 bits linear 01: 12 bits não-linear 10,11: reservado ID-5 (pitch da faixa) 00: 13,6 m 01: 20,4 m 10,11: reservado ID-6 (inibicao de copia) 00: permissao de copia digital 01: reservado 10: inibicao de copia digital 11: SCMS flag Pacote consiste de 32 ID-7s ID-7 UFPE 39 DAT UFPE 40 Compact Disc Armazenamento de bits baseado em princípios óticos Tecnologia levou cerca de 10 anos desde concepção ate introdução no mercado • 1972 – Phillips introduziu o conceito de armazenamento ótico de áudio em discos de tamanho limitado – Sony desenvolveu técnicas de correção de erros para discos óticos de grandes dimensões • 1980 – padrão de Compact Disc Digital Audio foi criado e aprovado pelo Digital Audio Disc Commitee, um grupo representando mais de 25 empresas UFPE 41 Compact Disc Tamanho da palavra e freqüência de amostragem fixas • • • • 16 bits 44.1 kHz dois canais (estéreo) total de 1,41 milhões de bits por segundo de áudio Dados adicionais de controle • correção de erro • sincronização • modulação Taxa total de transferência chega a 4.3218 Mbps UFPE 42 Compact Disc CD-DA define tamanho máximo em 6.3109 bits • capacidade para 74 minutos e 33 segundos de áudio Capacidade foi definida por sugestão de Herbert von Karajan • coincide com a duração de uma execução ininterrupta da 9a Sinfonia de Beethoven Variações nos parâmetros físicos permitem durações superiores a 80 minutos de áudio CD players de qualidade exibem resposta de freqüência de 5Hz a 20kHz com desvio de ±0.2dB • taxa de signal-to-noise acima dos 100dB • distorção harmônica a 1kHZ abaixo de 0.002% UFPE 43 Compact Disc 1,6 mm 0,6 m 0.163mm 1 frame (1/7.35 ms) Sync Sub (27 bits) Code Data (96 bits) Parity Data (32 bits) (96 bits) Parity (32 bits) 8 bits P,Q,R,S,T,U,V,W UFPE 44 Arquivos Wave Tamanho 4 bytes 4 bytes 4 bytes 4 bytes 4 bytes 2 bytes 4 bytes 4 bytes 2 bytes 2 bytes 4 bytes 4 bytes (n bytes) Descrição “RIFF” Tamanho do arquivo (subtraído de 4) “WAVE” “fmt “ Tamanho da descrição do arquivo Flag para mono (0x01) ou estéreo (0x02) Taxa de amostragem Bytes/sample Alinhamento do bloco Bits/sample “data” Tamanho do segmento de dados Dados Little-Endian Word Esquerdo (MSB) | Direito (LSB) UFPE 45 Arquivos Wave Taxa de amostragem é dada em Hz • e.g., 44.100Hz Bytes/sample é calculado como (taxa de amostragem alinhamento de bloco) Alinhamento de bloco é calculado como (canais bits por sample)/8 Bits por sample podem assumir apenas os valores 8 ou 16 Para arquivos em estéreo, o bloco de dados do canal esquerdo é imediatamente seguido do bloco do canal direito, em seqüência até o final do arquivo UFPE 46 Arquivo de áudio da Sun (.au) Definido pela Sun em 1992 Várias codificações (ISDN u-law, PCM linear, ponto flutuante IEEE), de 8 a 64 bits Várias taxas de amostragem (8000, 11025, 16000, 22050, 32000, 44100 e 48000 amostras/s) Funções para manipulação incluídas nos sistemas operacionais da Sun e em Java UFPE 47 Formato .au Offset Tamanho 0 4 bytes 4 4 bytes 8 4 bytes 12 4 bytes 16 4 bytes 20 4 bytes 24 (h-24)bytes (h) (s)bytes Descrição ".snd" <Header size (h)> <Sample data size (s)> <Audio file encoding> <Sample rate> <Number of channels> <Comment> <Sample data> Big-Endian Word Esquerdo (LSB) | Direito (MSB) UFPE 48 Codificação Sonora Perceptual Antes da compressão de áudio, um minuto de música estéreo (qualidade de CD) ocupava 10 MB! • 44.100 amostras/s * 2 canais * 2 bytes/amostra * 60 s/min Caso um arquivo destes fosse transmitido pela internet através de um modem padrão (28.8 Kbps) a transferência de 1 minuto levaria 49 minutos! • 10.000.000 bytes * 8 bits/byte / (28.800 bits/s * 60 s/min) Codificação sonora explora as propriedades do ouvido humano para conseguir uma redução de tamanho com pouca ou nenhuma perda perceptível na qualidade UFPE 49 Codificação Sonora Perceptual - MPEG Eficiência atingida através de algoritmos que exploram redundância em sinais e as nãorelevâncias (mascaramento) no domínio de freqüência baseado em um modelo do sistema auditivo humano • sinais redundantes e irrelevantes são perdidos na codificação Ideal para ambientes que precisam de alta qualidade com um baixo bitrate: trilhas sonoras de jogos em CD-ROM, áudio para internet, sistemas de transmissão de áudio digital, etc. UFPE 50 MPEG Audio Layer-3 (MP3) Início do desenvolvimento em 1987 pelo IIS Sinais digitais sem compressão: • 16bits, 44.1KHz - 1.400 Mbit para 1s de música estéreo Através de codificação MPEG: • redução do tamanho por um fator de 4-24 através de técnicas de codificação sonora perceptual – Layer 3: reduções de 10-12 vezes sem perda de qualidade Padronizado pela ISO e recomendado pela ITU-R para aplicações de broadcast que necessitem de um bitrate de 60 kbps/s por canal UFPE 51 MP3 Performance Qualidade Bandwidth Sonora Som de 2.5 KHz Telefone Melhor que ondas 4.5 KHz curtas Melhor que rádio 7.5 KHz AM Similar a 11 KHz rádio FM Quase CD 15 KHz CD > 15 KHz Modo bitrate mono 8 kbps Taxa de redução 96:1 16 kbps 48:1 32 kbps 24:1 estéreo 56-64 kbps 26-24:1 estéreo 96 kbps 16:1 estéreo 112-128 kbps 14-12:1 mono mono UFPE 52 Outros Formatos AIFF (Apple/SGI) • criado pela Apple para armazenamento de alta qualidade de instrumentos e som • extensão AIFC ou AIFF-C suporta compressão RealAudio (Real Networks) • voltado para streaming • compressão lossy, otimizada para baixa utilização de banda IFF/8SVX (Amiga) • versão para áudio do padrão IFF do Amiga VOC (Creative Labs) • padrão criado pela Creative Labs para sua placa Sound Blaster, com limites de taxa de amostragem e de 8 bits de quantização UFPE 53 Mídias para áudio digital Mídia Acesso Notas Cabeça estacionária (fita magnética) Serial Fita de vídeo com cabeça rotatória (fita magnética) Serial Fita de áudio com cabeça rotatória (fita magnética) Serial Fita de Áudio Digital (DAT) (fita magnética) Serial Gravação multitrack profissional, vários formatos coexistem Vários formatos (VHS, 8mm, Beta) e codificações (NTSC, PAL, SECAM) Formato profissional Nagra-D para gravações em 4 canais Compatibilidade mundial Discos Rígidos (magnéticos e óticos) Aleatório Disquetes (magnéticos) Aleatório CDs (óticos) Aleatório Memória (eletrônica) Aleatório Discos removíveis são mais lentos, porém mais convenientes Baratos, convenientes, lentos, limitados e não confiáveis Duráveis, vários níveis de qualidade, lentos para uma mídia deste tipo de acesso Acesso rápido, excelente para edição mas cara para UFPE armazenamento 54 Referências Ken C. Pohlman, Principles of Digital Audio, McGraw Hill, 1995, 3rd Edition http://home.sprynet.com/~cbagwell/AudioFormats.html http://www.iis.fhg.de/amm/techinf/layer3/index.html http://www.mp3tech.org/ http://www.dv.co.yu/mpgscript/mpeghdr.htm http://home.sprynet.com/~cbagwell/sox.html UFPE