PR UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ TV DIGITAL Prof. Alexandre A. P. Pohl Departamento de Eletrônica (DAELN) 1 Bibliografia Televisão Digital, Princípios e Técnicas, Arnaldo Megrich, editora Erica, 2009. Televisão Digital, Marcelo Sampaio de Alencar, editora Erica, 2007. Digital Television Fundamentals, Michael Robin and Michel Poulin, McGraw-Hill, 2000. Standard Handbook of Video and Television Engineering, McGraw-Hill, ed. Jerry Whitaker and Blair Benson, 2003. The MPEG Handbook, John Watkinson, Elsevier, 2004. 2 No Brasil A televisão no Brasil começou em 18 de setembro de 1950, trazida por Assis Chateaubriand, que fundou o primeiro canal de televisão no país, a TV Tupi. Decreto 4.901 de 26/11/2003 institui o projeto do Sistema Brasileiro de TV Digital. Entra em operação em dezembro de 2007 3 Vídeo Composto contém informações sobre luminância (brilho da imagem) e crominância (matiz e saturação, que são características da cor). Além disso, carrega sinais de sincronismo que permitem o retraço do sinal no processo de varredura na direção horizontal e vertical. 4 Varredura No sistema de TV os elementos de um quadro são disponibilizados em uma tela um após o outro, através de um processo de varredura… …mas são percebidos ao mesmo tempo devido ao fenômeno de persistência de visão. Consiste em se “quebrar” a imagem em uma série de linhas horizontais e transmití-las em seqüência (525, NTSC ou 625, PAL). 5 Varredura Entrelaçada 1 3 5 7 9 2 4 6 8 10 campo 1, linhas ímpares - esquerda para direita de cima para baixo - campo 2, linhas pares Sistema NTSC: 525 linhas e 262,5 linhas por campo Sistema PAL: 625 linhas e 312,5 linhas por campo 6 Comparação NTSC e PAL Características 625 / 50 (PAL) 525 / 60 (NTSC) No. linhas por quadro 625 525 No. linhas ativas/quadro 575 485 No. linhas por campo 312,5 262,5 Campos por segundo 2 fH / 625 = 50 2 fH / 525 = 59,94 Quadros por segundo 25 29,97 Duração total de uma linha (μs) 64 63,556 Frequencia da linha (Hz) 15.625 15.734,265 Duração do intervalo de apag. horiz. (μs) 12 10,7 7 Comparação NTSC e PAL Características PAL PALM / NTSC Largura total do canal 8 MHz 6 MHz Banda lateral vestigial 0,75 MHz 0,75 MHz Distância da portadora de vídeo em relação ao início da banda 1,25 MHz 1,25 MHz Distância entre a portadora de vídeo e a portadora de cor 4,43 MHz 3,58 MHz Distância entre a portadora de vídeo e a de áudio 5,5 MHz 4,5 MHz 8 Representação da Cor NTSC PAL R, G e B R, G e B (R-Y) e (B-Y) (R-Y) e (B-Y) I (in-phase) e Q (quadrature) UeV 1,5 e 0,5 MHz, respectivamente Amplitude ModulationDouble Side Band/Supressed Carrier 1,5 e 1,5 MHz, respectivamente Geração dos sinais Y, I e Q no transmissor, a partir de R, G e B Sistema NTSC (encoder) Recepção dos Sinais Notch Sinal Composto Atraso Y 3,58 MHz 3,58 MHz Sep. Sync FPB Gerad. Burst Sep. Burst PLL 3,58 MHz Osc B-Y demod. R-Y demod Desv. 90° Decoder NTSC M A T R I Z G B R Sistema PAL • O matiz é determinado pela relação de fase existente entre os vetores I e Q (no sistema NTSC). • Qualquer variação aleatória nessa relação causa a reprodução de matizes incorretos no receptor. • O sistema NTSC apresentou desde o início uma tendência para erros de fase. • Assim, o sistema PAL (Phase Alternating Line) foi desenvolvido com o objetivo de evitar que erros de fase provocassem mudanças no tom da imagem e também reduzir erros de cromaticidade produzidos na modulação em quadratura. Sistema PAL Representação da transmissão da crominância numa seqüência de 4 linhas nos sistemas NTSC e PAL. Observa-se que ocorre uma inversão de fase nas linhas pares do sistema PAL. É necessário haver reinversão da fase dessas linhas no receptor. Após a reinversão, é feita uma média entre duas linhas consecutivas a fim de se produzir o tom original da cor Sistema PAL No sistema PAL os sinais utilizados são os parâmetros U e V (ao invés dos parâmetros I e Q), os quais são transmitidos com sua largura integral de faixa, ou seja, 1,5 MHz cada (isto representa outra vantagem do sistema PAL). Na recepção existe a separação completa dos sinais U e V evitando, assim, os erros de fase e a sobreposição dos espectros dos sinais I e Q que ocorrem no sistema NTSC. O sistema PAL também utiliza a modulação em quadratura para transmitir os sinais diferenças de cor. Diagrama de Transmissão e Recepção 15 Modulação Portadoras servem como suporte para levar a informação até o destino. São compatíveis com com as dimensões do elemento irradiador e com as características do meio. Permitem multiplexação Tipos: AM, FM, Fase… st A1 am mt cosct Δam= B/A 16 AM-VSB AM-VSB (vestigial side band) – compromisso entre SSB e DSB 17 Modulação do Sinal de Vídeo Sync tip Nível de apagamento Modulado em amplitude (AM / VSB) 18 Vantagens do Vídeo Digital Sinal digital é imune à degradação observada no sinal analógico (distorções lineares e não-lineares, ruído) Facilidade de processamento do sinal digital (compressão, armazenamento) É compatível com as técnicas de transmissão (digital) desenvolvidas. Padrões de Vídeo Digital Padrão NTSC 4 fsc Padrão PAL 4 fsc Permite escolha entre 8 e 10 bits Norma SMPTE 244M define as características do padrão NTSC digital e as respectivas conexões da interface paralela dos bits Padrão Digital de Vídeo Componente Informação carregada pelos sinais (G, B, R) ou (Y, B-Y, R-Y) Processamento sujeito a degradações (distorção linear, não-linear, ruído e variação temporal) A utilização do vídeo componente pode remover ou reduzir essas degradações. Padrão Digital de Vídeo Componente A utilização do sinal na forma digital também reduz as degradações (desde que a conversão seja realizada uma única vez) Padrão de digitalização de vídeo composto: 4fsc Padrão de digitalização de vídeo componente privilegia a qualidade para operação em estudios CCIR Recommendation 601 (Encoding Paramenters of Digital Television for Studios) permitiu uma abordagem comum para digitalização dos sinais 525/60 e 625/50 Freqüências de Amostragem Para sinal NTSC (fref = 3,375 MHz) 4:1:1 sinal de luminância é amostrado em 13,5 MHz (4 x fref) e cada sinal diferença de cor em 1 x fref. 4:2:2 sinal de luminância é amostrado em 13,5 MHz (4 x fref) e cada sinal diferença de cor em 6,75 MHz (2 x fref) 4:4:4 sinal de luminância e sinais diferença de cor amostrados em 13,5 MHz (4 x fref) Características da Interface Codificação da fonte: conversor A/D Conversor Paralelo Série: transforma fluxo de dados paralelo em fluxo serial Reconversão (série-paralelo e D/A) no sistema de recepção Taxa serial de dados: Taxa serial = Taxa paralela de bits (Mpalavra/s) x Número de bits/palavra 24 Exemplo Para o sistema de vídeo componente 4:2:2: Taxa serial = 27 Mpalavras/s x 10 bits/palavra = 270 Mbps Para o sistema de vídeo composto 4 fSC NTSC: Taxa serial = 14,3 Mpalavras/s x 10 bits/palavra = 143 Mbps PAL: Taxa serial = 17,7 Mpalavras/s x 10 bits/palavra = 177 Mbps 25 Áudio Digital Conversão A/D Amostragem Quantização Codificação Padronização AES/EBU (Audio Engineering Society / European Broadcast Union) Formatos de Áudio Digital 26 Freqüências de Amostragem Padrão 32 KHZ (sistemas iniciais). Em estaçõec que alimentavam transmissores de FM estéreo. 44,1 KHz (padrão de eletrônica de consumo). CDs que usam PCM. 48 KHz (padrão de áudio de transmissão) 27 Diagrama do Codificador 28 Estrutura da Interface de Áudio AES/EBU 29 Características Gerais Dois Subquadros (32 bits, um para cada canal) Palavra de dados (16 a 20 bits) Sinais de sincronismo (palavras X, Y, Z) Dados auxiliares Bits Validade (V), Usuário (U), Canal (C) e Paridade (P) Agrupados em blocos de 192 quadros Duração de cada quadro: 20,83 μs Amostragem (Ts= 1/48 KHz) Duração de bloco AES/EBU: 20,83 x 192 = 4ms 30 Padrão MPEG Codificação Razão Compressão Taxa PCM (CD-Quality) 1:1 e 32 a 448 Kbps MPEG-1 layer II 8:1 192 Kbps MPEG-1 layer III (MP3) 12:1 128 Kbps Padrão Taxa de Amostragem (KHZ) Taxa (Kbps) MPEG-1 32 ; 44,1 ; 48 32, 40, 48, 56,64, 80, 96, 112, 128, 160, 192, 224, 256, 320 MPEG-2 16 ; 22,05 ; 24 8, 16, 24, 32, 40, 48, 56, 64, 80, 96, 112, 128, 144, 160 4:1 Prof. Alexandre Pohl 31 Padrões de Áudio nos Sistemas de TVD ATSC: Dolby Digital AC-3 (renomeado para A/52) DVB: ISDB: Dolby Digital AC-3 e MPEG-2 AAC MPEG-2 AAC ISDB-Tb Prof. Alexandre Pohl (brasileiro): MPEG-4 AAC 2.0 32 Compressão de Vídeo Taxas muito altas (SDI, 270 Mbps) exigem grande banda Sistemas convencionais (NTSC, PAL, SECAM): redução da informação de crominância (< 1,5 MHz) Levam em conta o fato do Sistema Visual Humano (HVS) não ser tão sensível à informação de cor Compressão de Vídeo Imagens geralmente contem dados idênticos, que NÃO precisam ser repetidos durante a transmissão O processo de identificação de dados idênticos em um quadro (ou seqüência de quadros) é conhecido como decorrelação de dados. Entropia: caracteriza a medida do conteúdo médio de informação de uma imagem (que é amostrada e representada por um conjunto e bits. Técnicas de Compressão Video Sem Perdas DCT VLC Com Perdas RLC Remoção sincronização Subamostragem Quantização DPCM Isoladamente apresentam baixa RC. Combinadas aprsentam melhor eficiência Processos com Perdas Resultam da combinação de duas ou mais técnicas Apresentam razão de compressão mais alta (2:1 a 100:1), mas apresentam perda de dados e degradação da qualidade da imagem depois da decompressão. Perdas podem ser minimizadas com conhecimento das deficiências do HVS O controle da razão de compressão leva a uma taxa de bits constante (CBR) Processo DCT A redução da taxa de bits é alcançada pelo emprego da técnica DCT combinada com a técnica de quantização e VLC. Transforma blocos de pixels que representam valores de amplitude do sinal em blocos que representam coeficientes no domínio da freqüência. Características do DCT DCT é usado para decorrelacionar os dados originais, compactar uma grande fração da energia do sinal em um número relativamente pequeno de coeficientes de baixa freqüência e gerar zeros ou valores baixos para serem aramzenados ou transmitidos. Não reduz a taxa de bits. Entretanto é sua combinação com a técnica de quantização e codificação (VLC) que o torna eficiente na redução da taxa. A escolha do tamanho de bloco 8x8 é o resultado de um compromisso entre a compactação eficiente da energia (requer uma grande área de tela) e o número reduzido de cálculos DCT em tempo real (requer uma área pequena) Quadros tipo P, I e B Técnica baseada no quadro anterior é unidirecional e conhecida como predição para frente. Gera quadros tipo-P. Contudo, áreas não cobertas não podem ser preditas do quadro anterior Um determinado bloco de pixels na área não coberta do quadro atual é codificada como um quadro tipo-I Predição temporal bidirecional usa informação do quadro anterior e de um quadro de referência futuro para predizer quadro atual 39 Quadros I, P e B Quadro-I: composto apenas por intrablocos (quadro sem referência a outros quadros). Usados apenas para reduzir redundância espacial. Quadro-P: contém intra macroblocos e macroblocos sobre compensação de movimento para frente. Referência a quadros B e futuros quadros P. Quadros-B: contém macroblocos que fazem referência a quadros para frente, para trás, intra macroblocos e compensação de movimento. Maior compressão. Não servem como referência. 2 quadros P e um quadro I devem ser decodificados primeiro. A sequência de quadros é chamada de GOP (group of pictures) e é determinada pelo algoritmo de compressão40 (MPEG) 41 42 43 44 45 Hierarquia nos Padrões de Compressão de Vídeo Acrescenta informações ao fluxo: modo de operação, tamanho da imagem, taxa de bits, precisão do pixel, esquema de compressão, precisão da quantização e tabelas Padrões: JPEG, MPEG1, MPEG-2, MPEG-4 / H.264, MPEG-7, MPEG21…. JPEG 6 camadas hierárquicas: Unidade de dado (DU): 8x8 MCU: minimum DU (2 blocos Y e um bloco CB e CR) ECS (entropy code segment): vários MCU´s Varredura Quadro Camada de imagem 46 Hierarquia dos Padrões MPEG-1 e MPEG-2 Blocos: 8x8 pixels Y e CB e CR Macroblocos: grupo de blocos DCT que correspondem a uma janela de 16x16 pixels na imagem original (conteúdo depende da estrutura de amostragem). Cabeçalho: tipo de macrobloco (Y e CB e CR) Fatia: formada por um ou mais macroblocos contíguos. Tamanho máximo (própria imagem). Mínimo: um macrobloco. Cabeçalho: informação sobre sua posição na imagem e sobre fator de escala. 47 Hierarquia dos Padrões MPEG-1 e MPEG-2 Quadro: tipo do quadro codificado (I, P ou B). Cabeçalho indica a seqüência de transmissão do quadro (para decodificador), sincronização, resolução, faixa dos vetores de movimento. GOP: composto por várias combinações de quadros I, P e B. Descrito com 2 parâmetros (m,n). Inicia c/ quadro I Seqüência de vídeo: contém vários GOP´s. Cabeçalho contém tamanho (h,v) de cada quadro, a taxa de bits do quadro, tamanho mínimo do buffer. A seqûência é conhecida como fluxo elementar de vídeo. 48 Esquema de Redução de Taxa de Bits (BRR) Razão pode variar de 2:1 a 150:1. Escolha depende da qualidade a ser transmitida Comparação entre diferentes sistemas é válida somente se o formato do vídeo (no. linhas/quadro, no. pixels/linha, no. quadros/segundo), as taxas de amostragem utilizadas (4:2:2, 4:4:4, 4:2:0, ou 4:1:1) e a resolução (8 ou 10 bits) forem iguais. 49 Razão de Compressão R.C = taxa da imagem original / taxa da imagem comprimida Área da região ativa de formato 4:2:2 com 8-bits de resolução: (720+360+360) no. pixels (Y, CB e CR) por linha 512 no. linhas por quadro 29,97 taxa exata de quadros/s (NTSC) (720+360+360)x512x29,97x8 = 176,77 Mbps Se a compressão for de 24 Mbps RC = 176,77 / 24 = 7,4 50 Padrão ITU-T H.264 / MPEG-4 (parte 10) AVC Também conhecido por: H.26L, ISO/IEC 14496-10, JVT Proposto com vistas ao melhor equilíbrio entre eficiência de codificação, complexidade de implementação e custo Baseado no estado atual de tecnologias VLSI (CPU, DSP, ASIC, FPGA) Desenvolvimento iniciado em 1998 (Video Coding Expert Group – VCEG). Em 2001 formado o JVT (Joint Video Team, ITU e ISO/IEC). Finalizado em 2004. 51 52 Arquitetura Básica Produção de Conteúdo Codif. dados Codif. Áudio Aplicações Interativas Codif. Vídeo Middleware Camada de Transporte Decodif. Áudio Decodif. Vídeo Camada de Transporte Canal de Radiodifusão Codificação de canal, Modulação e transmissão Descida Retorno Recepção, demodulação e decodificação de canal Diagrama de Blocos do Sistema de TV Digital T R A N S M I S S ÂO Sinal •Filtragem •Conversão A / D •Codificação fonte Analógico •Codificação de canal • Modulação Digital • Conversão (up) • Amplificação Antena Canal (Ar) RECEPÇÃO Sinal • Decodificação fonte • Conversão D / A Analógico • Filtragem Demodulação Digital Decodificação e Estimação de canal Antena BLOCO DE TRANSMISSÃO 1 2 3 Sinal comprimido A/D Sinal Analógico Compressor Digital H.264 ~ 1,2 Gbps ~20 Mbps Up Converter 4 Excitador 5 Sinal FI Modulador Amplificador de Potência 6 Antena Sinal UHF Bloco do modulador é diferente para cada padrão 56 HIERAQUIA DE CAMADAS H.264 / AVC VÍDEO PES* MPEG-2 AAC ÁUDIO PES TRANSPORTE TS PES MIDDLEWARE MULTIPLEXAÇÃO CODIFICAÇÃO DE FONTE * PES – Packetzied Elementary Stream MODULAÇÃO TRANSMISSÃO Conversão de freqüência Amplificação Filtragem/Antena 57 MPEG TS Pacotes de 188 bytes Cabeçalho (1 byte sincr + 3 bytes controle) 16 bytes extras (nulos) para verificação de paridade ITU-T H.222 (UIT-T, 2000a) MPEG-Systems (adotado por ATSC, DVB e ISDB) 188 bytes H Byte Sinc. Indicaç Indicaç. Priorid. Err tsp Início Transp. Carga Ident. Ctl Ctl adapt. Contador Adapt. Progr. Embaral. a taxa Continuid. Campo 4 bytes 58 1394/IEC61883-4 – MPEG2-TS MPEG2-TS é definido pelo TRANSFER Padrão IEC61883 Características: • Packet header (4bytes) Reserved field: 7bits, cycle count: 13 bits, cycle_offset: 12 bits • Estes campos são usados como time stamp • Transport Stream (TS) packet: 188bytes Source packet (compreende o source packet header e o TS packet) • É dividido em blocos de dados de 24 bytes Vários blocos de dados são colocados em um pacote síncrono Cabeçalhos IEEE1394 e de Pacotes Comuns Síncronos (Common Isochronous Packet – CIP) são aplicados em cada pacote síncrono Example 1394/IEC61883-4 – MPEG2-TS TRANSFER de um MPEG2-TS definido pelo IEC61883: 188bytes TS Packet Timestamp Header 125us Empty Packet 188bytes CODIFICAÇÃO DE CANAL E MODULAÇÃO TS Codificação de canal Modulação Antena Adequação ao Canal (“meio”) “ MODULADOR “ 61 CODIFICAÇÃO DE CANAL Aleatorizador (randomizer) Codificador interno Entrelaçador (interleaver) Codificador externo Mapeador 62 Codificação de Canal Sistema perturbado pela ação de ruído Erros podem ser esporádicos e independentes (erros aleatórios). Modelados como independentes e igualmente distribuídos ou ocorrer em surtos (burst) Objeto da Teoria da Codificação – prover sistemas com taxas de erros relativamente baixas (10-4 para telefonia móvel) FEC (Forward Error Correction) – sistema de controle de erros para transmissão de dados, no qual o transmissor adiciona dados redundantes à mensagem (necessita maior largura de banda). 63 Modulação em Quadratura Utiliza as propriedades de ortogonalidade dos sinais Seno e cosseno. Permite dois sinais diferentes na mesma Portadora (mesma banda AM). Informação carregada tanto na variação 64 de fase como de amplitude QAM Quando realizada com sinais digitais, a modulação recebe o nome de QAM (quadrature amplitude modulation) s(t) = b(t) cos(ωct + φ) + d(t) sen(ωct + φ) b(t) = ∑ bn p(t – nTb) d(t) = ∑ dn p(t – nTb) Constelação depende do no. de símbolos Ex: 4-QAM (π/4 QPSK) bn = {A, -A} e dn = {A, -A} No. maior de símbolos torna a modulação mais eficiente 65 OFDM Orthogonal Frequency Division Multiplexing Visa a transmissão de múltiplos sinais em diferentes freqüências Implementada com FFT OFDM em banda básica é o resultado da composição de várias subportadoras ortogonais Dados em cada subportadora são independentemente modulados (QAM ou PSK) Possui: elevada eficiência espectral, imunidade contra multipercursos e ruído de surto, resitência a desvanecimento. 66 Modulação OFDM Ortogonalidade garante que a interferência intersimbólica nas freqüências das subportadoras seja nula Subportadoras moduladas em QPSK, 16QAM ou 64M 67 Padrão ISDB 68 Características Principais ISDB-T Codificação de vídeo: H.264 Codificação de áudio: MPEG-2 AAC Modulação: CODFM (Coded Orthogonal Frequency Modulation): usa permutação pseudo-aleatória da carga entre as diversas portadoras Camada de Transporte: MPEG-TS Middleware Interatividade torna o terminal do assinante mais complexo Necessidade de garantir a interpretação e execução de instruções em uma diversidade de terminais heterogêneos, com diversos recursos e capacidades. Solução: criação de uma semântica em que os programas possam ser executados independentemente das peculiaridades do hardware de cada terminal. Carece de uma linguagem de programação e suas interfaces (APIs – Application Program Interfaces) Middleware Declarativo Criação de uma máquina virtual no terminal e acesso. Duas linguagens: declarativa e procedural Linguagens declarativas não exigem que o programador especifique cada passo a ser executado pelo programa. Basta o conjunto de tarefas a ser executado. Middleware declarativo suporta aplicações como o padrão HTML (que não é adequada para aplicações em TV digital interativa) Outras linguagens declarativas: SMIL, XMT-O, NCL. Middleware Procedural A linguagem procedural dá suporte a aplicações desenvolvidas em linguagens não declarativas. Requer o domínio da linguagem de programação. Programador precisa especificar o fluxo de controle e execução do programa. O middleware procedural requer o uso de uma JVM e um conjunto de APIs Padrões de Middleware ATSC: DASE (DTV Application Software Environment). Usa uma JVM e adota linguagens declarativas (HTML JavaScript) DVB: MHP (Multimidia Home Plataform). Suporta a linguagem declarativa DVB-HTML. No modelo procedural suporta aplicações de JavaTV (denominadas de DVB-J) ISDB: ARIB STD-B24 ( Association of Radio Industries Business – Data Coding and Transmission Specification for Digital Broadcasting). ARIB: usa linguagem declarativa BML (Broadcast Markup Language, baseada em XML). ARIB STD-B23 (Application Execution Engine Plataform for Digital broadcasting): especificação baseada no DVB-MHP GEM (Globally Executable MHP): tentativa de internacionalização. Canal de Interatividade Responsável por promover a inclusão digital Utilizado como canal de retorno para aplicações interativas Utilizado como canal de acesso a uma rede IP Compatível com sistema ISDB-Tb Redes: rede telefonia, rede celular, rede TV a Cabo Tecnologias: Wi-Fi, WiMax,… Middleware no ISDB-Tb Middleware procedural FlexTV (Iecom, UFCG, UFPB) Middleware declarativo (formatador) Maestro (PUC-RJ). Tem como base a linguagem NCL (Nested Context Language). A junção desses dois softwares deu origem ao GINGA Unidade Móvel de Recepção 76 Ensaios 77 Distribuição de Energia no Canal 78