Técnicas de Compressão Vídeo
Joaquim Macedo
Universidade do Minho
Material Utilizado

Acetatos do livro Multimedia Signals
and Systems (Kluwer Academic) de
Mrinal Mandal
Necessidade de Compressão Vídeo

Televisão de Alta Definição (HDTV)
1920x1080
 30 quadros por segundo (movimento total)
 8 bits cada uma das três cores primárias
Total 1.5 Gb/seg!


Cada canal cabo usa 6 MHz
Max débito de dados de 19.2 Mb/seg
 Reduzido para 18 Mb/seg c/audio + control …
Relação de compressão tem que ser 83:1!

Princípios de Compressão de Vídeo

Um vídeo pode ser considerado um função tridimensional de intensidade de luz I(x,y,t)
 A amplitude da função em qq coordenada espacial
(x,y) dá o brilho da imagem nessa coordenada
num instante de tempo
 Imagem mocromática I(x,y,t)
 Imagem a cores (R(x,y,t), B(x,y,t), G(x,y,t))
 No vídeo digital x,y,t são discretos
Princípios de Compressão de Vídeo

Como o vídeo é uma sequência de imagens
ordenada no tempo

As técnicas de compressão de imagens podem ser
aplicadas


Explorar as redundâncias estatística, espacial, estrutural
e psico-visual
Para além disso, o vídeo tem a redundância
temporal e de conhecimento que podem ser
exploradas para se conseguir melhor desempenho
Redundâncias no vídeo



Temporal
Conhecimento
Psico-Visual
Redundância Temporal


Tirar partido da similaridade entre quadros
sucessivos
Esta redundância entre quadros é removida
explorando técnicas de estimação e
compensação de movimento
950
951
952
Redundância de conhecimento

Quando um vídeo tem utilização limitada e se
pode associar um conhecimento comum


Pode-se conseguir compressão eficiente
Ex. Chamada Videofone



A imagem das pessoas não muda durante a chamada
Há pequenos movimentos de corpo e mudanças de
expressão facial
Se se enviar inicialmente a imagem das pessoas

Ir enviando os movimentos
Mudanças de expressão

Pode-se conseguir uma boa compressão

Redundância Psico-Visual

Há vários tipos


SVH é pouco sensível aos componentes de cor
 Os componentes de cor podem ser quantizados
mais grosseiramente que os de luminosidade
Quando vemos um vídeo de boa qualidade

Se pararmos a imagem não nos parece tão boa


SVH é menos sensível aos objectos em rápido
movimento
Regiões em rápido movimento podem ser
quantizadas mais grosseiramente
Objecto da sessão

Estudo de técnicas de redução para



Redundância temporal
Redundância da cor
As outras redundâncias

Não estão dentro do âmbito
Vídeo Digital e Redundância da Cor




As câmaras de vídeo usam tipicamente o espaço de
cores {R,G,B} para representar vídeo a cores
Assuma que a câmara de vídeo produz sinais com
correcção Gama {Rn,Gn,Bn} normalizados para
referência branco
Os componentes de luminância e crominância são
gerados pela combinação linear de {Rn,Gn,Bn}
O espaço de cores {R,G,B} não é eficiente para
compressão

Para transmissão os canais {R,G,B} são convertidos para um
sinal de luminância e dois sinais de crominância
Codificação de Cores

Imagem representada por pixel de 24 bits
pixel (8 bpp)


Cada valor de cor entre 0 e 255
O vídeo usa codificação não linear
Distribuição uniforme de cores para códigos
RGB  R’G’B’ (RGB com gamma corrigido)


Video usa a luminância/crominância
R’G’B’  Y’CBCR
Luminância é Y (tecnicamente luma é Y’)
Crominância é is CBCR

Modelo de Cores YCbCr
Y  0.299 R  0.587 G  0.114 B
Yd  219Y  16
Gama dinâmica = [16,235]
112 ( B  Y )
CB 
 128
0.886
Gama dinâmica = [16,240]
112 ( R  Y )
CR 
 128
0.701
Gama dinâmica = [16,240]
Sub-amostragem do Chroma
4:4:4 --> Sem sub-amostragem do chroma, cada pixel tem valores
Y, Cr e Cb.
4:2:2 --> Sub-amostragem horizontaldos sinais Cr,Cb por um factor
de 2
4:1:1 --> Sub-amostragem horizontal por um factor de 4
4:2:0 --> Sub-amostragem tanto na dimensão vertical como horizontal
por um factor de 2
4:1:1 e 4:2:0 são usados principalmente no JPEG e MPEG
Sub-amostragem do Chroma
4:4:4
4:2:2
(a)
(b)
4:1:1
(d)
(c)
4:2:0
(e)
4:2:0
Pixels
Pixelscom
withvalores
Y,
, Y, Cr, Ch,
Pixels apenas com o valor Y
Pixels com Cr e Ch
Exemplo 9.1


Determine a redução na taxa de bits devido à
sub-amostragem 4:2:2 e 4:2:0
Assuma que há N pixéis de cor no vídeo.
Quando não há sub-amostragem há 3N bytes de tamanho ( 8
bits de resolução em cada canal de cor)
Com sub-amostragem 4:2:2 teremos N amostras de Y, N/2 Cr
e N/2 Cb. Isto conduz a N+N/2+N/2= 2N bytes
Com sub-amostragem 4:2:0 teremos N amostras de Y, N/4 de
Cr e N/4 Cb. Termos N+N/4+N/4=1.5 N bytes
A sub-amostragem 4:2:2 reduz 33% e a 4:2:0 reduz 50%

Normas CCIR para Video Digital
CCIR 601
525/60
NTSC
CCIR 601
625/50
PAL/SECAM
CIF
QCIF
Resolução da
luminância
720 x 480
720 x 576
352 x
288
176 x
144
Resolução da
crominância
360 x 480
360 x 576
176 x
144
88 x 72
Sub-amostragem
de cor
4:2:2
4:2:2
4:2:0
4:2:0
Campos/seg
60
50
30
30
Entrelaçamento
Sim
Sim
Não
Não
(CCIR -- Consultative Committee for International Radio)
Porquê a Compressão ?
A 1920 x 1080, com 30 frames/sec (varrimento progressivo),
teremos 1920 x 1080 x 30 = 62.2 milhões de pixels/segundo. Se
Cada pixel usar 24 bits, a taxa de bits é
1.49Gb/s.
O vídeo digital em bruto necessita duma compactação massiva
(mais que 60:1 de relação de compressão)
Utlizaremos três métodos para consegui-la:
1. Codificação de menor resolução para os canais de cor
2. Remoção da redundãncia temporal pela Compensação de
Movimento
3. Remoção da Redundância espacial pelas técnicas de
transformada de domínio
Redundância temporal no vídeo
Redução da Redundância Temporal
Exemplo
T=1
T=2
Predição
É usado um modelo para prever o conteúdo do quadro; os
parâmetros do modelo precisam de ser extraídos e enviados para o
descodificador

Captura
Display
Predição
Modelo
Codificação
da entropia
Parâmetros do
Modelo
Extração de
parâmetros
Modelo
Descoficação
da entropia
Erro de predição
Motivação
A maioria das diferenças entre quadros subsequentes
numa cena típica são provocadas por movimentos de
translação:



Movimentos ou Zooming da Camera e de objectos
Variações de forma que tb parecem movimentos locais
Essas variações podem ser consideradas num modelo de
predição:
 Compensação de Movimento

Este modelo precisa de parâmetros que têm que ser
estimados no codificador:

 Estimação de Movimento
Técnicas de Estimação de Movimento

Unificação por Bloco

A imagem é dividida em pequenos blocos




Assume-se que cada bloco pertencem a um corpo rígido
e têm o mesmo movimento
Menor precisão e maior complexidade computacional
Mais usada
Recursiva ao pixel

Calcula-se o vector de movimento por pixel

Maior precisão mas maior complexidade computacional
Estimação/Compensação:
A estimação e a compensação estão relacionadas e
trabalham conjuntamente:



Estimação de Movimento (EM) tenta detectar movimento numa
cena e extrai vectores de movimento para descrevê-la.
Compensação de Movimento (CM) é um modelo. Usa
conjuntamente os vectores de movimento e outros quadros para
gerar um predictor para o quadro corrente.
É removida a redundância uma vez que é necessário
transmitir apenas os vectores de movimento

Os algoritmos EM/CM são baseados em blocos



Os pixéis não são considerados separadamente
São usados tipicamente blocos quadrados
Algumas aplicações usam blocos de pixels de formas arbitrárias
Estimação de movimento
Os quadros são divididos em quadrados de tamanho fixo.
 A EM encontra para cada bloco do novo quadro M o
previsor encontra a melhor previsão algures num quadro
M conhecido:

Quadro M
Quadro N
O vector-de-movimento é o deslocamento entre as
coordenadas dos blocos e a posição do melhor match.

Compensação de Movimento

CM tenta prever um quadro de:
Um quadro já conhecido
 Os vectores de movimento fornecidos adicionalmente
Cada bloco é substituído por outro no quadro de referência. O
deslocamento entre o bloco e a sua previsão é determinado
pelo vector de movimento.


Quadro M
Quadro N
Erro de
Previsão
Estimação de movimento baseada
em blocos

Considere um pixel vídeo i(x,y,k)



(x,y) coordenada espacial
k é o tempo
O objectivo da EM é calcular o vector de
movimento d(x,y,k)

Que permite reconstruir i(x,y,k) a partir de
i(x,y,k(+/-)p), p é um inteiro pequeno
Estimação de movimento por blocos

A EM por blocos pressupõe




a imagem é composta por objectos rígidos
Os objectos movem-se vertical ou
horizontalmente
É possível encontrar um vector d(x,y;k) tal
que i(x,y;k)= i((x,y) –d(x,y;k),k-p)
Se houver zoom ou rotação a estimação
não sucede.
Estimação de movimento por blocos

Assume-se que o movimento é homegéneo
no tempo i.e



Os objectos movem-se a velocidade constante no
plano da imagem
I(x,y;k)=I((x,y)+d(x,y;k), k+p)
Num EMB espera-se a validade desses
pressupostos para todos pixels do bloco b
com o mesmo vector de deslocamento db.

São satisfeitos se os blocos forem pequenos e se a
amostragem temporal for densa.
Estimação de movimento por blocos


Cada quadro é dividido em blocos KxL
rectangulares e não sobrepostos
Cada bloco no quadro actual e unificado
com um bloco no quadro anterior

Determinar os deslocamentos horizontais e
verticais para esse bloco
Estimação de Movimento por
Unificação de Bloco
Quadro prévio (t-1)
K ? 2? u
L ? 2? v
Vector de Movimento
Área de busca
L
K
Bloco de Referência
Quadro actual (t)
Critério de Unificação de Bloco
(uˆ, vˆ) 
K 1 L1
arg min  iDFD ( x, y; u, v ) 
(u,v )2 x0 y 0
u u , v v
2
onde
iDFD ( x, y; u, v)  i( x, y; k )  i( x  u, y  v; k  1)
Exemplo da Estimação de Movimento
37 39
43 44
40 41
42 43
41 42
43 44
43 43
44 45
43 43
43 44
43 44
44 45
44 45
47 48
44 46
45 47
47 48
48 49
40 41
41 43
Blocos da Imagem Prévia
Blocos da imagem corrente
8
6
1
3
5
8
7
6
7
9
10
9
8
9
11
13
12
12
16
19
19
17
17
23
27
Exemplo da Compensação de Movimento
8
6
1
3
5
8
7
6
7
9
10
9
8
9
11
13
12
12
16
19
19
17
17
23
27
40 41
41 43

MV(0,-2) +
0 0
-1 0
ME com busca completa (1)
Os algoritmos de busca completa, fazem uma busca exaustiva do
quadro de referência para a melhor unificação da previsão

A qualidade da unificação entre um bloco e o candidato para
previsão pode ser medida com diferentes critérios:


Erro Médio Quadrático (MSE)
W 1 H 1
D  
i 0 j 0

f
( x  i, y  j )  f N ( N x  i, N y  j ) 
M
2
Soma das Diferenças Absolutas (SAD)
W 1 H 1
D   f M ( x  i, y  j )  f N ( N x  i, N y  j )
i 0 j 0


Classificação da diferença dos pixels (PDC)
A previsão com a menor distância para o bloco previsto é
escolhido e as suas coordenadas relativas são codificadas
como VM para o bloco
ME com busca completa (2)
A complexidade computacional para a EM duma
imagem de tamanho X*Y que é dividida em blocos de
tamanho W*H pode ser estimada da forma seguinte:





O número total de operações é :
C = 2*(W*H)*(X*Y)*[(X/W)*(Y/W)] = (X^2)*(Y^2)


Cálculo o critério de unificação SAD para um candidato
precisa de 2*W*H operações de adição.
Tem que considerar candidatos para todos blocos em X*Y
A busca completa tem que ser feita para todos (X/W)*(Y/W)
blocos.
For X=352 Y=288 temos C>10 GAdições/Quadro
Para reduzir a complexidade:


A área de busca é limitada à vizinhança do bloco.
EM é executada com base apenas na luminância
Avaliação para técnicas de EM

Um algoritmo de EM é avaliado usando dois
factores

A eficiência da CM



Gm= (Energia do bloco de imagem original)/ (Energia residual da CM)
Se a compensação de movimento for adequada a energia
residual é pequena e o ganho é alto
Complexidade Computacional



Deve ser pequena para facilitar a concretização para
tempo real
É proporcional ao número de pontos testados pelo
algoritmo para uma dada área de busca
Numa concretização hardware para tempo real o número
de passos sequenciais necessários pode também ser
importante porque a ME dos blocos individuais pode ser
paralelizada
Exemplo 9.3

Calcule os VM correspondentes ao quadro
apresentado na figura 9.5(b), relativamente
mostrada na figura 9.5(b)


Assuma um tamanho de bloco 16x16 e uma
janela de busca [-16,16] tanto na direcção
horizontal como vertical
Calcule o ganho da previsão de movimento e
estime a complexidade da EM
Desempenho da CM
(a)Referência
(b) Corrente
(c)Diferença de Quadros
Imagens de erro com unificação de Busca Completa
(d) Janela de Busca =  7 ,7
(e) Janela de Busca =  16 ,16
VM para Busca Completa
Histograma dos VM
Sequência de futebol
Ver
t
. M
o tio
n
ti on
o
M
.
Hor
Algoritmos rápidos de EM



No exemplo anterior viu-se que a complexidade da
EM para um quadro de vídeo de 240x352 pode ser
superior a 100 MOP
Geralmente a complexidade do algoritmo de busca
completa é muito grande da ordem de 8x ΔuXΔv
Foram propostas diversas técnicas para reduzir a
complexidade da EM


A maioria destes algoritmos é baseada no pressuposto
que o erro de previsão cresce monotonamente conforme
a busca se move sem ser na direcção de distorção
mínima
Os algoritmos são mais rápidos que o de busca completa
mas menos precisos
Busca em 3 passos
Bloco com melhor
Unificação
Busca Logarítmica 2-D
Bloco com melhor
Unificação
Busca em Direcção Conjugada
Best M atched
Block
Desempenho de MC
Busca de 3 passos
GMP = 47.6
Busca de direcção conjugada
GMP = 36.7
Vectores de Movimento
Exemplo 9.5
Imagem Real
Imagem Estimada
Resultados
Imagem Real
Imagem Estimada
Limitações da Busca Rápida

A maioria dos algoritmos de busca rápida

Assumem um superfície de erro monótona onde
há apenas um mínimo

Se este pressuposto for correcto


todas técnicas encontram eventualmente esse mínimo
global
Normalmente uma superfície de erro não é
estritamente monótona


Nesse caso o algoritmo pode encontrar apenas um
mínimo local e fornecer apenas um desempenho subóptimo.
No sentido de evitar um mínimo local, os pontos de
busca devem estar bem espalhados
Estimação de Movimento Bidireccional

A estimação do movimento tem sido feita
com previsões para a frente


O quadro corrente pode ser previsto do quadro
passado para satisfazer a casualidade
Pode-se conseguir melhor desempenho com a
informação adicional de quadros futuros


Para conseguí-lo temos que atrasar a EM alguns quadros
A maior parte das normas de codificação de vídeo usam
previsão baseada em quadros passados e futuros.
Estimação do Movimento dos
componentes chroma


Num vídeo a cores existem três componentes
de cor
As técnicas de EM podem ser aplicadas
indivualmente a cada um dos componentes
de cor


Há uma forte correlação entre os VM dos
diferentes componentes
É usado o VM do Y para CM dos componentes Cr e
Cb

É necessário usar um factor de escala pelo facto dos
componentes Cr e Cb terem tamanho diferente do Y
Normas de Compressão Vídeo







Motion JPEG
MPEG-1
MPEG-2
MPEG-4
H.261
H.263,H.263+,H26L
Comparação de Desempenho dos Codecs
História dos Codecs
CODEC Vídeo Genérico
Motion-JPEG




O codec não normalizado mais simples
Usa o norma JPEG para imagens fixas para
cada quadro individualmente
Como não há EM a complexidade do
algoritmo de codificação é muito pequena
O desempenho de codificação não é muito
bom


Não explora a correlação temporal entre os
quadros de vídeo
Usado por muitas das primeiras aplicações de
vídeo
MPEG-1
Utiliza algoritmos de compressão eficientes para dados áudio e vídeo
completamente sincronizados
Atinge um débito máximo de 1.5 Mb/seg
Tem como objectivo:
Armazenamento de vídeo em CD-Rom e a sua transmissão sob os mais
diversos tipos de média digital

Codificador de Vídeo MPEG-1
Regulator
Reordered
Input Video
Frames
+
+
-
Block
DCT
Block
Quantizer
VLC
Block
Dequantizer
Block
IDCT
+
Motion
Compensation
Predictor
Motion Vectors
Motion
Estimator
M
U
X
Encoded
Bitstream
Buffer
Tipos de quadro MPEG


Conflito entre acesso aleatório e taxa de
compressão! 3 categorias de quadros:
I – quadros INTRA codificados que são
imagens auto contidas.





Dão pontos de acesso na sequência
Taxa de compressão moderadas
P – quadros PREVISTOS com base na
diferença bloco-a-bloco com o quadro
anterior. Baseados em macroblocos
(16x16 (8x8) pixels no espaço de
luminancia(crominância)).
B – quadros BI-DIRECTIONAIS que se
baseiam na diferença entre o último e o
próximo quadro. Não suportados por
todas concretizações MPEG-1.
GOP (Grupo de Figuras) no MPEG
Time
1
I1
R
2
3
4
5
6
7
8
9
B1
B2
P1
B3
B4
P2
B5
B6
R
R
10
I2
R
Descodificador Vídeo MPEG-1
Coded
Decoder
Bitstream VLCand
Demultiplexer
Inverse
Quantizer
Inverse
DCT
+
Motion Predicted Frame
Motion Vectors
Motion
Compensator
Predictor
Reconstructed
Frames
MPEG-2


Uma forma mais genérica de multiplexar áudio e vídeo.
Define cadeias elementares (elementary streams),
incluindo áudio e vídeo mas também incluindo cadeias de
dados que podem ser sincronizadas com áudio e vídeo como
por exemplo sub-títulos.




Cada uma das cadeias é primeiro dividida em pacotes com
etiquetas temporais. A saída do empacotador é uma
Packetised Elementary Stream (PES).
As PES’s para áudio e vídeo são então multiplexadas
conjuntamente para uma uma única saída a transmitir.
O program stream (PS) é usado para multiplexar
conjuntamente cadeias elementares que tenham uma base de
tempo comum e precisam de ser mostradas de forma
sincronizada.
A cadeia de transporte (transport stream) é usada para
multiplexar cadeias que não tenham uma base de tempo
comum
MPEG-2

Permite débitos de 1.5 a 80 Mbit/seg

É similar ao MPEG-1

inclui extensões para uma larga gama de aplicações





Sintaxe para codificação eficiente de vídeo emtrelaçado
Permite codidficação da crominância a 4:2:0, 4:2:2 e 4:4:4
10 bits DCT para previsão AC
Tabelas VLC
Disponibiliza funcionalidades para


Transmitir sinais multimédia multi-canal de alta qualidade
para difusão terreste, satélite ou redes de banda larga
Suporta uma variedade de formatos de pacotes, correcção de
erros adequada para TV cabo e ligações satélite
MPEG-2

Outras funcionalidades importantes:

Extensões escaláveis que permitem a
divisão dum sinal de vídeo continuo em 2
ou mais cadeias codificadas que
representam o vídeo a diferentes




Resoluções (escalabilidade espacial)
Qualidade da imagem (escalabilidade SNR)
Taxas de imagens (escalabilidade temporal)
O mesmo sinal pode servir para TV de alta
definição e TV normal
Codificador e Empacotador MPEG-2
Video
Data
Video
Encoder
Packetizer
Video
PES
PS
Program
Stream
Mux
Audio
Data
Audio
Encoder
Packetizer
Audio
PES
PS
Mux
Transport
Stream
Níveis e Perfis MPEG-2
Níveis
Simples
Baixo
Principal
4:2:0
720x756
15 Mbit/s
I,P
Principal
Escalável
SNR
4:2:0
352x288
4 Mbit/s
I,P,B
4:2:0
352x288
4 Mbit/s
I,P,B
4:2:0
720x756
15 Mbit/s
I,P,B
4:2:0
720x756
15 Mbit/s
I,P,B
Alto
1440
4:2:0
1440x1152
60 Mbit/s
I,P,B
Alto
4:2:0
1920x1152
80 Mbit/s
I,P,B
Escalável Alto
espacial
4:2:0,4:2:2
720x756
20 Mbit/s
I,P,B
4:2:0
1440x1152
60 Mbit/s
I,P,B
4:2:0, 4:2:2
1440x1152
80 Mbit/s
I,P,B
4:2:0,4:2:2
1920x1152
100 Mbit/s
I,P,B
Perfil
4:2:2
4:2:2
720x756
50 Mbit/s
I,P,B
Perfis e níveis MPEG-2
O MPEG-1 é usado apenas para armazenamento de vídeo a baixo
débito
Nível
Tamanho
Baixo
352x288x
30
720x576x
30
1440x115
2x60
1920x115
2x60
Prncipal
Alto
Muito
Alto
Pixels/
seg
3M
Débito
(Mbits/s)
4
12 M
15
96 M
60
128 M
80
Aplicações
Qualidade
VHS
TV Estúdio
HDTV
assinante
Produção
Filme
MPEG-4

MPEG-1 e MPEG-2



ME inter-quadro para remover redundância
temporal
DCT para remover correlação espacial nos quadros
de erro
Conseguem

Bom desempenho de codificação relativamente a


Taxa de Bits e Qualidade subjectiva
Maior desvantagem

Não disponibilizam funcionalidades de acesso ao
conteúdo
MPEG-4

Definido mais recentemente

Disponibiliza:

Técnicas para armazenamento, transmissão e
manipulação de



Texturas naturais e sintetizadas
Imagem e Vídeo em ambientes multimédia a uma
larga gama de débitos
Centrado no AVO

AVO (Audio-Visual Object)
MPEG-4

“Orientado ao Objecto (OO)”






Mas: actuais concretizações são quadro total
O cliente pode interagir com o conteúdo
Escalabilidade baseada no conteúdo
Reutilização de codificação
Comportamento associado aos objectos
audio-visuais
Mas: problemas de compatibilidade com
concretizações proprietárias do MPEG-4
Uma cena MPEG-4
Objectos Segmentados no MPEG-4
Mesh 2D-Animado

Para além do código baseado em
objectos

O MPEG-4 incorpora técnicas para
representar imagens sintéticas


Usa o VRML para sintetizar vídeo animado
Modelação mesh 2-D para representar imagens
como a face humana
Rede 2D Animada
Correspondência
 Armazena
movimento
da textura na rede
os vértices da rede e os parâmetros de
Estrutura das ferramentas
para representar vídeo natural

Os algoritmos para codificação de vídeo e
imagem do MPEG-4


Dão uma representação eficiente de objectos
visuais de forma arbitrária
Suportam a maioria das funcionalidades do MPEG1 e MPEG-2

Compressão eficiente de sequências de imagens
rectangulares para vários

Níveis de formatos de entrada,Taxa de Quadros,
Profundidade de pixel,Taxa de bits, Níveis de escalabilidade
espacial, temporal e de qualidade
Funcionalidades convencionais
baseados no conteúdo



Compromisso entre débito de bits e
funcionalidades
MPEG-4 a débito baixo é similar ao MPEG-1/2
VOP (Video Object Picture) é codificada com
CM seguido da codificação da textura

Para codificação de funcionalidades de conteúdo
com a sequência de vídeo a conter objectos de
forma arbitraria

Codifica-se a forma e transparência
Codificador Vídeo MPEG-4
VOP or
Video
+
Entropy
coding
DCT &
Quantizat ion

IDCT &
Dequantization
+
+
Mot. Co mp.
Predictor
Motion
Estimator
Shape
Coding
Frame
Store
M
U
L
T
I
P
L
E
X
E
R
Coded
Video
Exemplo de codificação sprite duma
sequência vídeo
(a)
(b)
(c)
Estrutura Lógica duma cena
Norma H.261

O MPEG-1 e MPEG-2 foram concebidos para
aplicações de propósito geral

Para conseguir melhor desempenho os
codificadores são bastante mais complexos que os
descodificadores


Esta abordagem é adequada quando há muito menos
codificadores que descodificadores
Para videotelefone este pressuposto não é verdadeiro

Tanto o codificador como o descodificador devem ser
baratos para tornar os produtos menos caros para os
consumidores
H.261





Similar ao MPEG-1
Um codec vídeo para débitos video de {1-30}x64
(px64, p de 1 a 30) kbps.
Dois formatos de imagem diferentes: CIF e QCIF.
Foi concebido para aplicações de video-conferência
e é suposto transportar vídeo sobre RDIS.
Optimiza a utilização de largura de banda
estabelecendo um compromisso entre qualidade
contra movimento

Imagens com rápidas mudanças têm pior qualidade que
imagens quase estáticas
H.263

Versão melhorada do H.261.



Usa a mesma DCT e mesma técnica para MC
Mesma qualidade com metade do débito
As diferenças principais são:






Usa CM de meio pixel para reduzir a energia DFD
Codificação de comprimento variável melhorada
(codificação aritmética como opção)
Modos opcionais incluem VM sem restrições
Modo de previsão de movimento avançado incluindo CM
de blocos sobrepostos.
Um modo que combina previsão bidireccional com a
prévia (modo PB)
Suporta uma larga gama de formatos de imagem
(4CIF,16 CIF)
H.263+

Melhoramentos adicionais sobre o H.263 para
aumentar



gama de aplicação
Desempenho de compressão
Aceita novos tipos de imagens



Imagens escaláveis
Formatos do utilizador
Novos modos de codificação



Codificação avançada intra-quadro
Filtro para “deblocking”
Selecção de imagens de referência
H.26L



Em desenvolvimento pelos peritos do ITU
Principal objectivo:Um algoritmo de codificação simples para
aumentar o desempenho da compressão
Adicionalmente
 Representação em pacotes de vídeo




Amigável para a rede
Orientada para aplicações interactivas (videotelefone) e
não interactivas (armazenamento, difusão,…)
Disponibiliza uma camada de codificação vídeo (VCL)
 Melhoria significativa na taxa de distorção
Uma camada de rede para difusão de vídeo sobre um tipo
particular de rede
 Desenvolvida para transportar vídeo sobre RTP/IP ou
sistemas sem fios 3G
Desempenho das Normas CODEC

O principal objectivo de qualquer
CODEC é bom desempenho de da
codificação

Têm diferente complexidade e
desempenho de codificação

É dificil de comparar porque são usados em
contextos diferentes e o débito pretendido é
diferente
Desempenho da Codificação
Vídeo SIF
PSNR (in dB)
40
Hallway
36
32
Football
28
Table Tennis
24
20
M-JPEG
0
MPEG2-I
1
MPEG2-IP
2
Desempenho da Codificação
Vídeo CCIR
PSNR (in dB)
40
Hallway
36
Football
32
Table Tennis
28
24
M-JPEG
0
MPEG2-I
1
MPEG2-IP
2
Vídeo Bream
MPEG-1 vs MPEG-4 a 1.1 Mbits/s
130
Bitrate (in kbps)
MPEG-1
40
PSNR (in dB)
MPEG-4
39
38
MPEG-1
MPEG-4
110
90
70
50
30
37
10
36
0
20
40
60
Frame Index
80
0
20
40
60
Frame Index
80
H.263 vs MPEG-4 a 1.1 Mbits/s
40
39
38
37
H.263
MPEG-4
36
Bitrate (in kbps)
PSNR (in dB)
41
H.263
MPEG-4
120
90
60
30
0
35
0
20
40
60
Frame Index
80
0
20
40
60
Frame Index
80
H.263 vs MPEG-4 a 56 Kbits/s
60
PSNR (in dB)
Bitrate (in kbps)
H.263
35
MPEG-4
33
31
29
50
H.263
40
MPEG-4
30
20
10
0
0
4
8
12
16
20
Frame Index
24
28
32
0
4
8
12
16
20
Frame Index
24
28
32
Download

Técnicas de Compressão Vídeo