1. introdução: sinais digitais x analógicos

36
Princípios de Televisão Digital – Mackenzie - 2007 1 VÍDEO DIGITAL PRINCÍPIOS DE TELEVISÃO DIGITAL Guido Stolfi – 04/2008 1. Introdução: Sinais Digitais x Analógicos Um sinal elétrico é denominado analógico quando reproduz uma informação através da variação de algum parâmetro de forma análoga à informação original. Um microfone, por exemplo, produz um sinal elétrico cuja tensão V o é análoga à pressão sonora incidente P S . Já em um sistema de modulação FM, é a freqüência do sinal transmitido que varia de forma análoga à informação modulante. Como tal, um sinal analógico pode assumir infinitos valores, em infinitos instantes de tempo, dentro de determinados intervalos. Podemos dizer então que o sinal analógico equivale a uma função contínua y = f(t) , definida para todos os valores da variável contínua t. Um sinal digital (do latim digitus = dedos), por outro lado, pode assumir apenas valores pertencentes a um conjunto finito de símbolos (p. ex. “0” ou “1” para um sinal binário), e esses valores são atribuídos apenas em determinados instantes dentro de um intervalo de tempo. O sinal digital portanto equivale a uma seqüência enumerável de símbolos discretos, ou, em outras palavras, a uma seqüência ordenada de números inteiros. O processo denominado “digitalização”, pelo qual um sinal analógico é convertido para o domínio digital, compreende assim dois processos independentes, que serão detalhados adiante: Amostragem Quantização. 1.1 Degradações do Sinal Analógico Uma das forças mais importantes que movem as técnicas das Telecomunicações em direção ao domínio digital deve-se ao fato de que todo sinal analógico está sujeito a 4 categorias de degradações, que o afetam em maior ou menor grau sempre que é transportado, processado ou armazenado: Ruído: aleatório, cumulativo, inerente aos processos físicos envolvidos na circulação da corrente elétrica; Distorção não-linear: presente em todos os elementos ativos de circuitos, amplificadores, processadores, etc.; Interferências: ingresso de sinais indesejados, geralmente de origem conhecida; identificáveis, porém de difícil ou impossível eliminação; Perdas: atenuação, limitação de resposta em freqüência, dispersão temporal, defasagem, etc. 3 Fig. 1.1 – Sinal Analógico em um Microfone Fig. 1.2 – Sinal Digitalizado Fig. 1.3 – Degradações de um Sinal Analógico M t Vo t PS t Vo t 202 275 100 43 52

Upload: others

Post on 27-Oct-2021

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 1. Introdução: Sinais Digitais x Analógicos

Princípios de Televisão Digital – Mackenzie - 2007 1

VÍDEO DIGITAL

PRINCÍPIOS DE TELEVISÃO DIGITAL Guido Stolfi – 04/2008

1. Introdução: Sinais Digitais x Analógicos

Um sinal elétrico é denominado analógico quando reproduz uma informação através da variação de algum parâmetro de forma análoga à informação original. Um microfone, por exemplo, produz um sinal elétrico cuja tensão Vo é análoga à pressão sonora incidente PS.

Já em um sistema de modulação FM, é a freqüência do sinal transmitido que varia de forma análoga à informação modulante.

Como tal, um sinal analógico pode assumir infinitos valores, em infinitos instantes de tempo, dentro de determinados intervalos. Podemos dizer então que o sinal analógico equivale a uma função contínua y = f(t) , definida para todos os valores da variável contínua t.

Um sinal digital (do latim digitus = dedos), por outro lado, pode assumir apenas valores pertencentes a um conjunto finito de símbolos (p. ex. “0” ou “1” para um sinal binário), e esses valores são atribuídos apenas em determinados instantes dentro de um intervalo de tempo. O sinal digital portanto equivale a uma seqüência enumerável de símbolos discretos, ou, em outras palavras, a uma seqüência ordenada de

números inteiros.

O processo denominado “digitalização”, pelo qual um sinal analógico é convertido para o domínio digital, compreende assim dois processos independentes, que serão detalhados adiante:

• Amostragem

• Quantização.

1.1 Degradações do Sinal Analógico

Uma das forças mais importantes que movem as técnicas das Telecomunicações em direção ao domínio digital deve-se ao fato de que todo sinal analógico está sujeito a 4 categorias de degradações, que o afetam em maior ou menor grau sempre que é transportado, processado ou armazenado:

• Ruído: aleatório, cumulativo, inerente aos processos físicos envolvidos na circulação da corrente elétrica;

• Distorção não-linear: presente em todos os elementos ativos de circuitos, amplificadores, processadores, etc.;

• Interferências: ingresso de sinais indesejados, geralmente de origem conhecida; identificáveis, porém de difícil ou impossível eliminação;

• Perdas: atenuação, limitação de resposta em freqüência, dispersão temporal, defasagem, etc.

3

Fig. 1.1 – Sinal Analógico em um Microfone

Fig. 1.2 – Sinal Digitalizado

Fig. 1.3 – Degradações de um Sinal Analógico

M

t

Vo

t

PS

t

Vo

t

202 275 100 43 52 …

Page 2: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 2

A codificação digital proporciona muitas vantagens no tratamento e distribuição de sinais de vídeo: além da imunidade às degradações listadas acima, os equipamentos que operam no domínio digital podem realizar, de forma eficiente, funções de processamento de imagem que seriam praticamente impossíveis de executar na forma analógica. Entre estas funções encontram-se, por exemplo, transformações espaciais e a extração das componentes visualmente relevantes de uma imagem, o que é fundamental para a implementação de processos de compressão de dados.

Os desenvolvimentos de técnicas de compressão de dados, aplicáveis a seqüências de imagens em movimento, bem como de códigos de correção de erros e processos eficientes de modulação, tornaram viável a radiodifusão de programas de TV em formato digital. Hoje existem vários sistemas digitais em operação, seja por satélite, cabo ou radiodifusão terrestre, apresentando vantagens em relação aos canais analógicos, tanto na qualidade de imagem (pela imunidade a ruídos), como na variedade de programas disponíveis (pelo aumento da capacidade do canal de comunicação conseguido pela compressão), além de permitir a interoperabilidade com serviços adicionais de comunicação de dados.

A aplicação dos processos digitais na transmissão e radiodifusão de sinais de TV será detalhada oportunamente em outros módulos do curso; neste texto vamos nos restringir aos conceitos de amostragem, quantização e processamento digital de sinais de vídeo.

2. Amostragem O processo de amostragem consiste em tomar os valores de uma função contínua, s(t), apenas para valores discretos de t, correspondentes a múltiplos de uma unidade T, denominada Período de Amostragem, resultando assim em uma seqüência de valores numéricos (“amostras”), associadas aos instantes nT.

s(n) = s(nT)

A variável t em geral corresponde ao tempo, mas pode representar uma dimensão linear, por exemplo x,y no caso da amostragem de uma imagem.

Denomina-se freqüência de amostragem ao inverso do período T: fA = 1/T

Fig. 2.1 – Amostragem de um Sinal Contínuo (T = 20 ms)

2.1 Expressão Matemática do Processo de Amostragem O sinal amostrado pode ser obtido de forma conveniente, do ponto de vista da análise matemática, como o resultado da multiplicação do sinal contínuo original, s(t), com uma função de amostragem a(t), constituída de uma seqüência periódica de impulsos:

∑+∞

−∞=

−=×=n

A nTttaondetatsts )()()()()( δ

O impulso δ (t) corresponde a uma função hipotética cujo valor é zero para t ≠ 0 , mas cuja área é unitária, ou seja, δ (t) tende a infinito para t = 0.

0 100 200 300 400 500 600 700 800 900 1000-1.5

-1

-0.5

0

0.5

1

1.5

0 5 10 15 20 25 30 35 40 45 50-1.5

-1

-0.5

0

0.5

1

1.5

Page 3: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 3

Fig. 2.2 – Amostragem como Produto com Impulsos Periódicos

2.2 Reconstrução de um Sinal Amostrado Pela expressão deduzida acima, um sinal amostrado possui valor igual a zero para t ≠ nT. Esse sinal não tem significado físico; ele não pode ser convertido diretamente para o formato da informação contínua (análoga) original. Para que um sinal amostrado possa ser transformado novamente em um sinal contínuo, é necessário aplicar um processo complementar à amostragem. O processo de reconstrução do sinal consiste na substituição de cada amostra sA(nT) por um pulso contínuo h(t-nT), posicionado em um ponto correspondente ao instante nT, com amplitude proporcional a sA(nT).

Esta operação consiste na convolução do sinal sA(nT) com uma função h(t), denominada função de reconstrução:

A expressão acima corresponde à resposta de um sistema linear (p. ex. um filtro), caracterizado por uma resposta ao impulso h(t), quando excitado com um sinal de entrada sA(t). Ou seja, cada impulso correspondente a uma amostra sA(nT) provoca uma resposta da forma h(t) com amplitude correspondente. Os pulsos h(t) podem ou não ter duração maior que T, ou seja, as respostas de cada amostra podem se superpor.

Fig. 2.3 – Reconstrução de um Sinal Amostrado

A escolha da função de reconstrução determina de certo modo a semelhança obtida em relação ao sinal original. A figura 2.4 apresenta alguns exemplos de reconstrução:

a) usando uma função retangular, com largura igual a T: neste método não há superposição das respostas ao impulso; esta forma é conhecida como “topo plano” ou “sample and hold”;

b) usando um pulso triangular, com largura igual a 2T: aqui ocorre superposição entre duas amostras, e o efeito equivale a efetuar a interpolação linear entre as amostras originais;

c) usando um pulso gaussiano, da forma h = exp(-kt2) : também ocorre superposição, teoricamente infinita.

0 1 0 0 2 0 0 3 0 0 4 0 0 5 0 0 6 0 0 7 0 0 8 0 0 9 0 0 1 0 0 0- 1 . 5

- 1

- 0 . 5

0

0 . 5

1

1 . 5

0 1 0 0 2 0 0 3 0 0 4 0 0 5 0 0 6 0 0 7 0 0 8 0 0 9 0 0 1 0 0 0

0 . 2

0 . 4

0 . 6

0 . 8

1

1 . 2

1 . 4

0 1 0 0 2 0 0 3 0 0 4 0 0 5 0 0 6 0 0 7 0 0 8 0 0 9 0 0 1 0 0 0- 1 . 5

- 1

- 0 . 5

0

0 . 5

1

1 . 5

)(ts

×

∑ − )( nTtδ

=

)(nTsA

)()()()()( thnTsdthsts AAR ∗=−⋅= ∫+∞

∞−τττ

h(t) sA(nT) sR(t) sA(nT) h(t)

Page 4: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 4

(a)

(b)

(c)

Fig. 2.4 – Reconstrução de um Sinal Amostrado: (a)= Pulso retangular; (b)= Triangular; (c)= Gaussiano

2.3 Teorema da Amostragem As condições teóricas para que o processo de amostragem permita uma reconstrução perfeita do sinal original, ou seja, sem perdas, estão expressas no Teorema da Amostragem, consolidado por Claude Shannon em 1948, a partir de embasamento obtido por Nyquist (1928) e V. A. Kotelnikov (1933). Este teorema estabelece que:

a) A reconstrução exata de um sinal amostrado é possível se o sinal for limitado em freqüência, e a taxa de amostragem for maior que o dobro da freqüência máxima contida no sinal:

MAXA ff ×>2

b) A função de reconstrução ideal h(t) é da forma

Isso equivale a dizer que um sinal deve ser limitado em banda antes de ser amostrado, para que ele possa ser reconstruído perfeitamente mais tarde. A banda de freqüências ocupada pelo sinal deve ser menor que a metade da freqüência de amostragem. Este critério é conhecido como “critério de Nyquist” para a freqüência de amostragem.

O teorema da amostragem pode ser demonstrado a partir da interpretação dos sinais no domínio da freqüência. A figura 2.5 apresenta um sinal s(t) e seu espectro S(f) (ou seja, sua representação no domínio da freqüência):

0 5 10 15 20 25 30 35 40 45 50-1.5

-1

-0.5

0

0.5

1

1.5

0 100 200 300 400 500 600 700 800 900 1000-1.5

-1

-0.5

0

0.5

1

1.5

100 200 300 400 500 600 700 800 900 1000

-20

-10

0

10

20

100 200 300 400 500 600 700 800 900 1000-1.5

-1

-0.5

0

0.5

1

( )( ) T

txondexxth =

⋅⋅

=ππsen)(

Page 5: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 5

Fig. 2.5 – Sinal s(t) e seu espectro S(f)

Já o espectro A(f) da função de amostragem, a(t),também assume a forma de uma seqüência de impulsos, espaçados de fA = 1/T em freqüência:

Fig. 2.6 – Função de Amostragem a(t) e seu espectro A(f)

O sinal amostrado, sA(nT), é igual ao produto de s(t) por a(t); portanto, o espectro de sA(nT) equivale à convolução dos espectros S(f) e A(f):

Fig. 2.7 – Sinal amostrado sA(nT) e seu espectro SA(f)

O espectro do sinal amostrado consiste da replicação do espectro do sinal original, transladado sobre todos os múltiplos da freqüência de amostragem. Podemos observar que não ocorrerá superposição do espectro original com os espectros replicados, caso a maior freqüência do sinal original seja menor que a metade da freqüência de amostragem (50 Hz, no caso do exemplo das figuras acima).

A reconstrução perfeita, nesse caso, é possível aplicando um filtro passa-baixas ideal, com freqüência de corte igual à metade da freqüência de amostragem, como apresentado na figura 2.8.

Ocorre que a resposta ao impulso de um filtro passa-baixas ideal é da forma

Portanto a reconstrução pode ser representada no domínio do tempo como a convolução do sinal amostrado, sA(nT), com uma função da forma sen(x)/x, como apresentado na figura 2.9.

Evidentemente, a reconstrução ideal em geral é hipotética, pois a função de reconstrução necessária é infinita em t (tem duração de – ∞ a + ∞).

0 100 200 300 400 500 600 700 800 900 1000-1.5

-1

-0.5

0

0.5

1

1.5

-500 -400 -300 -200 -100 0 100 200 300 400 5000

20

40

60

80

100

0 100 200 300 400 500 600 700 800 900 1000

0.2

0.4

0.6

0.8

1

1.2

1.4

-500 -400 -300 -200 -100 0 100 200 300 400 500

20

40

60

80

100

120

140

0 100 200 300 400 500 600 700 800 900 1000-1.5

-1

-0.5

0

0.5

1

1.5

-500 -400 -300 -200 -100 0 100 200 300 400 5000

20

40

60

80

100

( )( ) T

txondexxth =

⋅⋅

=ππsen)(

Page 6: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 6

Fig. 2.8 – Reconstrução por Filtro Passa-Baixas Ideal

Fig. 2.9 – Reconstrução no Domínio Temporal por h(t) = sen(x)/x

2.4 Rebatimento Espectral Quando a restrição do Teorema da Amostragem não é obedecida, ocorre superposição dos espectros replicados sobre o espectro do sinal original. Essa situação é denominada rebatimento espectral ou “aliasing”. A conseqüência desta superposição é que toda componente do sinal original com freqüência fM, maior que fA /2, dá origem a uma componente espúria com freqüência igual a fA - fM.

Esta componente terá freqüência menor que fA / 2, e portanto será indistinguível de uma eventual componente de mesma freqüência que estivesse presente no sinal original. A figura 2.10 apresenta um exemplo, no qual um sinal senoidal de freqüência igual a 8 Hz é amostrado com taxa de 10 Hz. Após a reconstrução, resulta em um sinal senoidal de freqüência igual a 2 Hz.

2.5 Critérios Práticos para Sistemas de Amostragem Excetuando casos especiais, os sistemas amostrados seguem o diagrama da fig. 2.11. O sinal contínuo a ser amostrado é aplicado a um filtro passa-baixas, denominado “filtro anti-aliasing”, cuja função é impedir que eventuais componentes com freqüência maior que fA / 2 passem para a etapa de amostragem.

O sinal filtrado é então amostrado com fA , e posteriormente (após o processamento, armazenamento ou transmissão) é retornado à forma analógica, através de um filtro de reconstrução.

Uma vez que um filtro anti-aliasing ideal não pode ser realizado fisicamente, em geral adota-se uma resposta (realizável) do tipo apresentado na figura 2.11(b), que é caracterizado por uma faixa de passagem

- 5 0 0 - 4 0 0 - 3 0 0 - 2 0 0 - 1 0 0 0 1 0 0 2 0 0 3 0 0 4 0 0 5 0 00

2 0

4 0

6 0

8 0

1 0 0

- 5 0 0 - 4 0 0 - 3 0 0 - 2 0 0 - 1 0 0 0 1 0 0 2 0 0 3 0 0 4 0 0 5 0 00

2 0

4 0

6 0

8 0

1 0 0

0 1 0 0 2 0 0 3 0 0 4 0 0 5 0 0 6 0 0 7 0 0 8 0 0 9 0 0 1 0 0 00

0 . 5

1

1 . 5

)(ωRS

×

)(ωH

=

)(ωAS

)(tsA∗

)(th

=

)(tsR

0 1 0 0 2 0 0 3 0 0 4 0 0 5 0 0 6 0 0 7 0 0 8 0 0 9 0 0 1 0 0 0- 1 . 5

- 1

- 0 . 5

0

0 . 5

1

1 . 5

0 1 0 0 2 0 0 3 0 0 4 0 0 5 0 0 6 0 0 7 0 0 8 0 0 9 0 0 1 0 0 0- 1 . 5

- 1

- 0 . 5

0

0 . 5

1

1 . 5

0 1 0 0 2 0 0 3 0 0 4 0 0 5 0 0 6 0 0 7 0 0 8 0 0 9 0 0 1 0 0 0- 0 . 5

0

0 . 5

1

Page 7: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 7

(que compreende as freqüências de interesse); por uma faixa de rejeição (freqüências a serem suprimidas, em geral acima de fA / 2), e por uma faixa de transição, na qual o filtro atua atingindo a atenuação especificada. Em geral, quanto menor a faixa de transição, mais difícil é a implementação do filtro, e e pior é a resposta temporal do mesmo. Em sistemas onde a resposta aos transitórios é importante (como é o caso do vídeo), a faixa de transição deve ser maior. No caso do áudio, onde a resposta em freqüência é importante e a resposta temporal não é significativa, são aceitos filtros com faixa de transição menor.

Fig. 2.10 – Exemplo de Rebatimento Espectral (“aliasing”)

Fig. 2.11 – Sistema Amostrado e Filtro “Anti-aliasing”

A tabela 2.1 apresenta as características de alguns sistemas amostrados usuais, onde podemos verificar que o critério de Nyquist é obedecido com margens de segurança variáveis, conforme a aplicação.

Sistema fM fA fA / fM Áudio CD 20 kHz 44,1 kHz 2,205 Telefonia 3,4 kHz 8 kHz 2,35 Vídeo Digital SD 4,2 MHz 13,5 MHz 3,21

Tabela 2.1 – Alguns Sistemas Amostrados

0 1 0 0 2 0 0 3 0 0 4 0 0 5 0 0 6 0 0 7 0 0 8 0 0 9 0 0 1 0 0 0

0 . 2

0 . 4

0 . 6

0 . 8

1

1 . 2

0 1 0 0 2 0 0 3 0 0 4 0 0 5 0 0 6 0 0 7 0 0 8 0 0 9 0 0 1 0 0 0- 1 . 5

-1

- 0 . 5

0

0 . 5

1

1 . 5

0 1 0 0 2 0 0 3 0 0 4 0 0 5 0 0 6 0 0 7 0 0 8 0 0 9 0 0 1 0 0 0- 1 . 5

-1

- 0 . 5

0

0 . 5

1

1 . 5

)(ts

)(ta

)(nTsA

0 1 0 0 2 0 0 3 0 0 4 0 0 5 0 0 6 0 0 7 0 0 8 0 0 9 0 0 1 0 0 0-0 . 5

0

0 . 5

1

1 . 5

0 1 0 0 2 0 0 3 0 0 4 0 0 5 0 0 6 0 0 7 0 0 8 0 0 9 0 0 1 0 0 0- 1 . 5

- 1

- 0 . 5

0

0 . 5

1

1 . 5

)(th

)(ts R

s(t)

a(t)

sA(t) sR(t)

Filtro “anti-aliasing”

Filtro de reconstrução

Função de amostragem

h(t)

Faixa de Passagem

Faixa de Transição

Faixa de Rejeição

0 fM fAfA / 2

Page 8: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 8

2.6 Critério de Kell O critério de Nyquist representa uma situação limite, que só pode ser atingida com o uso de um filtro ideal (ou quase). Nos casos em que o filtro de reconstrução não pode ser especificamente implementado, como ocorre freqüentemente em sistemas de visualização de imagem, esse critério não proporciona resultados satisfatórios.

A figura 2.12 apresenta um exemplo no qual o critério de Nyquist é atendido ( fA = 2,2 fM) e, no entanto, devido ao uso de uma função de reconstrução retangular, a supressão das componentes replicadas não é satisfatória, resultando em batimentos.

Fig. 2.12 – Amostragem Segundo o Critério de Nyquist (fA = 2,2 fM)

Em 1934, R. D. Kell realizou pesquisas tentando determinar a resolução máxima que poderia ser obtida em um sistema de varredura, aplicado à televisão. O “fator de Kell”, obtido experimentalmente, define a relação entre a freqüência de amostragem teórica obtida pelo critério de Nyquist e a freqüência mínima viável (para reduzir os efeitos de batimento). Valores experimentais estão na faixa de 0,64 a 0,8, e dependem das funções de reconstrução intrínsecas dos processos de reprodução de imagem em estudo.

Podemos combinar o “fator de Kell” com o critério de Nyquist, chegando a um “critério de Kell” (empírico): fA ≥ 3 fM.

A figura 2.13 mostra um sinal amostrado com fA = 3,3 fM e reconstruído com pulso retangular. Podemos notar que a ocorrência de máximos e mínimos é preservada para todos os ciclos do sinal original.

Conforme apresentado na Tabela 2.1, a amostragem de sinais de vídeo em geral é feita considerando o “critério de Kell”.

Fig. 2.13 – Amostragem Segundo o Critério de Kell (fA = 3,3 fM)

0 1 0 0 2 0 0 3 0 0 4 0 0 5 0 0 6 0 0 7 0 0 8 0 0 9 0 0 1 0 0 0-1 .5

-1

-0 .5

0

0 .5

1

1 .5

0 1 0 0 2 0 0 3 0 0 4 0 0 5 0 0 6 0 0 7 0 0 8 0 0 9 0 0 1 0 0 0-1 .5

-1

-0 .5

0

0 .5

1

1 .5

0 1 0 0 2 0 0 3 0 0 4 0 0 5 0 0 6 0 0 7 0 0 8 0 0 9 0 0 1 0 0 0-1 .5

-1

-0 .5

0

0 .5

1

1 .5

0 1 0 0 2 0 0 3 0 0 4 0 0 5 0 0 6 0 0 7 0 0 8 0 0 9 0 0 1 0 0 0-1 .5

-1

-0 .5

0

0 .5

1

1 .5

Page 9: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 9

3. Quantização As amostras de um sinal analógico são representadas por números reais, podendo assumir infinitos valores dentro de um determinado intervalo. O processo de quantização corresponde à conversão desses valores reais em números inteiros, atribuindo um mesmo valor numérico QN a todas as amplitudes dentro de um intervalo [vN, vN + δv]. Ou seja, equivale a “arredondar” a amostra para o valor inteiro mais próximo.

A distância entre os valores sucessivos de quantização (QN e QN+1) é denominada passo de quantização. Quando o passo é constante, dizemos que a quantização é uniforme. (Alguns sistemas de digitalização utilizam quantização não linear, onde o passo é variável em função da amplitude do sinal).

Fig. 3.1 – Quantização de um Sinal Analógico

O processo de quantização introduz um erro no sinal resultante, eQ(t) = sQ(t) – s(t), tanto maior quanto maior o passo de quantização. Em sistemas com quantização uniforme, o erro é limitado em amplitude entre –Q/2 e +Q/2. Para sinais irregulares, e com Q suficientemente pequeno, o erro de quantização não é correlacionado com o sinal e pode ser modelado como um sinal aleatório, com densidade espectral de potência uniforme, e com amplitude pico-a-pico igual a Q. Em outras palavras, o processo introduz um ruído aleatório, que passa a ser denominado ruído de quantização. A figura 3.2 apresenta o erro de quantização, seu histograma de amplitudes e o espectro, para o caso exemplificado na fig. 3.1. Nessas condições, a potência do ruído de quantização pode ser expressa por:

Fig. 3.2 – Erro de Quantização (a), Histograma (b) e Espectro (c)

0 100 200 300 400 500 600 700 800 900 1000-10

-5

0

5

10

0 100 200 300 400 500 600 700 800 900 1000-10

-5

0

5

10

)(tsQ

)(ts

( Q = 1 )

0 100 200 300 400 500 600 700 800 900 1000-0.5

0

0.5

-0.6 -0.4 -0.2 0 0.2 0.4 0.60

2

4

6

8

10

12

14

0 100 200 300 400 500 600 700 800 900 10000

5

10

15

20

25

30

)()()( tstste QQ −= (a)

(b) (c)

∫−

==2

2

22

12

Q

QQ

QdssP

Page 10: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 10

3.1 Quantização no Conversor A/D O dispositivo eletrônico responsável pela quantização de um sinal elétrico é o “Conversor Analógico-Digital”, ou A/D. Na maioria dos casos, este dispositivo converte sinais de entrada (contidos dentro de uma faixa de tensão de pico-a-pico, SP-P, denominada fundo de escala) para uma palavra digital expressa na forma binária, com um número n de bits. Desta forma, um conversor A/D possui 2n níveis de quantização, em geral uniformemente espaçados, com passo de quantização Q = SP / 2n .

Neste caso, podemos estabelecer que a potência de pico do sinal será PP = ¼ × SP2 = Q2 × 22n-2 . Como a potência do ruído de quantização pode ser modelada por PQ = Q2 / 12, então a relação Sinal / Ruído máxima que pode ser obtida em um processo de quantização desse tipo será dada por

Ou, expressa em decibéis, teremos:

Podemos estabelecer então, como regra prática, que a relação Sinal/Ruído melhora em 6 dB para cada bit adicional fornecido pelo conversor A/D. Por exemplo, conversores A/D com 8 bits (256 níveis de quantização) podem alcançar relação S/R máxima de 52,9 dB. Sistemas de 16 bits (65536 níveis) podem atingir até 101 dB.

3.2 Conversão A/D de Sinais de Vídeo Uma vez que a potência de um sinal de vídeo não tem um significado físico/sensorial direto (ao contrário do áudio), costuma-se caracterizar o ruído pela a relação entre a amplitude pico-a-pico máxima do sinal de vídeo (100 unidades IRE) e a amplitude eficaz do ruído de quantização, medida dentro da banda passante nominal (4,2 MHz para NTSC e PAL-M). Desta forma, o ruído de quantização (não ponderado) em função do número de bits n é expresso por:

Este valor deve ainda ser ajustado em função da relação entre a freqüência máxima do sinal fV e a freqüência de Nyquist (fA / 2), uma vez que a potência do ruído de quantização é distribuída uniformemente de 0 a fA / 2, enquanto que o sinal de interesse atinge fV :

Além disso, outro fator que deve ser considerado é que o fundo de escala VT do conversor A/D deve prever uma margem de segurança além da excursão nominal VB-VP do sinal de vídeo (margem denominada “headroom”). VB e VP correspondem aos níveis de branco e preto (100 e 0 IRE).

Fig. 3.3 – Correção pela Freqüência de Amostragem

Fig. 3.4 – Correção pela Margem de “Headroom”

nnn

Q

P

QQ

PP 222

2

222

2321212

2×=×=

÷×

= −−

dB77,402,6

)3log(10)2log(20)3log(10)2log(10 2

+×=

+=+=

n

nRS n

dBn

nRS n

8,1002,6

)12log(10)2log(20)12log(10)2log(10 2

+×=

+=+=

f

fA/2

fA fV

++×=

V

A

ffdBn

RS

2log108,1002,6

)(log202

log108.1002.6 dBVV

Vffn

QS

PB

T

V

A

e

⋅++⋅=

VB-VP VT

Page 11: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 11

Finalmente, para que a medida tenha significado prático, deve ser levada em conta a resposta em freqüência espacial da percepção visual humana, considerando condições de visualização típicas.

A função de transferência utilizada para modelar a resposta da visão, proposta pela CCIR, é:

onde f1= 270kHz f2 = 1.37MHz f3 = 390kHz

O efeito desta ponderação espectral equivale a acrescentar 6,81 dB na relação S/R calculada. A expressão final para a relação S/R de um sistema de conversão A/D de vídeo com 8 bits, por exemplo, é dada então por:

A conversão com 8 bits é suficiente para aplicações em que o processo de digitalização ocorre apenas uma vez, como é o caso em receptores de TV ou equipamentos de captura de vídeo para PC’s. Aplicações profissionais exigem pelo menos 10 bits, para contemplar a possibilidade de várias conversões A/D e D/A em cascata.

3.2.1 Correção Gama Deve-se ressaltar que a expressão acima é significativa apenas quando o sinal digitalizado corresponde à percepção visual de luminosidade, ou seja, é obtido a partir da luminância corrigida através do fator gama ( V = A × B γ ). Dessa forma, espera-se que cada passo de quantização seja menor que um passo de diferença apenas perceptível na luminosidade, tanto para as partes claras como escuras da imagem.

4. Amostragem Bidimensional Uma imagem pode ser descrita como uma função bidimensional f(x,y), definida dentro de um intervalo correspondente às dimensões da mesma. No caso de uma imagem colorida, a função retorna 3 componentes: (R, G, B) = f(x,y) ou (Y, U, V) = f(x,y). O que diferencia uma “imagem” de uma função f(x,y) é o fato de que o receptor final da informação é o sistema visual humano, ou seja, os parâmetros pelos quais a imagem deve ser analisada devem corresponder às características da visão.

Assim sendo, a escolha da estrutura de amostragem e dos parâmetros de quantização para a digitalização de uma imagem deve estar subordinada às características de resolução espacial da visão, as quais dependem fortemente das condições esperadas para a visualização dessa imagem.

Por exemplo, uma imagem destinada a ser impressa em um documento será visualizada em condições de iluminação apropriadas para a leitura, e poderá ser observada a uma distância da ordem de 20 a 50 cm. Nessas condições, a imagem deve ser descrita na forma de refletância relativa, e amostrada com resolução de várias centenas de pontos por polegada.

A amostragem de um sinal bidimensional está sujeita às mesmas degradações que foram descritas para o caso de um sinal unidimensional. Por exemplo, o rebatimento espectral manifesta-se na forma de interferências conhecidas como “figuras de Moirée”. O filtro anti-aliasing é normalmente realizado pela “abertura equivalente de captura”, enquanto que a função de reconstrução pode ser intrínseca ao processo de reprodução, como é o caso do “spot profile” de um cinescópio.

4.1 Resolução da Imagem na TV Para podermos definir a estrutura de amostragem para uma imagem de TV, precisamos analisar a relação entre o tamanho aparente da imagem (ou seja, o ângulo subentendido pela tela, observada a uma distância padrão de visualização) e as características de acuidade visual do observador, necessárias para garantir uma qualidade aceitável. Em especial, devemos analisar a evolução dos critérios que levaram à definição dos padrões de TV atualmente utilizados.

( ) dB

ff

ff

ff

fA

+

+⋅

+

= 2

3

2

2

2

1

10

1

11

log10

dB18.6381.6714.022.1log20

4.85.13log108.10802.6 =+

⋅++⋅=

QRS

Page 12: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 12

Uma vez que o cinema originalmente (por volta de 1930) adotava relação de aspecto de 4:3 (largura x altura), a TV estabeleceu a mesma proporção de imagem, garantindo compatibilidade tanto com o material disponível para exibição quanto com os equipamentos existentes (especialmente lentes).

Por outro lado, critérios de aceitação do produto determinaram que um sistema de TV deveria contemplar a reprodução de imagens, subentendendo um ângulo de visão de cerca de 10 graus no sentido horizontal e 7,5 graus na vertical. Isto corresponde a uma tela de 40 x 30 cm a uma distância aproximada de 2 metros do observador. Esta dimensão é suficiente para exibir a fisionomia de uma pessoa, à distância na qual costumamos conversar com pessoas (vide figura 4.1).

Sabe-se que, na prática, a condição preferida de visualização de uma imagem de TV convencional corresponde a uma distância d entre o observador e a tela igual a 7 vezes a altura H da imagem.

Isto significa que as condições típicas de visualização são bastante próximas das condições assumidas no desenvolvimento da TV convencional; ou seja, os ângulos a e b podem ser assumidos como sendo respectivamente 7,5 e 10 graus.

Com essas dimensões, se considerarmos que a resolução espacial da visão é da ordem de 1,5 minuto de grau, e considerando o critério de Kell para amostragem espacial, seriam necessárias cerca de 640 amostras no sentido horizontal e 480 no sentido vertical. Essa estrutura de amostragem constitui a base do que se denomina TV convencional, ou “Standard Definition” (SDTV) .

O padrão CCIR-601 (atualmente ITU-R Rec. 601) estabelece 482 linhas, com 720 pontos por linha, como estrutura de amostragem para a parte visível das imagens de SDTV.

4.2 TV de Alta Definição Pesquisas feitas no Japão pela NHK, na década de 70, identificaram a viabilidade de um formato de TV capaz de proporcionar “uma nova experiência visual” ao espectador, similar à sensação conferida pelo cinema de tela larga. Estas pesquisas culminaram com a adoção de uma tela com proporções de 16:9, dimensionada para visualização sob um ângulo horizontal de 30 graus, num formato denominado Hi-Vision.

Este formato (atualmente classificado como HDTV ou TV de Alta Definição), além de aproveitar melhor o material cinematográfico disponível, abrangeria ainda parte do campo de visão periférica do observador, o que proporciona um nível mais intenso de ilusão de realidade, através da manipulação da sensação de movimento e referências espaciais do espectador. A recomendação SMPTE 274M estabelece duas resoluções para amostragem de sinais de HDTV: 1080 linhas com 1920 pontos por linha (preferencial para imagens com entrelaçamento) e 720 linhas por 1280 pontos (para imagens com varredura progressiva).

A figura ao lado mostra as proporções relativas dos formatos de TV convencional e HDTV, bem como formatos correntes de filmes cinematográficos de tela larga.

Fig. 4.1 – Condições de Visualização da TV

L H

d

a b

TV (4:3)

HDTV (16:9)

Cinemascope (2.35:1)

Cinema (1.85:1)

Page 13: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 13

4.3 Medida Objetiva de Resolução Espacial: CTF e MTF A característica subjetiva associada à resolução espacial é a nitidez de uma imagem. Ela pode ser descrita como a resposta a transições ou contornos entre regiões claras e escuras da imagem; pode ser associada ao conteúdo espectral em altas freqüências espaciais (numa analogia com o "tempo de subida" do sinal de luminosidade).

Um critério objetivo para definirmos a nitidez de um processo de reprodução de imagens é dado pela curva de resposta em freqüência espacial do sistema, que recebe o nome de "resposta de abertura" ou Função de Transferência de Modulação (MTF).

A figura 4.2 mostra o que ocorre, por exemplo, em uma câmara de TV ao ser focalizado um padrão de linhas alternadas com contraste máximo (preto/branco). A câmara não realiza a amostragem da luminância da imagem em um ponto de dimensões infinitesimais, mas sim dentro de uma região definida como "abertura equivalente". A forma da abertura equivalente está associada à função do filtro “anti-aliasing” normalmente utilizado em sistemas amostrados.

A resposta da câmara será então proporcional à luminância média calculada dentro dessa abertura. Enquanto a largura das linhas da imagem for maior que o diâmetro da abertura equivalente, o sinal gerado pela câmara preservará o contraste total da imagem (ponto A na figura). À medida que as linhas tornam-se mais estreitas, a resposta diminui em amplitude (pontos B e C). Quando o contraste atingir o nível de ruído da imagem, dizemos que foi alcançada a resolução limite do sistema.

Quando a luminância das linhas possui forma de onda retangular, a curva de resposta obtida é denominada função de transferência de contraste (CTF). Quando as linhas usadas no teste possuem variação senoidal de luminância, a resposta obtida é a MTF do sistema.

A B

C

A B

C

CTF

Número de Linhas

Resolução Limite

RuídoMTF ou

Fig. 4.2 – Função de Transferência de Contraste

Podemos notar que isso corresponde a uma convolução da imagem original por uma resposta ao impulso bidimensional, que é abertura equivalente do sistema. No domínio das freqüências espaciais, o espectro da imagem resultante será o produto do espectro da imagem original pela resposta em freqüência espacial do sistema, que é dada pela própria MTF.

A MTF de uma associação série de dois ou mais elementos (por exemplo: lente + câmara + canal de comunicação + monitor + visão humana) é o produto das MTF individuais de cada elemento.

Usualmente, a curva de resposta em freqüência é dada em função do número de linhas (brancas + pretas) que cabem na dimensão vertical da imagem. Cada 2 linhas (1 preta e 1 branca) correspondem a um ciclo de freqüência espacial (Fig. 4.3)

Na definição dos parâmetros de um sistema de televisão, é importante dimensionarmos a MTF global de modo que a nitidez da imagem final seja compatível com a percepção de detalhes proporcionada pela acuidade da visão humana (Figura 4.4).

Page 14: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 14

0100200300400

10 100 1000Linhas de TV

MTF

Fig. 4.3 – Medida da Resolução Espacial Fig. 4.4 – MTF da Visão Humana

4.4 Processos Envolvidos na Amostragem Espacial A figura abaixo apresenta os conceitos envolvidos na amostragem de uma imagem bidimensional. A abertura equivalente de captura corresponde a um filtro passa-baixas, que em princípio evita a ocorrência de rebatimento espectral. Aplicada sobre um ponto (x, y) pertencente à estrutura de amostragem, a abertura de captura fornece uma amostra (elemento de imagem, ou “pixel”). A função de reconstrução, por sua vez, transforma o pixel em uma área finita de imagem, com intensidade proporcional ao valor do pixel, de modo a preencher a estrutura de amostragem na imagem reconstruída.

Fig. 4.5 – Amostragem e Reconstrução de uma Imagem

Na figura 4.6, temos uma comparação de 2 funções de reconstrução (retangular e gaussiana) aplicadas em uma imagem, com a mesma estrutura de amostragem espacial..

Fig. 4.6 – Reconstrução Retangular (a) e Gaussiana (b) de uma Imagem Original (c)

V

V

Imagem

Estrutura de Amostragem Espacial

Abertura Equivalentede Captura

Pixel

Função de Reconstrução

Page 15: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 15

4.5 Efeitos de Rebatimento Espectral No processo de amostragem bidimensional, o espectro (bidimensional) da imagem original é replicado ao longo dos múltiplos das freqüências espaciais de amostragem (fAX e fAY). Caso a imagem possua componentes acima da metade das freqüências de amostragem, ocorrerá superposição (rebatimento) espectral, resultando no surgimento de sinais espúrios em outras freqüências (fig. 4.7). Estes sinais são conhecidos como “figuras de Moirée”, exemplificadas na figura 4.8.b. A aplicação de funções de reconstrução não elimina essas componentes. Apenas a filtragem do sinal original (fig. 4.8.c) pode reduzir as componentes que podem provocar “aliasing”, como pode ser visto em 4.8.d.

Fig. 4.7 – Rebatimento Espectral na Amostragem Bidimensional

Fig. 4.8 – a) Imagem Original; b) Amostrada e Reconstruída (com Aliasing); c) Imagem Filtrada; d) Amostrada e Reconstruída (Aliasing Reduzido)

fX

fY

fX

fY

fAY

fAX

(a) (b)

(c) (d)

Page 16: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 16

5. Amostragem temporal Se uma imagem pode ser entendida como uma projeção óptica de uma região do espaço sobre um plano, podemos generalizar dizendo que a representação de uma imagem em movimento é um evento contínuo ocorrendo em um espaço tridimensional:

u = f (x, y, t) (luminância × dimensão horizontal, vertical e temporal).

No entanto, um sinal elétrico, na forma pela qual pode ser transmitido por um canal de comunicação convencional, é unidimensional (voltagem × tempo). O processo de varredura é a forma utilizada para reduzir a dimensionalidade daquele evento, criando um sinal análogo unidimensional. No caso da televisão, consiste de 2 etapas:

1. Amostragem temporal: divisão da imagem em fotogramas ou quadros (“frames”) sucessivos, assim como é o caso do cinema;

2. Amostragem Espacial (Varredura ou "Raster Scan"): divisão da imagem em linhas horizontais, ao longo das quais é feita a medida da luminosidade. O sinal temporal resultante é denominado sinal de vídeo.

5.1 Critérios de Resolução Temporal Na padronização de um sistema de televisão, há 3 critérios importantes que influenciam a escolha da taxa de amostragem temporal:

• Remanência da visão: a ilusão de movimento contínuo é obtida quando temos seqüências sucessivas com mais do que 15 a 20 quadros por segundo (O cinema usava inicialmente 12 a 16 fotogramas por segundo; atualmente usa 24);

• Cintilação: a freqüência acima da qual nossa visão deixa de perceber cintilação na imagem depende de vários fatores, entre os quais a luminosidade e a extensão visual do objeto pulsante. A tabela 5.1 mostra a relação entre a luminância da tela de um monitor de vídeo e as correspondentes freqüências críticas de cintilação, para 95% da população (ISO/TC159/1987), referentes a campos de visão de 10 e 70 graus. No caso do cinema, operando em baixos níveis de luminância, 48 imagens por segundo são suficientes, e são obtidas por dupla exposição de cada fotograma. Para TV seria desejável mais do que 60 imagens / segundo.

• Batimentos e interferências com a rede de distribuição de energia elétrica: seja na iluminação do estúdio ou nos circuitos do receptor de TV, a interferência com a freqüência da rede elétrica causaria flutuações de luminosidade ou padrões não-estacionários na imagem, caso a amostragem temporal fosse feita em outra freqüência.

Luminância da Tela (Nits)

Área da Pupila (mm2)

Iluminamento Retinal (Trolands)

Freq. Crítica p/ 10o (Hz)

Freq. Crítica p/ 70o (Hz)

10 10.75 ∼ 19.63 215 ∼ 392 48.4 ∼ 54.4 60.6 ∼ 66.9 30 9.08 ∼ 15.21 544 ∼ 912 57.6 ∼ 62.8 70.2 ∼ 75.5 100 8.04 ∼ 11.34 1608 ∼ 2268 68.9 ∼ 71.9 81.8 ∼ 84.9 300 7.07 ∼ 9.62 4242 ∼ 5772 78.2 ∼ 81.3 91.4 ∼ 94.6

1000 6.16 12320 88.9 102.4 3000 4.52 27120 96.7 110.5

10000 3.14 62800 105.1 119.2

Tabela 5.1 - freqüências Críticas de Cintilação

Tempo

Fig. 5.1 - Varredura e Amostragem Temporal

Page 17: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 17

Esses fatores levaram à adoção da taxa de 60 imagens por segundo na América do Norte, Japão e Brasil, entre outros, e de 50 imagens por segundo na Europa e na maioria dos demais países, em conformidade com a freqüência utilizada na distribuição de energia elétrica.

5.2 Estrutura de Amostragem Espacio-Temporal A estrutura de amostragem temporal da varredura entrelaçada pode ser representada pela figura 5.2, onde cada ponto corresponde a uma linha de varredura. Para simplificação, estamos analisando apenas uma coordenada espacial (y) e a coordenada temporal (t).

Fig. 5.2 - Estrutura de Amostragem Temporal com Entrelaçamento

A amostragem de um objeto em movimento se dará em posições diferentes a cada campo e a cada linha, de modo que um quadro completo, obtido pela superposição de dois campos, se apresentará como na fig. 5.3.

Pela observação da figura 5.2, podemos prever que um objeto que se mova verticalmente com velocidade equivalente a uma linha por campo será representado sempre com metade da resolução vertical; para esse objeto, a estrutura de linhas de varredura será visível. Esta velocidade corresponde à velocidade vertical crítica para essa amostragem.

Fig. 5.3 - Amostragem Entrelaçada de Objeto em Movimento

5.3 Análise Espectral do Processo de Amostragem Vamos inicialmente analisar o processo de amostragem através de uma projeção simplificada (uma coordenada espacial e uma temporal, e desprezando a inclinação percebida na fig. 5.2). A figura 5.4-a representa um padrão de amostragem não entrelaçado, enquanto que na fig. 5.4-b temos uma varredura entrelaçada, obtida pela remoção alternada de metade das linhas verticais.

A amostragem regular da fig. 5.4-a faz com que o espectro (no caso, bi-dimensional) do sinal amostrado seja repetido em torno de uma matriz retangular de freqüências espacio-temporais (Fig. 5.5-a). Por outro lado, a varredura entrelaçada corresponde a um espectro com estrutura losangular (Fig. 5.5-b), onde as distâncias entre as freqüências de amostragem são menores do que no caso da varredura progressiva. Percebe-se então que a chance de ocorrer aliasing (rebatimento espectral) é maior no sistema entrelaçado.

Page 18: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 18

t

y

a) Varredura Progressiva

t

y

b) Varredura Entrelaçada

Fig. 5.4 - Estruturas de Varredura

F

F

t

y

a) Varredura Progressiva

F

F

t

y

b) Varredura Entrelaçada

Fig. 5.5 - Espectro Bi-Dimensional de uma Imagem Amostrada

No domínio das freqüências temporais, o aliasing pode ser associado com efeitos estroboscópicos percebidos em movimentos periódicos, ou na inversão do sentido aparente de movimento em estruturas espacialmente periódicas dotadas de movimento uniforme (efeito "roda de carroça" - figura 5.6).

Uma Rotação de 85 graus em sentido Horário...

...confunde-se com uma rotação de 5 graus..

...em sentido

anti-horário.

Fig. 5.6 - Efeito “Roda de Carroça” (Sub-Amostragem Temporal)

O controle do rebatimento espectral decorrente da amostragem temporal é muito mais difícil de ser implementado do que no caso da amostragem espacial ou unidimensional. A limitação do conteúdo de freqüência temporal de uma imagem em movimento pode, em parte, ser obtida controlando-se o tempo de exposição de cada quadro (velocidade do obturador ou abertura temporal do sistema). Um sistema de aquisição que faça a amostragem instantânea da luminosidade em cada ponto da imagem irá manter o conteúdo espectral até altas freqüências, estando mais sujeito ao aliasing temporal do que um sistema que responda pela luminosidade média em cada ponto dentro de um intervalo de tempo igual ao período de varredura (fig. 5.7). Neste caso, a uma abertura temporal retangular corresponde uma resposta em freqüência da forma sen(x)/x, com freqüência de corte tanto maior quanto menor for o tempo de exposição em relação ao período de amostragem.

No entanto, a filtragem temporal prejudica a resolução espacial de objetos em movimento, o que pode ser percebido quando o observador acompanha visualmente a trajetória destes objetos.

Page 19: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 19

fechado ("pull-down")aberto

Obturador da Câmera com Abertura Máxima

Fig. 5.7 - Redução de Aliasing Temporal pelo Controle do Tempo de Exposição

5.4 Reconstrução Temporal: Persistência Luminosa Quando a imagem é apresentada em um cinescópio na forma de impulsos luminosos de curta duração, o fenômeno de remanência faz com que tenhamos a impressão de movimento contínuo. Se a percepção de movimento é feita pelo mecanismo visual de Movimento Ocular, essa sensação ocorre na medida em que o olho acompanha a trajetória média de um objeto, recebendo estímulos visuais consistentes com a idéia de movimento. Isto vale para estímulos instantâneos, como é o caso de um cinescópio. Caso a imagem na tela apresente persistência elevada (como ocorre em um visor LCD ou Plasma), perceberemos um movimento relativo entre a imagem (que permanece estática na tela) e a trajetória média do olho (em movimento linear), refletindo-se numa perda de definição espacial (figura 5.8).

Nos cinescópios usados em TV adotam-se fósforos com persistência de 0,1 a 1 ms no máximo. Monitores de computador para artes gráficas podem usar persistências maiores para minimizar cintilação, porém perdendo definição com imagens em movimento.

T ra je tó r ia d o O b je to

T ra je tó r ia M é d ia

M o v im e n to A p a re n te n a T V M o v im e n to O rig in a l

Im a g e m co m P e rs is tê n c ia

T e m p o

Fig. 5.8 - Imagem com Persistência

Um problema semelhante ocorre na transcrição de formatos diferentes de amostragem temporal, e pode ser exemplificado pela telecinagem, que consiste na apresentação de filmes cinematográficos através da TV. Como o cinema é produzido a 24 quadros por segundo, usa-se normalmente o esquema da figura 5.9 para efetuar a reamostragem temporal. Neste processo, denominado “Pull-down 2-3”, o primeiro

Page 20: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 20

fotograma é reproduzido em 2 campos consecutivos; o fotograma seguinte ocupa 3 campos; e assim por diante. Dessa forma, a taxa média de fotogramas permanece em 24 imagens por segundo.

Fig. 5.9 - Telecinagem com “Pull-Down” 2-3

No entanto, ao ser transcrita a imagem de um objeto em movimento, a imagem percebida apresentará oscilações em relação à trajetória média, provocando perda de resolução espacial (ver figura 5.10).

Trajetória do Objeto

24 fotogramas por segundo

Trajetória Média

TV 60 campos por segundo

Movimento Aparente na TV Movimento Original

Fig. 5.10 - Perda de Resolução na Telecinagem

6. Interfaces Padronizadas de Vídeo Digital Para proporcionar uma interface consistente (evitando assim a degradação cumulativa provocada pela concatenação de conversores A/D e D/A em equipamentos diferentes), foram instituídos alguns formatos padronizados de vídeo digital, compreendendo sistemas de amostragem (estruturas espaciais e temporais de amostragem) e interfaces físicas.

6.1 Estruturas de Amostragem Espacial Considerando que a resolução espacial da visão humana é muito menor para as componentes de crominância do que para a luminância, muitos sistemas utilizam estruturas espaciais diferentes para esses sinais. Em geral, a denominação das estruturas usuais indica a proporção relativa das amostras de luminância (Y) e de crominância (CR e CB). A figura 6.1 apresenta algumas estruturas usadas em interfaces de vídeo digital.

A estrutura 4:4:4, utilizada em equipamentos profissionais com alta qualidade de imagem, efetua a amostragem das componentes de luminância (pontos pretos) e crominância (círculos brancos) nas mesmas posições, para todos os elementos de imagem. Exemplos dessa estrutura são as interfaces RGB de placas de vídeo, interfaces DVI e HDMI, e processadores de vídeo profissionais.

1 2 3 4

0 1 0 1 0 1 0 1 0 1

Cinema (24 Fotogramas Por Segundo)

TV (60 Campos Por Segundo)

Page 21: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 21

A estrutura 4:2:2 é utilizada nas interfaces baseadas na recomendação CCIR-601, na qual as componentes de crominância (Cr e Cb) são amostradas a cada 2 amostras de luminância (Y).

A estrutura 4:1:1 é usada em equipamentos digitais domésticos, como o formato de gravação DV-25.

Os padrões MPEG-1 e MPEG-2 usam disposição espacial diferente para as estruturas de amostragem denominadas 4:2:0, nas quais é feita interpolação vertical e horizontal das componentes de crominância. Já na estrutura 4:2:0 utilizada em um formato DV, as amostras de crominância (Cr e Cb) ocorrem em linhas alternadas.

6.2 Padrão D-1 (CCIR-601 / ITU-R-BT.601) É também chamado de "Digital Components", ou 4:2:2, numa referência à proporção entre o número de amostras nas componentes Y’, PR e PB. Efetua a amostragem independente das componentes de luminância (com taxa de amostragem de 13.5 MHz) e de crominância (taxa de amostragem de 6.75 MHz cada uma). A quantização é feita com 8 bits, sendo que o nível de preto (0 IRE) corresponde ao nível de quantização 16, e o branco (100 IRE) corresponde a 219, deixando uma margem de segurança para evitar saturação com sinais de amplitudes maiores. Os códigos 00 e 255 são reservados para sincronismo.

Revisões mais recentes do padrão CCIR-601 permitem digitalização com 10 bits; os valores especificados acima correspondem aos 8 bits mais significativos.

O padrão D-1 proporciona qualidade de imagem excelente para TV convencional, sendo adequado para aplicações em estúdio. A interface física (definida pelo padrão SMPTE 125M) é paralela, balanceada e síncrona (clock de 27 MHz), utilizando um conector DB-25 cuja pinagem está indicada na Tabela 2.1. Os níveis de tensão correspondem a níveis lógicos ECL ( -0.8 / -1.85 V).

A taxa de amostragem corresponde a 720 pixels de luminância e 360 × 2 pixels de crominância (total de 1440 amostras) durante a parte ativa de cada linha (53.33µs), sendo que este valor é adequado tanto para sistemas em 60Hz como para 50Hz. No caso de NTSC e PAL-M, a linha completa corresponde a 858 ciclos de 13,5 MHz, sendo que 138 ciclos correspondem ao retraço horizontal. No caso de sistemas a 50 Hz (PAL europeu), a linha horizontal completa corresponde a 864 ciclos, com 144 ciclos reservados para retraço horizontal.

4 : 4 : 4 4 : 2 : 2 (Rec. 601) 4 : 1 : 1

4 : 2 : 0 (MPEG-1) 4 : 2 : 0 (MPEG-2) 4 : 2 : 0 (DV)

Fig. 6.1 – Estruturas de Amostragem Espacial

Page 22: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 22

Pino Sinal Pino Sinal Pino Sinal 1 Clock 10 Bit 2 19 Retorno Bit 6 2 Terra A 11 Bit 1 20 Retorno Bit 5 3 Bit 9 (MSB) 12 Bit 0 (LSB) 21 Retorno Bit 4 4 Bit 8 13 Blindagem 22 Retorno Bit 3 5 Bit 7 14 Retorno Clock 23 Retorno Bit 2 6 Bit 6 15 Terra B 24 Retorno Bit 1 7 Bit 5 16 Retorno Bit 9 25 Retorno Bit 0 8 Bit 4 17 Retorno Bit 8 9 Bit 3 18 Retorno Bit 7

Tabela 6.1 - Pinagem do Conector SMPTE 125M Paralelo (D-1)

As amostras são intercaladas, na seqüência – CB CY CR – CY - CB CY CR -... onde o grupo CB CY CR corresponde a amostras espacialmente coincidentes de luminância e crominância (co-localizadas), enquanto que o elemento CY seguinte corresponde a uma amostra de luminância avulsa intercalada (ver Figura 6.2). As componentes CY, CB e CR correspondem aos valores quantizados, obtidos a partir das componentes analógicas Y’, PB e PR correspondentes. As componentes analógicas Y’, PR e PB são calculadas a partir dos estímulos R’, G’ e B’ (pré-corrigidos pelo fator gama) pelas expressões abaixo:

Y’ = 0,299 R’ + 0,587 G’ + 0,114 B’ PB = – 0,169 R’ – 0,331 G’ + 0,5 B’ PR = 0,5 R’ – 0,419 G’ – 0,081 B’

Fig. 6.2 - Estrutura de amostragem 4 : 2 : 2 para componentes no D-1

O intervalo de retraço horizontal é substituído por um bloco de dados ("blanking digital") delimitado por códigos de sincronismo (4 bytes). Estes códigos contêm dados que identificam o campo (par ou ímpar), o período de retraço vertical, e o início e fim do trecho ativo da linha (SAV - Start of Active Video / EAV - End of Active Video). Nas figuras 6.3 e 6.4 temos detalhes temporais da codificação do sinal de vídeo, enquanto que a figura 6.5 mostra os valores de luminância e crominância digitalizados correspondentes a um padrão de barras coloridas com amplitude de 100% (100 IRE pico).

A tabela 6.2 mostra a codificação dos blocos delimitadores do "blanking digital" e da parte ativa de vídeo. Estes blocos consistem de um preâmbulo (3 bytes) e de um byte de dados . A Tabela 6.3 mostra os bits de paridade P3 a P0 que compõem o byte de dados.

Bit No. 9 8 7 6 5 4 3 2 1 1 1 1 1 1 1 1

Preâmbulo 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

Dados 1 Campo 0/1

Blank Vertical

SAV / EAV

P3 P2 P1 P0

Tabela 6.2 - Bloco Delimitador de amostras ativas

Y’

PB

PR

Seqüência de Amostras

Componentes:

(B’-Y’)

(R’-Y’)

148 74

CB CRCY CY CB CRCY CY

Page 23: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 23

Fig. 6.3 - Formato de Dados e Relações Temporais no Padrão CCIR-601

Fig. 6.4 - Formato de Dados e Relações Temporais no Padrão CCIR-601 – Detalhe do Intervalo de Retraço Horizontal

Fig. 6.5 - Padrão de Barras Digitalizado conforme CCIR-601 (D-1)

Page 24: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 24

Bits do Byte de Dados

9 (MSB)

8 Campo

V. B. SAV/ EAV

P3 P2 P1 P0 1 0

(LSB) 1 0 0 0 0 0 0 0 0 0 1 0 0 1 1 1 0 1 0 0 1 0 1 0 1 0 1 1 0 0 1 0 1 1 0 1 1 0 0 0 1 1 0 0 0 1 1 1 0 0 1 1 0 1 1 0 1 0 0 0 1 1 1 0 1 1 0 0 0 0 1 1 1 1 0 0 0 1 0 0

Tabela 6.3 - Cálculo dos bits de paridade (P3 a P0) no Byte de dados

6.3 Padrão D-2 (Digital Composto)

Este formato, mais econômico que o D-1, digitaliza diretamente o sinal de vídeo composto. Para o NTSC, a taxa de amostragem é de 14.31818 MHz (correspondente a 4× a freqüência da sub-portadora de cor), e a quantização é de 8 ou 10 bits. A interface física é idêntica à do D-1. A figura 6.6 mostra os níveis de quantização correspondentes para um sinal NTSC.

6.4 Padrão D-6 (SMPTE 274M - HDTV Digital) Para a TV de alta definição, adotou-se um padrão de 1080 linhas ativas com 1920 pixels por linha, baseado no padrão de vídeo analógico HDTV SMPTE 240M, cujas características estão resumidas na tabela abaixo.

Número de linhas: 1125 totais (entrelaçadas), 1080 linhas ativas Freqüência de Amostragem: 74.25 MHz (Luminância); 37.125 MHz (Crominância) Padrão de Amostragem: 4:2:2 Duração da linha: 29.63 µs (2200 amostras totais, 1920 amostras ativas) Resolução: 8 ou 10 bits

Este padrão especifica a função a ser utilizada na correção “gama” das componentes R, G e B:

As componentes analógicas Y’, PB e PR são obtidas pelas expressões:

Y’ = 0,2126 R’ + 0,7152 G’ + 0,0722 B’

PB = – 0,114572 R’ – 0,385428 G’ + 0,5 B’

PR = 0,5 R’ – 0,454153 G’ – 0,045847 B’

A figura 6.7 apresenta os valores de luminância e crominância digitalizados, correspondentes a um padrão de barras coloridas com amplitude de 100% (100 IRE pico), digitalizado com 10 bits.

Fig. 6.6 - Níveis de Quantização para D-2

≤≤

≤≤=

1018,0099,1

018,005,4'

45,0 VV

VVV

Page 25: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 25

O código EAV recebe mais duas palavras adicionais (LN0 e LN1), que transportam uma contagem seqüencial das linhas, e 4 palavras de CRC (YCR0, YCR1, CCR0, CCR1) para detecção de erros nas seqüências de luminância e crominância.

Fig. 6.7 - Padrão de Barras Digitalizado conforme SMPTE 274M (HDTV)

6.5 Interface Serial CCIR-656 Para simplificar a interconexão de equipamentos de vídeo, padronizou-se uma interface serial destinada a atender amostragem D-1 a 8 bits, permitindo transmissão por um cabo coaxial de 75 ohms. Esta interface, hoje obsoleta, opera a 243 Mb/s, sendo que cada byte de dados é convertido para um símbolo de 9 bits (codificação de grupo 8/9) com a intenção de conservar a componente CC próxima de zero e garantir boa quantidade de transições lógicas para permitir recuperação de clock.

6.6 Interface SDI - Serial Digital Interface (SMPTE 259M) Este padrão foi desenvolvido para permitir transmissão serial de sinais de vídeo, digitalizados com 10 bits, através de cabo coaxial de 75 Ohms, admitindo atenuação de até 30 dB.

Para garantir componente CC zero e presença de transições suficientes para recuperação de relógio, sem no entanto aumentar a taxa de bits, é utilizado embaralhamento (“scrambling”) através de um randomizador, apresentado na fig. 6.8, além de codificação diferencial (bits "1" são transmitidos como transições). A interface opera a 270 Mb/s para sinais CCIR-601 (D-1), ou 143 Mb/s para Digital Composto (D-2). A amplitude nominal do sinal SDI é de 800 mVpp em 75 Ohms.

Estas características possibilitam, em tese, que o sinal SDI trafegue pelas matrizes de comutação atualmente usadas para distribuir sinais de vídeo composto.

A taxa de erros depende fortemente da atenuação no cabo de transmissão; na fig. 6.9 temos valores de BER em função do comprimento do cabo, para um tipo de cabo coaxial comumente usado em estúdios.

O padrão SDI prevê a capacidade de transmissão de áudio digital, na forma de pacotes enviados durante os períodos de apagamento H e V. O sinal de áudio pode ser amostrado a 32 kHz ou 48 kHz, com 16 bits, em até 4 canais.

D D D D D D D D D D

EntradaSerial Saída

"Scrambler" Cod. Diferencial

Fig. 6.8 - Randomizador e Codificador SDI

Page 26: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 26

0.00001

0.0001

0.001

0.01

0.1

1

10

100

105 110 115 120 125

Comprimento do cabo (m)

Erro

s po

r seg

undo

Fig. 6.9 - Taxa de erros para SDI × comprimento de cabo

A interface serial utilizada para HDTV (HD-SDI) demanda uma taxa de transmissão de 1,485 Gb/s para quantização de 10 bits.

6.7 Interface DVI (Digital Visual Interface) A interface DVI foi desenvolvida para interligar equipamentos de vídeo com dispositivos de apresentação de imagem que sejam intrinsecamente digitais, como por exemplo monitores de Plasma ou Cristal Líquido (LCD). Deste modo, evitam-se os problemas decorrentes da conversão D/A no equipamento gerador, seguida de conversão A/D, eventualmente com taxa diferente, no dispositivo de apresentação. É largamente usada para interligar interfaces gráficas de microcomputadores com monitores digitais.

O padrão DVI utiliza 3 canais em paralelo para transmitir as informações de R, G e B, digitalizadas em 8 bits. A transmissão é serial, balanceada, a taxas que podem alcançar 1,6 Mb/s, sendo que a informação digital é codificada por um processo denominado T.M.D.S., ou “Transistion Minimized Differential Signalling”. Neste processo, uma palavra de 8 bits é convertida em 10 bits de forma a minimizar a quantidade de transições, o que garante menor ocupação espectral do sinal transmitido.

Além dos 3 canais de informação de imagem, o padrão DVI utiliza um canal de “clock”, na taxa de amostragem (1/10 da taxa de bits). As características do PLL a ser utilizado no decodificador, para multiplicar o “clock” e obter a freqüência de transmissão de bit (fig. 6.12) , são especificadas no padrão, de modo a suportar condições de instabilidade de freqüência que podem existir no equipamento codificador.

Fig. 6.12 – Interface DVI

1 / dia

1 / hora

1 / minuto

1 / segundo

1 / frame

PLL

Serializador

Clock de Pixel

Dados de Pixel

(24 bits)

25~165

PLL

Decodificador

Transmissor Receptor

(24 bits)

3 canais TMDS

Canal de Clock

Clock de Pixel

Page 27: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 27

6.8 Interface HDMI (High Definition Multimedia Interface) Esta interface é derivada do padrão DVI, utilizando o mesmo processo de codificação (T.M.D.S.) e de transmissão serial balanceada, porém visando aplicação em equipamentos de entretenimento. Além de utilizar um conector de menores dimensões, acrescenta a possibilidade de transmitir áudio digital, multiplexado com os canais de vídeo RGB.

Além disso, implementa um canal bidirecional de controle (de baixa velocidade), através do qual ambos os equipamentos, gerador e apresentador de imagem, estabelecem as respectivas capacidades de resolução espacial, visando compatibilidade de formatos de geração e de exibição de sinal.

6.9 Interfaces para Vídeo Comprimido

6.9.1 Vídeo Sobre IEEE1394 (“Firewire”, “I-Link”) O padrão IEEE1394 define uma interface síncrona bidirecional com taxas de transmissão da ordem de 100 a 400 Mb/s (800 Mb/s conforme IEEE1394-B). A interface física consiste de 3 pares de sinais, sendo um par para alimentação CC, e dois pares para dados e “strobe”. A codificação usada é apresentada na figura ao lado; os dados são transmitidos em NRZ, balanceado, enquanto que o par de “strobe” apresenta uma transição sempre que não houver uma transição no par de dados.

As transações ocorrem através de pacotes de dados, precedidos de etapas de arbitragem e prefixos (endereços de origem e destino, códigos de transação), e finalizados por CRC.

A interface IEEE1394 (“Firewire”) é usada como meio de transporte para vídeo digital comprimido, conforme formatos IEC61883-4 (Transporte de pacotes MPEG-2 DVB), DirecTV e DV (Digital Vídeo – IEC61883-2). No caso do MPEG-2, os pacotes de 188 bytes são acrescidos de um prefixo de descrição de tempo real (data/hora/frame) e depois repartidos em blocos de 24 bytes, que são transportados por pacotes isócronos.

Fig. 6.11 – Vídeo Comprimido (MPEG-2) sobre Pacotes Isócronos “Firewire”

6.9.2 Interface DVB-SPI (Synchronous Parallel Interface) Esta interface é padronizada pelo consórcio europeu DVB (Digital Vídeo Broadcasting) conforme norma ETSI - EN50083-9, com a finalidade de interligar equipamentos de transmissão que utilizam o protocolo de transporte por pacotes (Transport Stream) definido no padrão MPEG-2.

188 bytes

192 bytes

24 24 24 24 24 24 24 24

Pacote MPEG-2

Time Code

Blocos

D DPacotes isócronos IEEE1394

Page 28: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 28

Fisicamente, consiste de uma interface paralela, na qual trafegam 8 bits, clock, sincronismo de pacote e um sinal indicando que há dados válidos. Estes 11 sinais utilizam níveis lógicos LVDS (diferenciais).

A figura 6.12 apresenta formas de onda correspondentes a um modo de operação da interface, na qual um pacote de 188 bytes é complementado por 16 bytes de enchimento.

A tabela 6.4 apresenta a pinagem do conector DVB-SPI (conector tipo DB-25).

Fig. 6.12 – Sinais na Interface DVB-SPI – Modo 204 Bytes c/ Enchimento

Pino Sinal Pino Sinal Pino Sinal 1 Clock A 10 D0 A (LSb) 19 D4 B 2 Terra 11 DVALID A 20 D3 B 3 D7 A (MSb) 12 PSYNC A 21 D2 B 4 D6 A 13 Blindagem 22 D1 B 5 D5 A 14 Clock B 23 D0 B (LSb) 6 D4 A 15 Terra 24 DVALID B 7 D3 A 16 D7 B (MSb) 25 PSYNC B 8 D2 A 17 D6 B 9 D1 A 18 D5 B

Tabela 6.4 – Pinagem do Conector DVB-SPI

6.9.3 Interface ASI – Asynchronous Serial Interface Esta interface, também especificada na norma ETSI - EN50083-9, é a versão serial da interface DVB-SPI, operando à taxa fixa de 270 Mbits/s. As características físicas são semelhantes à interface SDI, com a diferença que os dados relativos ao Transport Stream são transmitidos em pacotes. Aqui é aplicada uma conversão de 8 para 10 bits, além da inserçãzo de códigos especiais para enchimento e sincronismo de pacotes.

7. Processamento Digital de Vídeo 7.1 Frame Buffer

Um componente central dos equipamentos processadores de vídeo que operam na forma digital é o “frame buffer”, ou memória de armazenamento de imagem. Este bloco funcional é normalmente implementado por um banco de memória RAM com duplo acesso, ou seja, a escrita e a leitura de informação podem ocorrer simultaneamente e são controladas por unidades de endereçamento independentes.

A figura abaixo mostra um diagrama de blocos de um “Frame Buffer” configurado como sincronizador de vídeo. O sinal digitalizado (por exemplo, em componentes YUV) é armazenado em uma memória com capacidade pelo menos para um quadro completo (~700 kBytes para CCIR-601). Os ponteiros de endereçamento para escrita e leitura são gerados independentemente, sincronizados respectivamente pelo sinal de vídeo da entrada e pelo sincronismo geral externo (“Genlock”). O endereçamento pode ser linear ou segmentado, ou seja, separado em coordenadas (x, y), onde x = número do pixel dentro de uma linha horizontal e y = número da linha no sentido vertical.

Dados Video In Video Out

Genlock

Memória

RAM

A/D

Separador de Sincronismo

D/A

Separador de Sincronismo

Page 29: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 29

Fig. 7.1 – “Frame Buffer”

7.2 Redutor de Ruído Um método de redução de ruído aplicável a imagens de vídeo explora na alta correlação existente entre pixels adjacentes, tanto no sentido espacial como no temporal, para imagens naturais. Equipamentos redutores de ruído digitais efetuam uma média ponderada entre pixels próximos, em linhas e quadros consecutivos. Utilizam para isso um “Frame Buffer” com saídas múltiplas, atrasadas de 1 ou mais pixels, linhas e/ou campos, as quais são combinadas.

Fig. 7.2 – Redutor Digital de Ruído

7.3 Transformações Geométricas Para criar efeitos de perspectiva, rotação ou deformação da imagem, é necessário introduzir um processador de geometria no endereçamento de leitura do “Frame Buffer”. Este processador mapeia o sistema de coordenadas da imagem reproduzida (xR, yR) sobre as coordenadas da imagem de entrada (xE, yE) através de um algoritmo apropriado.

Por exemplo, uma translação da imagem original é implementada pelas seguintes equações:

YRE

XRE

TyyTxx

−=−=

Na forma matricial, podemos expressar estas equações como:

−−

=

11001

R

R

Y

X

E

E yx

TT

yx

Endereço Ponteiro de Escrita

Ponteiro de Leitura

d

c

b +

aDados

Endereço

Video In Video Out

Memória

RAM

A/D

Separador Sincronismo

Ponteiro de Escrita

D/A

TY

TX

Page 30: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 30

Vários efeitos (transformações) podem ser concatenados em uma única matriz; para isso podemos em primeiro lugar generalizar o espaço da imagem como possuindo 3 dimensões (sendo que a imagem reproduzida terá sua coordenada zR = 0), e adotando matrizes quadradas para representar as transformações individuais. Assim sendo, a translação nas dimensões x, y e z será efetuada por uma matriz T dada por:

RER

R

R

Z

Y

X

E

E

E

vTvzyx

TTT

zyx

⋅=⇒

−−−

=

11000100010001

1

Uma expansão ou compressão da imagem nos eixos x, y e z corresponde ao uso de uma matriz de transformação de escala S dada por:

=−

10000100000000

1

1

Y

X

SS

S

A rotação de uma imagem em torno dos eixos x, y e z é feita pelas seguintes matrizes:

= −−

−−

10000cossen00sencos00001

11

11

αααα

αR

=−−

−−

10000cos0sen00100sen0cos

11

11

ββ

ββ

βR

=

1000010000cossen00sencos

θθθθ

θR

Várias transformações podem ser concatenadas calculando-se o produto das matrizes correspondentes a cada transformação, na ordem especificada. Por exemplo, uma seqüência de translação, escalamento e rotação no eixo z será definida por

( )( )( ) ER vTSRv ⋅⋅⋅= θ

Para criar efeitos de perspectiva, é necessário considerar a projeção de um espaço tridimensional (coordenadas xE, yE, zE) sobre um plano de projeção (coordenadas xR, yR, λ). Esta projeção corresponde a uma transformação não-linear, dada por

SY

SX

xE, yE, zE

z

x

λ xR

yR

Plano de Projeção Ponto de

Observação

E

ER

E

ER

zyyzxx

=

=

λ

λ

E

ER

E

ER

zyy

zxx

λ

λ

=

=⇒

Page 31: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 31

7.4 Interpolação e Decimação As operações de escalamento podem exigir interpolação de amostras (quando a distância entre os pixels nas coordenadas de saída é menor que a distância correspondente na imagem de entrada) ou decimação (no caso inverso).

Na figura abaixo, a grade (+) representa a estrutura de amostragem da imagem de saída, enquanto que (o) representa a estrutura da imagem de entrada, sujeita a uma transformação de perspectiva. O pixel A deve ser calculado a partir da média ou decimação de vários pixels da imagem original, enquanto que o pixel B deve ser interpolado a partir dos valores dos 4 pixels vizinhos na imagem original. Nestes processos deve ser prevista filtragem para evitar “aliasing” espacial.

7.5 Transcrição de Formatos

O processo de transcrição consiste na conversão entre formatos de vídeo diferentes. Por exemplo, a exibição em PAL-M ou NTSC de um sinal originado em PAL-B (50 Hz) exige que seja feita uma conversão de formato. Este processo envolve interpolação de quadros e decimação de linhas (o formato PAL-B possui 576 linhas visíveis que devem ser reduzidas para 480 linhas no PAL-M). Normalmente, é feita uma decimação usando um filtro FIR com 3 a 4 coeficientes no sentido vertical (linhas consecutivas), seguido de uma interpolação linear entre 2 campos consecutivos; ou então, uma interpolação bilinear entre as 4 linhas mais próximas (em 2 campos consecutivos).

Fig. 7.7 – Conversão de Formatos

7.6 “Chroma Key” O recurso de “Chroma Key” é usado para inserir uma imagem (primeiro plano) sobre outra imagem (plano de fundo), usando a informação de crominância como “chave” para efetuar a comutação entre as imagens.

Fig. 7.6 – Interpolação e Decimação

Estrutura de Amostragem de

Saída

Estrutura de Amostragem de

Entrada

Interpolação Bilinear y

t

A

B

Page 32: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 32

Fig. 7.8 – “Chroma Key”

Uma câmera focaliza os elementos do primeiro plano sobre um fundo uniforme, com uma cor de referência, geralmente azul ou verde. Um circuito compara em tempo real o sinal de vídeo com a cor de referência; se coincidir, a imagem de segundo plano é selecionada. Caso contrário, a imagem do primeiro plano é escolhida.

O mesmo princípio é usado para inserir caracteres, símbolos ou vinhetas, gerados por computador, sobre uma imagem de vídeo. Neste caso, os caracteres ou símbolos são armazenados em um “Frame Buffer” através de acesso direto à memória. Um determinado valor de luminância e/ou crominância é interpretado como “transparente” e provoca o chaveamento do sinal de vídeo ao qual os caracteres serão superpostos.

7.7 Processamento no receptor de TV: Equalização de Multi-percurso Alguns receptores de TV incorporam um filtro equalizador que permite reduzir o efeito das distorções por multi-percurso resultantes de reflexões em obstáculos, veículos, etc. (fantasmas). Este filtro baseia-se em um modelo de resposta finita ao impulso para o canal de transmissão (ver figura 3.7). Cada reflexão do sinal transmitido corresponde a um atraso ∆tn e a uma atenuação kn. No receptor, é implementado um filtro complementar. O correto funcionamento deste filtro depende da determinação dos valores de ∆tn e kn, o que pode ser feito por autocorrelação do sinal recebido.

Alguns sistemas dependem da transmissão de um sinal de referência específico (GCR – Ghost Cancelling Reference) no intervalo de retraço vertical; outros sistemas utilizam a forma de onda da linha 3 (início do sincronismo vertical), na qual ocorre um degrau isolado, que pode ser tomado como referência.

Fig. 7.9 – Equalização de Multi-percurso

Plano de Fundo

1o. Plano

Chave

Decodi-ficador

Compa-rador

Referência

Imagem Composta

∆t1

k1

k2

kn

∆t2

∆tn

SINAL TRANSMITIDO

∆t1

-k1

-k2

-kn

∆t2

∆tn

SINAL PROCESSADO

SINAL RECEBIDO

Modelo da Distorção por Multi-percurso

Equalizador Adaptativo no Receptor

Page 33: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 33

8. Requisitos de Banda Passante para Transmissão 8.1 Transmissão Analógica

O sistema original de TV comercial (Padrão “M” para TV preto-e-branco) adotou uma resolução vertical máxima de 340 linhas para o conteúdo da imagem, sendo que são necessárias na prática 480 linhas de varredura para reproduzir adequadamente imagens com essa freqüência espacial. Este valor é consistente com o “critério de Kell”, como visto anteriormente.

Se considerarmos que a resolução no sentido horizontal deve ser equivalente à vertical, a TV deve ser capaz de reproduzir 4/3 × 340 = 453 linhas verticais alternadas dentro da largura da imagem; isso equivale a 453 semiciclos de um sinal senoidal. O sinal de vídeo a ser transmitido (considerando 480 linhas de amostragem e 60 quadros de varredura) ocuparia assim uma banda de:

B MHzW = × × × =12

453 480 60 6 52,

8.1.1 Tempo de Retraço Por outro lado, nos receptores utilizavam-se predominantemente cinescópios (tubos de raios catódicos - TRC) nos quais um feixe de elétrons, com intensidade modulada pelo sinal de vídeo, varre uma tela foto-emissora (chamada de “fósforo”). A deflexão do feixe de elétrons no TRC é feita através de campos magnéticos, produzidos por bobinas de deflexão, nas quais injetam-se correntes com forma de onda semelhante a um dente-de-serra.

A indutância dessas bobinas impede que a corrente de deflexão inverta a polaridade instantaneamente ao final de cada linha de varredura; torna-se necessário admitir um tempo de retraço, durante o qual o sinal de vídeo deve manter-se em apagamento. O retraço horizontal foi adotado como sendo da ordem de 20% do tempo de varredura, enquanto que o retraço da varredura vertical é de cerca de 9%.

Considerando a necessidade desta margem de segurança devida ao retraço, a banda Bw ocupada pelo sinal de vídeo seria de

( )B MHzW = ×

×

× × × =

12

453 1 2 480 1 09 60 8 5, , ,

Este valor é excessivamente alto, especialmente considerando a tecnologia de radiodifusão disponível na década de 40 (mesmo usando modulação AM-VSB). Assim sendo, para proporcionar uma redução nos requisitos de banda passante, adotou-se o processo de entrelaçamento (figura 8.1).

Fig. 8.1 - Entrelaçamento

Tempo de Varredura

Tempo de Retraço

Page 34: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 34

8.1.2 Entrelaçamento Reproduzindo alternadamente apenas as linhas ímpares e depois as pares de uma estrutura de varredura, separadas assim em campo ímpar e campo par, consegue-se reduzir a taxa de imagens para 30 quadros completos por segundo, mantendo no entanto uma amostragem temporal de 60 campos por segundo. Uma vez que o olho humano não é sensível à cintilação de detalhes de pequenas dimensões, o entrelaçamento não é perceptível para imagens "normais", que são caracterizadas por contornos suaves e não alinhados com a estrutura de varredura. Evidentemente este argumento não é válido para imagens sintéticas, como em monitores de computador, que podem ser fortemente alinhadas com a estrutura de varredura. Neste caso, demanda-se varredura progressiva (não entrelaçada).

O entrelaçamento é obtido na prática fazendo com que a freqüência da varredura horizontal seja um múltiplo ímpar da freqüência de quadro (30 Hz). Considerando 480 linhas ativas e um período de retraço vertical de 9%, adotou-se no padrão “M” 525 linhas por quadro, ou seja, 262,5 linhas por campo. (Figura 5.1)

Com o entrelaçamento, a ocupação de banda do sinal de vídeo passa a ser de

( )B MHzW = × +

× × =

12

12

453 20% 525 60 4 2,

8.1.3 Modulação Vestigial O sinal de vídeo composto é transmitido utilizando modulação em amplitude negativa; isto é, o pico de amplitude da portadora (potência máxima) corresponde ao nível de sincronismo (-40 IRE), enquanto que a potência mínima corresponde ao nível de branco (100 IRE). Deste modo, a potência de pico do transmissor é constante, independente do conteúdo da imagem. Além disso, é reduzida a influência do ruído no sincronismo do receptor.

A modulação AM de um sinal de TV, com banda de 4,2 MHz, exigiria mais de 8,4 MHz de banda total. Para reduzir a banda ocupada, o sinal modulado sofre uma filtragem vestigial, pela qual a banda lateral inferior é limitada em 750 kHz abaixo da portadora (fig. 8.2). Considerando bandas de guarda entre os canais adjacentes, e considerando que o sinal de áudio é transmitido por uma portadora independente (modulada em FM numa freqüência 4,5 MHz acima da portadora de vídeo), a programação de TV no padrão “M” pode ser veiculada através de um canal de 6 MHz de banda total.

Em situações normais, a maior parte da energia irradiada concentra-se em freqüências próximas à da portadora de vídeo (até ~ 100 kHz, veja fig. 8.3). Para essas freqüências, a modulação é essencialmente AM.

4,2 MHz

-4,2 MHz

Vídeo Composto (Banda Base)

+4,2 MHz

-0,75 MHz+4,5 MHz

fo

Modulação AM

Modulação VSB + Áudio

0

Fig. 8.2 - Modulação AM-VSB para Radiodifusão de TV

Page 35: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 35

Fig. 8.3 - Espectro típico de um sinal de TV

8.2 Transmissão Digital A necessidade de compressão de dados decorre da enorme quantidade de informação resultante da digitalização de um sinal de vídeo, utilizando os critérios relevantes de amostragem. Considerando por exemplo o sinal de vídeo digitalizado conforme Rec. 601, os requisitos de transmissão (apenas relativos à parte ativa da imagem, sem considerar o retraço ou os canais de áudio) seriam dados por:

1 linha = 720 amostras de Luminância + 2 × 360 amostras de crominância = 1440 amostras

1440 amostras/linha × 482 linhas × 29,97 quadros/s = 20.801.578 amostras/s

20.801.578 amostras/s × 8 bits = 166,4 Mb/s

No caso do padrão D-2, temos:

1 linha (parte visível) = 51 µs ; Taxa de Amostragem = 14,31818 MHz

14,31818 MHz × 51 µs = 730 amostras / linha

730 × 482 linhas × 29,97 quadros/s = 10.545.244 amostras/s

× 8 bits = 84,36 Mb/s

Já para o caso da HDTV em 8 bits no padrão SMPTE 274M, teríamos:

1920 pixels × 1080 linhas × 29.97 quadros = 62.145.792 pixels/s

× 8 bits × (1 + 1/2 + 1/2) = 994,3 Mb/s

Estes valores tornam praticamente inviável a radiodifusão no formato digital, uma vez que demandam canais de comunicação com banda passante muito elevada. Como comparação, as capacidades nominais de alguns canais típicos (atualmente usados para transmissão de TV analógica), operando com modulação adequada para transmissão digital, estão apresentadas na tabela abaixo:

Page 36: 1. Introdução: Sinais Digitais x Analógicos

_______________________________________________________________________________________________________________________________________________

Princípios de Televisão Digital – Mackenzie - 2006 36

Meio Relação S/R Modulação Taxa Bruta Taxa Líquida Cabo Coaxial > 30 dB 256-QAM 42.88 Mb/s 38 Mb/s Radiodifusão > 15 dB 8-VSB 38 Mb/s 19 Mb/s Radiodifusão > 20 dB OFDM x 64-QAM 30 Mb/s 22 Mb/s

Satélite (DTH) > 6 dB QPSK 45 Mb/s 30 Mb/s

Tabela 8.1 – Capacidades de Canais de Comunicação

(Taxa Bruta = Taxa Líquida + Códigos de Correção de Erros)

Para permitir a radiodifusão de TV digital através dos canais disponíveis, torna-se necessário adotar processos de compressão com perdas, baseados na redução de redundância temporal (semelhança entre quadros consecutivos de uma imagem) e espacial (correlação entre pixels adjacentes). Estes processos devem obviamente levar em conta as características da percepção visual humana para permitir altas taxas de compressão (maiores que 50:1 para radiodifusão de HDTV) apresentando, no entanto, reduzida visibilidade dos erros provocados na reconstrução da imagem.

9. Referências Digital Image Processing - Rafael C. Gonzales, Richard E. Woods - Addison Wesley, 1992

Digital Video and HDTV – Charles Poynton – Morgan Kaufmann, 2003

Digital Visual Interface Rev. 1.0 – Digital Display Working Group Standard, 1999

NAB Engineering Handbook – J. Whitaker, ed. - National Association of Broadcasters, 1999

Signals & Systems – Alan Oppenheim, Alan Willsky – Prentice Hall, 1997

Television Engineering Handbook - K. Blair Benson, ed. - Mc Graw-Hill, 1985

The Digital Interface Handbook – F. Rumsey, J. Watkinson – Focal Press, 1995

Video Editing and Post Production – J. R. Caruso, A. E. Arthur – Prentice Hall, 1992

Video Engineering - Andrew F. Inglis, Arch C. Luther - Mc Graw-Hill, 1996