1 cap.9: fundamentos de vídeo prof. dr. abel gomes (agomes@di.ubi.pt)
Post on 18-Apr-2015
115 Views
Preview:
TRANSCRIPT
1
Cap.9: Fundamentos de vídeo
Prof. Dr. Abel Gomes(agomes@di.ubi.pt)
2Parte 2
Sumário
História Elementos de sistemas de difusão (broadcasting) Scanning e entrelaçamento Cor e gamma Sub-amostragem chroma Representações
3Parte 2
História 1839: câmeras fotográficas do tipo Daguerre (www.fi.edu/pieces/
myers ). 1893: difusão de áudio por telefone, (Puskas). 1895: comunicação sem fios (Marconi e Popov). 1895: criação do filme (irmãos Lumiére). 1919: difusão de rádio (Holanda e Canadá). 1934: Estados Unidos fundam FCC (Federal Communications
Commission, www.fcc.gov) 1935: difusão de TV (Alemanha e Grã-Bretanha). 1941: TV b&w nos Estados Unidos.
1951: gravador de vídeo (Bing Crosby Enterprises). 1963: satélite geo-estacionário Meados de 70: transmissão em cabo de fibra óptica 1985: FCC determina a criação da norma ATSC até 1993? 1989: difusão de HDTV analógica (Japão) 1996: adopção da norma ATSC
Ainda: invenção do telefone, fundação da ATT, invenções de TV, primeiras estações/redes de rádio
Ainda: primeiras emissões de TV NTSC, primeiro sistema por cabo, VCR doméstico, dispositivo tivoli/replay, TV directa, primeiras emissões HDTV
4Parte 2
Grupos de Normalização ITU-T (ITU Telecommunications), sucedânea da
CCITT ITU-R (ITU Radiocommunications), sucedânea da
CCIR FCC (Federal Communications Commission) SMPTE (Society of Motion Picture and Television
Engineers) etc.
5Parte 2
Sistema de emissão/difusão (broadcasting)
OBJECTIVOS: Utilização eficiente da largura de banda Elevada percepção da qualidade de
video/áudio
Tra
nsm
iss
or
Rece
pto
r
6Parte 2
Varrimento e entrelaçamento
Transmissão é um sinal contínuo O transmissor capta e codifica imagens O receptor descodifica iamgens para
visualização A imagem é traçada linha-a-linha
O varrimento é da esquerda para a direita, de cima para baixo.
Há um intervalo em branco vertical/horizontal
O sinal é entrelaçado Melhora a percepção do movimento Alternativa: varrimento progressivo
7Parte 2
Varrimento do dispositivo de visualização de vídeo
O vídeo é composto de dois sinais: luma e chroma Video composto (composite video) faz a combinação dos dois sinais. Video separado (component video) envia os dois sinais
separadamente
Amplitude
Time
Cathode
8Parte 2
Funcionamento duma câmera
Uma câmera tem 1, 2 ou 3 tubos para amostragem Mais tubos (CCDs) e melhores lentes produzem melhores
figuras
Beam Splitter
Color Filters
En
cod
er
Camera Tubes
Zoom Lens Luma
Chroma
G
R
B
9Parte 2
CRT de visão directa (Direct View CRT)
3 canhões (RGB) energizam fósforos:
Variando a energia altera a intensidade percepcionda
Diferentes energias em diferentes fósforos produzem diferentes cores
Os fósforos têm de ser refrescados para evitar o esmorecimento da cor
Tipos de tecnologias: Máscara sombra (shadow mask
ou delta-gun dot mask) PIL slot mask Grelha-abertura de canhão
simples com 3 feixes (single-gun aperture-grille); exemplo: Trinitron
Shadow Mask
HolesScreen
Phosphors
RG
B
RGB
10Parte 2
Notação de varrimento Especificação de linhas/”frame rate”
NTSC 525/59.94 PAL 625/50
ATSC – tudo é variável 1080i 1920x1080 varrimento entrelaçado 720p 1280x720 varrimento progressivo
Porquê 59.94? Evita o problema de interferência entre as sub-
portadoras de cor e de som.
11Parte 2
Campos entrelaçados(interlaced fields)
vertical blanking
vertical blanking
Field 1
Field 2
Line 1 ---
Line 21 ---
Line 263 ---
Line 283 ---
Line 525 ---
1
484
485
...
485
24
...
485
484
23
Signal Format
Raster Format
ITU-R Rec. 601: 720x483
12Parte 2
Varrimento (525/59.94)
Active
Active
Active
squarepixel
601
4fsc
Total Size Active Area
780X525
858X525
910X525
644X483
720X483
757X483
13Parte 2
Razão de aspecto/ taxa de refrescamento
Razão de aspecto TV convencional usa 4:3 (1.33) HDTV usa 16:9 (2.11) Cinema usa 1.85:1 ou 2.35:1
Taxa de refrescamento NTSC usa 60Hz (59.94Hz) PAL usa 50Hz Cinema usa 48Hz (mas ainda só 24 fps)
14Parte 2
Vídeo NTSC(525 linhas, 60 campos/s)
525 linhas de varrimento repetidas 29.97 vezes por segundo (i.e. 33.37 ms/frame)
Linhas de varrimento entrelaçadas dividem uma frame em dois campos com 262.5 linhas cada um (i.e. 16.68 ms/campo)
20 linhas reservadas para informação de controlo no início de cada campo
só 483 linnhas de dados visíveis Laserdisc e S-VHS mostram cerca de 420 linhas (percepção) Emissão/difusão TV normal mostra cerca de 320 linhas
Uma linha dura 63.6 s (10.9 s em branco)
15Parte 2
Vídeo PAL(625 linhas, 60 campos/s)
625 linhas de varrimento repetidas 25 vezes por segundo (i.e. 40 ms/frame)
Linhas de varrimento entrelaçadas dividem uma frame em 2 campos com 312.5 linhas cada um (i.e. 20 ms/campo)
Aproximadamente 20% mais linhas que o NTSC
NTSC vs. PAL grosseiramente a mesma largura de banda
16Parte 2
Percepção da cor Color é o resultado da percepção da luz
A retina capta ondas de luz no espectro entre 400nm e 700nm
Os seres humanos são mais sensíveis ao brilho do que à cor A retina é composta de cones e bastonetes
Cones respondem a diferentes frequências (RGB) Bastonetes medem o brilho a baixos níveis de luz
(i.e., visão nocturna) CIE estabeleceu normas relativas à cor
CIE XYZ, CIE xyY RGB linear
17Parte 2
Gammawww.cgsd.com./papers/gamma.html
Um CRT é inerentemente não-linear
As alterações de visualização são baseadas na voltagem alimentadora.
A visão humana é também não-linear
A sensação de luminosidade é função potência da intensidade de luz (y=xw)
Surpresas agradáveis acontecem… CRT não-linear tem uma
relação próxima com a luminosidade humana inversa
A codificação da intensidade num sinal com correcção gamma maximiza a percepção da imagem
Y -vs- Y’
Sample Input to Monitor Graph of Input
Output from Monitor Graph of
Output L = V 2.5
18Parte 2
Gamma em vídeowww.cgsd.com./papers/gamma.html
Câmera faz a correcção gamma
A visualização (display) impõe a função potência inversa
y = x 1/2.5
Sample Input Graph of Input
Gamma Corrected Input Graph of Correction L' =
L 1/2.5
Monitor Output Graph of Output
camera transmission display
19Parte 2
Codificação de imagens a cores
Imagem representada por 24 bits/pixel (8 bpp) Cada cor com valor entre 0 e 255
Vídeo usa codificação não-linear Distribuição uniforme de cores na
codificação RGB R’G’B’ (RGB c/ correcção gamma)
Vídeo usa luminância/crominância R’G’B’ Y’CBCR
Luminância é Y (tecnicamente luma é Y’) Crominância é CBCR
20Parte 2
Sub-amostragem cromática
A sub-amostragem cromática reduz dados: 2 chroma/luma 16 bpp 1 chroma/luma 12 bpp
A notação é a:b:c a é o número de amostras luma b é o número de amostras chroma por linha
ímpar c é o número de amostras chroma por linha
par Ex. 4:4:4, 4:2:2, 4:1:1, 4:2:0, …
21Parte 2
Amostragem de linhaY Y Y Y Y
4:4:4
CR/CB CR/CB CR/CB CR/CB CR/CBY Y Y Y Y
4:2:2
CR/CB CR/CB CR/CB
Y Y Y Y Y4:1:1
CR/CB
4:2:2 é conhecida por broadcast quality4:1:1 é conhecida por VHS quality4:2:0 é 2:1 nas direcções horizontal e vertical
22Parte 2
Representações Composta
NTSC - 6MHz (4.2MHz video), 29.97 frames/second PAL - 6-8MHz (4.2-6MHz video), 50 frames/second
Componente Vídeo com separação (luma, chroma) - svhs, Hi8mm RGB, YUV, YIQ, … YCBCR – usado na maior parte de representações
comprimidas
Vídeo com separação chamado “s-video”
23Parte 2
Representações analógicas de vídeo
NTSC Y = 0.299R + 0.587G + 0.114B I = 0.596R - 0.275G - 0.321B Q = 0.212R - 0.523G + 0.311B composite = Y + Icos(Fsc t) + Qsin(Fsc t)
PAL Y = 0.299R + 0.587G + 0.114B U = 0.492(B-Y) Q = 0.877(R-Y) composite = Y + Usin(Fsc t) + Vcos(Fsc t)
24Parte 2
Digitalização TV analógica é um sinal contínuo TV digital utiliza valores numéricos
discretos O sinal é amostrado As amostras são quantizadas Pequenas regiões discretas são digitalizadas
A imagem é representada por um array 2-dimensional de pixéis
25Parte 2
Tamanhos da imagem
QSIF(19Kp)
SIF (82Kp)
601 (300Kp)
SVGA (500Kp)
ATV (1Mp)
Workstation (1Mp)
HDTV (2Mp)
120
240
483
600
720
900
1080
160 352 720 800 1152 1280 1920
26Parte 2
Imagens de estações de trabalho
[1 Mega Pixel] 1152 x 900 = 1,036,800 pixels
[xvga] 1024 x 768 = 786,432 pixels
[?] 1280 x 1024 = 1,310,720 pixels
27Parte 2
Representações de vídeo digital
Digital Composite Video(D2/D3,SMPTE 244M) 142 Mb/s data rate, em paralelo ou em série Sinais de cor sub-amostrados 4:2:2
• Digital Component Video(D1/D5,SMPTE RP125)
Mantém sinais separados para luma e chroma 270 Mb/s data rate, em paralelo ou em série Sinais de cor sub-amostrados 4:2:2
• Compressed Digital Video MPEG, MJPEG, H.26x, DV, …
28Parte 2
Sub-amostragem cromática digital (estrutura de blocos)
29Parte 2
O que é video data rate? Digital
720x483 = 347,760 pixels/frame A amostragem 4:2:2 dá 695,520 bytes/frame 21 MB/sec (167 Mbs) A amostragem 4:4:4 dá 250 Mbs
ATV (MPEG MP@ML) 1280x720 = 921,600 pixels/frame A amostragem 4:2:0 dá 1,382,400 bytes/frame 41 MB/sec (328 Mbs)
(Nota: MPEG coded streams are 1.5-80 Mbs)
30Parte 2
O que é video data rate? (cont.)
ATSC (720P) 720x1280 = 921,600 pixels/frame A amostragem 4:2:2 = 1,843,200 bytes/frame 24 fps = 44,236,800 bytes per second 44 MB/s = 354 Mbs
ATSC (studio 1080I) 1080x1920 = 2,073,600 pixels/frame A amostragem 4:4:4 = 6,220,800 bytes/frame 30 fps = 186,624,000 bytes/second 187MB/s = 1.5 Gbs
31Parte 2
Taxa de dados vídeo digital em série
Vídeo digital em série é uma norma de transporte de vídeo Largamente usada em estúdios de produção e
de emissão/difusão Taxas de dados
NTSC SDI aproximadamente 200 Mbs ATSC SDI aproximadamente 1.5 Gbs
Routing Switcher Recorde-se que um recurso típico em redes de
computadores é um 256x256 routing switcher Qual é a taxa de dados através do switch?
32Parte 2
Percepção humana Movimento suave
Depende do material em movimento Grande parte da acção é percebida a níveis suaves
de 24 fps Seres humanos muito sensíveis a
Baixas frequências Mudanças na luminância e no sub-espectro azul-
laranja Visão dá realce à detecção de arestas
Forte propensão para as linhas horizontais e verticais Mascaramento visual face a grandes alterações
de luminância
33Parte 2
Produção de vídeo de alta qualidade
É necessária câmera de alta qualidade S-Video(SVHS, Hi8mm) melhor que vídeo composto 3 chips melhor que 1 chip Digital melhor que analógico
Luzes, luzes, luzes … Experimente produzir vídeo com filtros para alterar as
cores
Construa cenas a partir de ângulos diferentes para criar estimulação visual
Estude técnicas de filme/vídeo Deixe a pessoa sair de cena sem mover a câmera Mantenha a orientação correcta das imagens Mude de cena para reflectir a mudança temporal
34Parte 2
Conclusões NTSC/PAL foram excelentes normas que
duraram cerca de 50 anos A tecnologia mudou duma forma completa durante
este espaço de tempo A revolução digital está a mudar a indústria
O impacto principal está no desenvolvimento da norma ATSC
A revolução Internet está também a mudar a indústria Webcasting versus emissão/difusão para o mercado
de massas Wireless versus cable versus transmissão de
pacotes FIM
top related