codificação de informação - orium.pworium.pw/univ/lei/ci/slides/c6-26out2010.pdf · sistemas...
TRANSCRIPT
10/27/10
1
CodificaçãodeInformação
Sumário:• Codificaçãodesom• PCM(PulseCodeModula?on)• “PerceptualCoding”• MIDI(MusicalInstrumentsDigitalInterface
26/10/09 1
Oqueéosom?
• Soméumaondadepressãoquea?ngeosistemaaudi?vohumano,éumvalorconPnuo(analógico)
• Disposi?voscomoosmicrofones,convertemapressãonumatensãoeléctrica
• Éprecisoconverterestesinalparaumasequênciadenúmeros(inteirosdepreferência)
• Aconversãoanalógico‐digitalfaz‐seamostrandoperiodicamenteosinal(namostrasporsegundo)
26/10/09 2
10/27/10
2
LimitaçãodaaudiçãoHumana• Métodosdecodificaçãodeaudio,têmematençãoaslimitaçõesdoouvidohumano:– Comportamentonãolinear– Limiaradapta?vodeaudição
26/10/09 3
Tipodeonda Fontedeemissão Gamadefreq. Efeitos
Ondasinfra‐sónicas
Trovoadas,motoresdosveículos,foguetes
<16Hz Náuseas,apreensão
Somaudível Qualquerfontesonoraaudível
16Hz–20KHz Dependedaamplitude
Ondasultra‐sónicas
Controlosremotos,sistemasdealarme
>20KHz Perigosasumavezquearespec?vaamplituderealnãoéaudível
deciBels(dB)Intensidadedosom
• Aintensidadedeumsommede‐seemdBs,emrelaçãoaumsomdereferência20*log10(Amplitude_Sinal_S/Amplitude_Sinal_Referencia_R)
• OsinaldereferênciaRcorrespondeaumsomde1KHznolimiardeaudição
• Éumaescalalogaritmica:umsomcom40dBsé10vezesmaisfortedoqueumcom20dBs
26/10/09 4
10/27/10
3
Intensidadedosom(exemplo)
• A=86dB,ousejaadiferençaentreAesinaldereferênciaéde86dB
• Aé20000superioràpressãodereferênciaB
diferença=20log10A/B=86
log10A/B=4.3
A/B=104.3
A/B~20000
26/10/09 5
Intensidadedosom
26/10/09
160DanosnosPmpanos
140Limiardador
120Limiardodesconforto
100Martelopneumá?co
90Comboionumaestação
80Rádiocomvolumealto
60Conversa
20Salasilenciosa
0Limiardeaudição
dB
6
10/27/10
4
Conversãoanalógico‐digital• SinaisanalógicossãofunçõesconPnuasnotempo,sãodefinidosparaqualquerinstantedetempo.Aamplitudedefine‐separaqualquervalordotempo
• Sinaldigitaléumasequênciadevalorescodificadosemformatobináriodependentesdotempooudoespaço,queresultadatransformaçãodeumsinalanalógico.Sãodiscretosemamplitudeenotempo.
• Digitalizaçãoprocessoquepermiteobtersequênciasbináriasatravésdosinalanalógiconumsinaldigital
26/10/09 7
Conversãoanalógico‐digital
• Digitalização–processopeloqualsetransformaumsinalanalógiconumsinaldigital
• Digitalizaçãoéefectuadaatravésdamediçãodovalordatensãodosinalemváriospontosaolongodotempo,sendoatraduçãodamediçãodavoltagemumvalornumérico(sampling)
• Odisposi?vou?lizadoparao“sampling”édenominadodeconversoranalógico‐digital(A/D)
26/10/09 8
10/27/10
5
Ritmodeamostragem Amostrarumaondasinusoidal
26/10/09
Seamostrarmosaumritmoigualàfrequênciadosinalpodemosobterumvalorconstante
Seamostrarmosaumritmoqueé1.5vezesafrequênciadosinalpodemospensarquesetratadeumasinusóidedefrequênciainferior
9
TeoremadeNyquist
• Paraconseguirmosrecuperarosinalcomfidelidadetemosdeamostraraumritmoduasvezessuperioràmáximafrequênciaexistentenosinal
• OutraformadeenunciaroteoremadeNyquist:Oreceptorpodereconstruirumsinalemqueamáximafrequênciaéfdesdequeosinaltenhasidoamostradoaumritmoigualousuperiora2f
26/10/09 10
10/27/10
6
TeoremadeNyquist
• Exemplo:
Umsinaldevozqueestálimitadoa4KHz,sónecessitadeseramostrado8000vezes/segundo
frequênciadeamostragemfa=8KHz (i.e.períododeamostrageméde1/8000=125microsegundos
26/10/09
Inte
nsid
ade
do s
om
0 Fs/2 Fs
Ritmo de amostragem
11
PAM–PulseAmplitudeModula?onPCM–PulseCodeModula?on
• PAM:cadaamostraAcorrespondeaumdadovalorconPnuo(entre0eumvalormáximo)
• PCM:cadaamostraAécodificadaemNbits,ousejaexistem2nníveisdiferentes
26/10/09 12
10/27/10
7
PCM–PulseCodeModula?on
• PCMpossui2fases:– AMOSTRAGEM(discre?zação),retençãodeumconjuntofinitodevaloresassumidopelosinalanalógico.Aretençãorealiza‐seaintervalosdetemporegulares.
– QUANTIFICAÇÃO,processopeloqualosinalamostradoéconver?donosinalquan?ficado.Estesinalassumeapenasumdeterminadonúmerodevalores.Sinalquan?ficadopodesercodificadoembinário.
26/10/09 13
ExemplosdeusodePCM
• CDs– Frequênciadeamostragem44.1KHz– 16bitsporamostra,linear– Bitrate44.1x16x2bits/s>1Mbps
26/10/09
• Redetelefónica• 8000amostras/s• 8bitsporamostra,
nãolinear• 64Kbps
14
10/27/10
8
Quan?ficação• Processodeconversãodeumsinalamostradonoutrosinalqueapenaspodeassumirumnúmerolimitadodevalores(SinalQuan?ficado)
• Objec?vo–restringironúmerodevaloresqueosinaldigitalpoderátomar,demodoareduziroespaçodearmazenamentoembytesqueosinaldigitalocupará
26/10/09 15
Quan?ficaçãoLinear• Sobreumagamadeamplitudesdesinaisamostrados,sãodefinidostantosintervalosquantoonúmerodevaloresqueseirádispôrparaquan?ficarasamostras
stepsize=amplitudemáx/nºintervalos
• Aquan?ficaçãodosinalcorrespondeasubs?tuirosvaloresdasamostraspeloníveldequan?ficaçãocorrespondentesemprequeamostrasesituanointervalocorrespondente
• Aumentodonºdeníveisdequan?ficaçãolevaaumaumentodonºdebitsqueseu?lizapararepresentarcadaamostra
26/10/09 16
10/27/10
9
Ruídoeruídodequan?ficação• Emqualquersinalanalógico,flutuaçõesaleatórias(ruído)somam‐seaosinal.• Quantomaioréarelaçãoentreosinaleoruídomelhoraqualidadedosinal• Arelaçãosinalruído(SNR)mede‐setambémemdeciBels(dB)
– SNR=20*log10(Amplitude_Sinal/AmplitudeRuído)• Cadaamostraéquan?ficadadeformaarepresentaruminteiro.Onúmerodebits usadopararepresentarcadaamostradáonúmerodeníveisdequan?ficação
Tensão(emvolt)
1.0
0.0
0.5
0.75
0.25
0.125(Vmax‐Vmin)/nºdeníveis
000
111110
101100
011010
001
Todososvaloresentre0.000e0.125sãocodificadoscomo000.Háumerroqueemmédiaé(0.125*0.5)–RuídoouErrodequan;ficação
26/10/09 17
Ruídodequan?ficação
• Oerroentreosinalquan?ficadoeoáudiooriginaléoruídodequan?ficação
• Oruídodequan?ficaçãousandon‐bitsporamostrapodeseres?madoem:– 2n‐1a‐2n‐1– Ruídodequan?ficaçãocorrespondea½nível– Relaçãosinalruído(SNR)=20*log10(2n‐1/(1/2))=20*N*log102
~6.02*NdB– Umbitdequan?ficaçãocorrespondea:20*log102~6dBs
• AudioCDusa16bitsderesoluçãooquedáumarelaçãoSNRde~96dB
• Paraouviroruídodequan?ficação,oníveldesinalteriadeestarpertodolimiardador!
26/10/09 18
10/27/10
10
QualidadedeaudiovsRitmodedados
26/10/09
0‐96000(max)1200(max)24(max)Até6
192KHz(max)
DVDaudio
5‐20000192162canais
48KHzDAT
5‐20000176.4162canais
44.1KHzCD
20‐1100088.2162canais
22.05KHzRádioFM
100‐550011811.025KHzRádioAM
200‐3400888KHzTelefone
Frequênciasreproduzidas(Hz)
Ritmodedadosnãocomprimido(KByte/s)
Bitsporamostra
Ritmodeamostragem
19
Codificaçãodigitaldeaudio
PCM– Codificaçãodiferencialdasamostras
– Codificaçãocomprevisão:prevê‐sequeaamostraéigualàanterioreapenassecodificaadiferençaDPCM(DifferencialPulseCodeModula?on)
26/10/09 20
10/27/10
11
Codificaçãoemsub‐bandas
Oouvidoémaissensívelaalgumasfrequênciasdoqueaoutras Muitosalgoritmosdecodificaçãodeáudioexploramestapropriedade
dividindooespectrodosomem“sub‐bandas”(análisedeFourier)
26/10/09
Amostragem Filtros
Áudio in
÷
÷
÷
Quantificação
Áudio codif. out
Multiplex
Bit rates: 16x48000 =768 kbps
16x3x48000 =2304 kbps
16x3x16000 =768 kbps
4x3x16000 =192 kbps
21
“PerceptualCoding”
• Questãofundamentalnodesenhodocodificadordeumasub‐banda:– Quaisdevemserosníveisdequan?ficaçãodassub‐bandas?
• Oprocessodequan?ficaçãointroduzruídoeesseruídodeveserimprecepPvel
• Oruídodeveestarabaixodolimiardoqueéouvido(MinimumAudibleField‐MAF)
• Portantoaquestãoé:– QualéoMAFemcadasub‐banda?
• Paraestaes?ma?va,sãousadasascurvasdeRobinson‐Dadson…
26/10/09 22
10/27/10
12
CurvasdeIgualIntensidade(EqualLoudnessCurves)
26/10/09 23
ImplicaçõesdaQuan?ficação
26/10/09
Soun
d Pr
essu
re L
evel
[dB
-SPL
]
80
70
60
50
40
30
20
10
0
-10
-20
-30
5000 10000 15000
Peak Signal Level
Threshold of Hearing
24
10/27/10
13
Aplicaçãoàcodificaçãoem“sub‐banda”
26/10/09
Peak Signal Level
Threshold of Hearing
9 bits
9 bits
10 bits
10 bits
10 bits
9 bits
10 bits
11 bits
12 bits
11 bits
12 bits
12 bits
Soun
d Pr
essu
re L
evel
[dB
-SPL
]
80
70
60
50
40
30
20
10
0
-10
-20
-30
5000 10000 15000
25
Psico‐acús?ca
• Melhoriassubstânciaisaocodificadordesub‐bandapodemserconseguidosu?lizandopsico‐acús?ca
• Apsico‐acús?caestudaaformacomoosomérecebidopelacombinaçãoouvido‐cérebro
• Olimiardeaudiçãonãoéconstante
• MAFmudapermanentementedevidoaomascaramento(masking)
26/10/09 26
10/27/10
14
Mascaramento
• Napresençadesinal,oruídoéquaseindetectável
• Devidoàanatomiadoouvido,sonsfortesmascaram(escondem)sonsmaisfracosnasfrequênciaspróximas
• OMAF(limiardeaudição)éelevadopelolimiardemascaramento(maskingthreshold)
• Olimiardemascaramentopodeseres?madousandoomodelopsico‐acús?coeissopodeserexploradopelocodificador.
26/10/09 27
Limiardemascaramento
26/10/09
Soun
d Pr
essu
re L
evel
[dB
-SPL
]
80
70
60
50
40
30
20
10
0
-10
-20
-30
5000 10000 15000
Frequency [Hz]
Threshold of Hearing
Masking threshold
Signal
28
10/27/10
15
Limiardemascaramento
• Sinalcomfrequênciade1KHzfazsubirolimiardeaudibilidadeabruptamentealterandoacurvadolimiardeaudibilidadenagamadefrequênciaentre500Hze5KHz
• Somquesesituadentrodestagamadefrequênciaequeseriaaudívelemcondiçõesnormaisdeixadeseconseguirouvirsearespec?vaintensidadeforinferioràcurvademascaramento
26/10/09 29
Mascaramento
26/10/09 30
10/27/10
16
Aplicaçãomascaramento
26/10/09
Soun
d Pr
essu
re L
evel
[dB
-SPL
]
2 bits
4 bits
4 bits 4
bits 3
bits 2
bits
4 bits
4 bits
5 bits
5 bits
5 bits 5
bits
Soun
d Pr
essu
re L
evel
[dB
-SPL
]
80
70
60
50
40
30
20
10
0
-10
-20
-30
5000 10000 15000
Frequency [Hz]
Threshold of Hearing
Bits por amostra em média = 3.92 Taxa de compressão = 16:3.92 = 4.1:1
Masking threshold
31
Aplicaçãomascaramento
26/10/09 32
Banda 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
dBs 0 8 12 10 6 2 10 60 35 20 15 2 3 5 3 1
• 8banda=60dBs,modelopsicoacús?comáscarade12dBsparabanda7(anterior)ede15paraa8(seguinte)
• 7banda=10dBs<12dBs,codificadorpodeignorarocoeficientedabanda7,jáqueficatotalmentemascarado
• 9banda=35dBs>15dBs,codificadorvaicodificarestabandacomo35‐15=20dBs(Signal‐to‐MaskRa?o),necessitandode4bits
10/27/10
17
Informaçãoadicional
• Osinaldeáudioéprocessadoemconjuntosdeamostraschamadasaudioframes
• Cadaframedecadasub‐bandaestá:– Mul?plicadaporumfactorparanormalizaroníveldepicodosinal
– Quan?ficadaparaonívelapropriadoàrelaçãosinal‐ruídocorrente
• Oreceptortemdesaberofactordeescalaeoníveldequan?ficaçãousado
• Estainformaçãoestáembebidanasframes• Ogastoadicional(overhead)émuitopequenoquandocomparadocomosganhosob?dospelacompressão
26/10/09 33
Diagramadeblocos
26/10/09
Sub-band filter bank
Scale and Quantise Multiplex
and Data Format Code Side
Info FFT
Psycho-acoustic model
Digital Audio In Coded
Audio Out Masking
thresholds
CODIFICADOR
De-Multiplex
Descale & Dequantise
Inverse filter bank
Decode Side Info
DESCODIFICADOR
Digital Audio Out Coded
Audio In
34
10/27/10
18
CodificaçãodosomnanormaMPEG
• OcomitéMPEG(Mo?onPictureExpertGroup)definenormasparaacodificaçãodeinformaçãomul?média:imagememmovimento,som,outrainformação
• Definidasumasériedenormas;napartedosomsãousadasastécnicasdecompressãodescritasatrás
• AnormaMPEG1definetrêssubnormasparaacodificaçãodosom:camadas(layers)1,2e3
26/10/09 35
MPEG1–codificaçãodosom(1)
Layer1(.mp1)Sãousadas32sub‐bandas
Cadaframecontém384amostras(32x12)Umaversãodalayer1foiusadaDigitalCompactCasse�e(DCC)
26/10/09 36
10/27/10
19
MPEG1–codificaçãodosom(2)
Layer2(.mp2)Umpoucomaiscomplexamasmelhorqualidadequealayer1
Comprimentodaframeéde1152amostras(36x36)
Formatodasamostraseinformaçãoassociada(factordeescalaeSNR)codificadodeformamaiseficiente
UsandoemDigitalAudioBroadcas?ng(DAB)
26/10/09 37
MPEG1–codificaçãodosom(3)
Layer3(.mp3)Substancialmentemaiscomplexadoqueaslayers1e2Conseguequalidadeaceitávelmesmoa“bitrates”muitobaixos
Usa576bandasdefrequência.
Algoritmosusadosparacodificarcadasub‐bandamaissofis?cados
CodificaçãodeHuffmanaplicadaàsamostras
FicheirosMP3muitopopulares…
26/10/09 38
10/27/10
20
Outros“PerceptualCoders”
Osmesmosprincípiossãoaplicadosnoutroscodificadoresdeaudiodeusogeral
Exemplos:
RealAudio
FormatoWMAdaMicroso�
MiniDisc(ATRAC)
26/10/09 39
NormaMIDI
• MIDI(MusicalInstrumentsDigitalInterface),protocolodecomunicaçãoquepermiteacomunicaçãoentreinstrumentosmusicais(decadade80)
• Nãoéummétododecompressãodeáudio,massimumaformaderepresentarsimbolicamenteconteúdosmusicaisquepodemposterirmentedarorigemaáudiodigitalquandosisnte?zados
• FoiintroduzidonapartedacodificaçãoáudiodanormaMPEG‐4
26/10/09 40
10/27/10
21
VantagensdoprotocoloMIDI• Espaçodearmazenamentoconsumido.FicheirosMIDInãocontêmamostrasdeáudiomasapenasasinstruçõesnecessáriasparapermi?remaosinte?zadorgerarereproduzirossonspretendidos
• Menordimensãodosficheirosconduzaumamenorlarguradebandaparaatransmissãodedados
• Facilidadedeediçãodemúsicaepossibilidadedealteraçãodavelocidadedereproduçãodeumatonalidade(pitch)deumanotadeformaindependente
26/10/09 41
TransmissãoMIDI
• Fluxodedadosassíncronounidireccional• Débitobináriode31.25Kbits/s• 10bitsporcadabytedeinformaçãotransmi?do(1startbit;8databits;1stopbit)
• InterfaceMIDIpossui3portasMIDI:IN,OUTeTHRU
• 16canaislógicos,quepodemserassociadocadaumauminstrumentodiferente
26/10/09 42
10/27/10
22
MensagensMIDI
• Estruturadeumamensagem– Statusbyteeummáximode2bytesdados
• Statusbyte– Obitmaissignifica?voé1– 4bitsdemenorpesoiden?ficamocanalaquesedes?na(16canaispossíveis)
– Restantes3bitsiden?ficamamensagem
• Obitmaissignifica?vodedadosésempre0
26/10/09 43
TiposdeMensagens
26/10/09 44
MensagensMidi
MensagensChannel
MensagensSystem
MensagensVoice
MensagensMode
MensagensCommon
MensagensReal‐Time
MensagensExclusive
10/27/10
23
Tiposdemensagens(2)• ChannelVoicemessages
• ChannelModemessages
26/10/09 45
• Systemmessages
26/10/09 46
Tiposdemensagens(3)
10/27/10
24
Exemplo
• Exemplodapressãododócentral(noteon) 90 3C 40 • Exemplodesoltarodócentral(noteoff)
80 3C 33 • RunningStatus– 92 3C 44 92 40 40 92 43 3E 92 3C 44 40 40 43 3E – 92 3C 44 82 3C 40 92 3C 44 3C 00
26/10/09 47