codificação de informação - orium.pworium.pw/univ/lei/ci/slides/c6-26out2010.pdf · sistemas...

24
10/27/10 1 Codificação de Informação Sumário: Codificação de som PCM (Pulse Code Modula?on) “Perceptual Coding” MIDI (Musical Instruments Digital Interface 26/10/09 1 O que é o som? Som é uma onda de pressão que a?nge o sistema audi?vo humano, é um valor conPnuo (analógico) Disposi?vos como os microfones, convertem a pressão numa tensão eléctrica É preciso converter este sinal para uma sequência de números (inteiros de preferência) A conversão analógico‐digital faz‐se amostrando periodicamente o sinal (n amostras por segundo) 26/10/09 2

Upload: doduong

Post on 19-Sep-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Codificação de Informação - orium.pworium.pw/univ/lei/ci/slides/C6-26Out2010.pdf · sistemas de alarme ... analógico. São discretos em amplitude e no tempo

10/27/10

1

CodificaçãodeInformação

Sumário:• Codificaçãodesom• PCM(PulseCodeModula?on)• “PerceptualCoding”• MIDI(MusicalInstrumentsDigitalInterface

26/10/09 1

Oqueéosom?

•  Soméumaondadepressãoquea?ngeosistemaaudi?vohumano,éumvalorconPnuo(analógico)

•  Disposi?voscomoosmicrofones,convertemapressãonumatensãoeléctrica

•  Éprecisoconverterestesinalparaumasequênciadenúmeros(inteirosdepreferência)

•  Aconversãoanalógico‐digitalfaz‐seamostrandoperiodicamenteosinal(namostrasporsegundo)

26/10/09 2

Page 2: Codificação de Informação - orium.pworium.pw/univ/lei/ci/slides/C6-26Out2010.pdf · sistemas de alarme ... analógico. São discretos em amplitude e no tempo

10/27/10

2

LimitaçãodaaudiçãoHumana• Métodosdecodificaçãodeaudio,têmematençãoaslimitaçõesdoouvidohumano:– Comportamentonãolinear– Limiaradapta?vodeaudição

26/10/09 3

Tipodeonda Fontedeemissão Gamadefreq. Efeitos

Ondasinfra‐sónicas

Trovoadas,motoresdosveículos,foguetes

<16Hz Náuseas,apreensão

Somaudível Qualquerfontesonoraaudível

16Hz–20KHz Dependedaamplitude

Ondasultra‐sónicas

Controlosremotos,sistemasdealarme

>20KHz Perigosasumavezquearespec?vaamplituderealnãoéaudível

deciBels(dB)Intensidadedosom

•  Aintensidadedeumsommede‐seemdBs,emrelaçãoaumsomdereferência20*log10(Amplitude_Sinal_S/Amplitude_Sinal_Referencia_R)

•  OsinaldereferênciaRcorrespondeaumsomde1KHznolimiardeaudição

•  Éumaescalalogaritmica:umsomcom40dBsé10vezesmaisfortedoqueumcom20dBs

26/10/09 4

Page 3: Codificação de Informação - orium.pworium.pw/univ/lei/ci/slides/C6-26Out2010.pdf · sistemas de alarme ... analógico. São discretos em amplitude e no tempo

10/27/10

3

Intensidadedosom(exemplo)

•  A=86dB,ousejaadiferençaentreAesinaldereferênciaéde86dB

•  Aé20000superioràpressãodereferênciaB

diferença=20log10A/B=86

log10A/B=4.3

A/B=104.3

A/B~20000

26/10/09 5

Intensidadedosom

26/10/09

160DanosnosPmpanos

140Limiardador

120Limiardodesconforto

100Martelopneumá?co

90Comboionumaestação

80Rádiocomvolumealto

60Conversa

20Salasilenciosa

0Limiardeaudição

dB

6

Page 4: Codificação de Informação - orium.pworium.pw/univ/lei/ci/slides/C6-26Out2010.pdf · sistemas de alarme ... analógico. São discretos em amplitude e no tempo

10/27/10

4

Conversãoanalógico‐digital•  SinaisanalógicossãofunçõesconPnuasnotempo,sãodefinidosparaqualquerinstantedetempo.Aamplitudedefine‐separaqualquervalordotempo

•  Sinaldigitaléumasequênciadevalorescodificadosemformatobináriodependentesdotempooudoespaço,queresultadatransformaçãodeumsinalanalógico.Sãodiscretosemamplitudeenotempo.

•  Digitalizaçãoprocessoquepermiteobtersequênciasbináriasatravésdosinalanalógiconumsinaldigital

26/10/09 7

Conversãoanalógico‐digital

•  Digitalização–processopeloqualsetransformaumsinalanalógiconumsinaldigital

•  Digitalizaçãoéefectuadaatravésdamediçãodovalordatensãodosinalemváriospontosaolongodotempo,sendoatraduçãodamediçãodavoltagemumvalornumérico(sampling)

•  Odisposi?vou?lizadoparao“sampling”édenominadodeconversoranalógico‐digital(A/D)

26/10/09 8

Page 5: Codificação de Informação - orium.pworium.pw/univ/lei/ci/slides/C6-26Out2010.pdf · sistemas de alarme ... analógico. São discretos em amplitude e no tempo

10/27/10

5

Ritmodeamostragem Amostrarumaondasinusoidal

26/10/09

Seamostrarmosaumritmoigualàfrequênciadosinalpodemosobterumvalorconstante

Seamostrarmosaumritmoqueé1.5vezesafrequênciadosinalpodemospensarquesetratadeumasinusóidedefrequênciainferior

9

TeoremadeNyquist

•  Paraconseguirmosrecuperarosinalcomfidelidadetemosdeamostraraumritmoduasvezessuperioràmáximafrequênciaexistentenosinal

•  OutraformadeenunciaroteoremadeNyquist:Oreceptorpodereconstruirumsinalemqueamáximafrequênciaéfdesdequeosinaltenhasidoamostradoaumritmoigualousuperiora2f

26/10/09 10

Page 6: Codificação de Informação - orium.pworium.pw/univ/lei/ci/slides/C6-26Out2010.pdf · sistemas de alarme ... analógico. São discretos em amplitude e no tempo

10/27/10

6

TeoremadeNyquist

•  Exemplo:

Umsinaldevozqueestálimitadoa4KHz,sónecessitadeseramostrado8000vezes/segundo

frequênciadeamostragemfa=8KHz (i.e.períododeamostrageméde1/8000=125microsegundos

26/10/09

Inte

nsid

ade

do s

om

0 Fs/2 Fs

Ritmo de amostragem

11

PAM–PulseAmplitudeModula?onPCM–PulseCodeModula?on

•  PAM:cadaamostraAcorrespondeaumdadovalorconPnuo(entre0eumvalormáximo)

•  PCM:cadaamostraAécodificadaemNbits,ousejaexistem2nníveisdiferentes

26/10/09 12

Page 7: Codificação de Informação - orium.pworium.pw/univ/lei/ci/slides/C6-26Out2010.pdf · sistemas de alarme ... analógico. São discretos em amplitude e no tempo

10/27/10

7

PCM–PulseCodeModula?on

•  PCMpossui2fases:– AMOSTRAGEM(discre?zação),retençãodeumconjuntofinitodevaloresassumidopelosinalanalógico.Aretençãorealiza‐seaintervalosdetemporegulares.

– QUANTIFICAÇÃO,processopeloqualosinalamostradoéconver?donosinalquan?ficado.Estesinalassumeapenasumdeterminadonúmerodevalores.Sinalquan?ficadopodesercodificadoembinário.

26/10/09 13

ExemplosdeusodePCM

•  CDs– Frequênciadeamostragem44.1KHz– 16bitsporamostra,linear– Bitrate44.1x16x2bits/s>1Mbps

26/10/09

•  Redetelefónica•  8000amostras/s•  8bitsporamostra,

nãolinear•  64Kbps

14

Page 8: Codificação de Informação - orium.pworium.pw/univ/lei/ci/slides/C6-26Out2010.pdf · sistemas de alarme ... analógico. São discretos em amplitude e no tempo

10/27/10

8

Quan?ficação•  Processodeconversãodeumsinalamostradonoutrosinalqueapenaspodeassumirumnúmerolimitadodevalores(SinalQuan?ficado)

•  Objec?vo–restringironúmerodevaloresqueosinaldigitalpoderátomar,demodoareduziroespaçodearmazenamentoembytesqueosinaldigitalocupará

26/10/09 15

Quan?ficaçãoLinear•  Sobreumagamadeamplitudesdesinaisamostrados,sãodefinidostantosintervalosquantoonúmerodevaloresqueseirádispôrparaquan?ficarasamostras

stepsize=amplitudemáx/nºintervalos

•  Aquan?ficaçãodosinalcorrespondeasubs?tuirosvaloresdasamostraspeloníveldequan?ficaçãocorrespondentesemprequeamostrasesituanointervalocorrespondente

•  Aumentodonºdeníveisdequan?ficaçãolevaaumaumentodonºdebitsqueseu?lizapararepresentarcadaamostra

26/10/09 16

Page 9: Codificação de Informação - orium.pworium.pw/univ/lei/ci/slides/C6-26Out2010.pdf · sistemas de alarme ... analógico. São discretos em amplitude e no tempo

10/27/10

9

Ruídoeruídodequan?ficação•  Emqualquersinalanalógico,flutuaçõesaleatórias(ruído)somam‐seaosinal.•  Quantomaioréarelaçãoentreosinaleoruídomelhoraqualidadedosinal•  Arelaçãosinalruído(SNR)mede‐setambémemdeciBels(dB)

–  SNR=20*log10(Amplitude_Sinal/AmplitudeRuído)•  Cadaamostraéquan?ficadadeformaarepresentaruminteiro.Onúmerodebits usadopararepresentarcadaamostradáonúmerodeníveisdequan?ficação

Tensão(emvolt)

1.0

0.0

0.5

0.75

0.25

0.125(Vmax‐Vmin)/nºdeníveis

000

111110

101100

011010

001

Todososvaloresentre0.000e0.125sãocodificadoscomo000.Háumerroqueemmédiaé(0.125*0.5)–RuídoouErrodequan;ficação

26/10/09 17

Ruídodequan?ficação

•  Oerroentreosinalquan?ficadoeoáudiooriginaléoruídodequan?ficação

•  Oruídodequan?ficaçãousandon‐bitsporamostrapodeseres?madoem:–  2n‐1a‐2n‐1–  Ruídodequan?ficaçãocorrespondea½nível–  Relaçãosinalruído(SNR)=20*log10(2n‐1/(1/2))=20*N*log102

~6.02*NdB– Umbitdequan?ficaçãocorrespondea:20*log102~6dBs

•  AudioCDusa16bitsderesoluçãooquedáumarelaçãoSNRde~96dB

•  Paraouviroruídodequan?ficação,oníveldesinalteriadeestarpertodolimiardador!

26/10/09 18

Page 10: Codificação de Informação - orium.pworium.pw/univ/lei/ci/slides/C6-26Out2010.pdf · sistemas de alarme ... analógico. São discretos em amplitude e no tempo

10/27/10

10

QualidadedeaudiovsRitmodedados

26/10/09

0‐96000(max)1200(max)24(max)Até6

192KHz(max)

DVDaudio

5‐20000192162canais

48KHzDAT

5‐20000176.4162canais

44.1KHzCD

20‐1100088.2162canais

22.05KHzRádioFM

100‐550011811.025KHzRádioAM

200‐3400888KHzTelefone

Frequênciasreproduzidas(Hz)

Ritmodedadosnãocomprimido(KByte/s)

Bitsporamostra

Ritmodeamostragem

19

Codificaçãodigitaldeaudio

PCM– Codificaçãodiferencialdasamostras

– Codificaçãocomprevisão:prevê‐sequeaamostraéigualàanterioreapenassecodificaadiferençaDPCM(DifferencialPulseCodeModula?on)

26/10/09 20

Page 11: Codificação de Informação - orium.pworium.pw/univ/lei/ci/slides/C6-26Out2010.pdf · sistemas de alarme ... analógico. São discretos em amplitude e no tempo

10/27/10

11

Codificaçãoemsub‐bandas

Oouvidoémaissensívelaalgumasfrequênciasdoqueaoutras Muitosalgoritmosdecodificaçãodeáudioexploramestapropriedade

dividindooespectrodosomem“sub‐bandas”(análisedeFourier)

26/10/09

Amostragem Filtros

Áudio in

÷

÷

÷

Quantificação

Áudio codif. out

Multiplex

Bit rates: 16x48000 =768 kbps

16x3x48000 =2304 kbps

16x3x16000 =768 kbps

4x3x16000 =192 kbps

21

“PerceptualCoding”

•  Questãofundamentalnodesenhodocodificadordeumasub‐banda:– Quaisdevemserosníveisdequan?ficaçãodassub‐bandas?

•  Oprocessodequan?ficaçãointroduzruídoeesseruídodeveserimprecepPvel

•  Oruídodeveestarabaixodolimiardoqueéouvido(MinimumAudibleField‐MAF)

•  Portantoaquestãoé:– QualéoMAFemcadasub‐banda?

•  Paraestaes?ma?va,sãousadasascurvasdeRobinson‐Dadson…

26/10/09 22

Page 12: Codificação de Informação - orium.pworium.pw/univ/lei/ci/slides/C6-26Out2010.pdf · sistemas de alarme ... analógico. São discretos em amplitude e no tempo

10/27/10

12

CurvasdeIgualIntensidade(EqualLoudnessCurves)

26/10/09 23

ImplicaçõesdaQuan?ficação

26/10/09

Soun

d Pr

essu

re L

evel

[dB

-SPL

]

80

70

60

50

40

30

20

10

0

-10

-20

-30

5000 10000 15000

Peak Signal Level

Threshold of Hearing

24

Page 13: Codificação de Informação - orium.pworium.pw/univ/lei/ci/slides/C6-26Out2010.pdf · sistemas de alarme ... analógico. São discretos em amplitude e no tempo

10/27/10

13

Aplicaçãoàcodificaçãoem“sub‐banda”

26/10/09

Peak Signal Level

Threshold of Hearing

9 bits

9 bits

10 bits

10 bits

10 bits

9 bits

10 bits

11 bits

12 bits

11 bits

12 bits

12 bits

Soun

d Pr

essu

re L

evel

[dB

-SPL

]

80

70

60

50

40

30

20

10

0

-10

-20

-30

5000 10000 15000

25

Psico‐acús?ca

• Melhoriassubstânciaisaocodificadordesub‐bandapodemserconseguidosu?lizandopsico‐acús?ca

•  Apsico‐acús?caestudaaformacomoosomérecebidopelacombinaçãoouvido‐cérebro

•  Olimiardeaudiçãonãoéconstante

• MAFmudapermanentementedevidoaomascaramento(masking)

26/10/09 26

Page 14: Codificação de Informação - orium.pworium.pw/univ/lei/ci/slides/C6-26Out2010.pdf · sistemas de alarme ... analógico. São discretos em amplitude e no tempo

10/27/10

14

Mascaramento

•  Napresençadesinal,oruídoéquaseindetectável

•  Devidoàanatomiadoouvido,sonsfortesmascaram(escondem)sonsmaisfracosnasfrequênciaspróximas

•  OMAF(limiardeaudição)éelevadopelolimiardemascaramento(maskingthreshold)

•  Olimiardemascaramentopodeseres?madousandoomodelopsico‐acús?coeissopodeserexploradopelocodificador.

26/10/09 27

Limiardemascaramento

26/10/09

Soun

d Pr

essu

re L

evel

[dB

-SPL

]

80

70

60

50

40

30

20

10

0

-10

-20

-30

5000 10000 15000

Frequency [Hz]

Threshold of Hearing

Masking threshold

Signal

28

Page 15: Codificação de Informação - orium.pworium.pw/univ/lei/ci/slides/C6-26Out2010.pdf · sistemas de alarme ... analógico. São discretos em amplitude e no tempo

10/27/10

15

Limiardemascaramento

•  Sinalcomfrequênciade1KHzfazsubirolimiardeaudibilidadeabruptamentealterandoacurvadolimiardeaudibilidadenagamadefrequênciaentre500Hze5KHz

•  Somquesesituadentrodestagamadefrequênciaequeseriaaudívelemcondiçõesnormaisdeixadeseconseguirouvirsearespec?vaintensidadeforinferioràcurvademascaramento

26/10/09 29

Mascaramento

26/10/09 30

Page 16: Codificação de Informação - orium.pworium.pw/univ/lei/ci/slides/C6-26Out2010.pdf · sistemas de alarme ... analógico. São discretos em amplitude e no tempo

10/27/10

16

Aplicaçãomascaramento

26/10/09

Soun

d Pr

essu

re L

evel

[dB

-SPL

]

2 bits

4 bits

4 bits 4

bits 3

bits 2

bits

4 bits

4 bits

5 bits

5 bits

5 bits 5

bits

Soun

d Pr

essu

re L

evel

[dB

-SPL

]

80

70

60

50

40

30

20

10

0

-10

-20

-30

5000 10000 15000

Frequency [Hz]

Threshold of Hearing

Bits por amostra em média = 3.92 Taxa de compressão = 16:3.92 = 4.1:1

Masking threshold

31

Aplicaçãomascaramento

26/10/09 32

Banda 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

dBs 0 8 12 10 6 2 10 60 35 20 15 2 3 5 3 1

•  8banda=60dBs,modelopsicoacús?comáscarade12dBsparabanda7(anterior)ede15paraa8(seguinte)

•  7banda=10dBs<12dBs,codificadorpodeignorarocoeficientedabanda7,jáqueficatotalmentemascarado

•  9banda=35dBs>15dBs,codificadorvaicodificarestabandacomo35‐15=20dBs(Signal‐to‐MaskRa?o),necessitandode4bits

Page 17: Codificação de Informação - orium.pworium.pw/univ/lei/ci/slides/C6-26Out2010.pdf · sistemas de alarme ... analógico. São discretos em amplitude e no tempo

10/27/10

17

Informaçãoadicional

•  Osinaldeáudioéprocessadoemconjuntosdeamostraschamadasaudioframes

•  Cadaframedecadasub‐bandaestá:– Mul?plicadaporumfactorparanormalizaroníveldepicodosinal

– Quan?ficadaparaonívelapropriadoàrelaçãosinal‐ruídocorrente

•  Oreceptortemdesaberofactordeescalaeoníveldequan?ficaçãousado

•  Estainformaçãoestáembebidanasframes•  Ogastoadicional(overhead)émuitopequenoquandocomparadocomosganhosob?dospelacompressão

26/10/09 33

Diagramadeblocos

26/10/09

Sub-band filter bank

Scale and Quantise Multiplex

and Data Format Code Side

Info FFT

Psycho-acoustic model

Digital Audio In Coded

Audio Out Masking

thresholds

CODIFICADOR

De-Multiplex

Descale & Dequantise

Inverse filter bank

Decode Side Info

DESCODIFICADOR

Digital Audio Out Coded

Audio In

34

Page 18: Codificação de Informação - orium.pworium.pw/univ/lei/ci/slides/C6-26Out2010.pdf · sistemas de alarme ... analógico. São discretos em amplitude e no tempo

10/27/10

18

CodificaçãodosomnanormaMPEG

•  OcomitéMPEG(Mo?onPictureExpertGroup)definenormasparaacodificaçãodeinformaçãomul?média:imagememmovimento,som,outrainformação

•  Definidasumasériedenormas;napartedosomsãousadasastécnicasdecompressãodescritasatrás

•  AnormaMPEG1definetrêssubnormasparaacodificaçãodosom:camadas(layers)1,2e3

26/10/09 35

MPEG1–codificaçãodosom(1)

Layer1(.mp1)Sãousadas32sub‐bandas

Cadaframecontém384amostras(32x12)Umaversãodalayer1foiusadaDigitalCompactCasse�e(DCC)

26/10/09 36

Page 19: Codificação de Informação - orium.pworium.pw/univ/lei/ci/slides/C6-26Out2010.pdf · sistemas de alarme ... analógico. São discretos em amplitude e no tempo

10/27/10

19

MPEG1–codificaçãodosom(2)

Layer2(.mp2)Umpoucomaiscomplexamasmelhorqualidadequealayer1

Comprimentodaframeéde1152amostras(36x36)

Formatodasamostraseinformaçãoassociada(factordeescalaeSNR)codificadodeformamaiseficiente

UsandoemDigitalAudioBroadcas?ng(DAB)

26/10/09 37

MPEG1–codificaçãodosom(3)

Layer3(.mp3)Substancialmentemaiscomplexadoqueaslayers1e2Conseguequalidadeaceitávelmesmoa“bitrates”muitobaixos

Usa576bandasdefrequência.

Algoritmosusadosparacodificarcadasub‐bandamaissofis?cados

CodificaçãodeHuffmanaplicadaàsamostras

FicheirosMP3muitopopulares…

26/10/09 38

Page 20: Codificação de Informação - orium.pworium.pw/univ/lei/ci/slides/C6-26Out2010.pdf · sistemas de alarme ... analógico. São discretos em amplitude e no tempo

10/27/10

20

Outros“PerceptualCoders”

Osmesmosprincípiossãoaplicadosnoutroscodificadoresdeaudiodeusogeral

Exemplos:

RealAudio

FormatoWMAdaMicroso�

MiniDisc(ATRAC)

26/10/09 39

NormaMIDI

•  MIDI(MusicalInstrumentsDigitalInterface),protocolodecomunicaçãoquepermiteacomunicaçãoentreinstrumentosmusicais(decadade80)

•  Nãoéummétododecompressãodeáudio,massimumaformaderepresentarsimbolicamenteconteúdosmusicaisquepodemposterirmentedarorigemaáudiodigitalquandosisnte?zados

•  FoiintroduzidonapartedacodificaçãoáudiodanormaMPEG‐4

26/10/09 40

Page 21: Codificação de Informação - orium.pworium.pw/univ/lei/ci/slides/C6-26Out2010.pdf · sistemas de alarme ... analógico. São discretos em amplitude e no tempo

10/27/10

21

VantagensdoprotocoloMIDI•  Espaçodearmazenamentoconsumido.FicheirosMIDInãocontêmamostrasdeáudiomasapenasasinstruçõesnecessáriasparapermi?remaosinte?zadorgerarereproduzirossonspretendidos

•  Menordimensãodosficheirosconduzaumamenorlarguradebandaparaatransmissãodedados

•  Facilidadedeediçãodemúsicaepossibilidadedealteraçãodavelocidadedereproduçãodeumatonalidade(pitch)deumanotadeformaindependente

26/10/09 41

TransmissãoMIDI

•  Fluxodedadosassíncronounidireccional•  Débitobináriode31.25Kbits/s•  10bitsporcadabytedeinformaçãotransmi?do(1startbit;8databits;1stopbit)

•  InterfaceMIDIpossui3portasMIDI:IN,OUTeTHRU

•  16canaislógicos,quepodemserassociadocadaumauminstrumentodiferente

26/10/09 42

Page 22: Codificação de Informação - orium.pworium.pw/univ/lei/ci/slides/C6-26Out2010.pdf · sistemas de alarme ... analógico. São discretos em amplitude e no tempo

10/27/10

22

MensagensMIDI

•  Estruturadeumamensagem– Statusbyteeummáximode2bytesdados

•  Statusbyte– Obitmaissignifica?voé1– 4bitsdemenorpesoiden?ficamocanalaquesedes?na(16canaispossíveis)

– Restantes3bitsiden?ficamamensagem

•  Obitmaissignifica?vodedadosésempre0

26/10/09 43

TiposdeMensagens

26/10/09 44

MensagensMidi

MensagensChannel

MensagensSystem

MensagensVoice

MensagensMode

MensagensCommon

MensagensReal‐Time

MensagensExclusive

Page 23: Codificação de Informação - orium.pworium.pw/univ/lei/ci/slides/C6-26Out2010.pdf · sistemas de alarme ... analógico. São discretos em amplitude e no tempo

10/27/10

23

Tiposdemensagens(2)•  ChannelVoicemessages

•  ChannelModemessages

26/10/09 45

•  Systemmessages

26/10/09 46

Tiposdemensagens(3)

Page 24: Codificação de Informação - orium.pworium.pw/univ/lei/ci/slides/C6-26Out2010.pdf · sistemas de alarme ... analógico. São discretos em amplitude e no tempo

10/27/10

24

Exemplo

•  Exemplodapressãododócentral(noteon) 90 3C 40 •  Exemplodesoltarodócentral(noteoff)

80 3C 33 •  RunningStatus–  92 3C 44 92 40 40 92 43 3E 92 3C 44 40 40 43 3E –  92 3C 44 82 3C 40 92 3C 44 3C 00

26/10/09 47