armazenamento de sinais de Áudio

54
1 UFPE Armazenamento de Sinais de Áudio Geber Ramalho ([email protected]) Jeferson Valadares ([email protected] Ulisses Montenegro ([email protected]

Upload: zia

Post on 11-Jan-2016

23 views

Category:

Documents


0 download

DESCRIPTION

Armazenamento de Sinais de Áudio. Geber Ramalho ([email protected]) Jeferson Valadares ([email protected]) Ulisses Montenegro ([email protected]). Gravação/Armazenamento. Definição Meio pelo qual o som pode ser capturado permanentemente e, eventualmente, re-trabalhado - PowerPoint PPT Presentation

TRANSCRIPT

1

UFPE

Armazenamento de Sinais de Áudio

Geber Ramalho ([email protected])Jeferson Valadares ([email protected])Ulisses Montenegro ([email protected])

2

UFPE

Gravação/Armazenamento

Definição• Meio pelo qual o som pode ser capturado

permanentemente e, eventualmente, re-trabalhado• é baseada na conversão de sinais elétricos em

– sinais magnéticos– padrões mecânicos– padrões óticos– sinais eletrônicos (chips)

Plano de aula• Fita magnética e toca discos• Gravadores analógicos• Gravadores digitais e CD• Arquivos de som para computador

3

UFPE

Fitas magnéticas: contituição

Base de poliéster • função mecânica• espessura 25 a 40m

Material magnético• Óxido de ferro Fe2O3

• Dióxido de cromo: CrO2

• Ferro puro (metal): Fe

Material adesivo• resina

Solvente

N SN S

N SN S

N SN S

4

UFPE

Fabricação de fitas: etapas

1) Moagem• Mistura adesivo, óxido (partículas magnéticas ) e

solvente para forma uma pasta fluida• aplica a pasta sobre a base

2) Orientação• as partículas são orientadas

IMÂ

5

UFPE

Fabricação de fitas: etapas

3) Secagem• Evaporação do solvente• Túnel de secagem

4) Enrolamento

5) Polimento

6) Corte• no cassete

– comprimento 45, 60, 90 e 120 minutos– largura 3,8 mm

7) Embalagem

6

UFPE

Princípio de funcionamento

Ciclo de histerese• uma partícula (ponto 0)

exposta a uma força magnética H é magnetizada até a saturação (ponto 1)

• Quando a força é “desligada”, um certo fluxo magnético permanece (ponto 2)

• Submetida a uma força magnética negativa, o nível zero de magnetização é obtido (ponto 3)

• o ciclo continua...

7

UFPE

Característica de transferência A função de transferência não é linear

• as variações no sinal elétrico não são reproduzidas fielmente pela magnetização

• implica em distorção

entrada

saída

8

UFPE

Polarização (bias)

Solução: polarização• idéia: forçar o sinal a “trabalhar” na

zona linear somando-se outro sinal a ele• onda de alta freqüência (AM) que pode ser filtrada

depois

9

UFPE

Gravadores

3 componentes• cabeças• eletrônica• mecânica

10

UFPE

Cabeça de gravação

Idéia: • a variação de corrente na bobina induz fluxo magnético

correspondente no núcleo • pelo fato de existir um gap no núcleo, o fluxo magnético é forçado

a atravessar a fita orientando as suas partículas • Ao cessar o campo, pela propriedade da remanência, o campo

magnético permanece

11

UFPE

Cabeça de apagamento

Idéia:• mesmo princípio da cabeça de gravação, porém• introduz um sinal de alta freqüência de forma a

“bagunçar” o alinhamento dos domínios (partículas)

O gap • deve ser grande: aprox. 20 m• para poder mudar, por exemplo, pelo menos 10 vezes

cada domínio (partícula) no curto período de tempo em que a fita passa pela cabeça

12

UFPE

Cabeça de reprodução

Princípio inverso da gravação• a passagem da fita magnetizada, implica em uma

variação de fluxo magnético no núcleo, induzindo uma corrente correspondente

• deve ter alta permeabilidade (sensível às variações de fluxo da fita)

Gap• basicamente da mesma ordem do da cabeça de

gravação• largura do gap < comprimento de onda• se for maior, não conseguirá captar nas extremidades

do núcleo a variação de fluxo magnético

13

UFPE

Cabeças

Fazer ajustes• Zenite• Azimute

E de vez em quando desmagnetizar...• Magnetismo => ruído• Usar desmagnetizador (ponta de prova gerando 60

Hz)

14

UFPE

Cabeças

3 cabeças é melhor do que 2• cada uma pode ser projetada otimamente

15

UFPE

Velocidade Quanto maior a velocidade melhor a qualidade!

Velocidade• cassete: 4,75 cm/s (1 7/8 ips)• rolo: 9,5 cm/s (3 3/4 ips) • rolo: 19 cm/s (7 1/2 ips)• rolo: 38 cm/s (15 ips)

Exemplo• gravar freqüência de 10kHz• como = v/f• cassete: = 4,75/10000 = 0,5 m• rolo: = 19/10000 = 3,8 m

16

UFPE

cabeça fita

cabeça fita

12

Pistas (tracks)

Completa monofônica

Meia pista monofônica

Meia pista estéreo (Revox)

Quatro pistas mono

cabeça fita

esqdir

cabeça fita12

34

17

UFPE

Pistas

Quatro pistas estéreo • cassete

N pistas mono (estúdio)• 8• 16• 24• 32

crosstalk• informação de uma pista

vaza para a outra

cabeça fitaesqdir

diresq

cabeça fita123

456

78

1

18

UFPE

Limitações

Analogia entre fita e amostragem• largura do gap taxa de amostragem• Largura física da fita quantificação

Faixa dinâmica reduzida• Saturação: não pode-se usar níveis muito elevados de

sinal, senão distorce• Ruído branco: o ruído de fundo (hiss) impede que se

use níveis de sinal muito baixos sem serem mascarados

• Solução– Tipo de fita: Metal melhor– Velocidade de gravação: mais rápido melhor– Largura de fita: mais larga melhor

19

UFPE

Limitações das fitas Resposta em freqüência

• fraca nas baixas e altas freqüências • Polarização causa cancelamentos nas altas freqüências • Tamanho do Gap passa a ser crítico

Soluções• Pré-equalização para corrigir a resposta • Velocidade de gravação: mais rápido melhor• Tipo de fita: Metal

20

UFPE

Limitações das fitas

Ruído• Existe muito ruído de fundo (hiss)• a situação é crítica nas altas freqüências onde a

energia da música é mais fraca• a relação sinal ruído deveria ser de pelo menos 60dB

21

UFPE

Redutores de ruído

Solução• utilizar redutores de ruído

idéia• dar ênfase em certas freqüências na gravação e e

atenuá-las na reprodução

Sistemas• Dolby• dbx

22

UFPE

ilustraçãoam

p

freq

ruído

freq

música

freq

=

amp

freq

ruído

freq

música

freq

=

NORMALNORMAL

ÊnfaseÊnfase

freq

Gra

vaçã

oG

rava

ção

Gra

vaçã

oG

rava

ção

repr

odu

ção

repr

odu

ção

freq

atenuaçãoatenuação

23

UFPE

Redutores de ruído

Sistema dbx• enfatiza altas freqüências (taxa de 2:1) e depois

atenua com a mesma curva• trabalha então em uma única banda• reduz ruído em 30dB e aumenta headroom (faixa

dinâmica) em 10dB

Dolby A• divide o espectro em 4 bandas de freqüências que são

comprimidas e expandidas independentemente• Além disto, Dolby só opera em passagens de baixa

energia (abaixo de -10 VU) • consegue redução de 10dB abaixo de 5kHz e 15dB

acima de 15kHz

24

UFPE

Redutores de ruído

Dolby B• sistema mais barato para cassetes• só opera nas altas freqüências reduzindo hiss em

10dB

Dolby C • trabalha em um espectro mais largo e reduz 20dB

Dolby SR• melhor dos sistemas Dolby• atua em regiões onde o sinal tem nível baixo a médio• redução de mais de 25dB em grande parte do

espectro audível– ex. em 15 ips (38 m/s) é possível obter uma relação

sinal ruído de 105dB

25

UFPE

Toca-disco vinil: só curiosidades...

Disco• material: vinil• velocidade: 78, 45 ou 33 rpm

Reprodução: agulha + capsula

Sulcos e codificação

agulha

disco

sinal esquerdo induzido

sinal direito induzido

mono direito esquerdo d+e (em fase) d+e (em contrafase)

26

UFPE

Toca-disco vinil

Controle motor da rotação• Correia• Polia• Tração direta

Rastreio• para evitar erro: braço inclinado

– J, S, reto com capsula em anglo, etc.• para compensar pressão: anti-skating

Reposta em freqüência• Para corrigir a fraca reprodução nas altas e nas

baixas: equalização RIAA

27

UFPE

analógico digital

Sinal reconstituído

Sinal lido

Sinal magnético

Gravação Digital em Fita

Idéia• grava-se a informação digital (binária, PCM), em vez

do próprio sinal • não é necessário polarizar

Reprodução detecta mudanças de orientação

28

UFPE

Largura de banda

Definição• resolução (distância física mínima entre os picos) do

sinal• Influencia no espectro em que se pode gravar e pode

provocar erros

Interferência• deturpações nas mudanças dos picos

Sinal escrito

Sinal lido

Sinal reconstruído

29

UFPE

Largura de banda Caso digital

• 50 vezes maior do que a de um gravador analógico– 44,1 KHz x 16 bits = 705 Kbps– somando-se dados para sincronização e correção de erros,

seria preciso 1Mbps para a máxima freqüência– o problema piora para gravadores multipista

O grande desafio• maximizar densidade sem provocar erros!!!

Métodos• usar gravação vertical em vez de longitudinal

– não se está limitado ao tamanho das partículas magnéticas– difícil de ser operacionalizado

30

UFPE

2 Tipos de Cabeças

Estacionárias• DASH (digital audio stationary head)

Rotativas• duas cabeças giram deixando, por causa do

movimento da fita, um rastro diagonal• truque que aumenta o “tamanho útil”da fita

Exe

mpl

o do

víd

eo c

asse

te

31

UFPE

Balanço

Vantagens da cabeça rotativa• maior largura de banda • maior densidade de gravação (gasta menos fita)• mais fácil de sincronizar com sinais de vídeo• etc.

Vantagens da cabeça rotativa• em algumas aplicações particulares, difícil de fazer

edições muito precisas – melhor usar memória - chips

• mais difícil fazer overdubbing ou puch-in e punch-out devido a multiplexação

• menos simples de projetar e mais caras

32

UFPE

Armazenamento Digital de Áudio

Digital Audio Tape (DAT)Compact Disc (CD)

Arquivo wave (.wav)Arquivo de áudio da Sun (.au)

Codificação Sonora Perceptual (MPEG e MP3)Outros formatos

33

UFPE

DAT

Início das pesquisas em 1981

Em 1983, dois padrões foram propostos:• S-DAT• R-DAT

R-DAT foi definido como padrão em 1986, e desde então o formato é conhecido simplesmente como DAT

Fita DAT:• padronizada exclusivamente para o formato DAT• dimensões: 73x54x10.5 mm• capacidade de aproximadamente duas a seis horas de

áudio• só começa a se deteriorar a partir da 200ª reprodução

34

UFPE

DAT

O formato suporta três freqüências de amostragem:

• 32, 44.1 e 48 kHz

Dois níveis de bits de quantização• 12 bits não-lineares ou 16 bits lineares

Extensões ao padrão DAT, criadas por fabricantes

• 12 bits a 96KHz• 24 bits a 48KHz

Gravadores DAT apresentam entradas e saídas digitais

• cópias digitais de alta qualidade

35

UFPE

DAT

DAT (Gravação/Reprodução) Fita Pré-Gravada

Standard Option 1 Option 2 Option 3

No Canais 2 2 2 4 2 2

Freqüênciade Amostrag

48 KHz 32 KHz 32 KHz 32 KHz 44.1 KHz

Bits dequantização

16 (linear) 16 (linear) 12 (não-linear)

12 (não-linear)

16 (linear) 16 (linear)

Tempo degravação(minutos)

120 120 240 120 120 80

Velocidadeda fita(mm/s)

8.15 4.075 8.15 8.15 12.225

Velocidadeangular dascabeças(rpm)

2000 1000 2000 2000

36

UFPE

DAT

1 Margin 5 IBG 9 PCM 13 PLL (sub)

2 PLL (sub) 6 ATF 10 IBG 14 Sub-2

3 Sub-1 7 IBG 11 ATF 15 Postamble

4 Postamble

8 PLL(PCM)

12 IBG 16 Margin

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Formato da Trilha

37

UFPE

DAT

ID code (PCM block or

subcode block)

8 bits

Block address (and subcode

ID)

8 bits

Parity

8 bits

Sync

8 bits

Data (PCM data and parity or subcode data and

parity)

256 bits (32 symbols)

W1 W2P

Paridade: P = W1 W2 ( = Mod 2)Block address: corresponds to PCM or subcode data block,

the MSB indicates an ID bit (PCM or subcode data)

38

UFPE

DATID-0 (ID format) ID-1 a ID-7 Descricao

ID-1 (enfase) 00: off01: Pre-enfatizado (50/15 Sec)10,11: reservado

ID-2 (frequencia deamostragem)

00: 48Khz01: 44.1KHz10: 32KHz11: reservado

ID-3 (numero de canais) 00: 2 canais01: 4 canais10,11: reservado

ID-4 (numero de bits dequantizacao)

00: 16 bits linear01: 12 bits não-linear10,11: reservado

ID-5 (pitch da faixa) 00: 13,6 m01: 20,4 m10,11: reservado

ID-6 (inibicao de copia) 00: permissao de copia digital01: reservado10: inibicao de copia digital11: SCMS flag

0 0 (para audio)

ID-7 Pacote consiste de 32 ID-7s

39

UFPE

DAT

40

UFPE

Compact Disc

Armazenamento de bits baseado em princípios óticos

Tecnologia levou cerca de 10 anos desde concepção ate introdução no mercado

• 1972– Phillips introduziu o conceito de armazenamento ótico

de áudio em discos de tamanho limitado– Sony desenvolveu técnicas de correção de erros para

discos óticos de grandes dimensões• 1980

– padrão de Compact Disc Digital Audio foi criado e aprovado pelo Digital Audio Disc Commitee, um grupo representando mais de 25 empresas

41

UFPE

Compact Disc

Tamanho da palavra e freqüência de amostragem fixas

• 16 bits• 44.1 kHz• dois canais (estéreo)• total de 1,41 milhões de bits por segundo de áudio

Dados adicionais de controle• correção de erro• sincronização• modulação

Taxa total de transferência chega a 4.3218 Mbps

42

UFPE

Compact Disc

CD-DA define tamanho máximo em 6.3109 bits• capacidade para 74 minutos e 33 segundos de áudio

Capacidade foi definida por sugestão de Herbert von Karajan

• coincide com a duração de uma execução ininterrupta da 9a Sinfonia de Beethoven

Variações nos parâmetros físicos permitem durações superiores a 80 minutos de áudio

CD players de qualidade exibem resposta de freqüência de 5Hz a 20kHz com desvio de ±0.2dB

• taxa de signal-to-noise acima dos 100dB• distorção harmônica a 1kHZ abaixo de 0.002%

43

UFPE

Compact Disc

Sync(27 bits)

SubCode

Data(96 bits)

Parity(32 bits)

Data(96 bits)

Parity(32 bits)

8 bitsP,Q,R,S,T,U,V,W

0.163mm

1 frame (1/7.35 ms)

1,6 mm0,6 m

44

UFPE

Arquivos Wave

Tamanho Descrição4 bytes “RIFF”4 bytes Tamanho do arquivo (subtraído de 4)4 bytes “WAVE”4 bytes “fmt “4 bytes Tamanho da descrição do arquivo2 bytes Flag para mono (0x01) ou estéreo (0x02)4 bytes Taxa de amostragem4 bytes Bytes/sample2 bytes Alinhamento do bloco2 bytes Bits/sample4 bytes “data”4 bytes Tamanho do segmento de dados(n bytes) Dados

Little-Endian Word

Esquerdo (MSB) | Direito (LSB)

45

UFPE

Arquivos Wave

Taxa de amostragem é dada em Hz• e.g., 44.100Hz

Bytes/sample é calculado como(taxa de amostragem alinhamento de bloco)

Alinhamento de bloco é calculado como (canais bits por sample)/8

Bits por sample podem assumir apenas os valores 8 ou 16

Para arquivos em estéreo, o bloco de dados do canal esquerdo é imediatamente seguido do bloco do canal direito, em seqüência até o final do arquivo

46

UFPE

Arquivo de áudio da Sun (.au)

Definido pela Sun em 1992

Várias codificações (ISDN u-law, PCM linear, ponto flutuante IEEE), de 8 a 64 bits

Várias taxas de amostragem (8000, 11025, 16000, 22050, 32000, 44100 e 48000 amostras/s)

Funções para manipulação incluídas nos sistemas operacionais da Sun e em Java

47

UFPE

Formato .au

Offset Tamanho Descrição 0 4 bytes ".snd" 4 4 bytes <Header size (h)> 8 4 bytes <Sample data size (s)> 12 4 bytes <Audio file encoding> 16 4 bytes <Sample rate> 20 4 bytes <Number of channels> 24 (h-24)bytes <Comment>(h) (s)bytes <Sample data>

Big-Endian Word

Esquerdo (LSB) | Direito (MSB)

48

UFPE

Codificação Sonora Perceptual

Antes da compressão de áudio, um minuto de música estéreo (qualidade de CD) ocupava 10 MB!

• 44.100 amostras/s * 2 canais * 2 bytes/amostra * 60 s/min

Caso um arquivo destes fosse transmitido pela internet através de um modem padrão (28.8 Kbps) a transferência de 1 minuto levaria 49 minutos!

• 10.000.000 bytes * 8 bits/byte / (28.800 bits/s * 60 s/min)

Codificação sonora explora as propriedades do ouvido humano para conseguir uma redução de tamanho com pouca ou nenhuma perda perceptível na qualidade

49

UFPE

Codificação Sonora Perceptual - MPEG

Eficiência atingida através de algoritmos que exploram redundância em sinais e as não-relevâncias (mascaramento) no domínio de freqüência baseado em um modelo do sistema auditivo humano

• sinais redundantes e irrelevantes são perdidos na codificação

Ideal para ambientes que precisam de alta qualidade com um baixo bitrate: trilhas sonoras de jogos em CD-ROM, áudio para internet, sistemas de transmissão de áudio digital, etc.

50

UFPE

MPEG Audio Layer-3 (MP3)

Início do desenvolvimento em 1987 pelo IIS

Sinais digitais sem compressão:• 16bits, 44.1KHz - 1.400 Mbit para 1s de música

estéreo

Através de codificação MPEG:• redução do tamanho por um fator de 4-24 através de

técnicas de codificação sonora perceptual– Layer 3: reduções de 10-12 vezes sem perda de

qualidade

Padronizado pela ISO e recomendado pela ITU-R para aplicações de broadcast que necessitem de um bitrate de 60 kbps/s por canal

51

UFPE

MP3

Performance

QualidadeSonora

Bandwidth Modo bitrate Taxa deredução

Som deTelefone

2.5 KHz mono 8 kbps 96:1

Melhorque ondas

curtas4.5 KHz

mono16 kbps 48:1

Melhorque rádio

AM7.5 KHz

mono32 kbps 24:1

Similar arádio FM

11 KHz estéreo 56-64 kbps 26-24:1

Quase CD 15 KHz estéreo 96 kbps 16:1

CD > 15 KHz estéreo 112-128kbps

14-12:1

52

UFPE

Outros Formatos AIFF (Apple/SGI)

• criado pela Apple para armazenamento de alta qualidade de instrumentos e som

• extensão AIFC ou AIFF-C suporta compressão

RealAudio (Real Networks)• voltado para streaming• compressão lossy, otimizada para baixa utilização de

banda

IFF/8SVX (Amiga)• versão para áudio do padrão IFF do Amiga

VOC (Creative Labs)• padrão criado pela Creative Labs para sua placa Sound

Blaster, com limites de taxa de amostragem e de 8 bits de quantização

53

UFPE

Mídias para áudio digitalMídia Acesso Notas

Cabeça estacionária (fitamagnética)

Serial Gravação multitrackprofissional, váriosformatos coexistem

Fita de vídeo com cabeçarotatória (fita magnética)

Serial Vários formatos (VHS,8mm, Beta) e codificações

(NTSC, PAL, SECAM)Fita de áudio com cabeçarotatória (fita magnética)

Serial Formato profissionalNagra-D para gravações

em 4 canaisFita de Áudio Digital (DAT)

(fita magnética)Serial Compatibilidade mundial

Discos Rígidos(magnéticos e óticos)

Aleatório Discos removíveis sãomais lentos, porém mais

convenientesDisquetes (magnéticos) Aleatório Baratos, convenientes,

lentos, limitados e nãoconfiáveis

CDs (óticos) Aleatório Duráveis, vários níveis dequalidade, lentos para umamídia deste tipo de acesso

Memória (eletrônica) Aleatório Acesso rápido, excelentepara edição mas cara para

armazenamento

54

UFPE

Referências

Ken C. Pohlman, Principles of Digital Audio, McGraw Hill, 1995, 3rd Edition

http://home.sprynet.com/~cbagwell/AudioFormats.html

http://www.iis.fhg.de/amm/techinf/layer3/index.html

http://www.mp3tech.org/

http://www.dv.co.yu/mpgscript/mpeghdr.htm

http://home.sprynet.com/~cbagwell/sox.html