geber ramalho & osman gioia - ufpe 1 armazenamento de sinais de Áudio fita magnética e...
TRANSCRIPT
1
Geber Ramalho & Osman Gioia - UFPE
Armazenamento de Sinais de Áudio
Fita magnética e Gravadores analógicosGravadores digitais e CD
Arquivos de som para computador
2
Geber Ramalho & Osman Gioia - UFPE
Gravação/Armazenamento
Definição• Meio pelo qual o som pode ser capturado
permanentemente e, eventualmente, re-trabalhado• é baseada na conversão de sinais elétricos em
– sinais magnéticos– padrões mecânicos– padrões óticos– sinais eletrônicos (chips)
3
Geber Ramalho & Osman Gioia - UFPE
N SN S
N SN S
N SN S
Partículas Longitudinal e aleatoriamente direcionadas
Fitas magnéticas Constituição
• Base de poliéster • Material magnético (Fe2O3, Fe, ...)• Material adesivo (resina) • Solvente
Como funciona?• alinhamento às partículas magnéticas (com certas
características) análogo ao sinal
4
Geber Ramalho & Osman Gioia - UFPE
Princípio de funcionamento
Ciclo de histerese• uma partícula (ponto 0)
exposta a uma força magnética H é magnetizada até a saturação (ponto 1)
• Quando a força é “desligada”, um certo fluxo magnético permanece (ponto 2)
• Submetida a uma força magnética negativa, o nível zero de magnetização é obtido (ponto 3)
• o ciclo continua...
5
Geber Ramalho & Osman Gioia - UFPE
Característica de transferência A função de transferência não é linear
• as variações no sinal elétrico não são reproduzidas fielmente pela magnetização
• implica em distorção
entrada
saída
6
Geber Ramalho & Osman Gioia - UFPE
Polarização (bias)
Solução: polarização• idéia: forçar o sinal a “trabalhar” na
zona linear somando-se outro sinal a ele• onda de alta freqüência (AM) que pode ser filtrada
depois
7
Geber Ramalho & Osman Gioia - UFPE
Gravadores
3 componentes• cabeças• eletrônica• mecânica
8
Geber Ramalho & Osman Gioia - UFPE
Cabeças Cabeça de gravação
• a variação de corrente na bobina induz fluxo magnético correspondente no núcleo • Devido ao gap no núcleo, o fluxo magnético é forçado a atravessar a fita
orientando as suas partículas • Ao cessar o campo, pela propriedade da remanência, o campo magnético
permanece
Cabeça de reprodução: Princípio inverso!
9
Geber Ramalho & Osman Gioia - UFPE
Velocidade Analogia entre fita e amostragem
• Velocidade da fita taxa de amostragem• Largura física da fita quantificação
Exemplo• gravar freqüência de 10kHz• como = v/f• cassete: = 4,75cm/s / 10000 = 0,5 m• rolo: = 19cm/s / 10000 = 3,8 m
10
Geber Ramalho & Osman Gioia - UFPE
Pistas
Quatro pistas estéreo • cassete
N pistas mono (estúdio)• 8• 16• 24• 32
crosstalk• informação de uma pista
vaza para a outra
cabeça fitaesqdir
diresq
cabeça fita123
456
78
1
11
Geber Ramalho & Osman Gioia - UFPE
Limitações das fitas Resposta em freqüência
• fraca nas baixas e altas freqüências • Polarização causa cancelamentos nas altas freqüências • Tamanho do Gap passa a ser crítico
Soluções• Pré-equalização para corrigir a resposta • Velocidade de gravação: mais rápido melhor• Tipo de fita: Metal
12
Geber Ramalho & Osman Gioia - UFPE
Limitações das fitas
Ruído• Existe muito ruído de fundo (hiss)• a situação é crítica nas altas freqüências onde a
energia da música é mais fraca• a relação sinal ruído deveria ser de pelo menos 60dB
13
Geber Ramalho & Osman Gioia - UFPE
Redutores de ruídoam
p
freq
ruído
freq
música
freq
=
amp
freq
ruído
freq
música
freq
=
NORMALNORMAL
ÊnfaseÊnfase
freq
Gra
vaçã
oG
rava
ção
Gra
vaçã
oG
rava
ção
repr
odu
ção
repr
odu
ção
freq
atenuaçãoatenuação
idéia: dar ênfase em certas freqüências na gravação e atenuá-las na reprodução
14
Geber Ramalho & Osman Gioia - UFPE
Redutores de ruído: sistema dolby
Sistema Dolby A• divide o espectro em 4 bandas de freqüências
independentes e só opera em passagens de baixa energia • Redução de 10dB abaixo de 5kHz e 15dB acima de 15kHz
Sistema Dolby B• sistema mais barato para cassetes• só opera nas altas freqüências reduzindo hiss em 10dB
Sistema Dolby C • trabalha em um espectro mais largo e reduz 20dB
Sistema Dolby SR• O melhor dos sistemas Dolby• atua em sinais de nível baixo a médio• redução de mais de 25dB em grande parte do espectro
15
Geber Ramalho & Osman Gioia - UFPE
Vinil
16
Geber Ramalho & Osman Gioia - UFPE
Toca-disco vinil: curiosidades ;-)
Disco• material: vinil• velocidade: 78, 45 ou 33 rpm
Reprodução: agulha + capsula
Sulcos e codificação
agulha
disco
sinal esquerdo induzido
sinal direito induzido
mono direito esquerdo d+e (em fase) d+e (em contrafase)
17
Geber Ramalho & Osman Gioia - UFPE
Controle motor da rotação• Correia• Polia• Tração direta
Rastreio• para evitar erro: braço inclinado
– J, S, reto com capsula em anglo, etc.• para compensar pressão: anti-skating
Reposta em freqüência• Para corrigir a fraca reprodução nas altas e nas
baixas: equalização RIAA
Toca-disco vinil
18
Geber Ramalho & Osman Gioia - UFPE
Armazenamento Digital de Áudio
Magnético: Fita e DATÓtico: Compact Disc (CD)
Eletrônico: Arquivos de computador
19
Geber Ramalho & Osman Gioia - UFPE
Grava-se na fita a informação digital (PCM), em vez do próprio sinal, usando as mesmas propriedades magnéticas
Sinal reconstituído
Sinal lido
Sinal magnético
Gravação Digital em Fita: princípio
analógico digital
A reprodução detecta mudanças de orientação
20
Geber Ramalho & Osman Gioia - UFPE
Porque Fita?
Motivação• apesar da sofisticação das novas mídias de
armazenamento digital, a fita ainda é muito barata porque largura de banda é alta
Porém... • Enquanto no caso analógico: banda 20KHz• Caso digital: 50 vezes maior do que o analógico (
1Mbps por canal)– 44,1 KHz x 16 bits = 705 Kbps– somando-se dados para sincronização e correção de
erros, seria preciso 1Mbps para a máxima freqüência– o problema piora para gravadores multipista
21
Geber Ramalho & Osman Gioia - UFPE
Largura de banda O grande desafio
• maximizar densidade sem provocar erros!!!• Interferência inter-símbolo (peak shift)
Métodos• usar gravação vertical em vez de longitudinal
– não se está limitado ao tamanho das partículas magnéticas– difícil de ser operacionalizado
Sinal escrito
Sinal lido
Sinal reconstruído
22
Geber Ramalho & Osman Gioia - UFPE
Largura de banda Solução: Cabeças rotativas
• duas cabeças giram deixando, por causa do movimento da fita, um rastro diagonal
• aumenta o “tamanho útil”da fita
23
Geber Ramalho & Osman Gioia - UFPE
Largura de bandaE
xem
plo
do v
ídeo
cas
sete
24
Geber Ramalho & Osman Gioia - UFPE
Balanço
Vantagens da cabeça rotativa• maior largura de banda • maior densidade de gravação (gasta menos fita)• mais fácil de sincronizar com sinais de vídeo
Desvantagens da cabeça rotativa• é difícil de fazer edições precisas, overdubbing ou
puch-in/punch-out devido a multiplexação• menos simples de projetar e mais caras
25
Geber Ramalho & Osman Gioia - UFPE
DAT (digital audio tape)
Histórico• 1981: Início das pesquisas• 1983: dois padrões propostos: S-DAT e R-DAT• 1986: R-DAT foi definido como o padrão, e ficou
conhecido simplesmente como DAT
Fita DAT• padronizada exclusivamente para o formato DAT• capacidade de aproximadamente 2 a 6 horas de áudio• só começa a se deteriorar a partir da 200ª reprodução!!• 3 freqüências de amostragem: 32, 44.1 e 48 kHz• 2 níveis de bits de quantificação:12 bits não-lineares ou
16 bits lineares
26
Geber Ramalho & Osman Gioia - UFPE
DAT Gravadores DAT
• entradas e saídas digitais (cópias de alta fidelidade)• cabeças rotativas
27
Geber Ramalho & Osman Gioia - UFPE
DAT
O formato suporta três freqüências de amostragem:
• 32, 44.1 e 48 kHz
Dois níveis de bits de quantização• 12 bits não-lineares ou 16 bits lineares
Extensões ao padrão DAT, criadas por fabricantes
• 12 bits a 96KHz• 24 bits a 48KHz
Gravadores DAT apresentam entradas e saídas digitais
• cópias digitais de alta qualidade
28
Geber Ramalho & Osman Gioia - UFPE
DAT: track format
1 Margin 5 IBG 9 PCM 13 PLL (sub)
2 PLL (sub) 6 ATF 10 IBG 14 Sub-2
3 Sub-1 7 IBG 11 ATF 15 Postamble
4 Post amble 8 PLL (PCM) 12 IBG 16 Margin
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Formato da Trilha:
De um total de 196 blocos, 128 (parte 9) são realmente de som
29
Geber Ramalho & Osman Gioia - UFPE
Compact Disc
Armazenamento de bits baseado em princípios óticos
Tecnologia levou cerca de 10 anos desde concepção ate introdução no mercado
• 1972– Phillips introduziu o conceito de armazenamento ótico
de áudio em discos de tamanho limitado– Sony desenvolveu técnicas de correção de erros para
discos óticos de grandes dimensões• 1980
– padrão de Compact Disc Digital Audio foi criado e aprovado pelo Digital Audio Disc Commitee, um grupo representando mais de 25 empresas
30
Geber Ramalho & Osman Gioia - UFPE
Compact Disc: princípios
Armazenamento de bits baseado em princípios óticos
1,6 mm0,6 m
31
Geber Ramalho & Osman Gioia - UFPE
Compact Disc: dados técnicos
Quantificação e amostragem fixas• 16 bits• 44.1 kHz• dois canais (estéreo)• total de 1,41 milhões de bits por segundo de áudio
Dados adicionais de controle• correção de erro• sincronização• modulação
Tamanho máximo de 6.3109 bits• 74 minutos e 33 segundos de áudio
– sugestão de Herbert von Karajan: duração de uma execução ininterrupta da 9a Sinfonia de Beethoven
32
Geber Ramalho & Osman Gioia - UFPE
Compact Disc: dados técnicos
CD players de qualidade exibem resposta de freqüência de 5Hz a 20kHz com desvio de ±0.2dB
• SNR acima dos 100dB• distorção harmônica a 1kHZ abaixo de 0.002%
Codificação• dados agrupados em quadros (frames): menor seção
de dados reconhecível
O frame inclui• dados de som (PCM, 2 canais)• dados de sincronização• dados para correção de erros (CIRC Cross-Interleave
Reed-Solomon Code)
33
Geber Ramalho & Osman Gioia - UFPE
Codificação
Sync(27 bits)
SubCode
Data(96 bits)
Parity(32 bits)
Data(96 bits)
Parity(32 bits)
8 bitsP,Q,R,S,T,U,V,W(começo, fim, etc.)
0.163mm
1 frame (1/7.35 ms)
6 amostras PCM 16 bits
34
Geber Ramalho & Osman Gioia - UFPE
Armazenagem eletrônica
Historicamente...• Cada tipo de máquina usava seu próprio formato de
arquivo de áudio, mas foram depois padronizados para possibilitar conversões
2 tipos de formatos de arquivo: • auto-descritivos e sem cabeçalho
Formatos auto-descritivos• os parâmetros de dados de áudio e codificação são
feitos explicitamente em alguma forma de cabeçalho– palavra mágica, taxa de amostragem, quantificação,
canais, formato das amostras, etc.
Sem cabeçalho• parâmetros de dados de áudio e codificação são fixos.
35
Geber Ramalho & Osman Gioia - UFPE
Arquivos RIFF (Wave)
Características• formato “little-endian byte order” da Microsoft/IBM.
– Esquerdo (MSB) | Direito (LSB)• auto-descritivo• equivalente ao AIFF do Macintosh• PCM linear• composto de chunks de 32 bits• canal esquerdo seguido pelo direito (quando é estéreo)
36
Geber Ramalho & Osman Gioia - UFPE
Arquivos RIFF (Wave): Formato
Tamanho Descrição4 bytes “RIFF”4 bytes Tamanho do chunk (32 bits)4 bytes “WAVE”4 bytes “fmt”4 bytes Tamanho da descrição do arquivo2 bytes Flag para mono (0x01) ou estéreo (0x02)4 bytes Taxa de amostragem4 bytes Bytes/sample2 bytes Alinhamento do bloco2 bytes Bits/sample4 bytes “data”4 bytes Tamanho do segmento de dados(n bytes) Dados
37
Geber Ramalho & Osman Gioia - UFPE
Arquivos Wave
Taxa de amostragem• dada em Hz (ex. 44.100Hz)
Alinhamento de bloco • (canais bits por sample)/8
Bits por sample • podem assumir apenas os valores 8 ou 16
Bytes/sample • 1 = 8-bit mono, 2 = 8-bit stereo or 16-bit mono, 4 = 16-
bit stereo
38
Geber Ramalho & Osman Gioia - UFPE
Arquivo de áudio da Sun (.au)
Definido pela Sun em 1992
Características• Codificações: -law, PCM linear, ponto flutuante IEEE,
de 8 a 64 bits• 1 canal (mono)• Taxas de amostragem: 8000, 11025, 16000, 22050,
32000, 44100 e 48000• formato “big-endian byte order”
– Esquerdo (LSB) | Direito (MSB) • manipulação incluídas nos sistemas operacionais da
Sun e em Java• auto-descritivo
39
Geber Ramalho & Osman Gioia - UFPE
Formato .au
Offset Tamanho Descrição 0 4 bytes ".snd" 4 4 bytes <Header size (h)> 8 4 bytes <Sample data size (s)> 12 4 bytes <Audio file encoding> 16 4 bytes <Sample rate> 20 4 bytes <Number of channels> 24 (h-24)bytes <Comment>(h) (s)bytes <Sample data>
40
Geber Ramalho & Osman Gioia - UFPE
Outros Formatos AIFF (Apple/SGI)
• criado pela Apple para armazenamento de alta qualidade de instrumentos e som
• a extensão AIFC ou AIFF-C suporta compressão• AIFF, AIFC and WAVE são similares mas oferecem
diferentes graus de liberdade na codificação
IFF/8SVX (Amiga)• versão para áudio do padrão IFF do Amiga
VOC (Creative Labs)• padrão da Creative Labs para a Sound Blaster, com
limites de taxa de amostragem e de 8 bits de quantização
41
Geber Ramalho & Osman Gioia - UFPE
Outros Formatos
MPEG Audio Layer-3 (MP3)• redução do tamanho por um fator de 4-24 através de
técnicas de codificação sonora perceptual• sinais redundantes e irrelevantes (mascarados) são
perdidos na codificação• Padronizado pela ISO
RealAudio (Real Networks)• voltado para streaming• vários esquemas de compressão lossy, usando plug-
ins codecs (audio coder/decoder routines)
42
Geber Ramalho & Osman Gioia - UFPE
MP3
43
Geber Ramalho & Osman Gioia - UFPE
Histórico
No final da década de 80• criou-se o Motion Pictures Expert Group (MPEG) para
desenvolver um sistema de codificação para transmissão de moving pictures e gravação destas em uma mídia digital, tal como CD-ROM, CD-i e Vídeo CD.
Em 1992,• foi definido um novo padrão para codificação de áudio
e vídeo, chamado ISO/IEC 11172 ou MPEG-1.
Logo depois • Fraunhofer Institut für Integrierte Schaltungen
desenvolveu a codificação de áudio MPEG Layer-3 (IS 11172-3 e IS 13818-3).
44
Geber Ramalho & Osman Gioia - UFPE
Taxa de Compressão
Layer I 1:4
1:6 … 1:8
1:10 … 1: 12
Layer II
Layer III
Comparação
Como o MP3 atinge um fator de compressão de até 11:1 ?• Codificação de Huffman (compressão sem perda de
informações).• Psico-acústica (compressão com perda de
informações).
45
Geber Ramalho & Osman Gioia - UFPE
Compressão de dados
Entropia de eventos• Quanto menor a probabilidade de um evento
acontecer, mais informação ele contém e maior é a entropia
• A compressão é função da redundância
Codificação de entropia (David Huffman)• Amostras que acontecem com maior freqüência serão
mapeadas para uma palavra de código menor• O decodificador contém o mapeamento inverso• Exemplo código Morse
e ‘.’ z “--..”• Exemplo Fax:
6666 6666 é transmitido como 86
46
Geber Ramalho & Osman Gioia - UFPE
Compressão de dados
Vantagens:• Não é destrutivo
Desvantagens:• não é eficiente e nem suficiente para a música
47
Geber Ramalho & Osman Gioia - UFPE
Psico-acústica
Fator de compressão: Limiar Auditivo• Menor nível que o ouvido pode detectar a uma
determinada freqüência• Um codificador perceptual compara o sinal de entrada
com o limiar de audição e descarta os sinais que estão abaixo
48
Geber Ramalho & Osman Gioia - UFPE
Mascaramento
Dois tipos de mascaramento• Simultâneo• Temporal
Mascaramento Simultâneo• A presença física de um som não garante audibilidade.
Ao contrário, ela pode gerar a não audibilidade de outros sons.
– Quando dois sons são tocados simultaneamente, os com maior volume podem obscurecer os com menor volume.
• A curva de mascaramento é assimétrica– é mais fácil um tom mais baixo (na freqüência) mascarar
um mais alto do que o contrário.
49
Geber Ramalho & Osman Gioia - UFPE
Mascaramento Simultâneo
50
Geber Ramalho & Osman Gioia - UFPE
Mascaramento Temporal
Mascaramento Temporal • Ocorre quanto sons são tocados próximos no tempo,
mas não ao mesmo tempo.• Um som de maior volume que ocorre antes ou depois
de um som mais baixo pode mascará-lo.• Mascaramento simultâneo é mais forte do que o
mascaramento temporal.
51
Geber Ramalho & Osman Gioia - UFPE
Mascaramento Temporal (cont.)
52
Geber Ramalho & Osman Gioia - UFPE
Mascaramento Temporal e Simultaneo
53
Geber Ramalho & Osman Gioia - UFPE
Codificação em Sub-bandas
54
Geber Ramalho & Osman Gioia - UFPE
Divisão em Sub-bandas(cont.)
55
Geber Ramalho & Osman Gioia - UFPE
MPEG Audio Tag ID3v1: Meta-Dados
O TAG • usado para descrever o arquivo MPEG• muito útil em busca na internet
Tamanho Descrição
3
30
30
30
30
4
1
TAG
Título
Artista
Álbum
Ano
Comentário
Gênero
Mídias para áudio digitalMídia Acesso Notas
Cabeça estacionária (fitamagnética)
Serial Gravação multitrackprofissional, váriosformatos coexistem
Fita de vídeo com cabeçarotatória (fita magnética)
Serial Vários formatos (VHS,8mm, Beta) e codificações
(NTSC, PAL, SECAM)Fita de áudio com cabeçarotatória (fita magnética)
Serial Formato profissionalNagra-D para gravações
em 4 canaisFita de Áudio Digital (DAT)
(fita magnética)Serial Compatibilidade mundial
Discos Rígidos(magnéticos e óticos)
Aleatório Discos removíveis sãomais lentos, porém mais
convenientesDisquetes (magnéticos) Aleatório Baratos, convenientes,
lentos, limitados e nãoconfiáveis
CDs (óticos) Aleatório Duráveis, vários níveis dequalidade, lentos para umamídia deste tipo de acesso
Memória (eletrônica) Aleatório Acesso rápido, excelentepara edição mas cara para
armazenamento
57
Geber Ramalho & Osman Gioia - UFPE
Referências
Ken C. Pohlman, Principles of Digital Audio, McGraw Hill, 1995, 3rd Edition
http://home.sprynet.com/~cbagwell/AudioFormats.html
http://www.iis.fhg.de/amm/techinf/layer3/index.html
http://www.mp3tech.org/
http://www.dv.co.yu/mpgscript/mpeghdr.htm
http://home.sprynet.com/~cbagwell/sox.html
http://www.asel.udel.edu/speech/Spch_proc/libcwav.html
http://www.dv.co.yu/mpgscript/mpeghdr.htm
http://drogo.cselt.it/mpeg/standards/mpeg-4/mpeg-4.htm
http://www.music-center.com.br/internet.htm
http://jimhartley.com/ratutor.html
http://service.real.com/help/library/index.html
http://www.reelradio.com/rainfo.html