Áudio/música na internet desafios mp3. 2 problema central do áudio/musica na internet domínio...
TRANSCRIPT
Áudio/Música na Internet
Desafios
MP3
2
Problema central do áudio/musica na Internet
Domínio exigente aplicações musicais e sonoras exigem alta performance da
transmissão e mecanismos especiais de recuperação de informação
Infra-estrutura e tecnologia ainda inadequadas Infra-estrutura atual de rede e sistemas operacionais não
responde satisfatoriamente à demanda as soluções para recuperação de informação sonora são
incipientes
3
Problemas decorrentes
Problema 1: Grande fluxo de dados
Audio com qualidade de CD dois canais de 16bits e taxa de amostragem de 44.1kHz Largura de banda necessária: 1411.2Kbps.
4
Problemas decorrentes
Problema 2: Atraso Latência - diferença entre tempo de saída e chegada dos
dados Jitter - variação de atraso
interrupções na música impossibilidade de interatividade (em vídeo Conferência, um
atraso de 1s é tolerável, enquanto em música - atraso de 1s é inaceitável)
5
Problemas decorrentes
Problema 3: som é difícil de ser indexado e recuperado Como fazer busca por peças ...
com harmonia moderna? tocada por orquestra de câmara? com uma sonoridade do tipo x? onde tem um solo de saxofone? cuja melodia é mais ou menos esta (assobio)?
6
Largura de Banda e atraso
Problemas da infra-estrutura atual Velocidade e banda de transmissão
Modens: 56Kbps, Cable Modens: 1,5Mbps (1411.2Kbps desejado)
Mesmo que desse para enviar, iria congestionar Protocolos
Projetados para troca de informação textual e transferência de arquivos. Não otimizados para grande quantidade de dados
Sistemas operacionais suportam um número qualquer de tarefas sem preocupação
com a qualidade do serviço oferecido (QoS)
7
Soluções: Largura de Banda
Compactação e Codificação (representação alternativa) de dados
Melhor suporte de rede
Melhor suporte de sistemas operacionais
8
Compactação
Idéia eliminar redundâncias e otimizar forma de aramazenamento
PCM-não linear (-law) comprometimento da qualidade do áudio
RealAudio Uma das primeiras propostas para a transmissão de sons
em tempo-real pela Internet via streaming (transmissão e execução conjuntas)
comprometimento significativo da qualidade do áudio dependência das condições de transmissão dos dados
9
Compactação
MP3 Boa compressão: até 11:1
ex. 4 min de música 40MB (PCM) e 3,5MB (MP3) Boa qualidade, pois as perdas são pouco significativas Porém, só a codificação não pode ser feita em tempo real,
só a decodificação
10
Representação alternativa (codificação)
Representação alternativa Compressão de dados gera atraso e ainda produz uma
grande taxa de dados (da ordem de 128kbps) Que tal mudar de paradigma?
NetSound Sistema de descrição de som e música capaz de transmitir
especificações Csound em tempo real. Economiza largura de banda pois envia descrição
matemática da onda sonora no lugar da onda de audio Ordem de centenas de bps , ao invés de Mbps ou Kbps.
não resolve o problema de atraso por conta do processamento pesado na máquina de destino
11
Representação alternativa (codificação)
MIDI Armazenar informação como notas musicais ao invés de
ondas sonoras. Não há controle de qualidade, pois depende do sintetizador
do receptor (pouquíssima informação sobre forma de onda) Pouca disponibilidade de conteúdo
MOD Tentativa de melhorar em relação ao MIDI, com informações
sobre timbre do instrumento. Atraso, devido ao processamento pesado exigido.
12
Compactação e Codificação: Conclusões
Problemas Compactação/codificação resolvem o problema da largura
de banda mas não o do atraso Transmissão interativa de música é extremamente sensível
a atrasos!!
Idéias melhorar redes e sistemas operacionais!
13
Soluções: Atraso
Melhorar o suporte de sistemas operacionais Algoritmos especiais para aplicações de tempo real Controle de Admissão
o processo só é aceito para ser executado se houver recursos Reserva de recursos
recursos exclusivos para aplicações em tempo real
Buffers Armazenagem temporária (tamponização ou bufferização)
dos dados “no cliente” atrasando o início da execução por alguns segundos.
porém, esta armazenagem inviabiliza a interatividade
14
Soluções: Atraso & Largura de Banda
Problema de banda reforço na estrutura física (Cabos e Roteadores)
Problema de latência e jitter emprego de novos protocolos de rede e hardware
Iniciativas Redes ATM e FDDI
Reservas de Recursos Controle de Admissão
Conexões dedicadas (tecnologia ISDN) IPv6: suporte transmitir em tempo real dado que a banda, a
latência e o jitter são conhecidos
15
Aplicações
Apesar dos pesares, está rolando muita coisa... Download em geral Radio na Web; Ensaios e Concertos distribuídos e em tempo real
MP3
17
Histórico
No final da década de 80 criou-se o Motion Pictures Expert Group (MPEG) para
desenvolver um sistema de codificação para transmissão de moving pictures e gravação destas em uma mídia digital, tal como CD-ROM, CD-i e Vídeo CD.
Em 1992, foi definido um novo padrão para codificação de áudio e
vídeo, chamado ISO/IEC 11172 ou MPEG-1.
Logo depois Fraunhofer Institut für Integrierte Schaltungen desenvolveu a
codificação de áudio MPEG Layer-3 (IS 11172-3 e IS 13818-3).
18
Taxa de Compressão
Layer I 1:4
1:6 … 1:8
1:10 … 1: 12
Layer II
Layer III
Comparação
Como o MP3 atinge um fator de compressão de até 11:1 ? Codificação de Huffman (compressão sem perda de
informações). Psico-acústica (compressão com perda de informações).
19
Compressão de dados
Entropia de eventos Quanto menor a probabilidade de um evento acontecer,
mais informação ele contém e maior é a entropia A compressão é função da redundância
Codificação de entropia (David Huffman) Amostras que acontecem com maior freqüência serão
mapeadas para uma palavra de código menor O decodificador contém o mapeamento inverso Exemplo código Morse
e ‘.’ z “--..” Exemplo Fax:
6666 6666 é transmitido como 86
20
Compressão de dados
Vantagens: Não é destrutivo
Desvantagens: não é eficiente e nem suficiente para a música
21
Psico-acústica
Fator de compressão: Limiar Auditivo Menor nível que o ouvido pode detectar a uma determinada
freqüência Um codificador perceptual compara o sinal de entrada com
o limiar de audição e descarta os sinais que estão abaixo
22
Mascaramento
Dois tipos de mascaramento Simultâneo Temporal
Mascaramento Simultâneo A presença física de um som não garante audibilidade. Ao
contrário, ela pode gerar a não audibilidade de outros sons. Quando dois sons são tocados simultaneamente, os com
maior volume podem obscurecer os com menor volume. A curva de mascaramento é assimétrica
é mais fácil um tom mais baixo (na freqüência) mascarar um mais alto do que o contrário.
23
Mascaramento Simultâneo
24
Mascaramento Temporal
Mascaramento Temporal Ocorre quanto sons são tocados próximos no tempo, mas
não ao mesmo tempo. Um som de maior volume que ocorre antes ou depois de um
som mais baixo pode mascará-lo. Mascaramento simultâneo é mais forte do que o
mascaramento temporal.
25
Mascaramento Temporal (cont.)
26
Mascaramento Temporal e Simultaneo
27
MPEG Audio Tag ID3v1: Meta-Dados
O TAG usado para descrever o arquivo MPEG muito útil em busca na internet
Tamanho Descrição
33030
30
304
1
TAGTítuloArtista
ÁlbumAno
ComentárioGênero
28
Referências
http://www.dv.co.yu/mpgscript/mpeghdr.htm http://www.napster.com http://drogo.cselt.it/mpeg/standards/mpeg-4/mpeg-4.htm Áudio na Internet
http://www.music-center.com.br/internet.htm Real Audio
http://jimhartley.com/ratutor.html http://service.real.com/help/library/index.html http://204.236.5.3/rma/g1/rsg2sdk_r4.zip http://www.reelradio.com/rainfo.html