· web viewusando a expansão exponencial, multiplicando os termos da equação (a2), obtemos (a5)...

21
DEPARTAMENTO DE ENGENHARIA ELÉTRICA Processamento Digital de Sinais “Image method for efficiently simulating small-room acoustics” Marcelo Gonçalves Franco Trabalho apresentado a disciplina de Processamento Digital de sinais do curso de Engenharia Elétrica do setor de Tecnologia da Universidade Federal do Paraná.

Upload: others

Post on 20-Dec-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1:  · Web viewUsando a expansão exponencial, multiplicando os termos da equação (A2), obtemos (A5) Onde Rp representa os oito vetores [dado pela equação (6)] (A6) Usando a propriedade

DEPARTAMENTO DE ENGENHARIA ELÉTRICAProcessamento Digital de Sinais

“Image method for efficiently simulating small-room acoustics”

Marcelo Gonçalves Franco

Trabalho apresentado a disciplina de Processamento Digital de sinais do curso de Engenharia Elétrica do setor de Tecnologia da Universidade Federal do Paraná.

Curitiba2008

Page 2:  · Web viewUsando a expansão exponencial, multiplicando os termos da equação (A2), obtemos (A5) Onde Rp representa os oito vetores [dado pela equação (6)] (A6) Usando a propriedade

Introdução

Métodos de imagem geralmente são usados para analisar as propriedades acústicas em ambientes fechados. Neste trabalho veremos a teoria e a prática usada na técnica de simulação por imagem, em computador, da resposta ao impulso entre dois pontos em uma sala retangular pequena. O resultado da resposta impulsiva, quando convoluído com algum sinal de entrada, como a fala, simula a reverberação em uma sala do sinal de entrada. Todo o processo é feito em computador, portanto um grande número de parâmetros pode ser estudado para controlar as condições experimentais. A implementação deste modelo é em Fortran.

Em alguns experimentos recentes, os quais estudavam os efeitos perceptíveis das propriedades de reverberação em uma sala pequena, cuidadosamente controlada, facilmente adaptável, ambientes acústicos foram requeridos. Foi decidido utilizar simulação computacional do espaço acústico.

Acredita-se que o modelo usado pode ser muito útil em muitos estudos sobre ambientes acústicos.

O modelo é feito para uma sala retangular, fechada, com uma resposta ao impulso fonte-para-receptor, ou função de transferência, calculada usando método de expansão de imagem no domínio do tempo.

Primeiramente veremos uma breve teoria do método. Em seguida veremos a parte computacional, e para concluir veremos alguns exemplos de aplicação.

I – Modelo de imagem versus modo normal

O modelo de sala de interesse é retangular. A escolha dessa geometria tem algumas razões:

1- A maioria dos ambientes em que se aplicam este método é retangular.2- Este modelo pode ser facilmente realizado em um programa de

computador.3- A solução de imagem de uma sala retangular fechada se aproxima

rapidamente de uma solução exata de equação de onda.O modelo de imagem é escolhido porque estamos interessados na função

de transferência ponto-a-ponto da sala. Para se obter boas respostas transientes, o modelo no domínio do tempo se faz necessário. Um modelo normal de solução para salas fechadas precisa ser calculado com todas as faixas de freqüência de interesse (100Hz – 4kHz), mais as correções necessárias para saída nesta faixa. O método de imagem inclui apenas as imagens que contribuem para a resposta ao impulso. (A relação exata entre o modo normal e o modo de solução pela imagem, para salas sem perdas, é discutido no apêndice A). Uma informação importante é que no domínio do tempo, cada imagem contribui apenas no impulso com intensidade e atraso conhecidos, enquanto cada modo normal é um

Page 3:  · Web viewUsando a expansão exponencial, multiplicando os termos da equação (A2), obtemos (A5) Onde Rp representa os oito vetores [dado pela equação (6)] (A6) Usando a propriedade

decaimento exponencial que contribui em todo o tempo. Além disso, enquanto cada imagem tem apenas os parâmetros de atraso e ganho, no modo normal são necessárias soluções de equações transcendentais para achar a localização do pólo mais a resolução de uma função relativamente complexa para achar o ganho.

A – O modelo de imagem

O modelo usado é de um falante em uma sala como sendo o ponto da fonte em uma cavidade retangular. Uma única freqüência no ponto da fonte de aceleração no espaço livre emite uma pressão de onda na forma:

Onde:P = pressãoω = 2πff = freqüênciat = tempoR = |X – X’|X = vetor onde se localiza o falante (x, y, z).X’ = vetor onde se localiza o microfone (x’, y’, z’).i = √-1c = velocidade do som

Quando temos uma parede, a região de fronteira da parede (velocidade normal zero) deve ser satisfeita colocando uma imagem simétrica no lado mais distante da parede. Assim,

Onde definimos as duas distâncias do microfone para a fonte R-, e para a imagem R+, por:

Neste caso a parede foi colocada em x = 0 (observe o sinal nos termos em x de R- e R+).

Num caso geral para seis paredes a situação torna-se mais complicada, pois cada imagem gera uma imagem de si mesma.

A pressão pode ser escrita como:

Page 4:  · Web viewUsando a expansão exponencial, multiplicando os termos da equação (A2), obtemos (A5) Onde Rp representa os oito vetores [dado pela equação (6)] (A6) Usando a propriedade

(5)

Onde Rp representa os oito vetores dados pelas oito permutações sobre ± de

(6)

r é o vetor triplo (n,l,m), e

(7)

Onde (Lx, Ly, Lz) são as dimensões da sala. A equação (5) é a resposta em freqüência da pressão assumindo paredes

rígidas para um ponto de fonte em X = (x, y, z) e um receptor em X’ = (x’, y’, z’). Se a equação (5) é a transformada de Fourier, achamos a função resposta impulsiva,

(8)

Uma interpretação da equação (8) é dada na figura 1, onde mostramos uma parte do espaço de imagem para um trecho bi-dimensional da sala. Quando a localização da fonte acelerativa (falante) X é excitada, cada ponto de imagem é simultaneamente excitado, criando ondas de pressão esféricas, as quais se propagam através de cada ponto de imagem.

A equação (8) é a solução exata para a equação de onda em uma sala retangular, com paredes rígidas (sem perdas), e deve ser derivada diretamente da solução de modo normal mostrada no apêndice A.

Page 5:  · Web viewUsando a expansão exponencial, multiplicando os termos da equação (A2), obtemos (A5) Onde Rp representa os oito vetores [dado pela equação (6)] (A6) Usando a propriedade

Figura 1. Uma parte através do espaço de imagem mostra como as imagens da fonte estão espacialmente arranjadas. A caixa em negrito representa a sala original. O espaço de imagem atual é tridimensional.

B- Caso de paredes não rígidas

Se as paredes da sala não são rígidas, a solução em termos de pontos de imagem não deve estar longe da exata. Uma informação precisa dos efeitos de paredes com impedância finita é impossível no momento, desde os efeitos em uma única imagem são um pouco complicados. Contudo vamos continuar assumindo o modelo de ponto de imagem aproximado para paredes não rígidas. Além disso assumimos um ângulo independente de pressão como coeficiente de reflexão da parede, β. Essa presunção é como assumir que a impedância da parede a sec (θ), onde θ é o ângulo de incidência da onda plana com respeito à normal da parede. Logo, não entendemos a exata interpretação física do que foi assumido. No entanto, acreditamos que tais interpretações não devem introduzir sérios problemas nos resultados finais sobre condições típicas. Por típica, queremos dizer sobre uma faixa de freqüência de 100 Hz a 4 kHz, coeficientes de reflexão da parede maiores que 0,7, geometrias típicas de escritórios, e onde tanto a fonte quanto o receptor não estão pertos da parede. Muitas, mas não todas, as condições descritas não são críticas e podem ser aliviadas. Simplesmente queremos pontos cuidadosamente fora da natureza não exata dos resultados.

Os resultados assumidos no coeficiente de absorção de energia α para um coeficiente de reflexão uniforme β numa dada parede na forma,

(9)

Page 6:  · Web viewUsando a expansão exponencial, multiplicando os termos da equação (A2), obtemos (A5) Onde Rp representa os oito vetores [dado pela equação (6)] (A6) Usando a propriedade

O que assumimos é similar para geometrias acústicas e é a mesma coisa que o requerido para o ângulo especular - traçado independente do raio. Em implementações do modelo não permitimos variações na freqüência nos coeficientes de reflexão. Tanto a dependência do ângulo, quanto a dependência da freqüência podem ser incluídas em nosso programa computacional, mas apenas numa significativa complicação e num processo que deixaria o programa mais lento.

Introduzindo os efeitos finitos, ângulo independente da absorção da parede na equação (8) para modificar a resposta ao impulso da sala,

(10)

Onde Rp é agora expresso em termos da integral de vetor triplo p = (q, j , k) como,

(11)

Rp como dado pela equação (6) é similar ao de (11), mas com índices diferentes de (11). Os β’s são os coeficientes de reflexão de pressão de seis fronteiras planas, com o subscrito 1 se referindo a paredes adjacentes para coordenar origem (ver figura 1). Subscrito 2 é a parede oposta. A equação 10 foi derivada das considerações geométricas da figura 1. O somatório com o vetor de índice p é usado para indicar três somas, nomeadas cada uma para as três componentes de p = (q ,j, k). r = (n,l,m) é uma soma similar. Fisicamente essas somas são sobre uma treliça tridimensional dos pontos. Para p temos oito pontos na treliça e para r, a treliça é infinita.

II – Implementação do modelo

A primeira consideração em uma implementação computacional da equação (10) é o método de amostragem espacial. Contudo, um comportamento aparentemente não físico do modelo na freqüência zero é removido por uma baixa freqüência (0,01 da freqüência de amostragem), filtro passa alta digital.

O cálculo da resposta ao impulso é construído sobre um “histograma” dos pulsos de imagem recebidos em diferentes tempos de retardo. A largura de cada caixa do histograma é igual ao período de amostragem T assumido inicialmente, o qual é determinado pela maior freqüência para ser representado. Por exemplo, todas as imagens com largura NΔR para (N+1) ΔR, onde ΔR=cT (T é o período

Page 7:  · Web viewUsando a expansão exponencial, multiplicando os termos da equação (A2), obtemos (A5) Onde Rp representa os oito vetores [dado pela equação (6)] (A6) Usando a propriedade

de amostragem e c a velocidade do som), são adicionados junto com a amplitude apropriada dada pela equação (10).

A escolha da taxa de amostragem é governada pela sua aplicação. Se a fala deve ser estudada em salas pequenas, uma possível escolha seria T=0,1ms, (freqüência de amostragem de 10 kHz; freqüência mais alta de 5 kHz). Mas, se o tempo de reverberação de ambientes maiores devem ser estudados (e a convolução com a voz não se faz necessária) taxas muito menores podem ser usadas.

O tempo de duração para calcular a resposta impulsiva também deve ser considerado. Para uma dada taxa de amostragem, o número de pontos em p(t) cresce linearmente com sua duração, enquanto o tempo computacional (e o número de imagens) crescem aproximadamente com o cubo da duração da resposta. Isso é mostrado na primeira coluna da tabela 1 para nossa implementação em um dado geral, computador Eclipse S/200. (nesta máquina o tempo de computação necessário para cada imagem é em torno de 1,6ms). Os programas atuais em fortran usados são mostrados no apêndice B.

Tabela 1 – parâmetros computacionais – tamanho da sala (pés) 10’ x 15’ x 12,5’, taxa de amostragem 8 kHz.

A quantização temporal em uma função impulso computacional causa desconsideração estatística de erros nos tempos de chegada computados para cada pulso de imagem relativo ao tempo de atraso exato dado pela equação (10). Esse tempo de atraso pode ser pensado como efetivamente “movendo” cada fonte de imagem por relativo ao receptor. Este efeito pode ser removido, em princípio, pelo uso de pulso limitador de banda da fonte. Contudo, o erro é menor para a maioria (mas não todos) dos fins e pode complicar a computação para remover essa aproximação. Devemos estimar que o erro devido para desconsiderar o movimento das imagens pode não ser percebido em uma simulação digital de um experimento de ouvido binaural.

A sub-rotina SROOM do apêndice B requer como parâmetros o número de pontos desejados da resposta ao impulso (NPTS), a localização da fonte R0, a localização do receptor R, as dimensões da sala, tudo especificado em termos do comprimento das amostras (ΔR), e os coeficientes de reflexão de cada uma das seis superfícies das paredes (β). A figura 2 mostra um exemplo da resposta ao impulso obtida para uma sala com dimensões 80 x 120 x 100 com comprimento de amostragem igual ao coeficiente de reflexão da parede de 0,9 (α=0,19) e com coeficientes de reflexão do teto e piso (β c) de 0,7 (α=0,51). X e X' fossem (30, 100, 40) e (50, 10, 60) intervalos de amostragem, respectivamente.

Page 8:  · Web viewUsando a expansão exponencial, multiplicando os termos da equação (A2), obtemos (A5) Onde Rp representa os oito vetores [dado pela equação (6)] (A6) Usando a propriedade

Figura 2 – típica resposta ao impulso de uma sala de 80 x 120 x 100. O coeficiente de reflexão das paredes é de 0,9, do teto e do piso é de 0,7. X e X’ foram em (30, 100, 40) e (50, 10, 60) períodos de amostragem.

É usualmente conveniente para interpretar os parâmetros do modelo como a verdadeira distância um tanto quanto múltiplos de ΔR. Isto requer uma escolha da taxa de amostragem e conseqüentes conversões que podem ser realizadas na parte principal do programa, o qual chama uma sub-rotina do apêndice B. A figura 2 assume uma freqüência de amostragem de 8 kHz. Para tal (e assumindo a velocidade o som de 1 ft/ms) as dimensões da sala são 10' x15' x 12,5'.

III - Aplicações

Nosso modelo de imagem da sala tem sido aplicado a diversos problemas. Vamos discutir dois exemplos: uma avaliação psicofísica dos efeitos de reverberação da sala e um estudo das distâncias críticas medidas usando variação da resposta espectral. Também usamos o modelo para testar um processador de sinal destinado a reduzir reverberações percebidas e para estudar problemas associados com inversões matemáticas (filtros inversivos) da função de transferência da sala.

A - Psicofísica da reverberação da sala

Page 9:  · Web viewUsando a expansão exponencial, multiplicando os termos da equação (A2), obtemos (A5) Onde Rp representa os oito vetores [dado pela equação (6)] (A6) Usando a propriedade

Uma vez simulada a resposta ao impulso da sala usando o modelo de imagem, os efeitos psicofísicos da reverberação desta simulação na fala podem ser diretamente estudados. Um exemplo reverberante da voz foi produzido por convolução de um exemplo de voz não reverberante com a resposta ao impulso calculada [p(t)]. Isso pode ser feito eficientemente usando o método da transformada direta de Fourier (FFT) para fazer a convolução. A última coluna da tabela 1 mostra a taxa de convolução medida, para vários comprimentos da

resposta ao impulso. A taxa de convolução aumenta apenas como (onde N é a duração da resposta da sala no período de amostragem T) então grandes respostas impulsivas podem ser convoluídas com a voz eficientemente. Por exemplo, para convoluir (filtrar) um segundo de fala, amostrados em 8 kHz, com 256ms de duração de resposta ao impulso (2048 pontos) requer 15s de computação.

A velocidade de processamento torna praticável estudos psicofísicos multivariados. Facilidade de modificação e controle perfeito dos parâmetros da sala evitam problemas os quais dificultaram experimentos no passado. Os experimentos atuais usam 16 tipos diferentes de salas simuladas (respostas ao impulso) convoluídas com 10 diferentes frases faladas por 4 diferentes falantes. Isto foi descoberto para que salas experimentais fossem perceptivelmente bem caracterizadas por suas variações espectrais [equação (14)] e pelo tempo de reverberação. Esta última medida, tempo de reverberação, merece ser discutida.Dadas as respostas impulsivas, o tempo de reverberação deve ser estimado em número de vias. Um método é usar uma modificação da integral do método tone-burst,

(12)

Onde E(t) é o decaimento médio da energia, k é uma constante de proporcionalidade, e p(t) é a pressão da resposta ao impulso calculada pela equação (10). Para casos onde a resposta ao impulso foi truncada antes da maioria dos decaimentos serem pegos, podem ocorrer erros. Esses erros geralmente são óbvios quando se “plota” E(t).

Outra aproximação é simplesmente medir o curto tempo de decaimento da energia do impulso de si mesma (usando simulação de níveis de gravação). Para decaimentos exponenciais ou não exponenciais, ambos os métodos devem dar aproximadamente o mesmo valor para o tempo de reverberação. Exemplos de “plotagens” de E(t) para ambos os métodos são mostrados nas figuras 3(a) e 3(b) usando a resposta ao impulso da figura 2. Experiências indicam que a equação (12) dá os resultados mais satisfatórios. Empiricamente achamos o cálculo dos tempos de reverberação, para um número de ambientes simulados, de acordo com a fórmula de Eyring sobre uma ampla faixa de valores de β.

Page 10:  · Web viewUsando a expansão exponencial, multiplicando os termos da equação (A2), obtemos (A5) Onde Rp representa os oito vetores [dado pela equação (6)] (A6) Usando a propriedade

Figura 3 – (a) Curva de decaimento da energia para a resposta ao impulso da figura 2 usando o método de integração de Schroeder. (b) Impulso da curva de decaimento de energia para simulação de níveis de gravação.

Page 11:  · Web viewUsando a expansão exponencial, multiplicando os termos da equação (A2), obtemos (A5) Onde Rp representa os oito vetores [dado pela equação (6)] (A6) Usando a propriedade

Nos experimentos discutidos acima descobrimos a relação monotônica entre Δ/Δc (figura 4) a distância falante-microfone quando normalizada pela distância crítica da sala (distância na qual a energia reverberante é igual a energia direta do som), o tempo de reverberação, e as preferências psicofísicas para a fala resultante.

Page 12:  · Web viewUsando a expansão exponencial, multiplicando os termos da equação (A2), obtemos (A5) Onde Rp representa os oito vetores [dado pela equação (6)] (A6) Usando a propriedade

Figura 4 – Comparação do desvio teórico rms da pressão em dB para o significado de pressão em dB como função direta da taxa de energia reverberante (a) para uma sala de 17 x 13 x 10 pés e (b) 47 x 31 x 15 pés.

B – Medida de distância crítica

Um novo método tem sido proposto para medir a distância crítica (ou raio de reverberação) em salas. Nesta técnica a medição é feita do logaritmo da variação de resposta em freqüência σL definida como,

(13)

(14)

Dada a função de transferência da sala P(ω) [transformada de Fourier da equação (10)] para diversos espaços microfone-fonte. Os valores medidos são montados pela curva teórica de σL baseada em suposições simultâneas de excitação, não correlata, modo normal, combinada com um cálculo direto da

Page 13:  · Web viewUsando a expansão exponencial, multiplicando os termos da equação (A2), obtemos (A5) Onde Rp representa os oito vetores [dado pela equação (6)] (A6) Usando a propriedade

energia do som. O resultado ajustado dá uma precisão no valor da distância crítica da sala.

O novo método foi intensamente estudado usando o método de imagem sendo aplicado com sucesso a salas reais. Desde que energia direta e reverberante sejam conhecidas no modelo computacional, uma comparação pode ser facilmente feita com a teoria. O resultado do modelo mostra excelente concordância com o cálculo teórico visto nas figuras 4(a) e 4(b).

IV – Síntese e discussão

O método de simulação para salas pequenas baseado numa expansão aproximada de imagem para ambientes retangulares com paredes não rígidas foi discutido. O método é simples, de fácil implementação e eficiente para simulação em computador. Diversos exemplos de uso foram discutidos.

Apêndice A

Queremos derivar a solução direta de imagem de parede não rígida da expansão de modo normal para ambientes retangulares. A função de resposta em freqüência (função de Green) para a pressão P(ω) em ambiente é dada pela solução da equação de Helmholtz dirigida por um único ponto de freqüência da fonte.

(A1)

Onde ω é a freqüência e c é a velocidade do som. A solução para esta equação, assumindo perímetro rígido, e dada por

(A2)

Onde k = ω/c, r = (n,l,m) indica uma soma tridimensional, V é o volume da sala,

(A3)

e

Page 14:  · Web viewUsando a expansão exponencial, multiplicando os termos da equação (A2), obtemos (A5) Onde Rp representa os oito vetores [dado pela equação (6)] (A6) Usando a propriedade

(A4)

Onde os L’s são as dimensões da sala.

Usando a expansão exponencial, multiplicando os termos da equação (A2), obtemos

(A5)

Onde Rp representa os oito vetores [dado pela equação (6)]

(A6)

Usando a propriedade da função delata em kx, ky e kz

(A7)

Devemos reescrever a equação (A5) na forma integral

(A8)

Pela análise da série de Fourier

(A9)

Então [com equações análogas para (A9) para y e z]

(A10)

Onde RT é o vetor [dado pela equação (7)]

(A11)

Page 15:  · Web viewUsando a expansão exponencial, multiplicando os termos da equação (A2), obtemos (A5) Onde Rp representa os oito vetores [dado pela equação (6)] (A6) Usando a propriedade

Cada integral tripla é apenas a expansão de onda plana para um ponto fonte em espaço livre desde

(A12)

Finalmente, usando a equação (A12), a equação (A10) torna-se

(A13)

Pegando a transformada inversa de Fourier da equação (A13), a estrutura do eco torna-se explícita

(A14)

A qual é a mesma que a equação (8), como desejado.

Apêndice B

Page 16:  · Web viewUsando a expansão exponencial, multiplicando os termos da equação (A2), obtemos (A5) Onde Rp representa os oito vetores [dado pela equação (6)] (A6) Usando a propriedade
Page 17:  · Web viewUsando a expansão exponencial, multiplicando os termos da equação (A2), obtemos (A5) Onde Rp representa os oito vetores [dado pela equação (6)] (A6) Usando a propriedade
Page 18:  · Web viewUsando a expansão exponencial, multiplicando os termos da equação (A2), obtemos (A5) Onde Rp representa os oito vetores [dado pela equação (6)] (A6) Usando a propriedade

Referência

[1]. Image method for efficiently simulating small-room acoustics, Jont Allen e David Berkley, The journal of the acoustical society of America, vol. 64, nº 4, 1979, pp 943-950.