processamento digital de sinais no diagnóstico ... · scientia medica, porto alegre: pucrs, v. 16,...

6
Scientia Medica, Porto Alegre: PUCRS, v. 16, n. 3, jul./set. 2006 109 ARTIGO ORIGINAL Processamento digital de sinais no diagnóstico diferencial de doenças laríngeas benignas Digital signal processing in the differential diagnosis of benign larynx diseases IUBERI CARSON ZWETSCH 1 RUBEM DUTRA RIBEIRO FAGUNDES 2 THAIS RUSSOMANO 3 DIOGO SCOLARI 4 1 Médico Otorrinolaringologista. Autor responsável. 2 Professor PhD da Faculdade de Engenharia Elétrica e do Mestrado em Engenharia Elétrica PUCRS. Coordenador do Laboratório de Sistemas, Sinais e Computação da Faculdade de Engenharia – SiSC/FENG-PUCRS. 3 Professora PhD das Faculdades de Medicina e Ciências Aeronáutica e do Mestrado em Engenharia Elétrica/Biomédica da PUCRS. Coordenadora do Laboratório de Microgravidade/IPCT-PUCRS. 4 Engenheiro Eletricista, Ênfase em Telecomunicações. RESUMO Objetivos: Apresentar um novo procedimento em Processamento Digital de Sinais para avaliar distúr- bios da voz, especificamente os relacionados às doen- ças benignas da laringe. Métodos: Foram utilizados sinais acústicos grava- dos de vozes normais e com alterações, de pacientes atendidos em consultório, que realizaram videola- ringoscopia. O sinal acústico foi digitalizado para o estudo das alterações acústicas vocais. Sobre estes sinais foi aplicada uma janela e análise cepstral. Resultados: Observando-se as diferentes altera- ções das vozes em estudo, foi possível desenvolver um conjunto de parâmetros de análise, que permitiu um diagnóstico coerente das alterações laríngeas, basea- do nos achados cepstrais. Casos escolhidos aleatoria- mente, e que não participaram do estudo, foram iden- tificados somente com as informações do conjunto de parâmetros com 80% de acerto, validando significati- vamente o método. Conclusões: Este método computacional é muito eficiente e não invasivo, identificando com sucesso al- terações vocais pela análise cepstral. DESCRITORES: DOENÇAS LARÍNGEAS; CEPSTRUM; ANÁLISE CEPSTRAL. ABSTRACT Aims: To present a new Digital Signal Processing procedure to evaluate voice disorders, specifically those related to the benign larynx diseases. Methods: Recorded acoustic signals of normal and abnormal voices of outpatients subjected to videolaryngos- copy had been digitalized for the study of the alterations in vocal acoustics. Window and cepstral analysis were applied on these signals. Results: Through the observation of the different alterations in the voices, it was possible to develop a set of parameters of analysis that allowed a coherent diagnosis of larynx alterations, based in the cepstral findings. Cases randomly selected, who had not participated of the study, had been identified only through the information of the set of parameters, with 80% of rightness, significantly validating the method. Conclusions: This computing method is very efficient and non-invasive, successfully identifying vocal alterations by cepstral analysis. KEY WORDS: LARYNX DISEASES; CEPSTRUM; CEPSTRAL ANALYSIS.

Upload: buianh

Post on 24-Jan-2019

217 views

Category:

Documents


0 download

TRANSCRIPT

Scientia Medica, Porto Alegre: PUCRS, v. 16, n. 3, jul./set. 2006 109

Processamento digital de sinais no diagnóstico ... Zwetsch IC, et al.ARTIGO ORIGINAL

Processamento digital de sinais nodiagnóstico diferencial de doençaslaríngeas benignasDigital signal processing in the differentialdiagnosis of benign larynx diseases

IUBERI CARSON ZWETSCH1

RUBEM DUTRA RIBEIRO FAGUNDES2

THAIS RUSSOMANO3

DIOGO SCOLARI4

1 Médico Otorrinolaringologista. Autor responsável.2 Professor PhD da Faculdade de Engenharia Elétrica e do Mestrado em Engenharia Elétrica PUCRS. Coordenador do Laboratório de

Sistemas, Sinais e Computação da Faculdade de Engenharia – SiSC/FENG-PUCRS.3 Professora PhD das Faculdades de Medicina e Ciências Aeronáutica e do Mestrado em Engenharia Elétrica/Biomédica da PUCRS.

Coordenadora do Laboratório de Microgravidade/IPCT-PUCRS.4 Engenheiro Eletricista, Ênfase em Telecomunicações.

RESUMO

Objetivos: Apresentar um novo procedimento emProcessamento Digital de Sinais para avaliar distúr-bios da voz, especificamente os relacionados às doen-ças benignas da laringe.

Métodos: Foram utilizados sinais acústicos grava-dos de vozes normais e com alterações, de pacientesatendidos em consultório, que realizaram videola-ringoscopia. O sinal acústico foi digitalizado para oestudo das alterações acústicas vocais. Sobre estessinais foi aplicada uma janela e análise cepstral.

Resultados: Observando-se as diferentes altera-ções das vozes em estudo, foi possível desenvolver umconjunto de parâmetros de análise, que permitiu umdiagnóstico coerente das alterações laríngeas, basea-do nos achados cepstrais. Casos escolhidos aleatoria-mente, e que não participaram do estudo, foram iden-tificados somente com as informações do conjunto deparâmetros com 80% de acerto, validando significati-vamente o método.

Conclusões: Este método computacional é muitoeficiente e não invasivo, identificando com sucesso al-terações vocais pela análise cepstral.

DESCRITORES: DOENÇAS LARÍNGEAS; CEPSTRUM;ANÁLISE CEPSTRAL.

ABSTRACT

Aims: To present a new Digital Signal Processingprocedure to evaluate voice disorders, specifically thoserelated to the benign larynx diseases.

Methods: Recorded acoustic signals of normal andabnormal voices of outpatients subjected to videolaryngos-copy had been digitalized for the study of the alterations invocal acoustics. Window and cepstral analysis were appliedon these signals.

Results: Through the observation of the differentalterations in the voices, it was possible to develop a set ofparameters of analysis that allowed a coherent diagnosis oflarynx alterations, based in the cepstral findings. Casesrandomly selected, who had not participated of the study,had been identified only through the information ofthe set of parameters, with 80% of rightness, significantlyvalidating the method.

Conclusions: This computing method is very efficientand non-invasive, successfully identifying vocal alterationsby cepstral analysis.

KEY WORDS: LARYNX DISEASES; CEPSTRUM; CEPSTRALANALYSIS.

110 Scientia Medica, Porto Alegre: PUCRS, v. 16, n. 3, jul./set. 2006

Processamento digital de sinais no diagnóstico ... Zwetsch IC, et al.

INTRODUÇÃO

Atualmente o diagnóstico das alterações la-ríngeas benignas é realizado pelo exame devideolaringoscopia, que é um exame da laringe,onde se utiliza um sistema de óptica endoscópicapara a visualização das pregas vocais. Esta ópticaé conectada a uma microcâmera e o exame é gra-vado com o sinal de voz através de um microfo-ne. Certas alterações laríngeas, mesmo paramédicos especialistas experientes, podem trazerdificuldade diagnóstica, pois às vezes são muitoparecidas no aspecto, apesar de apresentaremorigens e alterações fisiopatológicas diferentes.Essas dificuldades também são encontradasna realização de técnicas computacionais deprocessamento de sinais que, em determinadoscasos, não são eficientes o suficiente para a dife-renciação das alterações laríngeas.1

As seguintes alterações laríngeas: nódulo vo-cal, cisto vocal, pólipo vocal, edema de Reinke esulco vocal, representam a grande maioria dosatendimentos de pacientes com alteração da voz,que não sejam alterações transitórias devido ainfecções das vias áreas superiores, onde temosuma inflamação das pregas vocais que geralmen-te cedem em alguns dias, com a melhora do qua-dro geral.2-5 Na maioria dos casos, as alteraçõeslaríngeas citadas produzem uma rouquidão comcaracterísticas típicas de cada uma, principalmen-te quando analisadas por ouvintes mais expe-rientes, tais como médicos otorrinolaringologis-tas ou profissionais da área da fonoaudiologia.3, 4

Várias técnicas de análise de sinais da voz sãoestudadas para a identificação de alteraçõeslaríngeas. 1, 6-14

A análise cepstral do sinal de voz para oestudo das alterações laríngeas é muito útil, per-mitindo trabalhar com o sinal da glote (excita-ção) separadamente das repercussões ressonan-tais do trato vocal, facilitando o entendimentodas modificações que ocorrem nas pregas vocais.A aplicação desta técnica no estudo do sinal acús-tico de vozes alteradas poderia detectar modifi-cações nas ondas que se relacionem com as alte-rações laríngeas e, conseqüentemente, identificarmodelos para uma classificação, permitindoa obtenção de uma ferramenta de diagnósticonão-invasiva.8-12

A qualidade da voz depende do modo de fe-chamento e abertura da glote e da vibração daspregas vocais. Certas alterações laríngeas impe-dem que pregas vocais tenham uma vibração

glotal harmônica. Os principais fatores que de-terminam a vibração vocal são:

1. posição da prega vocal, ou a extensãoem que as pregas vocais são aduzidas ouabduzidas;

2. mioelasticidade, ou o grau de elasticidadedas pregas vocais (determinado pela posi-ção e grau de tensão decorrente da contra-ção do músculo vocal);

3. nível de pressão do ar através das pregasvocais.15

As alterações das pregas vocais também po-dem determinar que estas não vibrem em con-cordância, resultando em uma área vocal onde otrato vocal é excitado em duas freqüências fun-damentais diferentes.2,15

A análise cepstral do sinal de voz permite tra-balhar com o sinal da glote (excitação) e do tratovocal (ressonância) separadamente, pelas suaspropriedades homomórficas, separando das ca-racterísticas do filtro do trato vocal da seqüênciade excitação, o que facilita o estudo das altera-ções das pregas vocais. Dentro das proprieda-des matemáticas envolvidas no processo, salien-ta-se principalmente as transformadas de Fouriere funções logarítmicas que resultará em uma fun-ção chamada cepstral ou cepstro, responsávelpela dissociação do sinal de voz.

O processo resumido de estimação do cepstropode ser visto no diagrama de blocos apresenta-do na Figura 1.

Figura 1 – Diagrama de blocos da estimação do cepstro.

A concentração das componentes aparece nocepstro como picos. O eixo horizontal da funçãocepstral tem dimensões temporais e o nome dequefrências. Com isto, na voz se obtém uma cla-ra distinção entre a componente de excitação e acontribuição do trato vocal, que aparece como umaglomerado de componentes aos baixos valoresde quefrência afastado da componente do perío-do fundamental que aparece com valores maisaltos de quefrência.

Na Figura 2, vê-se o cepstro de um segmentode voz onde o pico correspondente ao período

Scientia Medica, Porto Alegre: PUCRS, v. 16, n. 3, jul./set. 2006 111

Processamento digital de sinais no diagnóstico ... Zwetsch IC, et al.

A função de transferência do trato vocal e afunção de excitação da voz aparecem em partesseparadas da escala de quefrências, pelo que po-dem ser separadas as duas funções, ou removidauma delas por um processo de “lifteragem”(liftering), facilitando o estudo individualizadodas modificações ocorridas na excitação e da par-te ressonantal. Assim, o estudo do sinal acústicode vozes alteradas, através da aplicação datécnica de análise cepstral na detecção de mo-dificações no sinal relacionadas às alteraçõeslaríngeas e na identificação de modelos paraa classificação destes distúrbios em estudo, per-mitirá obter uma ferramenta não-invasiva dediagnóstico.

MÉTODOS

Foram utilizados sinais acústicos gravados depacientes com alterações vocais e de normais,atendidos em consultório, que realizaram video-laringoscopia. A distribuição das alterações foi aseguinte: 17 cistos, 5 edemas de Reinke, 9 nódu-los, 9 sulcos e 8 pólipos. Também foram obtidos13 sinais de vozes sem lesões nas pregas vocais esem alteração acústica perceptível auditivamen-te, que compõem o grupo normal.

O sinal acústico de foi digitalizado em modomono, com freqüência de amostragem de 22 kHze 16 bits de resolução de vocalizações específicasque permitissem obter-se informações sobre asmodificações acústicas que as alterações larín-geas causam no sinal em estudo.1,7,16-18

Os dados obtidos foram submetidos à análi-se de Processamento Digital de Sinais em pro-

grama rotina de análise cepstral no Matlab 19 queconsta dos seguintes passos (Figura 3):

1. obtenção de fragmento da vocalização eenjanelamento;

2. análise cepstral.A pré-ênfase que permite a filtragem de sons

labiais não foi usada, porque altera também o si-nal de excitação (da glote), fenômeno descrito naliteratura e constatado também neste trabalho.O enjanelamento foi ajustado para a análise doframe da vocalização em estudo e com o uso daanálise cepstral.16,17

fundamental (excitação) está próximo da que-frência de 10 ms, separado das componentes dotrato vocal às de baixas quefrências (trato vo-cal).1,6-8,16,17

Figura 2 – Cepstro de um segmento de fala.

FRAGMENTO DE SINAL

CEPSTRO RECONHECIMENTO

DE PADRÕES CEPSTRAIS DE CADA DOENÇA

RECONHECIMENTO DE DOENÇAS

SINAL DE VOZ

Figura 3 – Esquema em blocos da análise do sinal acústico.

RESULTADOS

Os achados cepstrais das vocalizações foramanalisados. Com a ajuda das característicasfisiopatológicas já conhecidas de cada alteraçãolaríngea foram descritas as modificações per-cebidas, as quais podem ser particularmenteatribuídas às diferentes alterações laríngeas.

Um aspecto relevante percebido é quando seanalisa os achados produzidos por três vocali-zações separadamente, para a mesma alteraçãolaríngea (e mesmo paciente) e para um caso nor-mal. Nos achados do caso normal, as modifica-ções das três vocalizações são muito discretas,mas nos casos das alterações laríngeas temosmodificações diferentes em cada vocalização tes-tada, provavelmente porque os distúrbios vibra-tórias provocadas pela alterações laríngeas semanifestam acusticamente de forma diferente, deacordo com o tipo de emissão vocal e de acordocom a alteração.

Na Tabela 1, apresenta-se, de maneira con-densada, os dados das alterações da laringe e osachados do método proposto, comparando ascinco alterações e um caso normal com determi-nados fragmentos da vocalização. É possível ob-servar-se que existem diferenças das alteraçõeslaríngeas no perfil cepstrográfico, quando com-paradas com o normal e entre si. Estas diferen-ças se repetem na maioria dos casos analisadospreliminarmente neste estudo.

112 Scientia Medica, Porto Alegre: PUCRS, v. 16, n. 3, jul./set. 2006

Processamento digital de sinais no diagnóstico ... Zwetsch IC, et al.

Definição2,3,5 Características Acústicas2,3,5 Sistema cepstral de análise vocal

(proposto) Normal Pregas vocais sem lesões

Som perceptivelmente adequado

Cisto Lesão: cística, com fluído em geral unilateral

Efeito: aumento da massa vibratória, em geral mais rigidez que nódulos/pólipos, assimetria vibratória Sensação acústica: pitch agravado, diplofonia, aspereza e rouquidão moderada

Edema Lesão: edema da mucosa das pregas

Efeito: aumento da massa e profundidade vibratória da onda, aperiódica, rigidez diminuída Sensação acústica: pitch muito agravado e rouquidão intensa

Sulco Lesão: falha em forma de sulco, uni ou bilateral

Efeito: diminuição da massa vibratória, onda “trava” no sulco e a rigidez é intensa Sensação acústica: pitch agudizado, soprosidade, pode apresentar bitonalidade e rouquidão

Nódulo Lesão: quase sempre bilateral e simétrica

Efeito: interferem na vibração dependendo de sua firmeza, aumento de massa Sensação acústica: rouquidão e pitch variáveis, soprosidade, aspereza, pode ter diplofonia

Pólipo Lesão: em geral unilateral

Efeito: aumento da massa vibratória, aumento da rigidez em geral, vibração assimétrica e aperiódica Sensação acústica: pitch agravado e rouquidão dependendo do tamanho

TABELA 1 – Doenças das pregas vocais, suas características principais e aspectos diagnósti-cos pelos métodos convencional e o proposto na pesquisa.

Observando-se as diferentes alterações, foipossível desenvolver um conjunto de parâmetrosde análise, agrupados em uma outra tabela, comos quais pôde-se diagnosticar de forma coerenteas alterações, tomando como base os achadoscepstrais de diferentes vocalizações. Para testare validar este procedimento de lingüística, foramestudados casos escolhidos aleatoriamente e quenão participaram do estudo, os quais foram

diagnosticados somente com as informações databela. O resultado obtido, quando os resultadosdos gráficos foram submetidos aos valores databela, foi de 80% de acerto, validando signifi-cativamente o método proposto e contribuindode forma efetiva para a elaboração de um pro-tocolo de diagnóstico não-invasivo das altera-ções laríngeas, baseado na técnica de análisecepstral.

Scientia Medica, Porto Alegre: PUCRS, v. 16, n. 3, jul./set. 2006 113

Processamento digital de sinais no diagnóstico ... Zwetsch IC, et al.

DISCUSSÃOObservando as diferenças entre os resultados

obtidos, resumidos na Tabela 1, percebe-se queexistem diferenças entre as alterações laríngeasanalisadas com o cepstro das diferentes vocali-zações coletadas, sendo que algumas alteraçõeslaríngeas geram modificações significativas.

Por exemplo, os achados do edema de Reinkesão os que mais se diferenciam de todas outrasalterações laríngeas, pois esta alteração deixa opitch muito agravado. O sulco vocal é uma alte-ração laríngea que deixa a prega vocal rígida eeste é um dos fatores que produzem modifica-ções significativas na voz. Todas as alteraçõeslaríngeas tendem se diferenciar significativamen-te dos normais, colaborando com a idéia de iden-tificar as alterações pelas modificações por elasproduzidas no sinal acústico.

Também se destaca que algumas alteraçõesapresentam características e constantes que ser-vem como método diagnóstico destas. Outras al-terações nem sempre são constantes ou, às ve-zes, estão presentes em mais de uma alteraçãolaríngea, e isto deve ser mais aprofundado emtrabalhos futuros. Acredita-se que este métodoinédito, por ser não invasivo, de custo mais bai-xo e fácil execução e com resultados promisso-res, como demonstrado nestes dados prévios,será uma ferramenta de diagnóstico de triagemmuito útil.

A Tabela 2 demonstra um agrupamento re-sumido das características principais obtidas noestudo.

relacioná-las com as características anatomo-fisiológias já conhecidas para as alterações la-ríngeas, sendo isto uma inovação nesta aérea.

Com os resultados da proposta de análisecepstral do sinal da voz nas alterações laríngeasiniciados neste trabalho, permite-se prever queeste método será uma ferramenta diagnósticamuito útil e promissora para este propósito, poisé um método não-invasivo, de custo mais baixoe fácil execução. Para uma maior qualificaçãodeste método, deve-se realizar trabalhos futu-ros com a inclusão de mais amostras, de outrasalterações laríngeas mais raras e da utilização deum delineamento adequado para a validação,como um estudo prospectivo duplo cego.

Também é necessário desenvolver modelosde alterações laríngeas com o diagnóstico maispreciso possível para o treinamento do sistema,através de diagnóstico de certeza das alterações.O diagnóstico de certeza é obtido somente comuma biópsia da doença, mas pode-se obter umdiagnóstico confiável com o acompanhamento damesma e sua evolução com o tratamento, obten-do o diagnóstico evolutivo, sem ser invasivo.Outro aspecto relevante é determinar as possibi-lidades de que o sexo da pessoa testada possainfluenciar o resultado, já que as alteraçõeslaríngeas tendem a alterar o pitch da voz, comoobservado na pesquisa.

E, ao ser obtido uma modelagem ideal dasalterações com este método inovador, será pos-sível usá-lo para treinamento mais preciso de umsistema de reconhecimento automático como, porexemplo, as redes neurais artificiais ou modelosde Markov,18 tornando-se um importante equi-pamento de diagnóstico.

REFERÊNCIAS 1. Rosa MO, Pereira JC, Greller M, CarvalhoA. Signal

processing and statistical procedures to identifylaringeal pathologies. IEEE Transactions on BiomedicalEngineering IEEE/EESC-USP. 1999;423-6.

2. Dedivitis RAB. Métodos de avaliação e diagnóstico delaringe e voz. 2ª ed. São Paulo: Lovise; 2002.

3. Minoru H, Diane MB. Exame videoestroboscópico dalaringe. Porto Alegre: Artes Médicas; 1997.

4. Erich CM, Lupercio LB, Osíris CB, Behlau M, Melo DM.Incidência de lesões laríngicas não neoplásicas em pa-cientes com queixas vocais. Revista Brasileira deOtorrinolaringologia. 2001;67:788-94.

5. Khul I. Manual prático de laringologia. Porto Alegre:Editora da Universidade; 1982.

6. Martinez CE, Rufiner HL. Acoustic analysis of speechfor detection of laryngeal pathologies. InternationalConference, EMBS: Proceedings of the 22nd AnnualEMBS, Chicago, IL, July 2000. p. 23-8.

TABELA 2 – Resumo das principais características decada método.

Diagnóstico com videolaringoscopia

(convencional)

Método cepstral de análise da vocalização

(sistema proposto)

Invasivo Sim (pouco invasivo) Não

Execução Somente por profissional médico

Por qualquer pessoa com treinamento adequado

Triagem Pouco prático para triagem

Muito adequado para triagem

Custos Iguais aos de um procedimento em consultório

Mais baixos que o convencional

Esta técnica de análise gráfica cepstral forne-ce informações sobre as alterações laríngeas quenão são demonstradas com outros métodos, prin-cipalmente no que se refere à visualização de re-giões alteradas específicas e à possibilidade de

114 Scientia Medica, Porto Alegre: PUCRS, v. 16, n. 3, jul./set. 2006

Processamento digital de sinais no diagnóstico ... Zwetsch IC, et al.

7. Rabiner RL, Schafer R. Digital processing of speechsignals. New Jersey: Prentice-Hall; 1978.

8. Rabiner RL,Gold B. Theory and application of digitalprocessing. New Jersey: Prentice Hall; 1975.

9. Gomez P, Godino JI, Rodriguez F. Evidence of vocalcord pathology from the mucosal wave Cepstralcontents. Madrid: IEEE/Universidade Politécnica deMadrid; 2004. p. 45-52.

10. Wilpon JG, Rabiner LR, Lee CH. Automatic recognitionof keywords in unconstrained speech using MarkovModels. IEEE Transactions on Acoustic, Speech andSignal Processing. 1990;11:1870-8.

11. Hadjittodorov S, Mitev P. A computer system foracoustic of pathological voices and laryngeal diseasesscreening, Technical note. Medical Engineering &Physics.Bulgaria. 2002;24:419-29.

12. Manfredi C, D’aniello M, Bruscaglioni P, Ismaelli A. Acomparative analysis of fundamental frequencyestimation methods with application to pathologicalvoices. Medical Engineering & Physics. 2000;22:135-47.

13. Wszolek W, Tadeusiewicz R, Izworski A, Wszolek T.Automated understanding of selected voice tractpathologies based on the speech signal analysis.International Conference, EMBS: Proceedings of the 23rd

Annual EMBS, Istanbul, October 2001. p. 25-8.

14. Mitev P, Hadjttodorov S. Fundamental frequencyestimation of voice of patients with laryngeal disorder.Information Sciences, Bulgaria. 2003;156:3-19.

15. Hansen JH, Gavdidia-Ceballos L, Kaiser RJF. A non-linear operator-based speech feature analysis methodwith application to vocal fold pathology assessment.IEEE Transactions on Biomedical Engineering March.1998;45:937-40.

16. Furui S. Digital speech processing, synthesis andrecognition. New York: Marcel Dekker; 2001.

17. O’Shaughnessy D. Speech Communications: Humanand Machine. New York: Institute of Electrical andElectronics Engineers; 2000.

18. Fagundes RDR. Reconhecimento de voz, linguagemcontínua, usando modelos de Markov. São Paulo, 1993.[Dissertação de Mestrado].

19. Ingle VK, Proakis J. Digital signal processing usingMATLAB. Canadá: Brooks/Cole; 2000.

Endereço para correspondência:IUBERI CARSON ZWETSCHAv. Ipiranga, 6681, Prédio 30 – PUCRS90619-900, Porto Alegre, RS, BrasilFone: 9328-3996 – Fax: 3026-4652E-mail: [email protected]