Universidade Estadual de CampinasInstituto de Estudos da Linguagem
Antônio Carlos Silvano Pessotti
Efeitos do treinamento e da prática vocal profissional sobre o canto e a fala
Tese de Doutorado apresentada ao Departamento de Linguística do Instituto de Estudos da Linguagem (IEL), da Universidade Estadual de Campinas (Unicamp) para a obtenção do título de Doutor em Linguística.
Orientadora: Profª Drª Eleonora Cavalcante Albano.
Campinas
2012
i
FICHA CATALOGRÁFICA ELABORADA POR CRISLLENE QUEIROZ CUSTODIO – CRB8/8624 - BIBLIOTECA DO INSTITUTO DE
ESTUDOS DA LINGUAGEM - UNICAMP
P439e Pessotti, Antonio Carlos Silvano, 1969-
Efeitos do treinamento e da prática vocal profissional sobre o canto e a fala / Antonio Carlos Silvano Pessotti. -- Campinas, SP : [s.n.], 2012.
Orientador : Eleonora Cavalcante Albano.Tese (doutorado) - Universidade Estadual de
Campinas, Instituto de Estudos da Linguagem.
1. Música e linguagem. 2. Canto. 3. Fonética. 4. Fonologia gestual. 5. Fonética acústica. I. Albano, Eleonora Cavalcante, 1950-. II. Universidade Estadual de Campinas. Instituto de Estudos da Linguagem. III. Título.
Informações para Biblioteca Digital
Título em inglês: Effects of training and professional vocal practice over singing and speech.Palavras-chave em inglês: Music and languageSingingPhoneticsGestural phonologyAcoustic phoneticsÁrea de concentração: Linguística.Titulação: Doutor em Linguística.Banca examinadora:Eleonora Cavalcante Albano [Orientador]Ricardo Molina de FigueiredoOsvaldo Novais de Oliveira JuniorLuiz Augusto de MoraesTatitMaria Jose Dias Carrasqueira de MoraesData da defesa: 23-01-2012.Programa de Pós-Graduação: Linguística.
ii
iii
iv
Agradecimentos
Agradeço a ajuda, paciência e parceria da minha orientadora, Profª Drª Eleonora
Cavalcante Albano, que me acolheu no Laboratório de Fonética e Psicolinguística desde a
graduação, mesmo sendo eu de outra área. Sem ela eu não conseguiria terminar este e
outros trabalhos.
Agradeço aos membros da banca de qualificação de área (Sociolinguística) e de tese
(Fonética e Fonologia) pelas discussões e sugestões de trabalhos futuros: Profs. Anna
Bentes, Thais Cristófaro Silva, Regina Cruz, Adriana G. Kayama e Wilmar D'Angelis.
Agradeço aos membros da banca e suplentes pela colaboração e paciência na leitura
do trabalho: Profs. Ricardo Molina de Figueiredo, Osvaldo N. de Oliveira Jr., Luiz Tatit, Maria
José Carrasqueira, Beatriz R. de Medeiros, Leonardo Fuks, Cristina M. Fargetti.
Agradeço aos professores que fazem parte da minha literatura estrangeira, que
conheci pessoalmente e muito me animaram a prosseguir nessa linha de estudos: Profs.
Johan Sundberg, David Howard, Donald Miller, Ronald Scherer, Sten Ternström, Gláucia
Salomão, Monika Hein, Christian Herbst, Pedro Amarante Andrade.
Agradeço aos professores artistas que me incentivaram a trabalhar com esse tema:
Profs. Niza Tank, Vania Pajares, Francisco Campos Neto, Adélia Issa, Edelton Gloeden,
Jônatas Manzoli, Jean Goldenbaum.
Agradeço aos professores do Cefala-UFMG pela ajuda e apoio em vários momentos:
Profs. Hani C. Yehia, Rui Rothe-Neves, Maurício Loureiro, Maurílio Nunes.
Agradeço aos meus colegas do Coro de Câmara de Piracicaba, especialmente ao
casal Cidinha e Ernst Mahle, cantores do Teatro Municipal de São Paulo, do Coro da
Orquestra Sinfônica do Estado de São Paulo, do Coro do Teatro São Pedro (SP), locutores
da Rádio Educativa FM de Piracicaba, amigos da Escola de Música de Piracicaba Maestro
Ernst Mahle, pela compreensão, apoio e paciência.
Agradeço aos docentes e funcionários do IEL pelos conselhos, apoio e orientações.
Agradeço aos colegas do Dinafon e Lafape pelo companheirismo e incentivo.
Agradeço às minhas informantes, pois sem elas eu não realizaria esse trabalho.
Agradeço ao Sálvio Nienkötter (Sendas Edições) pela revisão e conselhos.
Agradeço à Fapesp pela bolsa concedida no período em que conduzi minhas análises
(Processo nº 2008/10036-4).
v
vi
Resumo:
Neste estudo observam-se os efeitos decorrentes do treinamento e da prática vocal profissional, tendo por base três hipóteses que evidenciem semelhanças e diferenças entre fala e canto: 1) a fala é diferente entre grupos, 2) o canto é semelhante entre grupos, 3) fala e canto possuem semelhanças e diferenças influenciadas por formação musical e treinamento. Foi escolhida a canção Conselhos (Carlos Gomes), cujo texto foi lido e cantado cinco vezes por três grupos, cada qual com cinco informantes: cantoras solistas (SOL), cantoras coralistas (COR) e locutoras de rádio (LOC). Os dados obtidos da partitura da canção foram analisados com procedimentos não paramétricos. Os dados acústicos das gravações de fala e canto (com e sem acompanhamento) foram analisados com procedimentos paramétricos. As análises não-paramétricas mostraram que a partitura musical mantém as restrições linguísticas, sem perda da função fonológica nem da pertinência linguística. As diferenças observadas na análise da duração de fala corroboram a primeira hipótese. Tais diferenças sugerem influência de treinamento, distinção dos grupos com prática profissional, e manutenção da hierarquia prosódica. A gradiência entre os grupos na análise da entoação da fala separa cantoras das locutoras, e indicam influência do treinamento vocal profissional. A análise das estimativas de espaço vocálico evidenciou as tônicas, usadas pelos grupos como marcadores de expressividade. A intensidade na fala ressaltou locutoras e solistas como grupos com prática vocal profissional. As solistas se destacam na fala com valores elevados dos formantes e proximidade tonal com a partitura, fato que poderia explicar a tendência das cantoras com maior prática e treinamento em ler um texto próximo ao canto. A análise da duração global no canto sem acompanhamento mostra semelhança entre as cantoras que reflete a segunda hipótese, referente à formação musical. As diferenças de duração das variáveis linguísticas no canto refletem a influência da prática e do treinamento. A análise da entoação indicou que as coralistas atrelam a afinação à pulsação rítmica, e, o acompanhamento facilita essa tarefa. A análise das estimativas de espaço vocálico no canto mostrou áreas semelhantes entre os grupos. A distinção entre eles aparece nas tônicas, menos centralizadas pelas solistas, e, ainda, com intensidade e formantes mais altos. A comparação entre dados acústicos e estimativas da partitura no canto mostrou as solistas com entoação próxima à partitura. As tônicas foram melhor investigadas na fala, no canto, e entre as modalidades. Na fala, as diferenças entre os grupos são explicadas pela formação, pois solistas e locutoras são treinadas para produzir maior abertura oral. As consequências articulatórias seriam o abaixamento de laringe e redução do espaço faríngeo. A investigação das tônicas no canto mostrou formantes elevados para as solistas, implicando em estiramento labial (ou elevação de laringe, prática não recomendada pela pedagogia do canto). A comparação entre modalidades indicou influência da proficiência musical ou do treinamento vocal, em busca de postura vocal confortável. Esses resultados na fala e no canto indicam possível transferência gestual do canto para a fala, e vice-versa, tal como ocorre na aquisição de segunda língua. Tal fenômeno resultaria de adaptação biomecânica, coerentemente com a Fonologia Gestual.
Palavras chave: música e linguagem, canto, fonética, fonologia gestual, fonética acústica.
vii
viii
Title: Effects of training and professional vocal practice over the singing and speech.
Abstract:
The aim of this study is to observe the effects of training and professional voice practice, the basis of three scenarios that show similarities and differences in spoken and sung productions: 1) speech is different among groups, 2) singing is similar in the two groups of singers, 3) speech and singing have similarities and differences influenced by musical education and training. Conselhos, a song by Carlos Gomes, was chosen to constitute the corpus, whose text was read and sung five times by three groups, each with five subjects: solo singers (SOL), choir singers (COR) and news broadcasters (LOC). The data obtained from the musical score were analyzed with nonparametric procedures, and the data from acoustic recordings of speech and singing (with and without accompaniment) were analyzed using parametric procedures. Non-parametric analysis showed that the musical score maintains language restrictions, without loss of phonological function or linguistic relevance. Differences observed in the analysis of spoken duration support the first hypothesis. Such differences suggest the influence of training distinctions based on professional practice and maintenance of the prosodic hierarchy. Analysis of speech intonation shows gradient performance among groups, and separates singers from broadcasters, as well as indicate the influence of professional vocal training. The analysis of vowel space estimations shows the stressed vowels as expressiveness markers used by both groups. The intensity in speech distinguishes broadcasters and soloists such as groups with professional vocal practioneers. The soloists stand out with high values in intensity and formants. The way of keeping close to the score may explain the tendency of singers with more practice and training to read a text with an intonation that reminds the melody. Analysis of overall duration in singing without accompaniment shows that the similarity between groups reflects the second hypothesis, referring to musical training. Differences in duration of the linguistic variables in singing reflect the influence of practice and training. The analysis indicated that pitch singers' intonation ties the musical score, and accompaniment makes it easy. The analysis of vowel space area estimations in singing showed similar between groups. The distinction between them appears in the tonic vowels, more centralized by the soloists, and with higher intensity and formants. The comparison between acoustic data and estimations of the musical score in singing showed the soloists with similar pitch to the score. The stressed vowels were investigated in speech, singing, and between modalities. In speech, the differences between groups are explained by their background, as soloists and broadcasters are trained to open their mouth widely. The articulatory consequences would be the larynx lowering and reduction of pharyngeal space. Research results indicate the stressed vowels in singing have higher formants for soloists, resulting in stretching (or lifting of the larynx). The results of these comparisons indicate the influence of music proficiency or vocal training seeking a comfortable vocal space. These results, observed in the speech and singing, suggest gestural transference between singing to speech, and vice-versa, as occurs in second language acquisition. This phenomenon could be the result of bio-mechanical adaptation, consistent with the Gestural Phonology.
Keywords: music and language, singing, phonetics, gestural phonology, acoustic phonetics.
ix
x
Lista de FigurasFigura 2.5.1: Alinhamento Temporal Dinâmico de séries entoacionais...................................................19
Figura 2.6.1: Segmentação dos dados do corpus.....................................................................................25
Figura 4.2.1: Histograma dos dados de duração de fala, com curvas de densidade de probabilidade para
cada informante........................................................................................................................................44
Figura 4.3.1: Histograma dos dados de entoação (f0) de fala, com curvas de densidade de probabilidade
para cada informante................................................................................................................................47
Figura 4.4.1: Espaços vocálicos nas posições acentuais de fala das coralistas (COR)............................50
Figura 4.4.2: Espaços vocálicos nas posições acentuais de fala das solistas (SOL)................................51
Figura 4.4.3: Espaços vocálicos nas posições acentuais de fala das locutoras (LOC)............................51
Figura 5.2.1: Histograma de duração dos dados de canto sem acompanhamento...................................64
Figura 5.2.2: Histograma de duração de canto com acompanhamento...................................................68
Figura 5.3.1: Histograma de entoação (f0) para canto sem acompanhamento........................................71
Figura 5.3.2: Histograma dos dados de canto com acompanhamento.....................................................74
Figura 5.4.1: Espaços vocálicos nas posições acentuais da produção cantada sem acompanhamento das
coralistas (COR).......................................................................................................................................77
Figura 5.4.2: Espaços vocálicos nas posições acentuais da produção cantada sem acompanhamento das
solistas (SOL)...........................................................................................................................................77
Figura 5.4.3: Espaços vocálicos nas posições acentuais da produção cantada com acompanhamento das
coralistas (COR).......................................................................................................................................78
Figura 5.4.4: Espaços vocálicos nas posições acentuais da produção cantada com acompanhamento das
solistas (SOL)...........................................................................................................................................78
Figura 6.1.1: Gráfico de médias de F1 por grupo e modalidades: fala, canto sem acompanhamento
(cantoS), canto com acompanhamento (cantoC).....................................................................................94
Figura 6.1.2: Gráfico de médias de F2 por grupo e modalidades: fala, canto sem acompanhamento
(cantoS), canto com acompanhamento (cantoC).....................................................................................95
Figura 6.1.3: Gráfico de médias de F3 por grupo e modalidades: fala, canto sem acompanhamento
(cantoS), canto com acompanhamento (cantoC).....................................................................................96
Figura 10.1: Partitura da linha vocal de Conselhos (Carlos Gomes).....................................................143
Figura 11.1: Espaços vocálicos nas posições acentuais de fala das coralistas (COR). Pretônicas........155
xi
Figura 11.2: Espaços vocálicos nas posições acentuais de fala das coralistas (COR).Tônicas.............156
Figura 11.3: Espaços vocálicos nas posições acentuais de fala das coralistas (COR). Postônicas........157
Figura 11.4: Espaços vocálicos nas posições acentuais de fala das solistas (SOL). Pretônicas............158
Figura 11.5: Espaços vocálicos nas posições acentuais de fala das solistas (SOL). Tônicas................159
Figura 11.6: Espaços vocálicos nas posições acentuais de fala das solistas (SOL). Postônicas............160
Figura 11.7: Espaços vocálicos nas posições acentuais de fala das locutoras (LOC). Pretônicas.........161
Figura 11.8: Espaços vocálicos nas posições acentuais de fala das locutoras (LOC). Tônicas.............162
Figura 11.9: Espaços vocálicos nas posições acentuais de fala das locutoras (LOC). Postônicas........163
Figura 11.10: Espaços vocálicos nas posições acentuais da produção cantada sem acompanhamento das
coralistas (COR) Pretônicas...................................................................................................................164
Figura 11.11: Espaços vocálicos nas posições acentuais da produção cantada sem acompanhamento das
coralistas (COR) Tônicas.......................................................................................................................165
Figura 11.12: Espaços vocálicos nas posições acentuais da produção cantada sem acompanhamento das
coralistas (COR) Postônicas...................................................................................................................166
Figura 11.13: Espaços vocálicos nas posições acentuais da produção cantada sem acompanhamento das
solistas (SOL) Pretônicas.......................................................................................................................167
Figura 11.14: Espaços vocálicos nas posições acentuais da produção cantada sem acompanhamento das
solistas (SOL) Tônicas...........................................................................................................................168
Figura 11.15: Espaços vocálicos nas posições acentuais da produção cantada sem acompanhamento das
solistas (SOL) Postônicas.......................................................................................................................169
Figura 11.16: Espaços vocálicos nas posições acentuais da produção cantada com acompanhamento das
coralistas (COR).Pretônicas...................................................................................................................170
Figura 11.17: Espaços vocálicos nas posições acentuais da produção cantada com acompanhamento das
coralistas (COR).Tônicas.......................................................................................................................171
Figura 11.18: Espaços vocálicos nas posições acentuais da produção cantada com acompanhamento das
coralistas (COR). Postônicas..................................................................................................................172
Figura 11.19: Espaços vocálicos nas posições acentuais da produção cantada com acompanhamento das
solistas (SOL). Pretônicas......................................................................................................................173
Figura 11.20: Espaços vocálicos nas posições acentuais da produção cantada com acompanhamento das
solistas (SOL). Tônicas..........................................................................................................................174
Figura 11.21: Espaços vocálicos nas posições acentuais da produção cantada com acompanhamento das
xii
solistas (SOL). Postônicas......................................................................................................................175
xiii
xiv
Lista de TabelasTabela 3.1: Resumo das análises não paramétricas da partitura de Conselhos (Carlos Gomes); S –
resultado significativo; NS – resultado não significativo........................................................................33
Tabela 3.2: estatística descritiva dos dados acústicos estimados da partitura..........................................38
Tabela 4.1: ANOVA para dados de duração de fala.................................................................................45
Tabela 4.3: ANOVA para dados de entoação de fala...............................................................................48
Tabela 4.5: ANOVA das medidas de espaço vocálico para a produção falada: área de espaço vocálico
(VSA); significância: significativo (S), não-significativo (NS)...............................................................52
Tabela 4.7: teste t para as estimativas de espaço vocálico (VSA) comparando grupos na produção
falada........................................................................................................................................................53
Tabela 4.8: ANOVA das medidas de espaço vocálico para a produção falada: razão de centralização
formântica (FCR); significância: significativo (S), não-significativo (NS).............................................54
Tabela 4.10: teste t para as estimativas de espaço vocálico (VSA e FCR) comparando grupos na
produção falada........................................................................................................................................55
Tabela 4.12: ANOVA dos formantes por grupo.......................................................................................57
Tabela 4.13: Médias e desvios padrões dos formantes por grupo............................................................57
Tabela 4.14: teste t comparando os formantes por grupo na fala............................................................58
Tabela 4.15: Médias e desvios-padrão de duração e entoação para partitura e grupos............................58
Tabela 4.16: teste t com os dados acústicos da produção falada e as estimativas da partitura................59
Tabela 5.1: ANOVA para os dados de duração da produção cantada sem acompanhamento..................65
Tabela 5.4: Médias e desvios padrão de duração para as variáveis linguísticas por grupo, canto com
acompanhamento.....................................................................................................................................70
Tabela 5.5: ANOVA para os dados de entoação da produção cantada sem acompanhamento................72
Tabela 5.6: Médias e desvios padrão de entoação por grupo, canto sem acompanhamento...................73
Tabela 5.7: ANOVA para os dados de entoação da produção cantada com acompanhamento................75
Tabela 5.8: Médias e desvios padrão de entoação por grupo, canto com acompanhamento...................76
Tabela 5.9: Teste t entre grupos para VSA na produção cantada sem acompanhamento........................80
Tabela 5.10: Médias e desvios padrão de VSA por grupo, canto sem acompanhamento........................80
Tabela 5.11: teste t das estimativas de VSA entre grupos no canto com acompanhamento....................81
Tabela 5.12: Médias e desvios padrão para VSA por grupo, canto com acompanhamento....................81
xv
Tabela 5.13: Teste t entre grupos para FCR na produção cantada sem acompanhamento.......................82
Tabela 5.14: Médias e desvios padrão de FCR por grupo, canto sem acompanhamento........................82
Tabela 5.15: teste t das estimativas de FCR entre grupos no canto com acompanhamento....................83
Tabela 5.16: Médias e desvios padrão de FCR por grupo no canto com acompanhamento....................83
Tabela 5.17: Teste t das medidas de intensidade entre grupos no canto sem e com acompanhamento...84
Tabela 5.18: Médias e desvios padrão de intensidade(SPL) por grupo no canto, sem e com
acompanhamento.....................................................................................................................................84
Tabela 5.19: Comparação entre médias para os formantes do canto sem acompanhamento...................85
Tabela 5.20: Médias e desvios padrão dos formantes por grupo no canto sem acompanhamento..........85
Tabela 5.21: teste t entre grupos dos formantes no canto com acompanhamento...................................86
Tabela 5.22: Médias e desvio padrão para os formantes por grupo no canto com acompanhamento.....86
Tabela 5.23: teste de comparação entre dados acústicos da produção cantada sem acompanhamento
com as estimativas da partitura................................................................................................................87
Tabela 5.24: Médias e desvios padrão para duração e entoação por grupo e partitura no canto sem
acompanhamento.....................................................................................................................................87
Tabela 5.25: teste t comparando duração e entoação entre grupos na produção cantada com
acompanhamento.....................................................................................................................................88
Tabela 5.26: Médias e desvio padrão de duração e entoação por grupo e partitura no canto com
acompanhamento.....................................................................................................................................88
Tabela 6.1: ANOVA dos Formantes F1 e F2 (Bark) por vogais e grupo na fala......................................97
Tabela 6.2: Médias e desvios padrão dos formantes por vogal na fala....................................................98
Tabela 6.3: Teste t comparando formantes das vogais tônicas por grupo, canto sem acompanhamento.
................................................................................................................................................................100
Tabela 6.4: Médias e desvios padrão dos formantes das vogais tônicas por grupo, canto sem
acompanhamento...................................................................................................................................101
Tabela 6.5: Teste t comparando formantes das vogais tônicas por grupo, canto com acompanhamento.
................................................................................................................................................................102
Tabela 6.6: Médias e desvios padrão dos formantes das vogais tônicas por grupo, canto com
acompanhamento...................................................................................................................................103
Tabela 6.7: Quadro resumo das relações entre formantes das vogais tônicas, modalidade e grupo: Com
– canto com acompanhamento, Sem – canto sem acompanhamento, Fala – fala..................................104
xvi
Tabela 9.1: Análises não paramétricas de Conselhos (Carlos Gomes): Pearson (x2), Fisher exato e V-
Cramer....................................................................................................................................................135
Tabela 9.2: Análises não paramétricas de Conselhos (Carlos Gomes): desvios de Freeman-Tukey.....136
Tabela 9.3: Estatística Descritiva dos dados de fala e canto; loc – locutoras, cor – coralistas, sol –
solistas, desvpad – desvio-padrão..........................................................................................................137
Tabela 9.4: ANOVA entre formantes e vogais por modalidade.............................................................138
Tabela 9.5: Comparações entre modalidades e cantoras (TukeyHSD)..................................................139
xvii
xviii
Sumário
1 Introdução...............................................................................................................................1
1.1 Considerações Preliminares............................................................................................3
1.2 Abordagens sobre o assunto...........................................................................................3
1.3 Objetivo............................................................................................................................7
1.4 Fatores envolvidos...........................................................................................................8
1.5 Estrutura da tese.............................................................................................................9
2 Metodologia...........................................................................................................................11
2.1 Considerações Preliminares..........................................................................................13
2.2 Descrição dos procedimentos de análise de partitura e letra.......................................13
2.3 Descrição da metodologia de gravação e análise dos dados acústicos......................15
2.4 Justificativa da escolha dos sujeitos e montagem do corpus.......................................16
2.5 Método de gravação, descrição de variáveis e segmentação......................................17
2.5.1 Método de segmentação e análises semiautomáticas..........................................17
2.5.2 Descrição das Variáveis.........................................................................................20
2.5.2.1 Variáveis Acústicas e Categóricas..................................................................20
2.5.2.2 Variáveis Estimadas........................................................................................20
2.5.2.2.1 Área de Espaço Vocálico.........................................................................21
2.5.2.2.2 Razão de Centralização Formântica.......................................................21
2.6 Análise fonológica do corpus.........................................................................................22
2.6.1 Dados de Fala........................................................................................................23
2.6.1.1 Texto da Canção.............................................................................................23
2.6.2 Dados de Canto......................................................................................................25
2.6.2.1 Produção cantada sem acompanhamento.....................................................26
2.6.2.2 Produção cantada com acompanhamento.....................................................26
2.7 Comparação entre Partitura e Interpretações Cantadas quanto a f0 e duração .........26
2.8 Análises Estatísticas: Descritivas e Inferenciais............................................................27
2.8.1 Análises Descritivas...............................................................................................27
2.8.2 Análises Inferenciais...............................................................................................27
3 Resultados e Análises: Partitura e Letra...............................................................................29
xix
3.1 Considerações Preliminares..........................................................................................31
3.1.1 Análise Exploratória em Partituras.........................................................................32
3.1.1.1 Análise das associações entre categorias linguísticas e musicais.................32
3.1.1.2 Análises das Estimativas Acústicas da partitura a partir das categorias da
letra...............................................................................................................................35
4 Resultados e Análises: Gravações de Fala..........................................................................41
4.1 Considerações preliminares..........................................................................................43
4.2 Análises dos dados de duração ....................................................................................43
4.2.1 Análise descritiva ..................................................................................................43
4.2.2 Análises inferenciais...............................................................................................45
4.3 Análise dos dados de entoação (f0) .............................................................................46
4.3.1 Análise Descritiva...................................................................................................46
4.3.2 Análises Inferenciais...............................................................................................48
4.4 Análise das estimativas de espaço vocálico nas posições acentuais ..........................49
4.4.1 Área de Espaço Vocálico (VSA).............................................................................52
4.4.2 Razão de Centralização Formântica (FCR)...........................................................54
4.5 Análise da Intensidade (SPL)........................................................................................56
4.6 Análise dos Formantes..................................................................................................57
4.7 Comparação entre dados acústicos e estimativas da partitura....................................58
5 Resultados e Análises: Gravações de Canto.......................................................................61
5.1 Considerações Preliminares..........................................................................................63
5.2 Análises dos dados de duração ....................................................................................63
5.2.1 Canto sem acompanhamento ...............................................................................63
5.2.1.1 Análise descritiva............................................................................................63
5.2.1.2 Análises inferenciais........................................................................................65
5.2.2 Canto com acompanhamento................................................................................67
5.2.2.1 Análise descritiva............................................................................................67
5.2.2.2 Análises inferenciais........................................................................................69
5.3 Análise dos dados de entoação (f0) .............................................................................70
5.3.1 Canto sem acompanhamento................................................................................70
5.3.1.1 Análise Descritiva............................................................................................70
xx
5.3.1.2 Análises inferenciais........................................................................................72
5.3.2 Canto com acompanhamento................................................................................73
5.3.2.1 Análise Descritiva............................................................................................73
5.3.2.2 Análises Inferenciais.......................................................................................75
5.4 Análise das estimativas de espaço vocálico nas posições acentuais ..........................76
5.4.1 Área de Espaço Vocálico (VSA).............................................................................79
5.4.1.1 Canto sem acompanhamento.........................................................................79
5.4.1.2 Canto com acompanhamento.........................................................................80
5.4.2 Razão de Centralização Formântica (FCR)...........................................................81
5.4.2.1 Canto sem acompanhamento.........................................................................81
5.4.2.2 Canto com acompanhamento.........................................................................83
5.4.3 Análise da Intensidade (SPL).................................................................................84
5.4.4 Análise dos Formantes...........................................................................................84
5.4.4.1 Canto sem acompanhamento.........................................................................85
5.4.4.2 Canto com acompanhamento.........................................................................86
5.5 Comparação entre dados acústicos e estimativas da partitura....................................87
5.5.1.1 Canto sem acompanhamento.........................................................................87
5.5.1.2 Canto com acompanhamento.........................................................................88
6 Análise das vogais tônicas....................................................................................................91
6.1 Considerações preliminares..........................................................................................93
6.2 Investigação sobre as tônicas na fala...........................................................................97
6.3 Investigação sobre as tônicas no canto........................................................................99
6.3.1 Canto sem acompanhamento..............................................................................100
6.3.2 Canto com acompanhamento..............................................................................102
6.4 Comparação entre modalidades.................................................................................104
7 Discussão e Considerações Finais.....................................................................................107
7.1 Recapitulação..............................................................................................................109
7.2 Discussão.....................................................................................................................110
7.3 Considerações Finais..................................................................................................113
8 Referências Bibliográficas...................................................................................................115
9 Anexo I – Tabelas................................................................................................................133
xxi
10 Anexo II – Partitura .........................................................................................................141
11 Anexo III – Espaços Vocálicos..........................................................................................153
................................................................................................................................................153
xxii
1 Introdução
1
2
1.1 Considerações Preliminares
No mundo em que vivemos é comum o emprego da voz como instrumento de uso
cotidiano profissional. Tal prática depende de formação prévia e treinamento continuado,
quer por professores, atores, locutores, e cantores, entre outros. Esses profissionais fazem
uso da voz sem perceber suas implicações na fala coloquial.
Indiscutivelmente, fala e canto são duas formas de produção linguística com o mesmo
trato vocal. Muitas vezes elas são consideradas variantes de uma mesma produção,
tomando-se a fala stricto sensu (coloquial, lida, entre outras) e a fala cantada como duas
modalidades distintas (MEDEIROS, 2002). Há autores que também tratam toda e qualquer
produção do trato vocal como fala, admitindo gradientes diversos, e caracterizam desde a
fala isócrona e sem entoação, ao canto melismático e sem palavras. Tais produções seriam
dependentes do ambiente de origem, refletindo assim características socioculturais (LIST,
1963).
Considerando que a prática vocal profissional transcende o cotidiano, e pode
apresentar gradiência semelhante à descrita na literatura sobre as diversas modalidades de
produção, pergunta-se que efeitos possíveis seriam observados na fala daqueles que fazem
uso profissional da voz. Em outras palavras, que efeitos de adaptação resultariam do
trabalho da fala profissional impostada, trabalho esse comum a profissionais tais como
locutores, atores e cantores? Quais efeitos poderiam ser observados no canto executado por
cantores com maior ou menor proficiência em canto lírico? Como observar tais fatos?
1.2 Abordagens sobre o assunto
Várias pesquisas foram realizadas por diversos autores sobre a relação fala-canto,
principalmente quanto à descrição dessas produções em diversos níveis: acústicos,
fisiológicos, linguísticos, semióticos. O trabalho de dois pesquisadores são referências
necessárias nesse campo de estudo, principalmente no enfoque de aspectos prosódicos e
3
segmentais (fones).
Em sua obra, Nicole Scotto di Carlo descreve vários aspectos da produção vocal no
canto e sua comparação com a fala. Seus trabalhos sobre os fatores envolvidos na
inteligibilidade do canto (SCOTTO DI CARLO, 1972, 1985, 1995) abordam desde as
condições acústicas mínimas de altura e intensidade, bem como a influência dos métodos de
canto na articulação das frases (sintagmas) linguísticas, se pareadas às frases musicais.
Sobre a frase cantada e a articulação musical, Scotto di Carlo (1976) faz um estudo
comparativo entre emissão falada e cantada, no sentido de entender que nível de
perturbação da articulação no canto exerce influência sobre os diversos elementos
constituintes da musicalidade da frase cantada, bem como suas consequências. Tais
resultados questionam as técnicas vocais baseadas na articulação de encontros
consonantais ou apoiadas em consoantes. Essa discussão é ampliada em Scotto di Carlo
(1993), que afirma que tais métodos de canto com base nessas articulações devem ser
evitados, a fim de preservar o equilíbrio entre a compreensão do texto cantado e a estética
musical.
Outro achado de Scotto di Carlo (1997 e 2005b) é que o aprendizado do canto faz uso
da memória proprioceptiva1. Nesse trabalho, a autora descreve o papel do professor de
canto ao ensinar como o aluno deve fazer os ajustes articulatórios de cavidade faríngea e
abertura oral, a fim de adaptar as cavidades de ressonância, e, assim, aumentar seu volume.
Tal processo de aprendizado faz uso da memória cinestésica, isto é, da memória dos
movimentos musculares. Em outro momento, o aluno é estimulado ao uso da memória paleo
estética, ou ainda, a memória local das vibrações mais intensas sentidas na música,
diretamente correlacionada ao fraseado musical.
Esse processo de aprendizado tem implicações motoras refletidas nas expressões
faciais do canto (SCOTTO DI CARLO, 2004). A autora descreve nesse trabalho a influência
da abertura oral na identificação das emoções ou na avaliação de tal intensidade.
Tais atividades gestuais da face têm consequências nos níveis da hierarquia
prosódica, incluindo os inferiores. Dentre essas consequências, há fatores microprosódicos
1 Memória proprioceptiva é a memória da percepção de posição e deslocamento, também responsável por coordenar os movimentos da fala.
4
do canto que não são percebidos na fala (SCOTTO DI CARLO, 1977). Esses efeitos de
microprosódia foram aprofundados em Scotto di Carlo (2005a), que descreve as limitações
fisiológicas dos cantores, e suas consequências sobre a produção das consoantes cantadas,
deixando sua duração intrínseca e elasticidade com valores muito próximos aos das
consoantes faladas.
Nesse mesmo estudo, a autora afirma que as vogais no canto são mais alongadas por
haver certa desaceleração significativa no ritmo, que é inerente à produção musical. Há um
consequente aumento da duração dessas vogais, fato que se deve à amplitude considerável
dos movimentos realizados pelos articuladores. A redução temporal das consoantes e
expansão vocálica são explicadas não somente pelas fortes restrições aerodinâmicas
enfrentadas na sua produção, mas, também, pelas limitações estéticas necessárias para
manter o legato, que é um dos parâmetros-chave da musicalidade.
Um autor que vem contribuindo com suas pesquisas há mais de cinquenta anos é
Johan Sundberg. Sua obra abrange diversos aspectos da produção cantada, desde a análise
acústica à percepção e simulação em laboratório dos efeitos da voz falada e cantada.
Dentre seus trabalhos, em colaboração e/ou individual, destacam-se seus estudos
sobre a acústica da voz cantada (SUNDBERG, 1973), a sintonização formântica, ou ainda, o
formante do cantor (SUNDBERG, 1972), entre outros. Tais estudos evidenciam o conforto
obtido com o abaixamento de laringe, também observados e indicados nos tratados de
canto.
Alguns dos seus estudos com colaboradores trataram de esmiuçar tal sintonia com
testes perceptivos (CARLSSON-BERNDTSSON e SUNDBERG, 1991). As consequências
articulatórias, conforme já mencionado, são do abaixamento de laringe e abertura oral,
também observadas em outro estudo (SUNDBERG e SKOOG, 1999), notando-se a
dependência da abertura oral sobre o pitch e vogais nos cantores profissionais, pois,
segundo esse estudo, a princípio, tal gradiência de abertura oral ajudaria na sintonia de f0
com F1.
A diferença entre solistas e coralistas é observada em vários trabalhos. Em especial, o
trabalho de Rossing, Sundberg e Ternström (1985) faz a comparação acústica do uso da voz
no canto solista e coralista, com o emprego da análise espectral (espectro médio de longo
5
termo, LTAS) para observar o formante2 do cantor. Notou-se nesse estudo que cantores
solistas não dependem do acompanhamento para se manter fiéis à partitura proposta.
Outro trabalho que Sundberg orientou é relativo aos efeitos da formação do cantor
solista. Em Murbe et al. (2003) são observados os efeitos da educação de um cantor solista
profissional sobre o retorno auditivo e cinestésico, visando um estudo longitudinal do controle
tonal dos cantores. Novamente, notou-se que os solistas não dependem do
acompanhamento.
Outros autores abordaram o mesmo assunto, com diferentes enfoques. Dalla Bella et
al. (2006) trata da proficiência cantada na população em geral, proficiência que estaria
correlacionada às diferenças de tempo, pois cantores ocasionais (amadores) tendem a
cantar mais rápido e com maiores erros de tom e duração.
Outros autores abordam a relação entre fala e canto no nível prosódico. Lehiste (2004
) observa esse tópico relativo à prosódia no canto e na fala: como é a manifestação do
sistema prosódico de uma língua no canto, que contrastes de duração têm semelhantes
oposições prosódicas em relação à melodia, ou, se a melodia da canção interage com
contrastes de tom, ou ainda, se a melodia ultrapassa contrastes prosódicos baseados na
entoação falada.
A mesma relação entre fala e canto é observada em Boersma e Kovacic (2006), que
avaliam as características espectrais de três estilos de canção folclórica croata, com o
emprego do LTAS como ferramenta de análise. De forma semelhante, De Anima e De
Audibilibus (ARISTOTELES, apud DUEY, 1946) tratam da arte vocal na antiguidade,
enfatizando a necessidade de maior abertura oral, trabalhos muito mais antigos em que se
nota a necessidade dessa abertura correlacionada à inteligibilidade na fala e no canto.
No Brasil, destacam-se alguns trabalhos semelhantes. Medeiros(2002) faz uma
comparação de aspectos fonético-acústicos entre fala e canto. Fazendo uso de logatomas3
inseridos num trecho de uma canção de câmara brasileira, a autora avalia medidas acústicas
de duração, entoação e formantes dos segmentos dos logatomas em posição acentual
tônica, concluindo que tais vogais estão submetidas às restrições musicais da afinação e do
2 Formante é a frequência de ressonância que mostra um pico de intensidade em torno de um tom.3 Palavras sem sentido semântico, usadas em experimentos linguísticos.
6
volume da nota musical, proposta na partitura.
Como Scotto di Carlo, a autora observa certa negociação entre a fala e o canto, para
manter inteligibilidade do texto com o “encurtamento” das consoantes no canto, além do
pareamento dos três primeiros formantes com os harmônicos entoacionais, sem haver
coarticulação no canto. Ainda, ela propõe que tal negociação implicaria em capacidades
cognitivas linguísticas e musicais.
Em trabalhos anteriores a este, foram observados aspectos segmentais e prosódicos.
Em Pessotti (2005) foram estudados aspectos segmentais de certas vogais e dos róticos4,
discutindo a influência da técnica vocal de origem italiana, ou a escola italiana de canto, na
pronúncia cantada em vernáculo, isto é, no português do Brasil, de informantes paulistas.
Pessotti (2007) estudou aspectos prosódicos e seus reflexos sobre o estilo empregado
por cantoras líricas brasileiras na interpretação falada e cantada de uma canção de câmara
brasileira. A variação desses elementos prosódicos na fala e no canto podem marcar estilo
pessoal ou estilo de grupo (escola), observados nos dados acústicos de fala e de canto,
referentes à duração, à entoação e ao timbre, correlacionado à variabilidade dos formantes.
A variabilidade observada nesses três níveis reflete a escolha do intérprete entre várias
formas de interpretação, que dão mais ou menos peso aos três fatores alvidados: o texto, a
melodia e a escola.
1.3 Objetivo
O objetivo desse estudo é observar os efeitos decorrentes do treinamento e da prática
vocal profissional, através das análises de parâmetros fonético-acústicos que possam
constatar semelhanças e diferenças na fala e no canto. Os parâmetros estudados são: tom,
duração, intensidade e formantes.
Para tanto, foram escolhidos grupos de informantes, a saber: cantoras solistas (SOL),
cantoras coralistas (COR), e locutoras (LOC). As análises compararam os grupos citados, e,
considerando que fala e canto são modalidades diferentes, pautou-se as seguintes
4 Róticos no português brasileiro (PB) pertencem ao conjunto sons que se assemelham (alofones) mantendo mesma função fonológica. O [r], vibrante múltipla, foi analisado no estudo citado.
7
hipóteses para caracterizar os grupos:
• H1: a fala é distinta entre os grupos;
• H2: entre os grupos, o canto tem semelhanças dependentes da formação musical, e
diferenças dependentes da prática e do treinamento vocal; e
• H3: fala e canto refletem identidade de grupo através das semelhanças/diferenças
observadas nos parâmetros acústicos, que indicam possíveis usos dos articuladores
semelhantes ou diferentes entre os grupos.
1.4 Fatores envolvidos
Conforme já mencionado, diversos fatores podem influenciar a produção da fala e do
canto. Dentre eles está experiência e seus reflexos quanto à prática continuada, em outras
palavras, a proficiência e a prática profissional.
Esses dois fatores dependem do tipo e do tempo de formação que o indivíduo ou
grupo recebem. Consequentemente, podem ter efeitos que são observados como
gradientes, pois cada indivíduo tem seu processo particular de aprendizagem e assimilação
de conhecimento. Ainda, nota-se que determinados grupos apreendem com maior rapidez
certos conceitos ou habilidades motoras de forma distinta. É o caso dos músicos, que podem
tocar bem um instrumento ou instrumentos, mas, muitas vezes não cantam.
Como compreender a proficiência canora? Assume-se que ela depende de
aprendizado dentro de uma linha de estudos ou estética, aqui assumida como escola, além
da prática cotidiana. Tal proficiência tem diferentes níveis, dependentes do tempo de prática
e imersão dentro de tal escola. Logo, mesmo com as diferenças entre a prática do canto
erudito e a do rap, ou de outros gêneros de canto popular, todos dependem do tempo de
prática e inserção nos seus ambientes. Neste trabalho foi analisado um padrão de canto, o
canto de câmara, deixando para trabalhos futuros a análise e enfoque de outros gêneros.
Há várias formas de emissão cantada dentro do conceito de canto erudito. Sem
dúvida, o Bel Canto foi o período que mais influenciou o século XIX, com reflexos até hoje. A
emissão sofreu mudanças ao longo dos séculos, principalmente na escola Italiana
8
(PACHECO, 2002 e 2005). Tal emissão cantada não teria a mesma aceitação na música de
câmara brasileira (ANDRADE, 1938), pois, segundo o autor, criaria algo como “sotaque
italianizado”. Neste trabalho, foram escolhidas informantes que conhecem tais efeitos, mas,
procuraram seguir as normas para a pronúncia do canto em português brasileiro.
A habilidade de falar pode ser entendida como instrumental a partir do momento que
se faz uso dela em uma profissão, como acontece com os cantores, locutores, atores,
oradores, professores, entre outros. Essas práticas profissionais dependem de treinamento,
como já mencionado. Em especial, a prática do canto e da locução profissionais tornam o
indivíduo mais proficiente com o tempo, com o aprimoramento da técnica que acontece com
a prática cotidiana.
Deve-se considerar que o aprendizado musical tem semelhanças com a aquisição de
linguagem, quer de primeira ou de segunda língua. O indivíduo depende de prática
continuada e imersão no meio musical para atingir a proficiência necessária na prática
profissional, se assim deseja. O mesmo indivíduo tem a mesma necessidade de imersão ou
prática cotidiana para o aprendizado da língua materna ou segunda língua.
Como observado por estudiosos desses fenômenos (FLEGE, 1988; SANCIER e
FOWLER, 1998), existe a possibilidade da transferência de traços da língua materna para a
segunda língua, e vice-versa, num processo de interação que resulta em modificações da
atividade de fala desses indivíduos. O aprendizado musical tem processo semelhante, pois,
quando se aprende a tocar um instrumento da família das cordas é mais fácil aprender outro
instrumento da mesma família. O mesmo ocorre com outros instrumentos, como madeiras ou
percussão.
Ocorreria o mesmo processo no canto em relação à fala? Haveria traços que se
transferem da fala para o canto, e vice-versa, como acontece no aprendizado de línguas?
Seria possível observá-los de que forma?
1.5 Estrutura da tese
Como já dito, esse trabalho tem essa finalidade: observar os efeitos do treinamento e
da prática vocal profissional no canto e na fala. Que efeitos seriam esses? Quais seriam os
traços a observar?
9
A Metodologia explicita os procedimentos adotados para essa tarefa. O capítulo 3 faz
a análise da concepção idealizada de uma canção, a partitura, sob os aspectos da letra e da
música, de onde foram extraídos os parâmetros para as análises das gravações. Essas,
serão discutidas em dois capítulos, sobre as gravações de fala (capítulo 4) e de canto
(capítulo 5).
Notou-se durante o trabalho a importância das tônicas como local próprio para
distinções e semelhanças entre os grupos. Por isso, foram analisadas à parte no capítulo 6.
O último capítulo faz as discussões e considerações finais.
10
2 Metodologia
11
12
2.1 Considerações Preliminares
Em muitas culturas, a fala é considerada como referência ideal para o canto. A
explicação é baseada no fato de o canto conter os conteúdos musical e linguístico,
simultaneamente. Neste trabalho são analisados dados de fala e canto, por isso, a
metodologia aqui adotada é mais complexa.
A metodologia empregada na análise de dados acústicos de fala é comum à Fonética
e à Fonologia de Laboratório. Aqui são descritos os procedimentos empregados nas análises
em busca de indicadores, de uma hierarquia de variáveis que caracterizem as semelhanças
e diferenças entre essas produções, falada e cantada.
2.2 Descrição dos procedimentos de análise de partitura e letra.
O primeiro objeto a ser investigado é referente à representação categórica da canção,
que pode dar pistas quanto à interpretação. Nesse sentido, a partitura, que é criação do
compositor, interpretada posteriormente pelo artista, se torna fonte de dados preditores. Os
dados produzidos a partir dessa categorização são nominais e remetem a tratamento e
análises específicos, não-paramétricos.
Considerando-se esses pontos, e os dados extraídos da partitura de acordo com o
procedimento descrito em Pessotti (2007), foram feitas análises não-paramétricas com os
dados da canção em foco (Conselhos, de Carlos Gomes – anexo II), posteriormente gravada
pelas informantes, para se observarem as possíveis interações existentes entre música e
texto.
Os dados de duração, entoação (doravante, termo referente à f0), e fronteiras
prosódicas foram obtidos das partituras, e categorizados em proeminência de tom, de
duração, tonicidade, tempo forte, conforme descrição detalhada que segue, e aplicados aos
dados obtidos das gravações. As partituras oferecem parâmetros acústicos idealizados,
13
obtidos através da conversão dos valores da nota musical, referentes à duração em
segundos (s) e à entoação (f0) em Hertz (Hz). Esses valores idealizados podem divergir
daqueles obtidos na gravação de intérpretes/informantes, já que foram estimados e
categorizados.
Os dados referentes às proeminências foram obtidos via derivada primeira das curvas
de duração e f0. Tal procedimento não replica o processo semelhante executado em Pessotti
(2007). Suspeitou-se que alguns alinhamentos observados nas partituras não se ajustavam
ao se aplicar o método da razão tonal (DILLEY, 2005). A aplicação da derivada primeira
produziu resultados mais coerentes com a variação de tom e duração observada diretamente
nas partituras, justificando a troca de procedimento.
Eis as categorias aplicadas à partitura em análise que permitiram contagem de
frequência de ocorrência para a realização de testes não paramétricos:
• Tonicidade linguística: sílaba tônica/átona do texto,
• Posição de Sintagma Entoacional (pos_SE): sílaba ocorrendo nos limites do
sintagma entoacional à direita (SED) ou à esquerda (SEE), ou em posição medial
(SEM), de ordem linguística,
• Posição de Sintagma Fonológico (pos_SF): sílaba ocorrendo nos limites do
sintagma fonológico à direita (SFD) ou à esquerda (SFE), ou em posição medial
(SFM), de ordem linguística,
• Tempo musical: forte/fraco, da partitura,
• Proeminência linguística de Duração (proemDur): sim/não, há ou não proeminência
de duração,
• Proeminência linguística de Tom (proemTom): pico/platô; há proeminência, pico na
curva da derivada, ou, não há proeminência, platô na mesma curva,
• Ocorrência de pausas musicais (pausas): presente/ausente na partitura.
Com as frequências dessas categorias na partitura, foram realizados testes não
paramétricos de Pearson (χ2 :chi-quadrado), Fisher exato, V de Cramer, e desvios (resíduos)
de Freeman-Tukey, a fim de evidenciar associação entre variáveis de texto e variáveis
relacionadas à composição musical. Adotou-se o nível de significância a 5% com o teste de
14
Bonferroni, com valores críticos de Sokal-Rohlf (1995).
Células com frequências muito baixas dificultam a solução do problema da avaliação
das associações entre categorias. Para evitar esse problema com a análise em questão, e
considerando certas alternativas ao uso do erro médio, optou-se pelo teste exato de Fisher
(1932), recomendado por Sokal e Rohlf (1995).
2.3 Descrição da metodologia de gravação e análise dos dados acústicos.
Num primeiro olhar sobre o falar e o cantar nota-se que a variabilidade de ambos
passa basicamente pelos níveis duracional e entoacional. Quem tem a fala como instrumento
profissional como locutores e cantores usa o trato vocal para tarefas distintas, ou seja,
locuções profissionais e não profissionais. Ajustes na realização dessas tarefas têm
consequências acústicas e articulatórias que podem ser mensuradas.
Com esses dados, pode-se empregar para a análise diversos métodos comuns em
Fonética Experimental e Fonologia de Laboratório. Aqui se emprega a metodologia quasi-
experimental (CAMPBELL e STANLEY, 1963, 1966; COOK e CAMPBELL, 1979; WOODS,
FLETCHER e HUGHES, 1989).
Na investigação experimental há controle e manipulação deliberados, que visam
determinar pontos de interesse, com manipulação de uma variável (independente), e a
observação do efeito dessa mudança em uma ou mais variáveis (dependente). Esse
isolamento e controle de variáveis permite estabelecer certa casualidade, que é própria ao
ambiente de laboratório. Nesse caso, a amostragem é necessariamente aleatória.
Na investigação que envolve um quasi-experimento os grupos não são aleatórios, ou
ainda, são pré-selecionados de acordo com certo critério adotado. Esse método exige
grande quantidade de dados, normalmente obtidos por várias repetições, permitindo testar
múltiplas variáveis (análise multivariada), além de não necessitar de longos períodos de
observação na coleta de dados.
Aqui, observam-se os efeitos do treinamento e da prática vocal sobre o canto e a fala
15
com o auxílio da metodologia quasi-experimental. As gravações foram feitas com cinco
repetições de fala e de canto por grupos distintos, com sujeitos aleatoriamente escolhidos,
mas, nivelados quanto ao tom de fala.
2.4 Justificativa da escolha dos sujeitos e montagem do corpus.
Procurou-se escolher e analisar informantes com mesmo tipo de voz, tendo-se optado
por sopranos, mulheres, com f0 médio em 220Hz, aproximadamente. Aqui, trabalhou-se com
não cantoras e cantoras para distinguir fala e canto, e, para isso, procurou-se escolher as
não cantoras com mesmo tipo de voz, locutoras de rádio (LOC), ou seja, também
profissionais. Elas foram avaliadas de oitiva e a corroboração da escolha veio a partir da
análise preliminar dos dados acústicos.
A entrevista feita nas gravações permitiu dividir as cantoras em solistas (SOL) e
coralistas (COR) e observar o grau de experiência profissional e treinamento vocal de cada
uma. Os critérios de seleção foram o número de apresentações como solistas, inclusive fora
do Brasil, e o tipo de trabalho realizado: concertistas, coralistas, cantoras de eventos, ou
professoras de canto/técnica vocal.
As LOC tem entre 30 e 45 anos, tiveram formação não formal em música, não cantam
em grupos, corais ou como solistas, porém, fazem uso profissional da voz no rádio. As COR
tem entre 18 e 41 anos, cantam em grupos ou corais e realizam pequenos solos, porém, não
tem essa atividade canora como profissão. Já as SOL tem entre 23 e 51 anos, atuam como
solistas em corais, óperas, e têm atividade pedagógica vocal grande (aulas de canto), além
de atuarem em gravações de jingles e peças de teatro, com pelo menos uma atuação no
exterior como solistas, quer em concerto de câmara, quer ópera.
Para comparar fala e canto foi escolhido o texto da canção Conselhos (Carlos Gomes
), cuja partitura (linha vocal e piano) está no anexo II. Esse texto tem 195 sílabas,
segmentadas conforme metodologia descrita adiante. Ele foi lido por todos os grupos e
cantado por SOL e COR, não declamado, com a execução sem e com acompanhamento
digital. A taxa de elocução obtida na leitura realizada pelas locutoras justificou a pulsação
16
escolhida posteriormente para o acompanhamento.
Também foram gravados dados de fala de gêneros textuais distintos, que, no entanto,
devido ao volume de dados, foram reservados para futuros estudos, sendo eles: texto
jornalístico (255 palavras sem repetição, aproximadamente 400 sílabas) poesia (cinco
repetições com 119 palavras, aproximadamente 1500 sílabas), e fala coloquial condicionada
por entrevista, totalizando em torno de 12h30min de gravações e 64800 ocorrências
silábicas.
2.5 Método de gravação, descrição de variáveis e segmentação
Os dados de produção falada e cantada foram gravados em estúdio profissional. A
taxa de amostragem inicial de 96KHz estéreo foi ajustada posteriormente para 16KHz mono
para as análises. A seguir, são descritos os métodos semiautomáticos de segmentação e
análise, e as variáveis e estimativas empregadas.
2.5.1 Método de segmentação e análises semiautomáticas.
Para o processamento desses dados foram criadas rotinas (scripts) específicas dentro
dos programas Praat (www.praat.org) e R (www.r-project.org), ambos de domínio público,
afim de extrair e analisar os dados. A extração dos formantes foi elaborada a partir da rotina
criada por Oliveira e Arantes (2009), adaptada para a extração automática de várias séries
de dados e montagem das tabelas do corpus. Com o programa MuseScore versão 0.95
(www.musescore.org) foram criados o acompanhamento musical digitalizado, a linha
melódica e a duração silábica. Todos esses parâmetros foram obtidos da partitura e usados
como referência para a produção cantada.
Num primeiro momento, as gravações foram segmentadas manualmente.
Posteriormente, elas foram reavaliadas com o uso do algoritmo de Alinhamento Temporal
17
Dinâmico (Dynamic Time Warping, doravante DTW, de acordo com ITAKURA, 1975;
MYERS, RABNER e ROSENBERG, 1980; COLEMAN, 2005; MORI ET AL. 2006). Várias são
as aplicações desse algoritmo, principalmente em reconhecimento de padrões visuais ou de
fala.
O DTW é usado para ajustar séries temporais, e permite avaliar a similaridade, ou
melhor, o grau de semelhança entre duas séries comparadas (MEYER e BUCHTA, 2009; LI
ET COLS, 2010). Especificamente, o algoritmo DTW fornece uma solução eficaz para o
problema de medida de similaridade entre duas séries temporais (cadeias sonoras) de fala
de comprimentos diferentes (LEITNER ET COLS., 2010).
O gráfico seguinte mostra um exemplo dessa aplicação. As segmentações foram
reavaliadas por meio dessa técnica de alinhamento, permitindo correção das segmentações
realizadas manualmente.
18
O gráfico apresenta o alinhamento de séries temporais via DTW. Ele mostra dois eixos
de índices, de referência e de consulta, para dados de entoação (f0, em semitons) de uma
informante na produção falada. Os índices de referência pertencem à amostra que é usada
como “padrão” de comparação, enquanto que os índices de consulta pertencem à amostra
que será analisada. O ajuste da curva de alinhamento permite aproximar, ou melhor, alinhar
as duas amostras através dos índices gerados pelo algoritmo.
19
Figura 2.5.1: Alinhamento Temporal Dinâmico de séries entoacionais
2.5.2 Descrição das Variáveis
2.5.2.1 Variáveis Acústicas e Categóricas
As variáveis acústicas são f0, duração, intensidade do nível de pressão sonora (SPL)
e formantes. As medidas de f0, em Hertz (Hz) foram convertidas em semitons (st), com
referência em 440Hz, para padronizar fala e canto, permitindo assim a comparação direta. A
duração foi medida em segundos (s); intensidade em decibéis (dB); e os formantes F1, F2 e
F3, em Hertz, tendo posteriormente sido convertidos em Bark.
As variáveis categóricas são: grupo; padrão acentual (PA); tonicidade (TN); sintagma
fonológico (SF); sintagma entoacional (SE) (NESPOR e VOGEL, 1986; SELKIRK, 1984);
posição de proeminência de sintagma entoacional (PSE); e posição de proeminência de
sintagma fonológico (PSF), conforme já explicado para a partitura.
Grupo compreende as informantes LOC, COR e SOL. O padrão acentual (PA) é
definido segundo Mattoso Câmara (1970 e 1977): 0 para as pós-tônicas, 1 para as
pretônicas, 2 para as tônicas não proeminentes, e 3 para as tônicas proeminentes. A
Tonicidade (TN) é definida como fraca (w) ou forte (s), segundo Hayes (1985).
A duração e os limites de Sintagma Fonológico (SF) e Sintagma Entoacional (SE)
foram medidos e avaliados, e suas posições de proeminência nas linhas de letra foram
categorizadas à esquerda, medial ou à direita. Assim, recapitulando, a posição de
proeminência de sintagma entoacional (PSE) compreende as categorias à esquerda (SEE),
medial (SEM), e à direita (SED). A posição de proeminência de sintagma fonológico (PSF)
recebe rótulos semelhantes à posição de sintagma entoacional (SFE, SFM, SFD).
2.5.2.2 Variáveis Estimadas
A variabilidade formântica de cada produção é decorrente da articulação da
mandíbula, do corpo da língua e dos lábios. Duas variáveis foram estimadas para analisar os
20
seus efeitos: a Área de Espaço Vocálico (VSA, Vowel Space Area) e a Razão de
Centralização Formântica (FCR, Formant Centralization Ratio). Ambas foram analisadas
para cada posição acentual (pretônica, tônica e pós-tônica).
2.5.2.2.1 Área de Espaço Vocálico
A observação dos espaços vocálicos pode dar pistas da atividade articulatória
executada pelas informantes. Esses espaços foram estimados pelas regras de
triangularização, de acordo com a Geometria Plana, segundo a fórmula de Heron. A sua
observação permite fazer inferências sobre abertura/fechamento e
posterização/anteriorização, decorrentes, como já se disse, da atividade dos articuladores
mandíbula, lábios e língua (LINDBLOM e SUNDBERG, 1971).
Os formantes, medidos em Hertz, foram usados no cálculo dos espaços vocálicos a
partir da conversão em Bark. Essa medida psicoacústica está relacionada à percepção, e é
também conhecida como medida de banda crítica. Sua conversão foi feita pela
transformação de Traunmuller (1990). As vogais foram rotuladas de acordo com o texto da
partitura, não tendo sido consideradas as vogais nasais e os encontros vocálicos (ditongos e
hiatos).
2.5.2.2.2 Razão de Centralização Formântica
A Razão de Centralização Formântica (FCR) é uma nova medida para a avaliação
global das distâncias relativas entre as vogais dos falantes (SAPIR et al., 2010). Esse
procedimento é empregado para normalizar os formantes vocálicos, e usado para reduzir a
variabilidade associada ao falante nos estudos de percepção vocálica (ADANK, SMITS, e
van HOUT, 2004).
A avaliação da variabilidade dos espaços vocálicos com essas duas estimativas, VSA
e FCR, permite fazer inferências sobre a produção da fala. Valores altos de FCR refletem
centralização das vogais, ao passo que valores baixos indicam a sua expansão. Vogais
centralizadas mostram possível imprecisão articulatória e consequente menor inteligibilidade,
21
enquanto vogais periféricas indicam precisão.
2.6 Análise fonológica do corpus
Por tratar-se de um único texto, a canção teve o mesmo tipo de segmentação e
análise fonológica nas duas produções, falada e cantada. Ainda que outros trabalhos citem
pelo menos quatro níveis prosódicos com base em evidências duracionais (WIGHTMAN et
al. 1991; LADD e CAMPBELL 1991), adotou-se aqui os níveis hierárquicos de constituintes
prosódicos que muitos trabalhos consideram em seus experimentos: os sintagmas
entoacional e fonológico, segundo a nomenclatura de Nespor e Vogel (1986).
Diversas teorias linguísticas descrevem de forma semelhante a estrutura hierárquica
da prosódia, com diversos níveis (LIBERMAN e PRINCE, 1977; SELKIRK, 1980, 1984;
BECKMAN e PIERREHUMBERT, 1986; NESPOR e VOGEL, 1983; LADD, 1986). Nessas
abordagens, é comum a estrutura prosódica ter pelo menos dois níveis de constituintes: o
sintagma entoacional e o sintagma fonológico. Esse último sintagma (fonológico) é chamado
de intermediário na terminologia de Beckman e Pierrehumbert.
Para os autores citados, a sentença é composta de sequência(s) de sintagmas
entoacionais, que, por sua vez, são compostos de sequências de sintagmas fonológicos,
onde as pausas são consideradas quebras entre sintagmas. Assim, a quebra de sintagma
entoacional é percebida como mais forte ou mais saliente que a quebra de sintagma
fonológico. Ainda, os sintagmas entoacionais são delimitados por fronteiras tonais, e os
sintagmas fonológicos são, teoricamente, marcados com acento frasal, onde os marcadores
inflexão de curva entoacional podem ser altos ou baixos (BECKMAN e PIERREHUMBERT,
1986).
Em outras teorias de entoação (por exemplo t´HART, COLLIER e COHEN, 1990), os
marcadores entoacionais também ocorrem nas fronteiras acentuais, mas são identificados
com o movimento, e são ambos referidos como elevação e/ou abaixamento. A transição
entre os constituintes prosódicos costuma também ser marcada por alongamento segmental
e silábico em final de sintagma (WIGHTMAN et al., 1992).
22
2.6.1 Dados de Fala
A seguir são descritas as análises do corpus de fala, considerando-se o modelo
fonológico descrito anteriormente.
2.6.1.1 Texto da Canção
A observação das amostras gravadas da produção falada com o texto da canção
revelou uma estrutura similar quanto à produção das pausas nas fronteiras prosódicas. As
pausas em fronteiras prosódicas previstas pelo modelo adotado foram confirmadas pelas
gravações de fala com uma taxa de concordância de aproximadamente 72% entre os dados
observados e o modelo (esperado). Esse fato levou adotar a segmentação dos dois
constituintes prosódicos citados (sintagmas entoacional e fonológico), primeiramente, com
posterior avaliação por parte de juízes, os quais observaram o texto, sem explicitar
marcadores de pontuação, e colocaram as devidas marcas de pausas e fronteiras, obtendo
aproximadamente 69% de concordância.
Para avaliar e comparar a proeminência tonal ou a duracional, ou ainda, a combinação
das duas foram calculadas as derivadas primeiras das curvas dos dados de duração e
entoação. Esse procedimento permitiu observar que 85 % dos dados de fala tiveram
fronteiras coincidentes. Com base nesses resultados preliminares assumiu-se nos níveis
sintagma entoacional (SE) e fonológico (SF) a seguinte estrutura de segmentação:
23
Nas proeminências em que as falantes apresentavam um percentual de concordância
baixo, a estrutura foi atribuída segundo o algoritmo preconizado pelo modelo fonológico
adotado. Com isso, a segmentação final atribuída foi aquela feita pela maioria das
informantes, em concordância com os resultados obtidos pela análise de julgamento, e pelas
análises via derivada primeira. Várias pausas apareceram em menor número e em fronteiras
possíveis e previsíveis pela teoria adotada.
As pausas foram segmentadas, incluindo algumas menos numerosas e de menor
duração, mas, não analisadas. Elas apresentaram alta variabilidade duracional em diversos
contextos sintagmáticos, ainda que previsíveis pela teoria. Tal variabilidade é, aliás, uma
24
SE01:[Menina venha cá]SF01 [veja o que faz]SF02
SE02:[Se por seu gosto o casamento quer]SF03
[a vontade ao marido há de fazer]SF04
SE03:[que este dever o casamento trás]SF05
SE04:[Se o homem velho for ou se ainda rapaz]SF06
[tome tome a lição que ele quiser lhe dar]SF07
SE05:[Se funções e contra danças não quiser]SF08
[também não queira que é melhor]SF09
[pra não brigar]SF10
SE06:[Menina venha cá veja o que faz]SF11
SE07:[Procure de agradar sem contrariar]SF12 [pronta sempre a obedecer]SF13
SE08:[Tenha dele cuidados com amor enquanto ao resto deixe lá correr]SF14
SE09:[Se ainda muito moço e arrebatado for]SF15
[nada nada de ciúmes que seria pior]SF16
SE10:[Oh menina venha cá]SF17 [veja o que faz]SF18
SE11:[A mulher só faz o homem bom e mau]SF19
SE12:[Que assim como dá pão]SF20 [pode dar pau]SF21
SE13:[Ai]SF22
questão controversa entre vários autores que abordam a hierarquia prosódica. A
recursividade algorítmica adotada por modelos hierárquicos pode, em alguns casos, criar
categorias prosódicas não concordes, ou até duvidosas para algumas línguas, como, por
exemplo, os clíticos na abordagem de Nespor e Vogel. Outros níveis hierárquicos são
concordes, como nos níveis entoacional e intermediário nas abordagens de SELKIRK (1980,
1984) BECKMAN e PIERREHUMBERT (1986), e NESPOR e VOGEL (1986). A figura a
seguir mostra a aparência final da segmentação.
2.6.2 Dados de Canto
Como já explicado, os dados da produção cantada foram obtidos da canção de
câmara Conselhos, composta por Carlos Gomes. Essa canção tem em seu subtítulo um
indicativo da sua “filiação” à música popular brasileira. Ela foi escolhida por ter sua tessitura
25
Figura 2.6.1: Segmentação dos dados do corpus.
próxima à tessitura da produção falada no Português Brasileiro (PB). Sua segmentação
seguiu os pressupostos explicitados anteriormente.
2.6.2.1 Produção cantada sem acompanhamento
A produção cantada sem acompanhamento foi gravada cinco vezes pelas coralistas
(COR) e solistas (SOL). Como foi dito, espera-se que essa produção seja distinta entre os
grupos de informantes. Se as solistas (SOL) mantiverem menor variabilidade de produção
nos três tipos de variáveis (duração, entoação e espaços vocálicos) do que as coralistas
(COR), ter-se-á um efeito da proficiência, que é condicionada pelo treinamento e prática
vocal.
2.6.2.2 Produção cantada com acompanhamento
A produção cantada com acompanhamento foi gravada cinco vezes pelas cantoras
(COR e SOL). Como já foi dito, espera-se que essa produção seja semelhante entre os
grupos dois grupos de informantes. Se as solistas (SOL) mantiverem a mesma variabilidade
de produção nos três tipos de variáveis (duração, entoação e espaços vocálicos) que as
coralistas (COR), supõe-se que elas se apoiem em recurso cognitivo externo, no caso, o
acompanhamento musical
2.7 Comparação entre Partitura e Interpretações Cantadas quanto a f0 e duração
Com dados categóricos originados das partituras, e gravações das performances
cantadas e lida, fez-se a comparação dos dados de duração e entoação (f0) a fim de avaliar
o pareamento entre produção e idealização. Esse problema já havia sido abordado em
26
Pessotti (2007), onde se suspeitou que tais produções eram muito semelhantes. Aqui
procurou-se reavaliar esse procedimento por meio da análise estatística inferencial (ANOVA),
uma vez que os dados são em maior quantidade.
2.8 Análises Estatísticas: Descritivas e Inferenciais.
2.8.1 Análises Descritivas
As análises estatísticas empregadas foram de dois níveis: descritivas e inferenciais.
As análises descritivas servem para ter uma visão geral dos dados, ou ainda, explorar seu
comportamento e tendências.
Para tanto, foram empregadas medidas de tendência central e dispersão, histogramas
e gráficos de médias com desvio-padrão. Primeiramente fizeram-se análises exploratórias
com os dados da partitura da canção e, posteriormente, com os dados acústicos coletados e
estimados.
2.8.2 Análises Inferenciais
As análises inferenciais realizadas permitiram aprofundar as descrições e tendências
encontradas na estatística descritiva dos dados. Elas foram realizadas com testes de
comparação de médias (teste t) quando há dois grupos, e Análise de Variância (ANOVA) com
mais grupos (SOL, COR, LOC).
27
28
3 Resultados e Análises: Partitura e Letra
29
30
3.1 Considerações Preliminares
Neste estudo assume-se que canto e fala se assemelham por transmitirem informação
com os mesmos aparatos, mais especificamente, com o trato vocal. Com essa premissa,
assume-se que o falante possivelmente ajusta, “sintoniza”, ou nos termos da teoria de
Traunmuller (1998), faz a modulação dos gestos articulatórios para executar as diferentes
produções, falada ou cantada. Ainda, segundo o autor, a percepção pode ser assim
considerada como o processo inverso. Esse processo de demodulação por parte do ouvinte
permite que ele possa replicar o que ouve.
Nessa perspectiva, a inteligibilidade pode estar correlacionada à percepção do que é
produzido pelo falante ou cantante. Ao se cantar certo texto, é preciso manter a mínima
inteligibilidade, que é muitas vezes requerida e melhor realizada por indivíduos/sujeitos que
se mostram mais proficientes com as práticas orais da língua em uso e, no caso, com a
composição musical.
Como a produção falada e a produção cantada possuem diferenças de modulação,
investigou-se três variáveis (duração, entoação e espaços vocálicos) que podem indicar a
mínima inteligibilidade requerida e executada pelas informantes descritas no capítulo anterior
(Metodologia).
Este capítulo descreve as análises exploratórias dos dados da partitura, e os capítulos
seguintes (4 e 5) descrevem as análises dos dados acústicos coletados, considerando a
estatística descritiva básica, via medidas de tendência central e de dispersão. Os resultados
aqui descritos mostraram que a tonicidade está correlacionada a fatores linguísticos e
musicais, bem como à manutenção da estrutura linguística. As análises inferenciais
realizadas naqueles dois capítulos (4 e 5) servem para a reavaliação dos resultados da
estatística descritiva dos dados acústicos e a comparação com os dados analisados neste
capítulo.
31
3.1.1 Análise Exploratória em Partituras
Canção é o resultado da interação entre letra e música. Considerando essa premissa,
assume-se a partitura como fonte de dados preditores de certa produção, concebida pelo
compositor, cuja interpretação cabe ao artista. Esse decidirá e realizará a melhor
performance da obra dentro de certas convenções estabelecidas, quer por certa linha
interpretativa, quer por certos parâmetros consagrados pelo gosto de certa audiência
(público).
Como se viu, a partitura é fonte de dados preditores, os quais podem ser
categorizados ou não. Dados nominais ou categóricos não são medidos, são contados e
considerados quanto à frequência de ocorrência. Tais dados não paramétricos porque as
distribuições de frequência não obedecem à curva normal. Foram feitas análises não-
paramétricas com os dados da canção (Conselhos, de Carlos Gomes – anexo II) gravada
pelas informantes, para se observar as possíveis interações existentes entre música e texto.
3.1.1.1 Análise das associações entre categorias linguísticas e musicais
Os dados de duração e f0 (contínuos), e fronteiras prosódicas (categóricos) foram
todos obtidos da partitura, conforme descrição e segmentação fonológica previamente
descritas. Os parâmetros acústicos esperados foram calculados (no caso dos dados
contínuos) e categorizados (no caso das fronteiras prosódicas).
Como anteriormente exposto, os dados referentes às proeminências de tom e de
duração foram estimados via cálculo da derivada primeira das curvas de duração e f0,
conforme descrito no capítulo anterior. A aplicação da derivada primeira produziu resultados
mais coerentes e, possivelmente, esse procedimento poderia ser aplicado a outras partituras5.
Retomando, os dados categóricos obtidos da partitura em análise são: Tonicidade,
Posição de Sintagma Entoacional (pos_SE), Posição de Sintagma Fonológico (pos_SF),
5 Aqui são relatados os resultados para Conselhos. O mesmo procedimento foi realizado em outras quatro canções, com resultados semelhantes, e serão reportados em trabalhos futuros.
32
Tempo, Proeminência de Duração (proemDur), Proeminência de Tom (proemTom), Pausas.
Com os cômputos de frequência, foram realizados os testes não paramétricos descritos
anteriormente:
• Associação: Pearson (χ2), valor exato de Fischer;
• Força da associação: V-Cramer;
• Significância por célula: desvios de Freeman-Tukey, com valores críticos de Sokal-
Rohlf (Sokal e Rohlf, 1981).
A tabela 3.1, expandida no anexo I (tabela 9.1), mostra os resultados significativos da
análise não paramétrica de Conselhos, com os valores realçados, para os testes χ2 e V-
Cramer. Esses resultados mostram que onde há uma sílaba tônica (tonicidade), há possível
proeminência de tom e de duração, e o tempo é considerado forte. Esses resultados são
esperados, pois tais sílabas estão em fronteiras prosódicas que são marcadas por pausas, à
33
Tabela 3.1: Resumo das análises não paramétricas da partitura de Conselhos (Carlos Gomes); S – resultado significativo; NS – resultado não significativo.
Variáveis significânciaTônica versus Sintagma Fonológico à Direita (SFD) STônica versus Sintagma Entoacional à Direita(SED) STônica versus Ocorrência de Pausa (presente) STônica versus Proeminência de Tom (pico) STônica versus Proeminência de Duração (sim) STônica versus Tempo (forte) SSFD/SED pareado com SFE/SEE SSFD versus Ocorrência de Pausa (presente) SSFE versus Proeminência de Tom (pico) NSSFD versus Proeminência de Duração (sim) SSFD versus Tempo (forte) SSED versus Ocorrência de Pausa (presente) SSEE versus Proeminência de Tom (pico) NSSED versus Proeminência de Duração (sim) SSED versus Tempo (forte) SOcorrência de Pausa (presente) versus Proeminência de Tom (pico) NSOcorrência de Pausa (presente) versus Proeminência de Duração (sim) SOcorrência de Pausa (presente) versus Tempo (forte) SProeminência de Tom (pico) versus Proeminência de Duração (sim) SProeminência de Tom (pico) versus Tempo (forte) SProeminência de Duração (sim) versus Tempo (forte) S
direita e/ou à esquerda desses sintagmas.
Os altos valores de V-Cramer para as variáveis referentes à proeminência de duração,
pausa, posição de sintagma fonológico e entoacional, tem alta significância na correção de
Fisher e em χ2. Esse resultado é esperado e mostra possível coerência entre a partitura e o
texto, entre o musical e o linguístico.
A tabela expandida no anexo I (tabela 9.2) mostra os valores assinalados na tabela
anterior considerados significativos, de acordo com o procedimento de Sokal-Rohlf. A
associação constatada via correção de Sokal-Rohlf aplicada ao teste de Freeman-Tukey
mostra que as fronteiras prosódicas são mais significativas em proeminências de duração
que em proeminências de tom.
Esses resultados evidenciam, também, relações linguísticas esperadas, como o
encontro das fronteiras prosódicas em níveis sintagmáticos hierárquicos (SFD e SED
pareados com SFE e SEE), sintagmas fonológico e entoacional à direita com ocorrência de
pausas, tempo forte e proeminência de duração. Tal proeminência se dá devido ao
alongamento silábico de fronteira, que é esperado na produção cantada, assim como na
produção falada.
O alinhamento tonal nas fronteiras prosódicas é aparentemente respeitado como
restrição linguística, como se pode notar nos resultados da análise da peça. A significância
para a associação entre posição tônica e a ocorrência das proeminências de tom também é
esperada no nível linguístico. Esse fato é coerente com a não significância da ocorrência de
pausas em fronteiras prosódicas à esquerda (SFE e SEE).
Esses resultados preliminares podem dar pistas para tentativa dos compositores de
criar canções que reflitam as estruturas da língua, esperando que os intérpretes recriem
essas estruturas nas suas “releituras” (performances). Tal busca é comum nas canções de
cunho popular, pois supõe-se que, nesse gênero, haveria maior compromisso com a
inteligibilidade e com a manutenção das estruturas sintagmáticas da língua.
Considera-se que a busca pela inteligibilidade é uma demanda do gênero música
popular. É interessante notar que Conselhos é considerada música de “cunho popular”, e traz
inclusive em sua partitura esse indicativo, embora ela faça parte do repertório camerístico
brasileiro. Pensando nessa valorização da inteligibilidade que a música popular busca − de
34
acordo com Tatit (1996) − pode-se levantar a hipótese de que a palavra falada no canto deixa
de ser instrumento simples, perde parta da sua função fonológica e da pertinência linguística,
e ganha uma função fonética suplementar, tornando-se instrumento musical, sem perder sua
inteligibilidade.
Os resultados até aqui obtidos mostram que a partitura musical sustenta a idealização
da manutenção das restrições linguísticas, pois o texto em análise não apresenta perda da
sua função fonológica nem da pertinência linguística. No entanto, essas funções podem ser
alteradas na produção, pois o que foi observado aqui é a idealização e não a cadeia sonora
gravada que seria resultante da performance de um intérprete.
3.1.1.2 Análises das Estimativas Acústicas da partitura a partir das categorias da letra
Antes de ser feita a análise acústica das produções gravadas serão aqui detalhadas
as análises das estimativas acústicas obtidas dos dados da partitura, cuja finalidade é
realizar posterior comparação com os dados das gravações. Foram estimados valores para
duração e entoação, adotando-se a taxa de 75 bpm para estimar a duração em segundos (s
). As estimativas para entoação (f0) foram obtidas em semitons (st), com o referencial em
440Hz.
35
O gráfico de densidade de probabilidade (figura 3.1) exibe os valores de duração em
segundos (s) estimados da partitura, onde os picos indicam a frequência das durações.
Pode-se observar dois valores mais proeminentes, refentes às figuras semicolcheia e
colcheia da partitura. A duração estimada mostra possível proximidade com a taxa de
elocução na fala moderada, que é de aproximadamente cinco sílabas por segundo, conforme
também observado em Barbosa (2006).
36
Figura 3.1: Curva de Densidade de Probabilidade para os dados de duração (em segundos) da partitura − Conselhos
0 1 2 3 4
0.0
0.5
1.0
1.5
2.0
2.5
3.0
D e n s i d a d e d e P r o b a b i l i d a d e d e C o n s e l h o s - D u r a ç ã o
N = 1 9 5 B a n d w i d t h = 0 . 0 7 3 1 1
dens
idad
e de
pro
babi
lidad
e
O gráfico da curva de densidade de probabilidade (figura 3.2) é relativo aos dados de
entoação, obtidos da estimativa da partitura. A entoação foi estimada em semitons (st), com
referência em 440Hz. A bimodalidade observada no gráfico é relativa aos dois tons mais
frequentes na partitura, cuja tessitura é próxima à da fala.
Esses gráficos mostram o que pode ser expresso na estatística descritiva dos dados
de duração e entoação, que são apresentados a seguir (tabela 3.1). Os valores de assimetria
e curtose indicam o deslocamento do gráfico (assimetria, nesse caso, à esquerda) e o grau
de afilamento/achatamento da distribuição dos dados (curtose), valores que são relativos à
frequência de ocorrência das notas na partitura.
37
Figura 3.2: Curva de Densidade de Probabilidade para os dados de entoação (f0) com valores estimados da partitura - Conselhos
- 1 0 - 5 0 5 1 0 1 5
0.0
00
.02
0.0
40
.06
0.0
80
.10
D e n s i d a d e d e P r o b a b i l i d a d e d e C o n s e l h o s - E n t o a ç ã o
N = 1 9 5 B a n d w i d t h = 1 . 1 7
de
nsi
da
de
de
pro
ba
bili
da
de
Os resultados observados para a duração mostram que existe alta variância, pois o
desvio padrão é próximo ao valor da média. Os resultados observados para a entoação
mostraram também alta variabilidade, tendência mais central dos dados e possibilidade de
achatamento da curva, pois os valores são baixos, apesar da bimodalidade acima aludida.
Os resultados até agora obtidos mostram que é necessário realizar a descrição e
análise dos dados acústicos de gravações. Com os valores estimados e as estatísticas
obtidas é possível realizar uma comparação direta com os dados acústicos, com o intuito de
avaliar as semelhanças e diferenças no nível duracional e entoacional.
Por outro lado, esses resultados mostram que é necessário investigar melhor a
magnitude da força das fronteiras prosódicas como caracterizadoras da estrutura linguística
refletida na música, especialmente na música de câmara, ou melhor, averiguar que peso têm
os alinhamentos de força silábica (Tempo Forte) com as proeminências musicais como
marcadores de fronteiras.
Recapitulando, os resultados obtidos para as associações entre fatores prosódicos
relativos à comparação letra versus partitura teve valores significativos para tonicidade em
relação às seguintes variáveis: posição de sintagma (SE e SF), proeminência de duração,
proeminência de tom, tempo e pausa. Também tiveram valores significativos as associações
para proeminência de duração em relação às seguintes variáveis: tonicidade, posição de
sintagma (SE e SF), proeminência de tom, tempo e pausa. Não foram significativas as
associações para proeminência de tom em relação às seguintes variáveis: posição de
sintagma (SE e SF) e pausa. Tais resultados evidenciam a manutenção da estrutura
linguística pela partitura, mas, nada revelam sobre a produção do intérprete, pois ela, a
partitura, é uma idealização concebida pelo compositor.
Nos capítulos seguintes faz-se a análise acústica da produção falada (capítulo 4) e
cantada (capítulo 5) da canção de câmara em questão, lida e cantada por informantes
38
Tabela 3.2: estatística descritiva dos dados acústicos estimados da partitura
média desvio padrão assimetria curtose nduração 0,6218 0,6029 3,4902 15,2966 195entoação 0,7641 4,8157 0,6702 -0,1424 195
cantoras, coralistas e solistas, e lida por outro grupo de informantes, locutoras profissionais
não cantoras. A metodologia de análise já foi exposta no capítulo anterior.
39
40
4 Resultados e Análises: Gravações de Fala
41
42
4.1 Considerações preliminares
Este capítulo descreve os testes realizados com os dados de gravação de fala, os
quais procuram averiguar a primeira hipótese (H1) elencada na Introdução: a fala é distinta
entre os grupos. Recapitulando, foram gravados três grupos de informantes (LOC, SOL e
COR) que leram o texto de Conselhos com cinco repetições.
As gravações foram segmentadas de acordo com o modelo descrito na Metodologia.
Os dados foram extraídos das segmentações de acordo com as variáveis descritas
anteriormente. A tabela do anexo I (tabela 9.3) mostra os resultados da estatística descritiva:
média, desvio padrão (desvpad), assimetria e curtose. O índice nT na tabela mostra o
número de sílabas.
4.2 Análises dos dados de duração
4.2.1 Análise descritiva
As medidas de tendência central (média e desvio padrão) dos dados de duração de
fala mostram que as informantes aparentemente realizam a leitura com durações
semelhantes entre si. A assimetria mostra a dispersão dos dados mais à esquerda, isto é, há
maior frequência de valores de menor duração.
43
O histograma da figura 4.1 ilustra a estatística descritiva. Nesse caso, optou-se pela
padronização via função densidade de probabilidade, procedimento estatístico que permite
comparar os histogramas em mesma escala, por meio da sua suavização em uma curva. As
curvas de cada grupo foram sobrepostas para comparação visual, junto com a curva dos
valores médios, mostrando que não há diferença aparente entre os grupos.
44
Figura 4.2.1: Histograma dos dados de duração de fala, com curvas de densidade de probabilidade para cada informante.
Os resultados ilustrados no gráfico foram preditos pela assimetria. Eles podem dar
pistas da taxa de elocução produzida por todas as informantes, que aparenta ser semelhante
entre elas, e, consequentemente, entre os grupos. Esse fato pode ser explicado com base no
conhecimento que as informantes têm da língua para produzir taxas de elocução
semelhantes, pois não se pediu leitura acelerada ou lenta, nem declamação com peso
emotivo. A grande maioria das informantes permaneceu numa taxa de elocução em torno de
cinco sílabas por segundo, com produções mais alongadas em sílabas tônicas.
4.2.2 Análises inferenciais
Considerando-se as categorias usadas na análise não paramétrica foram realizadas
as análises de variância (ANOVA), considerando a duração como variável independente, e
as seguintes como variáveis dependentes: duração total do texto da canção (grupo), posição
proeminência de sintagma entoacional (PSE), posição de proeminência de sintagma
fonológico (PSF), padrão acentual (PA), e Tonicidade (TN).
A ANOVA realizada (tabela 4.1) mostra significância para quase todas as variáveis, ou
melhor, a duração é distinta para Grupo, Padrão Acentual (PA), Tonicidade (TN) e Posição de
Proeminência de Sintagma Entoacional (PSE). Já o resultado não significativo para Posição
de Proeminência de Sintagma Fonológico (PSF) indica duração semelhante nessa variável.
45
Tabela 4.1: ANOVA para dados de duração de fala
Fala
F valor p significânciaGrupo 2 24,4690 0,0000 SPosição de Proeminência de Sintagma Entoacional 2 17,6692 0,0000 SPosição de Proeminência de Sintagma Fonológico 2 2,0285 0,1316 NSPadrão Acentual 3 4990,0303 0,0000 STonicidade 1 382,7251 0,0000 S
Variável Resposta: duraçãoDf
A tabela 4.2 exibe as médias e desvios padrão de duração para as variáveis
linguísticas analisadas na ANOVA. A relação entre os grupos foi avaliada por teste post-hoc
(Tukey), com os seguintes resultados para as variáveis relativas à hierarquia prosódica: a)
posição de sintagma entoacional e fonológico mostram semelhança entre os grupos (SOL =
COR = LOC); b) as médias para o Padrão Acentual tem valores semelhantes entre LOC e
SOL, porém, maiores que COR; d) Tonicidade mostra a gradiência entre os grupos que têm
prática profissional (SOL > LOC > COR).
As diferenças observadas sugerem que a primeira hipótese desse estudo se mantém,
ou melhor, a fala é diferente entre os grupos. Tais diferenças também sugerem influência de
treinamento, como notado em Padrão Acentual e nas medidas de duração para a variável
grupo. Nessas variáveis, os dois grupos com prática profissional (LOC e SOL) tem valores
próximos. A semelhança nas posições de sintagma indicam que todos os grupos respeitam a
estrutura linguística, pois procuram manter a hierarquia prosódica.
4.3 Análise dos dados de entoação (f0)
4.3.1 Análise Descritiva
As medidas de tendência central (média e desvio padrão) mostram valores próximos
entre os grupos, apesar dos desvios padrões altos. Já as medidas de dispersão mostram as
diferenças entre os grupos. O histograma da figura 4.2 ilustra o que foi obtido na estatística
descritiva.
46
Tabela 4.2: Médias e desvios padrão das variáveis linguísticas em relação à duração por grupo.
VariáveisLinguísticasSOL COR LOC
relaçãomédia desvio padrão média desvio padrão média desvio padrão
grupo 0,2181905 0,1180361 0,2075892 0,1135793 0,2162057 0,1077118 SOL = LOC > CORPSE 0,2643188 0,1074260 0,2598994 0,1073581 0,2628682 0,0953636 SOL = LOC = CORPSF 0,2651427 0,0992833 0,2578589 0,0988952 0,2604579 0,0886757 SOL = LOC = CORPA 0,2438672 0,0827485 0,2330028 0,0824891 0,2391601 0,0737291 SOL = LOC > CORTN 0,2201306 0,0900891 0,2093257 0,0888998 0,2183306 0,0831092 SOL > LOC > COR
A figura 4.2 ilustra as curvas de densidade de probabilidade de cada grupo para os
dados de entoação (f0) em semitons (st). Conforme já mencionado, optou-se pela
padronização via função densidade de probabilidade e a suavização da curva dos dados,
47
Figura 4.3.1: Histograma dos dados de entoação (f0) de fala, com curvas de densidade de probabilidade para cada informante.
com a sobreposição das curvas de cada grupo e da curva de valores médios para
comparação visual. Esse gráfico mostra que há diferença entre os grupos e levanta a
hipótese da influência do treinamento vocal, pois LOC mantém a entoação mais grave,
enquanto que SOL e COR mantiveram entoação mais aguda, porém distinta, pois SOL está
próxima do valor médio.
4.3.2 Análises Inferenciais
Considerando-se as categorias usadas na análise não paramétrica foram realizadas
as análises de variância (ANOVA), sendo a entoação (f0) como variável independente, e as
seguintes como variáveis dependentes: duração total do texto da canção (grupo), posição
proeminência de sintagma entoacional (PSE), posição de proeminência de sintagma
fonológico (PSF), padrão acentual (PA), e Tonicidade (TN).
O resultado significativo na ANOVA dos dados de entoação (tabela 4.3) mostra a
diferença de produção entre os grupos, o que é esperado, além de corroborar a primeira
hipótese (fala diferente entre os grupos).
48
Tabela 4.3: ANOVA para dados de entoação de fala.
FalaVariável Resposta: f0
Df F valor p significânciaGrupo 2 889,1952 0,0000 SPosição de Proeminência de Sintagma Entoacional 2 64,5581 0,0000 SPosição de Proeminência de Sintagma Fonológico 2 6,2107 0,0020 SPadrão Acentual 3 343,8876 0,0000 STonicidade 1 22,8440 0,0000 S
A tabela 4.4 mostra as médias e desvios padrão de f0 para as variáveis linguísticas
analisadas na ANOVA. Essas medidas são globais, e o resultado mais frequente mostra a
gradiência SOL > COR > LOC, separando cantoras das locutoras, e, ainda, um indicativo da
influência do treinamento para o canto. No entanto, a relação é diferente para PSF: COR >
SOL > LOC. Esse resultado sugere o mesmo efeito observado nas curvas dos histogramas
de f0, isto é, levanta a hipótese da influência do treinamento vocal profissional, pois LOC e
SOL são os grupos que possuem maior tempo de treinamento, além da prática profissional.
4.4 Análise das estimativas de espaço vocálico nas posições acentuais
Os espaços vocálicos são estimativas acústicas que mostram as possíveis
configurações de abertura/fechamento, posterização/anteriorização vocálica, e podem dar
indícios da atividade dos articuladores mandíbula, lábios e língua (LINDBLOM E
SUNDBERG, 1971). Como já dito, o cálculo dos espaços vocálicos foi feito com as medidas
dos formantes realizadas em Hertz, posteriormente convertidas em Bark via transformação
de Traunmuller (1990). Bark é uma medida psicoacústica que está relacionada à percepção,
também conhecida como medida de banda crítica.
As vogais foram rotuladas com o alfabeto SAMPA6 durante a segmentação, e plotadas
com o IPA, a seguir. SAMPA é o alfabeto fonético que utiliza fontes comuns a todos os
editores de texto e programas de análise fonético-fonológica, sem a necessidade da
instalação de fontes especificas, como aquelas empregadas pelo IPA.
6 Conferir: http://www.phon.ucl.ac.uk/home/sampa/index.html
49
Tabela 4.4: Médias e desvios padrão para f0 em relação às variáveis linguísticas.
VariáveisLinguísticasSOL COR LOC
relaçãomédia desvio padrão média desvio padrão média desvio padrão
grupo -10,0690 4,7179 -10,2484 3,9244 -13,2489 4,1956 SOL > COR > LOCPSE -9,5992 4,8329 -11,0247 3,7740 -13,9583 4,2244 SOL > COR > LOCPSF -13,3892 4,5978 -10,8174 3,6575 -13,6250 4,1249 COR > SOL > LOCPA -10,0222 4,5325 -10,6326 3,8118 -13,6237 3,9721 SOL > COR > LOCTN -9,3415 4,6585 -10,2633 3,8872 -13,2643 4,1585 SOL > COR > LOC
A plotagem das vogais foi concebida quanto à tonicidade – pretônica, tônica ou
postônica – sem considerar as vogais nasais e os encontros vocálicos. As vogais [i, I, e, E, a,
A, o, O, u, U] foram os pontos de base para o cálculo das estimativas: área de espaço
vocálico (VSA) e razão de centralização formântica (FCR).
A figura 4.3 (ampliada no anexo III) mostra os espaços vocálicos da fala das coralistas
(COR). As tônicas aparentam maior área, além de centralização formântica em [E, a, o]. As
pretônicas possuem maior área de espaço vocálico que as postônicas, com dispersão
vocálica em todas as vogais, nas duas posições acentuais. Esse dado de dispersão pode
indicar imprecisão articulatória, com possível falta de inteligibilidade.
50
Figura 4.4.1: Espaços vocálicos nas posições acentuais de fala das coralistas (COR).
A figura 4.4 (ampliada no anexo III) mostra os espaços vocálicos da fala das solistas
(SOL). A maioria das vogais tônicas aparenta áreas mais delimitadas e menor dispersão que
em COR. Além disso, a área desses espaços vocálicos aparenta ser homogênea em todas
as posições acentuais, e, com certo abaixamento de [a] nas tônicas, indicativo de maior
abertura mandibular.
A figura 4.5 (ampliada no anexo III) mostra os espaços vocálicos da fala das locutoras
51
Figura 4.4.2: Espaços vocálicos nas posições acentuais de fala das solistas (SOL).
Figura 4.4.3: Espaços vocálicos nas posições acentuais de fala das locutoras (LOC).
(LOC). Como notado com as SOL, elas têm maior área de espaço vocálico nas três posições
acentuais, além de aparentar áreas mais delimitadas com menor dispersão, que implica em
melhor inteligibilidade. Esse fato comum aos dois grupos é indicativo da prática vocal
profissional que possuem.
4.4.1 Área de Espaço Vocálico (VSA)
Recordando, foram calculadas estimativas de Área de Espaço Vocálico (VSA) e
Razão de Centralização Formântica (FCR), que permitem fazer inferências do ponto de vista
da precisão articulatória e da inteligibilidade.
A análise de variância (ANOVA) da tabela 4.5 foi conduzida considerando o grupo
(LOC, COR e SOL) em relação a VSA na posição acentual (pretônica, tônica e pós-tônica).
Os resultados foram significativos para as tônicas e não significativos para as pretônicas e
pós-tônicas, resultado que indica diferença entre as informantes para as áreas dos espaços
vocálicos nas tônicas, e certa semelhança entre as informantes nas pretônicas e postônicas.
52
Tabela 4.5: ANOVA das medidas de espaço vocálico para a produção falada: área de espaço vocálico (VSA); significância: significativo (S), não-significativo (NS).
F valor p significância2 0,5409 0,5958 NS
VSA 2 8,5791 0,0049 S2 1,6344 0,2357 NS
dfpretônicatônicapós-tônica
A tabela 4.6 exibe as médias e desvios padrões das áreas dos espaços vocálicos para
cada grupo e em cada contexto acentual (pretônica, tônica e postônica), bem como a relação
entre os grupos verificada pelos resultados dos testes post-hoc (Tukey). Conforme já
observado, as átonas são semelhantes entre os grupos, enquanto que as tônicas de LOC
aparentam ser maiores que as das cantoras (SOL e COR). Médias com valores elevados
para as tônicas é indicativo de articulações mais extremas. Tais resultados corroboram a
influência da prática vocal profissional de LOC na leitura.
A tabela 4.7 exibe a comparação entre os grupos por meio do teste t (tabela 4.7), e,
novamente, observa-se que a diferença entre as informantes está nas tônicas. Conforme já
mencionado, esses resultados significativos para VSA mostram que LOC realiza movimento
articulatório maior que SOL e COR, principalmente nas tônicas, reforçando a influência da
prática vocal profissional nessa tarefa de leitura. Locutores buscam melhor inteligibilidade na
sua produção, que, além de exigência da profissão, é alcançada com muita prática e
treinamento de precisão articulatória.
53
Tabela 4.6: Médias e desvios-padrão para VSA por grupo e padrão acentual.
VSASOL COR LOC
relaçãomédia desvio padrão média desvio padrão média desvio padrão
pretônica 4,8736 1,2374 4,6595 1,7661 5,6176 1,5371 LOC = SOL = CORtônica 5,6456 1,0805 4,9535 1,1638 9,4844 2,8097 LOC > SOL = CORpostônica 2,4061 0,5326 1,8866 0,4382 2,6880 1,0204 LOC = SOL = COR
Tabela 4.7: teste t para as estimativas de espaço vocálico (VSA) comparando grupos na produção falada
variável grupo t valor p significância0,8431 0,4247 N0,9150 0,3874 N0,2220 0,8305 N2,8515 0,0345 S3,3314 0,0188 S0,9745 0,3585 N0,5477 0,6036 N1,6137 0,1629 N1,6842 0,1320 N
VSA-pretônicasloc-solloc-corsol-cor
VSA-tônicasloc-solloc-corsol-cor
VSA-postônicasloc-solloc-corsol-cor
4.4.2 Razão de Centralização Formântica (FCR)
As médias da razão de centralização formântica (FCR) por grupo e contexto acentual
exibem diferenças entre os grupos nas tônicas, e nenhuma diferença entre os grupos nas
pretônicas e postônicas. Recapitulando: valores altos de FCR refletem centralização das
vogais, ao passo que valores baixos indicam a sua expansão; vogais centralizadas indicam
imprecisão articulatória e consequente menor inteligibilidade, enquanto vogais periféricas
indicam precisão.
Os resultados da análise de variância (ANOVA) para as estimativas de razão de
centralização formântica (tabela 4.8) mostraram-se significativos somente para a tônica, e
não significativos para pretônicas e postônicas, resultados semelhantes aos obtidos para
VSA.
54
Tabela 4.8: ANOVA das medidas de espaço vocálico para a produção falada: razão de centralização formântica (FCR); significância: significativo (S), não-significativo (NS).
F valor p significância2 0,9303 0,4211 NS
FCR 2 5,5512 0,0196 S2 2,5478 0,1196 NS
dfpretônicatônicapós-tônica
A tabela 4.9 mostra os valores das médias e desvios-padrão para FCR por grupo e
padrão acentual. As LOC são o grupo de informantes que têm menor FCR nas tônicas,
seguidas de SOL, que tem as médias desses índices entre os dois grupos nos padrões
acentuais (pretônicas, tônicas e pós-tônicas). COR é o grupo com maior FCR, resultado que
implica em menor precisão articulatória.
A tabela 4.10 mostra os resultados da comparação entre os grupos por meio do teste
t. O resultado não significativo para FCR em relação a LOC e SOL indica semelhança entre
os dois grupos, e pode ser interpretado como marca de proficiência resultante da prática
vocal profissional. Os dois grupos são profissionais da voz que buscam inteligibilidade nas
suas produções. O resultado significativo para LOC e COR indica a diferença entre os
grupos com prática profissional (LOC) e os sem (COR), diferença relativa à leitura.
As tônicas ficam evidenciadas novamente, fato já observado na análise dos dados de
duração, entoação e VSA. Esses resultados indicam que os grupos usam as tônicas como
marcadores de expressividade, pois elas, as tônicas, são as protagonistas da conjunção
55
Tabela 4.10: teste t para as estimativas de espaço vocálico (VSA e FCR) comparando grupos na produção falada
variável grupo t valor p significância-1,0178 0,3401 N-1,3274 0,2268 N-0,3964 0,7025 N-1,6563 0,1599 N-2,8212 0,0251 S-2,1836 0,0738 N-0,6597 0,5322 N-2,0452 0,0876 N-1,9682 0,0854 N
FCR-pretônicasloc-solloc-corsol-cor
FCR-tônicas
loc-solloc-corsol-cor
FCR-postônicasloc-solloc-corsol-cor
Tabela 4.9: Médias e desvios-padrão para FCR por grupo e padrão acentual.
FCRSOL COR LOC
relaçãomédia desvio padrão média desvio padrão média desvio padrão
pretônica 1,5024 0,0631 1,5200 0,0765 1,4659 0,0497 COR = SOL = LOCtônica 1,4410 0,0251 1,4979 0,0526 1,3827 0,0747 COR > SOL > LOCpostônica 1,5999 0,0316 1,6364 0,0270 1,5815 0,0536 COR = SOL = LOC
letra/partitura.
Tais resultados parecem ter respaldo na literatura. Muitos estudos mostram que é
sobre a tônica que incide a maior variabilidade de f0 (LADD, 1996; GRABE et al, 1998;
GUSSENHOVEN, 1984). As mesmas vogais, tônicas, são as mais importantes para a
manutenção do ritmo na fala, conforme é observado em vários modelos de ritmo de
produção falada e de produção cantada (SMITH, 1991; SMITH, 1999; LARGE e COLEN,
1994; KAY et cols, 1987; SALTZMAN e BYRD, 1999; MARCUS, 1976; BARBOSA, 2002;
BURROWS, 1997).
4.5 Análise da Intensidade (SPL)
A tabela 4.11 mostra as médias e desvios-padrão para os dados de intensidade na
fala. Os resultados obtidos ressalvam a gradiência LOC > SOL > COR já observada
anteriormente, evidenciando os grupos que possuem prática vocal profissional. A análise de
variância realizada mostrou significância (F = 227521; df = 2; p < 0,05), bem como a
comparação aos pares por teste t (p < 0,05).
56
Tabela 4.11: Médias e desvios padrão de intensidade (SPL) por grupo.
SOL COR LOCrelação
média desvio padrão média desvio padrão média desvio padrãoIntensidade 68,0165 7,4748 64,7001 6,0438 74,3447 4,3082 LOC > SOL > COR
4.6 Análise dos Formantes
Aqui serão realizadas as análises dos formantes, que foram tomados como base para
o cálculo das estimativas dos espaços vocálicos. Recordando, tais espaços mostraram
evidências sobre a atividade articulatória realizada pelos grupos.
A tabela 4.12 mostra a ANOVA dos formantes por grupo, com diferenças significativas
entre os grupos. Esses resultados são esperados, e endossam a hipótese da diferença entre
os grupos na fala.
A tabela 4.13 exibe as médias e desvios padrão dos formantes (F1 a F3), e a relação
entre os grupos avaliada com teste post-hoc (Tukey). Os resultados apontam para a
gradiência entre os grupos (SOL > LOC > COR), evidenciando mais uma vez os grupos que
possuem prática vocal profissional (SOL e LOC).
57
Tabela 4.13: Médias e desvios padrões dos formantes por grupo.
FormantesSOL COR LOC
relaçãomédia desvio padrão média desvio padrão média desvio padrão
F1 3,3776 1,3228 2,4993 1,4185 2,7267 1,4621 SOL > LOC > CORF2 9,4770 1,7723 8,5984 1,8436 8,9767 1,9690 SOL > LOC > CORF3 14,3423 0,8896 13,7697 1,0742 14,1116 0,9916 SOL > LOC > COR
Tabela 4.12: ANOVA dos formantes por grupo.
F pF1 2 500,55 0,00F2 2 920,22 0,00F3 2 402,90 0,00
df
A tabela 4.14 exibe os resultados do teste t efetuado para a comparação entre os
grupos, com resultados evidenciando a diferença entre eles. Mais uma vez, esses resultados
reforçam a primeira hipótese sobre a diferença entre os grupos na fala.
4.7 Comparação entre dados acústicos e estimativas da partitura
Conforme já mencionado, a comparação dos dados de duração e entoação (f0) tem
por objetivo avaliar o pareamento entre produção e idealização. A tabela 4.15 mostra as
médias e desvios-padrão de duração e entoação (f0) para a partitura e os grupos.
A tabela 4.15 exibe as médias e desvios padrão de duração (em milissegundos) e
entoação em semitons (st), com referência em 440Hz. Recordando, essa medida para
entoação foi adotada por permitir comparação direta entre fala e canto, por isso, entende-se
que os valores negativos para entoação são aqueles abaixo da referência.
58
Tabela 4.14: teste t comparando os formantes por grupo na fala.
variável grupo t valor p significância
F1-Bark-22,7183 0,0000 S
7,6837 0,0000 S31,1705 0,0000 S
F2-Bark-12,9963 0,0000 S
9,6545 0,0000 S23,6494 0,0000 S
F3-Bark-11,9169 0,0000 S16,1017 0,0000 S28,2628 0,0000 S
loc-solloc-corsol-corloc-solloc-corsol-corloc-solloc-corsol-cor
Tabela 4.15: Médias e desvios-padrão de duração e entoação para partitura e grupos.
PARTITURA SOL COR LOCrelação
média desvio padrão média desvio padrão média desvio padrão média desvio padrãoduração 621,7949 602,8532 218,1905 118,0361 207,5892 113,5793 216,2057 107,7118 PAR > SOL = LOC > CORentoação 0,7641 4,8157 -10,0690 4,7179 -10,2484 3,9244 -13,2489 4,1956 PAR > SOL = COR > LOC
Variáveis Acústicas
De forma geral, observa-se na tabela 4.15 claramente as diferenças entre partitura e
grupos. SOL tem valores maiores que LOC e SOL na duração e na entoação, aproximando-
se da partitura. Esse fato poderia explicar a tendência das cantoras com maior prática e
treinamento em ler um texto de maneira próxima ao canto.
Outro fato que também pode justificar essa tendência é a relação SOL = COR para a
entoação, pois, esse resultado semelhante entre os grupos indica distinção entre cantoras e
locutoras. Por outro lado, a igualdade de SOL com LOC para duração sugere leitura
proficiente quanto ao ritmo, reflexo também da prática e do treinamento, pois ambos os
grupos são profissionais da voz.
Os dois fatos têm explicação na prática profissional, pois LOC deve fazer uso do
aumento duracional e da entoação baixa para elocução, diferente de COR. Já a comparação
das duas variáveis para SOL em relação aos outros grupos (COR e LOC) mostra valores
maiores, que pode indicar reflexo da prática vocal profissional do canto na fala.
A tabela 4.16 mostra os resultados da comparação via teste t dos dados acústicos de
duração e entoação com as estimativas obtidas da partitura. Os resultados significativos
reforçam o esperado: há diferença entre a produção falada e os valores obtidos das
estimativas, preditores para a produção cantada. Com esses resultados, pode-se entender
que os grupos têm produções duracionais e entoacionais próprias, não refletindo o que está
na partitura, que é uma representação musical, idealizada, e, sim, a maior variabilidade típica
da fala.
59
Tabela 4.16: teste t com os dados acústicos da produção falada e as estimativas da partitura
Falavariável grupo t valor p significância
duração-9,389 0,000 S-9,342 0,000 S-9,587 0,000 S
entoação-40,013 0,000 S-30,810 0,000 S-31,506 0,000 S
loc-partiturasol-partituracor-partituraloc-partiturasol-partituracor-partitura
60
5 Resultados e Análises: Gravações de Canto
61
62
5.1 Considerações Preliminares
Este capítulo descreve os testes realizados com os dados de gravação de canto, sem
e com acompanhamento. Recapitulando, foram gravados dois grupos de informantes
cantoras (SOL e COR) que cantaram a canção Conselhos sem e com acompanhamento
musical, com cinco repetições em cada condição.
As análises aqui realizadas procuram averiguar a segunda hipótese (H2) elencada na
Introdução: o canto pode ser semelhante ou diferente entre os grupos. Se o canto for
semelhante entre os grupos, ele apresenta propriedades dependentes da formação musical.
Se o canto for diferente entre os grupos, então ele apresenta propriedades dependentes do
treinamento e da prática.
Como já dito, as gravações foram segmentadas conforme o modelo descrito na
Metodologia, de onde foram extraídos os dados de acordo com as variáveis já descritas. A
tabela do anexo I (tabela 9.3) mostra os resultados da estatística descritiva: média, desvio
padrão (desvpad), assimetria e curtose. O índice nT na tabela mostra o número de sílabas.
5.2 Análises dos dados de duração
5.2.1 Canto sem acompanhamento
5.2.1.1 Análise descritiva
Recapitulando, a produção sem acompanhamento foi realizada pelos grupos de
cantoras COR e SOL como descrito na Metodologia. Cantar dessa forma (a capella) é uma
tarefa que exige proficiência por parte das informantes, ou ainda, a memorização das
informações contidas na partitura para a sua interpretação.
63
O histograma da figura 5.1 ilustra a estatística descritiva citada. Como já feito antes,
optou-se pela padronização via função densidade de probabilidade, procedimento que
permite comparação direta por meio da suavização da curva dos dados. As curvas de cada
64
Figura 5.2.1: Histograma de duração dos dados de canto sem acompanhamento.
grupo foram sobrepostas com a curva dos valores médios, sem diferença aparente entre os
grupos.
5.2.1.2 Análises inferenciais
Como já dito, foram realizadas as ANOVAs considerando a duração como variável
independente, e as seguintes como variáveis dependentes: duração total do texto da canção
(grupo), posição proeminência de sintagma entoacional (PSE), posição de proeminência de
sintagma fonológico (PSF), padrão acentual (PA), e Tonicidade (TN).
A tabela 5.1 apresenta as ANOVAs com o modelo já descrito. Os resultados mostram
que a duração não é significativa para grupo. Entende-se com esse resultado que os grupos
aparentemente não variam seu ritmo sem o acompanhamento. Essa manutenção rítmica é
afetada apenas pelos fatores prosódicos, como se pode verificar nos resultados significativos
para as demais variáveis.
65
Tabela 5.1: ANOVA para os dados de duração da produção cantada sem acompanhamento
Canto sem acompanhamentoVariável Resposta: duracao
Df F valor p significânciaGrupo 1 0,1861 0,6662 NSPosição de Proeminência de Sintagma Entoacional 2 143,8518 0,0000 SPosição de Proeminência de Sintagma Fonológico 2 64,2064 0,0000 SPadrão Acentual 3 2216,4388 0,0000 STonicidade 1 6,7150 0,0096 S
A tabela 5.2 exibe as médias e desvios-padrão para as variáveis linguísticas citadas.
As diferenças significativas encontradas nos testes post-hoc entre os grupos são
apresentadas. Observa-se os seguintes resultados distintos: a) SOL > COR para Padrão
Acentual (PA) e posição de proeminência de sintagma entoacional (PSE), b) COR > SOL
para Tonicidade (TN) e posição proeminência de sintagma fonológico (PSF).
Esses resultados mostram que os grupos tentam manter a seu modo a estrutura
musical. Espera-se que a posição de sintagma entoacional esteja pareada com a idealização
das frases musicais propostas na partitura. Os resultados para PA e PSE indicam o foco de
SOL nos níveis mais altos da hierarquia prosódico musical, pois a posição acentual está
atrelada ao posicionamento de sintagma entoacional. Os resultados para TN e PSF indicam
que COR usa estratégia contrária à de SOL, marcando unidades rítmicas de nível mais baixo
(TN) e apoiando-se no nível fonológico mais próximo à palavra (PSF) e não na entoação
(PSE).
A semelhança geral entre os grupos reflete parte da segunda hipótese (H2) referente
à formação musical, pois tendem a manter a duração total semelhante. Já as diferenças
locais nas variáveis linguísticas refletem a influência da prática e do treinamento, pois,
enquanto SOL preocupa-se com níveis linguísticos que pareiam com os musicais mais altos,
COR preocupa-se com níveis linguísticos que pareiam com os musicais mais baixos.
66
Tabela 5.2: Médias e desvios padrão de duração nas variáveis linguísticas por grupo.
SOL CORrelação
média desvio padrão média desvio padrãogrupo 0,2967 0,1304 0,3065 0,3712 SOL = CORPSE 0,6271 0,4468 0,6181 0,4144 SOL > CORPSF 0,5924 0,4196 0,5925 0,3968 COR > SOLPA 0,5104 0,3082 0,5038 0,2933 SOL > CORTN 0,4233 0,3216 0,4258 0,3037 COR > SOL
VariáveisLinguísticas
5.2.2 Canto com acompanhamento
5.2.2.1 Análise descritiva
Como já dito na Metodologia, as gravações cantadas com acompanhamento musical
foram segmentadas conforme modelo adotado. A estatística descritiva desses dados (tabela
9.3 do anexo I) mostra resultados semelhantes aos obtidos para o canto sem
acompanhamento.
67
A figura 5.2 mostra a sobreposição quase total das curvas suavizadas dos dados.
Como já feito antes, optou-se pela padronização via função densidade de probabilidade, pois
esse procedimento permite comparação visual direta, com a sobreposição das curvas de
cada grupo. A estatística descritiva corrobora a semelhança entre as curvas, cujo resultado
pode ser interpretado como realização rítmica semelhante. Diferente do canto a capella, o
68
Figura 5.2.2: Histograma de duração de canto com acompanhamento.
acompanhamento fornece bases rítmicas e harmônicas com as quais o/a cantor(a) pode fiar-
se na interpretação. As análises inferenciais vão endossar essas observações, como segue.
5.2.2.2 Análises inferenciais
Recapitulando, considerou-se nas análises de variância (ANOVA) realizadas a
duração como variável independente, e as seguintes como variáveis dependentes: duração
total do texto da canção (grupo), posição proeminência de sintagma entoacional (PSE),
posição de proeminência de sintagma fonológico (PSF), padrão acentual (PA), e Tonicidade
(TN).
A tabela 5.3 apresenta os resultados da ANOVA, e, da mesma forma que no canto
sem acompanhamento, eles mostram que a duração não é significativa para grupo, ou
melhor, pode-se entender que as informantes mantêm seu ritmo estável. De forma
semelhante ao canto sem acompanhamento, os grupos aparentam semelhante duração,
mas, essa manutenção poderia ser justificada pela presença do acompanhamento se não
fossem as diferenças significativas observadas nas variáveis linguísticas.
69
Tabela 5.3: ANOVA dos dados de duração do canto com acompanhamento.
Canto com acompanhamentoVariável Resposta: duracao
Df F valor p significânciaGrupo 1 0,3243 0,5690 NSPosição de Proeminência de Sintagma Entoacional 2 81,5537 0,0000 SPosição de Proeminência de Sintagma Fonológico 2 68,3232 0,0000 SPadrão Acentual 3 2346,9893 0,0000 STonicidade 1 6,9331 0,0085 S
A tabela 5.4 exibe as médias e desvios-padrão para a duração no canto com
acompanhamento, referente às variáveis linguísticas analisadas na ANOVA. As relações
entre os grupos são apresentadas, com semelhança global, e distinção nas variáveis
linguísticas. Como já observado, essas diferenças mostram como os grupos manipularam
tais variáveis para interpretar a partitura. O acompanhamento parece facilitar uma
aproximação da partitura para SOL, diferente de COR, que possui médias menores.
Esses resultados corroboram a segunda hipótese (H2) como observado no canto sem
acompanhamento, mas também a diferença entre os grupos com a influência do
acompanhamento, ressaltando a relação SOL > COR, resultado que enfatiza a influência da
prática e do treinamento.
5.3 Análise dos dados de entoação (f0)
5.3.1 Canto sem acompanhamento
5.3.1.1 Análise Descritiva
Recordando, o canto sem acompanhamento foi realizado por COR e SOL, como
descrito na Metodologia. O histograma da figura 5.3 ilustra o que foi obtido na estatística
descritiva: diferenças aparentemente justificadas pelos valores de desvio-padrão e medidas
70
Tabela 5.4: Médias e desvios padrão de duração para as variáveis linguísticas por grupo, canto com acompanhamento.
SOL CORrelação
média desvio padrão média desvio padrãogrupo 0,2753 0,1144 0,2839 0,3376 SOL = CORPSE 0,5413 0,3562 0,5346 0,3618 SOL > CORPSF 0,5522 0,3627 0,5462 0,3652 SOL > CORPA 0,4682 0,2578 0,4594 0,2672 SOL > CORTN 0,3913 0,2735 0,3880 0,2757 SOL > COR
VariáveisLinguísticas
de dispersão (assimetria e curtose).
Como já mencionado, optou-se pela padronização via função densidade de
probabilidade, procedimento que permite comparação direta por meio da suavização da
curva dos dados. As curvas de cada grupo, sobrepostas com a curva dos valores médios,
mostram diferenças mínimas entre os grupos, corroborando a estatística descritiva.
71
Figura 5.3.1: Histograma de entoação (f0) para canto sem acompanhamento.
5.3.1.2 Análises inferenciais
Novamente, considerou-se na análises de variância (ANOVA) realizadas f0 como
variável independente, e as seguintes como variáveis dependentes: duração total do texto da
canção (grupo), posição proeminência de sintagma entoacional (PSE), posição de
proeminência de sintagma fonológico (PSF), padrão acentual (PA), e Tonicidade (TN).
A tabela 5.5 apresenta os resultados das ANOVAs, com diferenças significativas em
grupos, padrão acentual e posições de sintagma (entoacional e fonológico). Esses resultados
indicam que os grupos usaram estratégias entoacionais distintas. O resultado não
significativo para Tonicidade indica semelhança rítmica nos níveis mais baixos, mesmo sem
acompanhamento (SOL = COR), pois Tonicidade é o correlato rítmico mais próximo entre
música, letra e produção (falada ou cantada).
72
Tabela 5.5: ANOVA para os dados de entoação da produção cantada sem acompanhamento.
Canto sem acompanhamentoVariável Resposta: f0
Df F valor p significânciaGrupo 1 7,5967 0,0059 SPosição de Proeminência de Sintagma Entoacional 2 37,1138 0,0000 SPosição de Proeminência de Sintagma Fonológico 2 9,4762 0,0001 SPadrão Acentual 3 51,9449 0,0000 STonicidade 1 0,8962 0,3438 NS
A tabela 5.6 exibe as médias e desvios-padrão para entoação por grupo das variáveis
analisadas na ANOVA para o canto sem acompanhamento. Note-se a relação SOL > COR
para as variáveis, exceto em Tonicidade (COR > SOL), resultados que podem ser
interpretados como reflexo da prática e do treinamento de SOL no emprego das variáveis
linguísticas para a interpretação da canção, enquanto que COR tenta manter a entoação
atrelada à pulsação rítmica, que é reflexo do conhecimento musical. Em outras palavras,
COR tenta manter a afinação sem perder o ritmo. Ainda que as médias sejam diferentes em
TN, a ANOVA considerou sem diferença significativa entre os grupos por terem desvios-
padrão elevados.
5.3.2 Canto com acompanhamento
5.3.2.1 Análise Descritiva
Recapitulando, o canto sem acompanhamento foi realizado por COR e SOL, como
descrito na Metodologia. O histograma da figura 5.4 ilustra a estatística descritiva, mostrando
poucas diferenças que podem ser justificadas pelo desvio-padrão e medidas de dispersão
(assimetria e curtose).
73
Tabela 5.6: Médias e desvios padrão de entoação por grupo, canto sem acompanhamento.
SOL CORrelação
média desvio padrão média desvio padrãogrupo 0,2161 3,8997 -0,0017 3,8946 SOL > CORPSE 0,6103 4,4743 -0,3460 4,4123 SOL > CORPSF 0,9001 4,4066 0,0738 4,3851 SOL > CORPA 0,5634 3,9461 0,1659 3,9544 SOL > CORTN -0,4094 3,8803 0,0063 3,8762 COR > SOL
VariáveisLinguísticas
Novamente, optou-se pela padronização via função densidade de probabilidade, por
permitir a comparação direta com a suavização da curva dos dados. Tais curvas
sobrepostas com a curva dos valores médios mostram poucas diferenças entre os grupos.
Tal observação visual corrobora a segunda hipótese (H2), quanto à semelhança entre os
grupos, pois ambos possuem formação musical para seguir o acompanhamento.
74
Figura 5.3.2: Histograma dos dados de canto com acompanhamento
5.3.2.2 Análises Inferenciais
A análise de variância (ANOVA) apresentada a seguir é referente aos dados de canto
com acompanhamento, realizada com o modelo antes descrito. Recapitulando, as variáveis
adotadas foram f0 como variável independente, e as seguintes como variáveis dependentes:
duração total do texto da canção (grupo), posição proeminência de sintagma entoacional
(PSE), posição de proeminência de sintagma fonológico (PSF), padrão acentual (PA), e
Tonicidade (TN).
A tabela 5.7 mostra a ANOVA da entoação (f0) referente às variáveis linguísticas
mencionadas. Os resultados mostram diferença não significativa de f0 para TN, que indica
manutenção dos acentos musicais por parte das cantoras. Como já notado anteriormente, as
outras diferenças significativas distinguem os grupos e suas possíveis estratégias de
interpretação, com a manipulação dos níveis hierárquicos prosódicos, já observado por
GELAMO(2006).
75
Tabela 5.7: ANOVA para os dados de entoação da produção cantada com acompanhamento
Canto com acompanhamentoVariável Resposta: f0
Df F valor p significânciaGrupo 1 4,6819 0,0305 SPosição de Proeminência de Sintagma Entoacional 2 36,9068 0,0000 SPosição de Proeminência de Sintagma Fonológico 2 10,3966 0,0000 SPadrão Acentual 3 58,4538 0,0000 STonicidade 1 0,5916 0,4418 NS
A tabela 5.8 exibe as médias e desvios-padrão da entoação para as variáveis
linguísticas analisadas na ANOVA. As relações entre os grupos são as seguintes: a) COR >
SOL em grupo e Tonicidade (TN); b) SOL > COR em Padrão Acentual (PA), posição de
proeminência de sintagma entoacional (PSE) e posição de proeminência de sintagma
fonológico (PSF).
Como observado nos resultados para o canto sem acompanhamento, COR parece
manter a afinação atrelada à pulsação rítmica. Neste caso, o acompanhamento parece
facilitar essa tarefa, fato notado na elevação da média do grupo em relação ao canto sem
acompanhamento.
5.4 Análise das estimativas de espaço vocálico nas posições acentuais
Recapitulando, os espaços vocálicos são estimativas acústicas que podem dar
indícios da atividade dos articuladores mandíbula, lábios e língua (LINDBLOM e
SUNDBERG, 1971). Como já dito, o cálculo dos espaços vocálicos foi feito com a conversão
para Bark das medidas dos formantes obtidas em Hertz. Bark é conhecida como medida de
banda crítica, uma medida psicoacústica relacionada à percepção, cuja conversão foi feita
via transformação de Traunmuller (1990)
Conforme já mencionado, As vogais foram rotuladas com o alfabeto SAMPA durante a
segmentação, e plotadas com o IPA. A plotagem das vogais foi concebida quanto à
tonicidade – pretônica, tônica ou postônica – sem considerar as vogais nasais e os encontros
76
Tabela 5.8: Médias e desvios padrão de entoação por grupo, canto com acompanhamento.
SOL CORrelação
média desvio padrão média desvio padrãogrupo -0,0036 4,0000 0,1681 3,8361 COR > SOLPSE 0,3777 4,4882 0,2659 4,3153 SOL > CORPSF 0,7643 4,5528 -0,1367 4,3554 SOL > CORPA 0,3953 4,0259 0,3493 3,8957 SOL > CORTN -0,6693 3,9827 0,1763 3,8160 COR > SOL
VariáveisLinguísticas
vocálicos. As vogais [i, I, e, E, a, A, o, O, u, U] serviram como base para o cálculo das
estimativas de área de espaço vocálico (VSA) e de razão de centralização formântica (FCR).
A figura 5.5 (ampliada no anexo III) exibe os espaços vocálicos para o canto sem
acompanhamento das coralistas (COR). Observa-se certa homogeneidade das áreas totais
entre as posições acentuais. As áreas de cada vogal nas pretônicas não estão bem
delimitadas, diferente das tônicas e postônicas.
A figura 5.6 (ampliada no anexo III) ilustra os espaços vocálicos nas posições
77
Figura 5.4.1: Espaços vocálicos nas posições acentuais da produção cantada sem acompanhamento das coralistas (COR)
Figura 5.4.2: Espaços vocálicos nas posições acentuais da produção cantada sem acompanhamento das solistas (SOL)
acentuais do canto sem acompanhamento das solistas (SOL). Esse grupo apresenta área
aparentemente maior que COR, quanto ao eixo de F2, em todas as posições acentuais. Na
sua maioria, as áreas correspondentes às vogais são melhor definidas, exceto em [o] nas
pretônicas.
A figura 5.7 (ampliada no anexo III) ilustra os espaços vocálicos nas posições
acentuais no canto com acompanhamento das coralistas (COR). Nota-se áreas bem
definidas nas tônicas e postônicas, e dispersão nas pretônicas.
A figura 5.8 (ampliada no anexo III) ilustra os espaços vocálicos nas posições
acentuais no canto com acompanhamento das solistas (SOL). Note-se a melhor definição
78
Figura 5.4.3: Espaços vocálicos nas posições acentuais da produção cantada com acompanhamento das coralistas (COR).
Figura 5.4.4: Espaços vocálicos nas posições acentuais da produção cantada com acompanhamento das solistas (SOL).
das áreas das vogais em todas as posições acentuais, exceto em [o] das pretônicas, que
aparenta dispersão.
Como observado, as vogais foram separadas por padrões acentuais (pretônicas,
tônicas e pós-tônicas), permitindo ver as diferentes realizações dos grupos. Note-se
visualmente a variabilidade de área de espaço vocálico, bem como a dispersão e
centralização vocálicas. Recordando, a avaliação dessas impressões foi realizada com o
cálculo das estimativas de Área de Espaço Vocálico (VSA) e de Razão de Centralização
Formântica (FCR), que permitem fazer inferências do ponto de vista da precisão articulatória
e da inteligibilidade.
5.4.1 Área de Espaço Vocálico (VSA)
Recapitulando, a avaliação da variabilidade dos espaços vocálicos com as estimativas
de área de espaço vocálico (VSA) e razão de centralização formântica (FCR), permite fazer
inferências sobre a atividade articulatória vocálica. Valores altos de VSA indicam maior
atividade de mandíbula e de corpo de língua, enquanto valores baixos indicam menor
atividade desses articuladores. Valores altos de FCR refletem centralização das vogais, ao
passo que valores baixos indicam a sua expansão. Vogais centralizadas mostram possível
imprecisão articulatória e consequente menor inteligibilidade, enquanto vogais periféricas
indicam precisão.
5.4.1.1 Canto sem acompanhamento
A análise aqui adotada empregou o teste t para comparação das médias dos grupos,
pois são apenas dois (COR e SOL).
79
A tabela 5.9 exibe os resultados do teste t aplicado para as estimativas de VSA por
grupo. Os resultados não significativos mostram que os grupos apresentam áreas
semelhantes nas posições acentuais, fato observado na inspeção visual dos espaços
vocálicos.
A
tabela 5.10
exibe as
médias e
desvios padrão de VSA por grupo no canto sem acompanhamento. A relação de igualdade
entre eles é novamente enfatizada.
5.4.1.2 Canto com acompanhamento
Conforme procedimento já realizado, foram realizadas as comparações entre os
grupos por meio do teste t. A tabela 5.11 mostra os resultado obtidos sem diferenças
significativas entre os grupos, com resultados idênticos aos já observados para o canto sem
acompanhamento.
80
Tabela 5.9: Teste t entre grupos para VSA na produção cantada sem acompanhamento
variável grupo t valor p significância0,2220 0,8305 N0,9745 0,3585 N1,6842 0,1320 N
VSA-pretônicas sol-corVSA-tônicas sol-corVSA-postônicas sol-cor
Tabela 5.10: Médias e desvios padrão de VSA por grupo, canto sem acompanhamento.
VSASOL COR
relaçãomédia desvio padrão média desvio padrão
pretônica 4,8736 1,2374 4,4595 1,5960 SOL = CORtônica 5,6456 1,0805 4,9606 1,1628 SOL = CORpostônica 2,4061 0,5326 1,8858 0,4381 SOL = COR
A tabela 5.12 exibe as médias e desvios-padrão de VSA por grupo, enfatizando os
resultados obtidos no teste t.
5.4.2 Razão de Centralização Formântica (FCR)
5.4.2.1 Canto sem acompanhamento
Conforme já mencionado, não se empregou a ANOVA por haver apenas dois grupos
em análise, assim como nas análises de VSA.
81
Tabela 5.11: teste t das estimativas de VSA entre grupos no canto com acompanhamento
variável grupo t valor p significância0,1841 0,8587 N0,7354 0,4842 N2,2239 0,0702 N
VSA-pretônicas sol-corVSA-tônicas sol-corVSA-postônicas sol-cor
Tabela 5.12: Médias e desvios padrão para VSA por grupo, canto com acompanhamento.
VSASOL COR
relaçãomédia desvio padrão média desvio padrão
pretônica 4,8489 1,4749 4,6595 1,7661 SOL = CORtônica 5,5705 1,4716 4,9535 1,1638 SOL = CORpostônica 2,9073 0,9281 1,8866 0,4382 SOL = COR
A tabela 5.13 exibe os resultados do teste t aplicado para as estimativas de FCR por
grupo, sem diferenças significativas. Novamente, tais resultados indicam atividade
articulatória semelhante entre os grupos.
A tabela 5.14 apresenta as médias e desvios-padrão de FCR por grupo no canto sem
acompanhamento. Mais uma vez é salientada a igualdade entre os grupos.
Os resultados de VSA e FCR para o canto sem acompanhamento reforçam a
semelhança entre os grupos, e salientam a segunda hipótese, que concerne à semelhança
entre eles relativa ao conhecimento musical. A formação musical e a técnica vocal
apreendida são os fatores que explicam a semelhança entre os grupos, fato esse
corroborado pela literatura sobre o canto (TOSI, 1783) e pesquisas instrumentais recentes
(ROSSING, SUNDBERG e TERNSTRÖM ,1985; SUNDBERG, LINDBLOM e
LILJENCRANTS, 1992; SUNDBERG, 1972, 1973, 1977, 1979, 1987,1999a, 1999b, 2001;
SUNDBERG e ASKENFELT, 1981; SUNDBERG e NORDSTRÖM, 1976; PABST e
SUNDBERG, 1993; MURBE et al., 2002; SUNDBERG, FAHLSTEDT e MORELL, 2005).
82
Tabela 5.13: Teste t entre grupos para FCR na produção cantada sem acompanhamento
variável grupo t valor p significância-0,3964 0,7025 N-2,1836 0,0738 N-1,9682 0,0854 N
FCR-pretônicas sol-corFCR-tônicas sol-corFCR-postônicas sol-cor
Tabela 5.14: Médias e desvios padrão de FCR por grupo, canto sem acompanhamento.
FCRSOL COR
relaçãomédia desvio padrão média desvio padrão
pretônica 1,5024 0,0631 1,5022 0,0937 SOL = CORtônica 1,4410 0,0251 1,4903 0,0574 SOL = CORpostônica 1,5999 0,0316 1,6407 0,0263 SOL = COR
5.4.2.2 Canto com acompanhamento
A tabela 5.15 exibe os resultados do teste t realizado para FCR por grupo. Note-se a
diferença significativa para as tônicas, indicando diferença entre os grupos. O resultado para
as postônicas poderia ser considerado marginalmente significativo, e mostra possível
diferença entre os grupos.
A tabela 5.16 exibe as médias e desvios-padrão de FCR por grupo no canto com
acompanhamento. A relação COR > SOL mostra a precisão articulatória de SOL, pois
valores baixos de FCR indicam posições mais periféricas no espaço vocálico, implicando em
melhor inteligibilidade.
Esse fator endossa outro ponto da segunda hipótese (H2), relativo às diferenças entre
os grupos baseada no treinamento e na prática. Cantores com maior tempo de treinamento e
prática certamente buscam maior precisão na sua emissão.
83
Tabela 5.15: teste t das estimativas de FCR entre grupos no canto com acompanhamento
variável grupo t valor p significância-0,0587 0,9546 N-2,6319 0,0331 S-2,3937 0,0563 N
FCR-pretônicas sol-corFCR-tônicas sol-corFCR-postônicas sol-cor
Tabela 5.16: Médias e desvios padrão de FCR por grupo no canto com acompanhamento.
FCRSOL COR
relaçãomédia desvio padrão média desvio padrão
pretônica 1,5172 0,0753 1,5200 0,0765 SOL = CORtônica 1,4223 0,0369 1,4979 0,0526 COR > SOLpostônica 1,5679 0,0580 1,6364 0,0270 SOL = COR
5.4.3 Análise da Intensidade (SPL)
A intensidade, ou melhor, o nível de pressão sonora (SPL), foi medida em decibéis
(dB) e avaliada entre os grupos. A tabela 5.17 mostra os resultados com diferenças
significativas entre os grupos
A tabela 5.18 exibe as médias e desvios-padrão das medidas de intensidade entre os
grupos no canto, sem e com acompanhamento. Observa-se a relação SOL > COR,
ressaltando o grupo que tem maior tempo de treinamento e prática, resultado que corrobora
os achados anteriores relativos à diferença entre os grupos.
5.4.4 Análise dos Formantes
A avaliação dos espaços vocálicos foi baseada nas estimativas VSA e FCR, que
derivam do cálculo baseado nos formantes. Como já mencionado, foram conduzidos os
84
Tabela 5.17: Teste t das medidas de intensidade entre grupos no canto sem e com acompanhamento
intensidade t df valor psem acomp. 11,9351 9219,611 0com acomp. 10,2707 9212,195 0
Tabela 5.18: Médias e desvios padrão de intensidade(SPL) por grupo no canto, sem e com acompanhamento.
intensidadeSOL COR
relaçãomédia desvio padrão média desvio padrão
sem acomp. 71,8702 6,8633 70,3173 5,7647 SOL > CORcom acomp. 71,9157 7,1366 70,5280 5,9774 SOL > COR
testes com os três primeiros formantes de todas as vogais (F1, F2 e F3), desconsiderando os
encontros vocálicos e as vogais nasais. Os formantes foram medidos de acordo com o
procedimento descrito na Metodologia.
5.4.4.1 Canto sem acompanhamento
Foram conduzidos testes de comparação de médias entre os grupos para os
formantes. A tabela 5.19 mostra os resultados do teste t aplicado aos formantes (em Bark),
com diferenças significativas em todos.
A tabela 5.20 exibe as médias e desvios-padrão dos formantes por grupo. A relação
SOL > COR mostra a diferença entre os grupos. Esse resultado também foi encontrado na
fala, indicativo de distinção entre os grupos e de estratégia articulatória particular, que será
discutida a diante.
85
Tabela 5.19: Comparação entre médias para os formantes do canto sem acompanhamento
variável grupo t valor p significânciaF1-Bark 11,2504 0,0000 SF2-Bark 21,4312 0,0000 SF3-Bark 31,8432 0,0000 S
sol-corsol-corsol-cor
Tabela 5.20: Médias e desvios padrão dos formantes por grupo no canto sem acompanhamento.
FormantesSOL COR
relaçãomédia desvio padrão média desvio padrão
F1 4,2657 1,2163 3,9416 1,5676 SOL > CORF2 10,2322 1,5091 9,5641 1,5274 SOL > CORF3 14,4554 0,8629 13,8187 1,0730 SOL > COR
5.4.4.2 Canto com acompanhamento
Replicando o procedimento anterior, foram conduzidos testes de comparação de
médias entre os grupos para os formantes. A tabela 5.21 mostra os resultados do teste t
aplicado aos formantes (em Bark), com diferenças significativas em todos.
A tabela 5.22 exibe as médias e desvios-padrão para os formantes por grupo no canto
com acompanhamento. Novamente, observam-se valores maiores para SOL em relação a
COR em todos os formantes, já observado na fala e no canto sem acompanhamento. Esse
aumento sistemático é outro fator que distingue esse grupo, pois sugere estratégia
articulatória distinta, que será discutida adiante. Além disso, esse fator corrobora a segunda
hipótese (H2) sobre a diferença entre os grupos, baseada na prática e treinamento.
86
Tabela 5.21: teste t entre grupos dos formantes no canto com acompanhamento
variável grupo t valor p significânciaF1-Bark 17,7831 0,0000 SF2-Bark 27,8610 0,0000 SF3-Bark 41,6687 0,0000 S
sol-corsol-corsol-cor
Tabela 5.22: Médias e desvio padrão para os formantes por grupo no canto com acompanhamento.
FormantesSOL COR
relaçãomédia desvio padrão média desvio padrão
F1 4,5444 1,1493 4,0401 1,5796 SOL > CORF2 10,5496 1,4360 9,7078 1,5070 SOL > CORF3 14,7005 0,7323 13,9319 1,0382 SOL > COR
5.5 Comparação entre dados acústicos e estimativas da partitura
5.5.1.1 Canto sem acompanhamento
Conforme já mencionado, a comparação dos dados de duração e entoação (f0) tem
por objetivo avaliar o pareamento entre produção e idealização. A tabela 5.23 mostra as
médias e desvios-padrão de duração e entoação (f0) para a partitura e os grupos.
A tabela 5.24 exibe as médias e desvios-padrão para duração e entoação por grupo e
partitura. A relação entre esses grupos mostra o que já foi observado nos dados
anteriormente analisados, que é a semelhança dos grupos na duração e a diferença entre
eles na entoação no canto sem acompanhamento. Esses resultados mostram também que
os grupos estão abaixo do esperado e idealizado na partitura, ou melhor, “desafinam” no
ritmo e na entoação, efeitos já observados por outros autores (BROWN et cols. 2000, 2004;
MENDES, 2003).
87
Tabela 5.23: teste de comparação entre dados acústicos da produção cantada sem acompanhamento com as estimativas da partitura
variável grupo t valor p significância
duração-4,6710 0,0000 S-4,6171 0,0000 S
entoação-1,5682 0,1184 N-2,1914 0,0296 S
sol-partituracor-partiturasol-partituracor-partitura
Tabela 5.24: Médias e desvios padrão para duração e entoação por grupo e partitura no canto sem acompanhamento.
PARTITURA SOL CORrelação
média desvio padrão média desvio padrão média desvio padrãoduração 621,7949 602,8532 418,3328 399,6974 420,9191 371,2295 PAR > SOL = CORentoação 0,7641 4,8157 -0,0608 3,4609 -0,2345 3,4233 PAR > SOL > COR
Variáveis Acústicas
5.5.1.2 Canto com acompanhamento
A tabela 5.25 exibe os resultados do teste t para duração e entoação por grupo,
considerando a comparação com a partitura. As diferenças significativas para duração
indicam que os grupos não estão se adunando à partitura e ao acompanhamento. Já a
entoação tem resultado não significativo para SOL e partitura, que indica semelhança entre
os dois parâmetros, ou melhor, SOL se aduna à partitura quanto à entoação quando há o
acompanhamento. Por sua vez, COR não se aduna ao acompanhamento na duração e na
entoação.
A tabela 5.26 exibe as médias e desvios-padrão de duração e entoação por grupo e
partitura no canto com acompanhamento. As diferenças das médias sugerem as relações
observadas, com semelhança entre SOL e COR na duração e diferença entre esses grupos
na entoação.
Ainda, as diferenças entre os grupos e a partitura mostram que os grupos se
88
Tabela 5.25: teste t comparando duração e entoação entre grupos na produção cantada com acompanhamento
variável grupo t valor p significância
duração-5,4115 0,0000 S-5,4812 0,0000 S
entoação-1,7062 0,0895 N-2,1953 0,0293 S
sol-partituracor-partiturasol-partituracor-partitura
Tabela 5.26: Médias e desvio padrão de duração e entoação por grupo e partitura no canto com acompanhamento.
PARTITURA SOL CORrelação
média desvio padrão média desvio padrão média desvio padrãoduração 621,7949 602,8532 386,6310 342,3663 383,6462 337,5930 PAR > SOL = CORentoação 0,7641 4,8157 -0,2908 3,5937 -0,0752 3,3607 PAR > COR > SOL
Variáveis Acústicas
assemelham no ritmo e na entoação quando há o acompanhamento. A explicação para esse
resultado, que diverge dos testes da tabela 5.26 quanto à entoação, tem base possível no
emprego do vibrato usado por SOL, justificado nos valores altos dos desvios-padrão que
aproximam as médias dos harmônicos.
Mais uma vez, esses fatores endossam a segunda hipótese (H2). As semelhanças
observadas em SOL quanto à entoação sugerem a influência da formação musical para se
adunar ao acompanhamento. As diferenças observadas sugerem a influência da prática e do
treinamento, necessários para se alinhar ao acompanhamento.
No entanto, aqui não foi analisada a correlação direta entre o acompanhamento e as
mudanças locais das vogais. Esse estudo traria luzes sobre as variantes de interpretação, ou
melhor, as diversas possibilidades de interpretação, pois o que se observou foi a adaptação
do intérprete ao acompanhamento controlado, sem aprofundar esse grau de adaptação. Tal
procedimento deve ser averiguado em trabalhos futuros.
89
90
6 Análise das vogais tônicas
91
92
6.1 Considerações preliminares
Os resultados obtidos nos capítulos anteriores mostram relações de semelhança e
diferença entre os grupos, na fala e no canto. Nesses capítulos (4 e 5) observou-se as
estratégias que os grupos empregaram na interpretação do texto da canção, lida ou cantada,
através da análise das variáveis acústicas e das variáveis linguísticas.
Recapitulando, foram estudados três grupos (SOL, COR, LOC) que leram o o texto da
canção Conselhos (Carlos Gomes), não declamaram, com as gravações segmentadas e
analisadas de acordo com o modelo descrito na Metodologia.
Dentre os diversos resultados, as análises mostraram que as vogais tônicas têm um
lugar privilegiado nas duas produções (fala e canto). Conforme já mencionado, essas vogais
são responsáveis pela manutenção do ritmo e da entoação, além de definir características
que tornam os grupos semelhantes ou distintos.
Tais resultados reforçam aspectos diferentes das duas hipóteses elencadas na
Introdução. A primeira hipótese (H1) trata da diferença da fala entre os grupos, que é
esperada. A segunda (H2) é sobre as semelhanças/diferenças no canto: se há semelhanças,
então, elas são definidas por fatores que dependem da formação musical; se há diferenças,
então, elas são definidas por fatores que dependem da prática e/ou treinamento.
A terceira hipótese (H3) elencada na introdução trata da identidade dos grupos
expressa na fala e no canto. Tal identidade tem semelhanças e diferenças entre as duas
modalidades, que são expressas através dos parâmetros acústicos analisados. Ainda, esses
parâmetros indicam as semelhanças/diferenças de articulação vocálica.
As análises conduzidas até então ressaltam a importância de um parâmetro acústico
específico: os formantes. Eles serviram como base para o cálculo de VSA e FCR, estimativas
de espaço vocálico que permitem inferir sobre a precisão articulatória e a inteligibilidade,
conforme já mencionado. Eles apresentaram valores distintos entre os grupos em todas as
modalidades, fala e canto, conforme a exposição a seguir.
93
A figura 6.1 exibe o gráfico de médias de F1 por grupo nas modalidades: fala, canto
sem acompanhamento (cantoS) e canto com acompanhamento (cantoC). As medidas dos
formantes, conforme já mencionado, foram feitas em Hertz e convertidas em Bark, aqui
apresentadas.
Nota-se nesse gráfico que as locutoras (LOC) estão entre os grupos com F1 mais alto
(SOL) e mais baixo (COR) na fala. COR possui pouca diferença entre o canto sem
acompanhamento e o canto com acompanhamento. SOL apresenta valores de F1 maiores
que os outros grupos, com diferença aparente ainda maior entre o canto sem e o canto com
acompanhamento.
94
Figura 6.1.1: Gráfico de médias de F1 por grupo e modalidades: fala, canto sem acompanhamento (cantoS), canto com acompanhamento (cantoC).
A figura 6.2 exibe o gráfico de médias de F2 conforme já descrito na figura anterior.
Aqui são observados resultados idênticos àqueles da figura 6.1: a) LOC entre SOL e COR na
fala, b) pouca diferença no canto sem e com acompanhamento para COR, c) valores
maiores para SOL em todas as modalidades, d) diferença aparente entre o canto sem e o
canto com acompanhamento de SOL.
95
Figura 6.1.2: Gráfico de médias de F2 por grupo e modalidades: fala, canto sem acompanhamento (cantoS), canto com acompanhamento (cantoC).
A figura 6.3 exibe o gráfico de médias de F3, segundo a descrição feita na figura 6.1.
Os resultados são semelhantes aos anteriores: a) gradiência observada na fala (SOL > LOC
> COR), b) valores de COR nas três modalidades com pouca diferença; c) SOL com valores
maiores, d) valor mais alto no canto com acompanhamento em relação ao canto sem de
SOL.
De modo geral, nota-se que os formantes têm valores baixos para a fala em relação
ao canto, mas, SOL apresenta valores sistematicamente maiores que os outros grupos.
Observa-se também a influência do acompanhamento musical, que eleva os formantes de
todas as cantoras (SOL e COR).
96
Figura 6.1.3: Gráfico de médias de F3 por grupo e modalidades: fala, canto sem acompanhamento (cantoS), canto com acompanhamento (cantoC).
Dadas essas observações, foram investigadas as vogais tônicas [i, e, a, o, u] através
da análise dos formantes F1 e F2. Para os dados de fala foram conduzidas a análise de
variância (ANOVA) e o teste post-hoc de Tukey. Para os dados de canto foram conduzidos
testes de comparação de médias (teste t), por haver apenas dois grupos (SOL e COR).
Ainda, foram conduzidas análises comparando canto e fala de SOL e COR, por meio de
ANOVA e teste post-hoc de Tukey. Essa última análise foi conduzida devido às suspeitas
levantadas em MEDEIROS (2002) e em PESSOTTI (2007) sobre semelhanças entre fala e
canto, decorrentes de certa negociação entre essas modalidades no nível segmental a fim de
manter a inteligibilidade.
6.2 Investigação sobre as tônicas na fala
Conforme já mencionado, foram conduzidas a ANOVA e a comparação entre os
grupos com teste post-hoc de Tukey, para averiguar as semelhanças entre os grupos nas
vogais da fala.
A tabela 6.1 exibe os resultados da ANOVA dos formantes F1 e F2 por vogais e grupo.
Os resultados para F1 mostram diferenças significativas, e podem ser interpretados como
97
Tabela 6.1: ANOVA dos Formantes F1 e F2 (Bark) por vogais e grupo na fala.
vogais df F valor p significância
F1
i 2 6,2359 0,0022 Se 2 32,5030 0,0000 Sa 2 32,5250 0,0000 So 2 15,6550 0,0000 Su 2 17,7070 0,0000 S
F2
i 2 2,4983 0,0840 Ne 2 26,2070 0,0000 Sa 2 17,6410 0,0000 So 2 1,0070 0,3660 Nu 2 6,6576 0,0015 S
diferenças de estratégias de abertura oral entre os grupos em todas as vogais.
Os resultados significativos para F2 nas vogais [e, a, u] indicam anteriorização/
posterização diferentes entre os grupos. Já os resultados não significativos em [i, o] para F2
indicam semelhante articulação entre os grupos nessas vogais.
A tabela 6.2 exibe as médias e desvios-padrão para os formantes por vogal na fala, e
a relação entre os grupos, avaliada pelo teste post-hoc de Tukey. SOL tem valores maiores
em F1 para todas as vogais, enquanto que LOC e COR são semelhantes em [i, e, a] e
distintas (LOC > COR) em [o, u]. Em F2 há semelhança nas vogais [i, o] entre os grupos,
gradiência de grupos (SOL > LOC > COR) em [e, a], e distinção de SOL em [u].
Os resultados obtidos em F1 podem ser interpretados como abertura oral maior em
SOL para todas as vogais, semelhança entre LOC e COR em [i, e, a], e maior abertura oral
de LOC em relação a COR em [o, u]. Os resultados obtidos em F2 podem ser interpretados
como maior anteriorização/posterização em [e, a, u] de SOL em relação aos grupos. Os
outros resultados parecem refletir diferenças da atividade labial, com maior estiramento por
parte de SOL em relação aos outros grupos, justificado também pelos valores elevados de
todos os formantes.
98
Tabela 6.2: Médias e desvios padrão dos formantes por vogal na fala.
vogais média desvio padrão relação
F1
i 1,4712 1,0585 SOL > LOC = CORe 2,2211 1,1015 SOL > LOC = CORa 2,9644 1,7732 SOL > LOC = CORo 4,2012 1,3400 SOL > LOC > CORu 3,5596 1,0987 SOL > LOC > COR
F2
i 6,8595 2,6667 SOL = LOC = CORe 9,1653 2,2090 SOL > LOC > CORa 9,0761 1,3771 SOL > LOC > CORo 8,4614 1,1012 SOL = LOC = CORu 8,8140 1,2479 SOL > LOC = COR
Tais resultados, aliados aos anteriores, sugerem comportamento articulatório distinto
dos grupos com maior prática e treinamento vocal (SOL e LOC). SOL é o grupo que tem
formantes mais elevados, com evidente articulação mandibular distinta comprovada pelos
valores de F1. Nota-se também que os resultados de F2 mostram a distinta articulação de
corpo de língua em [e, a], vogais que exigem maior abertura oral.
As diferenças entre SOL e LOC podem ser explicadas pela formação que receberam.
SOL é o grupo de cantoras solistas, que, devido à sua formação foram ensinadas a exagerar
a abertura oral a fim de melhor sintonizar a entoação, com fins estéticos e/ou emotivos. LOC
é o grupo de locutoras profissionais e, de forma semelhante, foram treinadas para obter uma
articulação maior, porém, não tão ampla como no canto, enfatizando a chamada voz de
locução, com entoação grave. Tal recurso tem consequências articulatórias já observadas,
como o abaixamento de laringe e aumento do espaço faríngeo.
Esses resultados corroboram o comportamento articulatório particular na fala desse
grupo (SOL), pois essas duas vogais podem ser articuladas com possível estiramento labial,
cuja explicação, já mencionada, estaria baseada nos valores elevados dos formantes. A
saber, formantes elevados implicam duas estratégias articulatórias distintas: ou elevação de
laringe ou estiramento labial. A primeira é desaconselhada porque pode causar cansaço
vocal, enquanto a segunda é recomendada até por questões estilísticas.
6.3 Investigação sobre as tônicas no canto
Os resultados obtidos no capítulo 5 para a produção cantada, com e sem
acompanhamento, mostram diferenças entre os grupos SOL e COR, ressaltando as tônicas,
como observado na análise dos dados de fala. Conforme já observado, todos os formantes
de SOL são mais elevados.
99
6.3.1 Canto sem acompanhamento
A tabela 6.3 apresenta os resultados do teste de comparação de médias (teste t) dos
formantes das vogais tônicas por grupo. Os resultados não significativos foram obtidos em
F1 para [i, a, u], e não significativo em F2 ocorre na vogal [u].
Os resultados não significativos foram obtidos em F1 indicam semelhante abertura
mandibular dos grupos. Já o resultado não significativo em F2 pode ser interpretado como
semelhante anteriorização/posterização de corpo de língua, além de semelhante protrusão
labial entre os grupos, pois a vogal [u] tem essa articulação dos lábios.
100
Tabela 6.3: Teste t comparando formantes das vogais tônicas por grupo, canto sem acompanhamento.
vogais df t valor p significância
F1
i 195,729 0,9093 0,3643 Ne 415,089 2,6423 0,0085 Sa 491,581 0,7713 0,4409 No 291,308 1,9998 0,0465 Su 180,56 -1,1488 0,2521 N
F2
i 197,319 2,2652 0,0246 Se 438,423 5,2357 0,0000 Sa 497,608 2,4238 0,0157 So 342,986 2,3687 0,0184 Su 196,99 -0,2829 0,7776 N
A tabela 6.4 apresenta as médias e desvios-padrão dos formantes das vogais tônicas
por grupo no canto sem acompanhamento. A relação entre os grupos mostra que prevalecem
os valores altos dos formantes de SOL, superando os de COR nas vogais onde se observou
diferença significativa nos testes anteriores.
Esses resultados corroboram as análises anteriores. Os resultados de F1 mostram
atividade mandibular semelhante nas vogais [i, a, u]. Os resultados de F2 mostram
semelhante atividade em [u] entre os grupos, devido ao possível papel compensatório dos
lábios. Note-se os valores altos de F2 nas outras vogais em SOL, resultado que pode ser
interpretado como maior estiramento labial.
101
Tabela 6.4: Médias e desvios padrão dos formantes das vogais tônicas por grupo, canto sem acompanhamento.
SOL CORrelação
vogais média desvio padrão média desvio padrão
F1
i 4,4358 1,4984 4,2318 1,6695 SOL = CORe 4,1244 1,2490 3,7574 1,6681 SOL > CORa 4,6886 1,7095 4,5633 1,9174 SOL = CORo 4,9574 1,0036 4,6675 1,6243 SOL > CORu 4,1818 0,8599 4,3505 1,1866 SOL = COR
F2
i 11,2043 1,8938 10,5790 2,0085 SOL > CORe 10,9168 1,5379 10,0945 1,7848 SOL > CORa 9,8870 1,1640 9,6381 1,1318 SOL > CORo 9,3210 1,0767 9,0415 1,1156 SOL > CORu 9,1515 1,1601 9,1984 1,1802 SOL = COR
6.3.2 Canto com acompanhamento
A tabela 6.5 apresenta os resultados do teste de comparação de médias (teste t) dos
formantes das vogais tônicas por grupo no canto com acompanhamento. Note-se a
predominância das diferenças significativas em F1, indicativo de maior abertura mandibular
distinta no canto com acompanhamento. Em F2 há distinta anteriorização/posterização de
corpo de língua entre os grupos para as vogais [i, e, a, o] no canto com acompanhamento,
exceto em [u], pois não há diferença significativa entre os grupos.
102
Tabela 6.5: Teste t comparando formantes das vogais tônicas por grupo, canto com acompanhamento.
vogais df t valor p significância
F1
i 183,419 2,2443 0,0260 Se 396,861 4,8623 0,0000 Sa 483,334 2,6587 0,0081 So 288,691 2,4307 0,0157 Su 184,266 -1,9981 0,0472 S
F2
i 167,152 5,2639 0,0000 Se 411,525 7,6915 0,0000 Sa 492,641 5,0331 0,0000 So 341,918 2,0067 0,0456 Su 169,614 -0,2847 0,7762 N
A tabela 6.6 exibe as médias e desvios-padrão dos formantes das vogais tônicas por
grupo, no canto com acompanhamento. Os resultados mostram o que já foi observado, com
valores maiores dos formantes para SOL e semelhança em [u] de F2.
Os valores altos observados em SOL indicam, em F1, maior abertura mandibular, e,
em F2, maior anteriorização/posterização de corpo de língua. Como já observado, o
resultado semelhante de F2 em [u] pode ser interpretado como a possível compensação
labial devido à protrusão exigida para executar a vogal. Ainda, os formantes elevados de
SOL sugerem maior estiramento labial, principalmente nas vogais [e, o, a].
Esses resultados corroboram os achados anteriores, e levantam suspeitas da
atividade articulatória de SOL. Como já observado, os formantes altos implicam em
estiramento labial ou elevação de laringe, com preferência do primeiro em relação ao
segundo.
103
Tabela 6.6: Médias e desvios padrão dos formantes das vogais tônicas por grupo, canto com acompanhamento.
SOL CORrelação
vogais média desvio padrão média desvio padrão
F1
i 4,5171 1,3642 4,0061 1,8228 SOL > CORe 4,4324 1,2078 3,7408 1,7586 SOL > CORa 5,0673 1,5434 4,6634 1,8404 SOL > CORo 5,2421 0,9127 4,9182 1,5003 SOL > CORu 4,3608 0,9338 4,6709 1,1997 SOL > COR
F2
i 11,5990 1,3933 10,2256 2,2058 SOL > CORe 11,3315 1,3367 10,1748 1,8171 SOL > CORa 10,2159 0,9838 9,7480 1,0923 SOL > CORo 9,4571 1,0234 9,2388 0,9959 SOL > CORu 9,3826 1,3418 9,4330 1,0659 SOL = COR
6.4 Comparação entre modalidades
A comparação entre as modalidades foi conduzida somente com as cantoras (SOL e
COR), pois elas leram e cantaram, diferente de LOC, considerando as análises das vogais
separadamente. Fez-se a ANOVA dos formantes por modalidade e grupo, além da
comparação via teste post-hoc de Tukey, cujas tabelas estendidas estão nas tabelas 9.4 e
9.5 do anexo I.
A tabela 6.7 apresenta o quadro resumo das análises (ANOVA e testes post-hoc de
Tukey) entre os formantes F1 e F2 das vogais tônicas por modalidade e grupo, disponíveis
no anexo I. A modalidade é definida por fala (Fala), canto sem acompanhamento (Sem) e
com (Com). Observam-se três tipos de resultados: a) Com > Sem > Fala, b) Com = Sem =
Fala, c) Com = Sem > Fala.
O primeiro (Com > Sem > Fala) indica a diferença entre as modalidades, que ocorre
em F1 de [i, o] em COR, em decorrência da diferença de abertura mandibular nessas vogais
entre as modalidades, e em F2 de [e] em SOL, indicativo de diferença de
anteriorização/posterização de corpo de língua entre as modalidades.
O segundo (Com = Sem = Fala) mostra a semelhança entre as modalidades,
104
Tabela 6.7: Quadro resumo das relações entre formantes das vogais tônicas, modalidade e grupo: Com – canto com acompanhamento, Sem – canto sem acompanhamento, Fala – fala.
Formantes Grupo [i] [e] [a] [o] [u]
F1SOL Com = Sem > Fala Com = Sem > Fala Com = Sem = Fala Com = Sem > Fala Com = Sem = FalaCOR Com > Sem > Fala Com = Sem > Fala Com = Sem > Fala Com > Sem > Fala Com = Sem > Fala
F2SOL Com = Sem > Fala Com > Sem > Fala Com = Sem > Fala Com = Sem > Fala Com = Sem = FalaCOR Com = Sem = Fala Com = Sem > Fala Com = Sem > Fala Com = Sem > Fala Com = Sem = Fala
indicando semelhante atividade articulatória. Observa-se esse resultado em F2 de [i, u] em
COR, F1 de [a, u] em SOL e F2 de [u] em SOL. Isso indica que COR tem semelhante
anteriorização/posterização de corpo de língua e protrusão labial nas vogais [i, u]. SOL tem
semelhante articulação mandibular em [a, u] e semelhante articulação de corpo de língua em
[u].
O terceiro (Com = Sem > Fala) mostra a realização semelhante no canto sem e com
acompanhamento, diferindo da fala. Esse resultado é o predominante, e, esperado, pois o
canto tende a ter formantes maiores que a fala, como já demonstrado nos gráficos das
figuras 6.1 a 6.3.
Tais resultados podem derivar da proficiência musical que possuem, em decorrência
do treinamento vocal. De modo geral, esse treinamento objetiva a busca por manutenção de
postura vocal confortável. Conforme já observado, formantes elevados têm consequências
articulatórias distintas, que podem levar ao desconforto ou ao conforto. Um profissional da
voz dificilmente procura o desconforto vocal, ainda mais durante uma jornada cotidiana de
trabalho. Com esses resultados, supõe-se a ocorrência de algum tipo de processo
adaptativo, entre as modalidades, a fim de facilitar a passagem de uma à outra.
105
106
7 Discussão e Considerações Finais
107
108
7.1 Recapitulação
Faz-se necessária uma recapitulação dos objetivos, procedimentos e resultados
obtidos. O objetivo deste estudo é observar os efeitos decorrentes do treinamento e da
prática vocal profissional, através das análises de parâmetros fonético-acústicos que
evidenciam semelhanças e diferenças na fala e no canto. Para isso, elencaram-se três
hipóteses: H1) a fala é distinta entre os grupos; H2) entre os grupos, o canto tem
semelhanças dependentes da formação musical, e diferenças dependentes da prática e do
treinamento; e H3) fala e canto refletem identidade de grupo através das
semelhanças/diferenças observadas nos parâmetros acústicos.
Para tanto, foram realizadas análises com os dados obtidos da partitura da canção
escolhida (Conselhos, Carlos Gomes), de natureza não paramétrica, e análises com os
dados acústicos das gravações de fala e canto, de natureza paramétrica. As variáveis das
análises não paramétricas influenciaram a escolha e definição das variáveis paramétricas.
Foram estipuladas variáveis acústicas e linguísticas tomadas como base nas análises.
As análises não-paramétricas mostraram que as estimativas prosódicas de nível
linguístico e musical parecem manter a estrutura linguística da canção, pondo em evidência
as tônicas. As análises paramétricas das estimativas acústicas de duração e entoação
obtidas das partitura foram pareadas com os dados das gravações. Os resultados dessas
análises mostraram que a fala difere entre todos os grupos quanto à duração e quanto à
entoação. O canto difere entre SOL e COR quanto à duração, porém, se assemelha quanto à
entoação.
As gravações de fala e canto foram analisadas de forma pareada entre os grupos. As
análises realizadas com as variáveis linguísticas para os dados de fala mostram
semelhanças e diferenças duracionais que separam os grupos com maior prática e
treinamento vocal (LOC e SOL) quanto ao padrão acentual (PA), e semelhante produção de
posicionamento de sintagma fonológico (PSF).
Já no canto, sem e com acompanhamento, a semelhança ocorre na Tonicidade (TF)
quanto à entoação; PA quanto à duração. Ainda, os resultados mostram que SOL procura
manter o alongamento nos níveis prosódicos mais altos, enquanto COR procuram manter o
109
mesmo nos níveis mais baixos. Tais estratégias parecem manter a estrutura linguística da
composição nas produções das modalidades (falada e cantada).
A intensidade parece evidenciar a proficiência das leitoras, pois é maior na fala das
locutoras (LOC) que das cantoras (SOL e COR). Os formantes marcam o grupo com maior
proficiência no canto (SOL), pois observou-se que os seus formantes (F1, F2, F3) têm
valores maiores que os de LOC e de COR, diferenciando as tônicas das átonas na fala e no
canto.
Novamente, tais resultados diferenciam o grupo SOL, possivelmente pela proficiência
musical e pela prática e treinamento vocal. Esses resultados sugerem uma busca por
possível manutenção de postura vocal confortável.
7.2 Discussão
As análises dos dados acústicos apresentam diversos resultados interessantes que
corroboram as hipóteses elencadas (H1, H2 e H3), evidenciando as estratégias realizadas
pelos grupos nas tarefas de leitura e canto do mesmo texto. Tais estratégias incluem a
manipulação e interação entre níveis linguísticos e estrutura musical, ou melhor, a
manipulação de níveis prosódicos para a manutenção da estrutura musical. Além disso,
levantam outras questões.
Primeiramente, esses resultados apontam valores elevados dos formantes do canto
em relação aos da fala, já relatados na literatura (LINBLOM e SUNDBERG, 1972 e 2005;
SUNDBERG e NORDSTRÖM, 1976; SUNDBERG e ASKENFELT, 1981; SUNDBERG, 1973
e 1987; MEDEIROS, 2002; SUNDBERG et al., 2005; PESSOTTI, 2007). Deve-se notar a
gradiência de todos os formantes na fala é SOL > LOC > COR, corroborada pela análise de
variância e pelos testes post-hoc de comparações aos pares (Tukey HSD < 0,05). Ainda,
ocorre no canto a mesma gradiência observada na fala (SOL > COR).
É preciso notar que a fala das locutoras também tem formantes sistematicamente
mais altos que a das coralistas. Existem estudos que apontam outro formante especial, o do
ator/leitor (LEINO e KARKKAINEN, 1995; PINCZOWER e OATES, 2005; MASTER et al.
110
2006, 2008 e 2011; LEINO et al., 2009), e outros que reportam um uso sistemático da “fala
sorridente” (LEINO e KARKKAINEN, 1995; PINCZOWER e OATES, 2005; BELE, 2006;
MASTER et al., 2006, 2008 e 2011; LEINO et al. 2009).
A maior abertura oral, provocada pelo abaixamento da mandíbula ou pelo estiramento
dos lábios, tem como possível resultado a elevação dos formantes observada, fato ausente
do grupo das cantoras coralistas, menos treinado. Pode-se supor que as estratégias
utilizadas pelas locutoras sejam semelhantes às das solistas, mas, sejam aplicadas à fala,
onde a melodia veiculada por f0 é a da entoação.
Tais diferenças sistemáticas de elevação dos formantes podem indicar que as solistas
usam estratégias articulatórias que permitem o encurtamento do trato vocal. Duas
estratégias distintas podem ser executadas, com consequências distintas: a) a elevação da
laringe, que não implica maior abertura oral; b) o estiramento dos lábios, que implica
necessariamente maior abertura oral.
A elevação de laringe é desaconselhada na literatura da pedagogia do canto (TOSI,
1723[1968]; MANCINI, 1774; GARCIA, 1854; LAMPERTI, 1864), por acarretar esforço vocal.
Esse fato foi corroborado por estudos recentes (SUNDBERG e ASKENFELT, 1981; PABST e
SUNDBERG, 1993).
O estiramento dos lábios resulta numa mudança de timbre (SUNDBERG e
ASKENFELT, 1981; PABST e SUNDBERG, 1993; GARNIER et al., 2008), recomendada pela
pedagogia do canto (GARCIA, 1854; MILLER, 1977). Outro uso positivo desse gesto
articulatório é encontrado na literatura sobre expressividade, pois o estiramento e suas
consequências acústicas decorrem necessariamente da “fala sorridente” (FAGEL, 2009),
agregando valor estilístico positivo.
Há na literatura fonética sobre o canto bases que justificam as manobras articulatórias
citadas. Estudos recentes identificam a sintonização do segundo formante com algum
harmônico de f0 (SUNDBERG, 1974; SUNDBERG, 1987; SUNDBERG et al., 1999;
JOLIVEAU et al., 2004, WOLFE e SMITH, 2008, GARDNER et al., 2010). Seria esse um
complemento da abertura da mandíbula, que é uma maneira conhecida de sintonizar o
primeiro formante com f0 (LESSAC, 1967; RAPHAEL e SCHERER, 1987; MILLER e
SCHUTTE, 1990; CARLSSON-BERNDTSSON e SUNDBERG, 1991; SUNDBERG et al.,
1992; KAYES, 2003).
111
No entanto, somente a abertura mandibular e o estiramento labial poderiam acarretar
a distorção de certas vogais, principalmente as altas. Como a prática vocal profissional busca
o conforto, é natural que um cantor proficiente tente parear f0 ou qualquer de seus
harmônicos com o formante menos passível de alteração, pois essa estratégia de “sintonia”
permite aumentar o volume sem esforço vocal, além de preservar a inteligibilidade.
Os resultados mostram ainda outro fator interessante: o canto com acompanhamento
parece ser um lugar privilegiado para a elevação dos formantes. O acompanhamento tende a
marcar o ritmo e servir de apoio da harmonia, independente da melodia. Além disso, uma
vez que a sintonização promove um aumento de volume, deve-se investigar no futuro a sua
importância em momentos de saliência rítmica.
Para tanto, pode-se em trabalhos futuros, recorrer à síntese de fala, replicando alguns
dos trechos gravados de forma semelhante ao que se faz com a fala de laboratório. As
elevações de formantes observadas são possíveis de simular de acordo com a literatura
(Sanguinetti et al., 1994; Beautemps et al., 1995; Perrier et al. 2003 e 2005).
Esses resultados chamam a atenção para a possível transferência articulatória da
prática vocal profissional para a situação informal de leitura. O treinamento tanto das solistas
como das locutoras parece aumentar o conforto na abertura oral, com a elevação dos
formantes e, assim, sintonizá-los da maneira menos custosa possível com f0 ou seus
harmônicos, criando um efeito de maior ressonância.
Esses seriam indícios de uma possível adaptação fônica semelhante à que ocorre nas
interlínguas, onde uma prática sedimentada sofre influência de outra mais recente e menos
frequente. O uso da voz profissional, por razões de saúde vocal, não costuma exceder
determinado limite diário. Porém, é improvável que um profissional da voz faça pouco uso da
oralidade no cotidiano. É possível que a transferência articulatória aqui observada na tarefa
de leitura possa ser mais generalizada, hipótese que deve ser investigada no futuro.
Além disso, esse pode ser um fenômeno de “interprática” vocal, semelhante ao
observado na aquisição de segunda língua. Em outras palavras, um recurso usado
anteriormente com pouca frequência passa a ser mobilizado cada vez mais, visando à
proficiência, e acaba por “invadir” contextos onde não é esperado.
112
7.3 Considerações Finais
Várias teorias poderiam contribuir para explicar os resultados aqui reportados, dentre
elas, a Fonologia Gestual (BROWMAN e GOLDSTEIN, 1995 e seguintes). Nesse teoria,
postula-se que a fala pode ser explicada pela ativação dos gestos dos articuladores. Os
gestos são considerados nessa teoria linguística como a unidade mínima de descrição.
Aqui foram estudadas as produções de cantoras e locutoras que possuem prática
profissional cotidiana, e, possuem treinamento vocal prévio. Tal treinamento desenvolvido
diária e continuamente, deve envolver a percepção do que se produz e produção do que se
percebe, muitas vezes como um processo de imitação.
Essas profissionais certamente buscaram aproximar a fala cotidiana das suas práticas
profissionais, transferindo muitos dos gestos articulatórios de uma produção para a outra, de
forma semelhante ao que ocorre na aquisição de segunda língua. As estratégias das solistas
aqui reportadas para elevação dos formantes poderiam ser explicadas como sintonização
dos gestos em busca de conforto durante o canto, gestos que, por sua vez, seriam
transferidos para a fala por um processo inverso, que é decorrente da prática continuada. O
mesmo se pode dizer das locutoras, que transfeririam sua gestualidade oral para além da
prática profissional, para a fala cotidiana.
Como observado nos resultados obtidos, há possível sintonia gestual com a entoação,
em busca de conforto da produção falada ou cantada. Tais resultados poderão ser
reavaliados com diversas ferramentas, entre elas, a análise espectral com o LTAS
(ROSSING, SUNDBERG e TERNSTRÖM, 1985; BOERSMA e KOVACIC, 2006). Esse é o
primeiro caminho a explorar num aprofundamento futuro da análise dos dados desta tese.
113
114
8 Referências Bibliográficas
115
116
ABRAHAMSSON, M., e SUNDBERG, J. Subglottal pressure variation in actors’ stage
speech. In REES, M. (Ed.), Voice and Gender Journal for the Voice and Speech
Trainers Association (pp. 343-347); 2007.
ADAMI, Andre G., MIHAESCU, Radu, REYNOLDS, Douglas A., GODFREY, John J.
Modeling Prosodic Dynamics for Speaker Recognition. In ICASSP 2003 -
Proceedings, Oregon,USA; 2003
ALBANO, Eleonora C. O gesto e suas bordas: esboço de fonologia acustico-
articulatoria do português brasileiro - Campinas: Mercado das Letras; 2001.
AMIR, O., AMIR, N., e KISHON-RABIN, L. The effect of superior auditory skills on vocal
accuracy, J. Acoust. Soc. Am. 113-2, 1102– 1108; 2003.
BAAYEN, R.H. DAVIDSON, D.J. BATES, D.M. Mixed-effects modeling with crossed
random effects for subjects and items, Journal of Memory and Language, Volume
59, Issue 4, Special Issue: Emerging Data Analysis, November 2008, pp. 390-412, ISSN
0749-596X, DOI: 10.1016/j.jml.2007.12.005. Url:
http://www.sciencedirect.com/science/article/B6WK4-4RYXSNC-
1/2/bcebe3e8046b6c776f211f6c078b6f20
BARBOSA, P. A.,. Explaining Brazilian Portuguese resistance to stress shift with a
coupled-oscillator model of speech rhythm production, Cadernos de Estudos
Lingüísticos 43, 71-92; 2002b
BARBOSA, P. A.,. Explaining cross-linguistic rhythmic variability via a coupled-
oscillator model of rhythm production. Speech Prosody 2002 Conference. Aix-en-
Provence, France, 163-166; 2002a
BARBOSA, P. A. Incursões em torno do Ritmo da Fala, Campinas, SP, Ed. Pontes/
FAPESP; 2006.
BEAUTEMPS D., BADIN P. e LABOISSIÈRE R. Deriving vocal-tract area functions from
midsagittal profiles and formant frequencies: a new model for vowels and fricative
consonants based on experimental data. Speech Comm.16, 27-47; 1995
BELE, I.V. The Speaker’s Formant. Journal of Voice; 2006.
117
BOERSMA, Paul e WEENINK, David Praat: doing phonetics by computer (Version 5.1.05
) software; último acesso: 06.06.2010; URL: http://www.praat.org/
BROWMAN, C., GOLDSTEIN, L. Competing constraints on intergestural coordination
and self-organization of phonological structures. Bull. Comm. Parle 5, 25-34, 2000.
BROWMAN, Catherine P. e Louis GOLDSTEIN Articulatory gestures as phonological
units. Phonology 6: 201–252; 1989.
BROWMAN, Catherine P. e Louis GOLDSTEIN Articulatory phonology: An overview.
Phonetica 49: 155–180; 1992.
BROWMAN, Catherine P. e Louis GOLDSTEIN Gestural specification using dynamically-
defined articulatory structures. Journal of Phonetics 18: 299–320; 1990.
BROWMAN, Catherine P.; GOLDSTEIN, Louis “Targetless” schwa: an articulatory
analisys; in DOCHERTY, Gerard J. and LADD, D. Robert Papers in Laboratory
Phonology: Gesture, Segment, Prosody; Cambridge University Press; pp 26-67;
1992.
BROWN, S., MARTINEZ, M. J., HODGES, D. A., FOX, P. T., e PARSONS, L. M. The song
system of the human brain, Brain Res. Cognit. Brain Res. 20, 363–375; 2004.
BROWN, W. S., Jr., ROTHMANN, H. B., e SAPIENZA, C. Perceptual and acoustic study of
professionally trained versus untrained voices, Journal of Voice 14(3), 301–309;
2000.
BURROWS, David A Dynamical Systems Perspective on Music; The Journal of
Musicology, Vol. 15, No. 4 (Autumn, 1997), pp. 529-545; University of California Press,
1997.
BYRD, D. Articulatory vowel lengthening and coordination at phrasal junctures,
Phonetica, 57, 3-16; 2000.
BYRD, Dani & SALTZMAN, Elliot Intragestural dynamics of multiple prosodic
boundaries; Journal of Phonetics 26, 173–199; 1998.
BYRD, Dani & SALTZMAN, Elliot The elastic phrase: modeling the dynamics of
boundary-adjacent lengthening; Journal of Phonetics 31 149–180; 2003.
118
BYRD, Dani Articulatory Vowel Lengthening and Coordination at Phrasal Junctures;
Phonetica; 57:3–16; 2000.
CARLSON, Rolf; FRIBERG, Anders; FRYDÉN, Lars; GRANSTRÖM, Björn e SUNDBERG,
Johan Speech and music performance: Parallels and contrasts; Contemporary
Music Review, vol 4, #1; 1989; online reprinted by Routledge, Taylor & Francis Group
(2006) ISSN 0749-4467
CARLSSON-BERNDTSSON, G., e SUNDBERG, J. Formant frequency tuning in singing.
STL-QPSR, 32(1), 029-035; 1991.
CASTRO, S.L., MARQUES, C., & BESSON, M. Aprendizagem musical e linguagem: A
percepção do contorno melódico e da entoação. Psychologica, Extra-Série, 69-77;
2004.
CLAYTON, Martin; SAGER, Rebecca e WILL, Udo In time with the music: the concept of
entrainment and its significance for ethnomusicology. European Meetings in
Ethnomusicology, 11, pp. 3–142; 2005.
COLEMAN, J. Introducing speech and language processing. Cambridge University Press,
Cambridge, UK, 2005.
COOK, Thomas D. & CAMPBELL, Donald T. Quasi-Experimentation: design & analysis
issues for field settings; Houghton Mifflin Co. Boston, USA; 1979.
D’AUTILIA, Roberto Prosody and the Music of the Human Speech; International Journal of
Modern Physics B;World Scientific Publishing Company, 2006.
DALLA BELLA, Simone, GIGUÈRE, Jean-François e PERETZ, Isabelle Singing proficiency
in the general population, Journal of Acoust. Soc. Am. 121 (2), 1182–1189, 2007.
DE BOER, B The origins of vowel systems Oxford University Press, USA, 2001.
DE JONG, K., Acoustic and Articulatory Correlates of Pcenter Perception, UCLA
Working Papers in Linguistics, 81: 66-75, 1992.
DE JONG, N.H. e WEMPE, T. Praat script to detect syllable nuclei and measure speech
rate automatically. Behavior research methods, 41 (2), 385 – 390; 2009.
119
DELATTRE, Pierre Vowel Color and Voice Quality: an acoustic and articulatory
comparison. Chicago. NATS Bulletin, October, 1958.
DELATTRE, Pierre; LIBERMAN, Alvin M.; COOPER, F. S. , GERSTMAN, C. J. An
Experimental Study of the acoustic determinants of vowel color: observations on
one and two-formant vowels synthesized from spectrographic patterns. New York;
Haskins Laboratories, reimpressão da WORD, 1952.
DUEY, P. A. Vocal Art in Antiquity The Musical Quarterly, Vol. 32, No. 3., pp. 390-410, 1946.
FAGEL, Sascha Effects of Smiling on Articulation: Lips, Larynx and Acoustics. In
Proceedings of COST 2102 Training School, 2009. pp.294~303; 2009.
FELD, Steven e FOX, Aaron A. Music and Language; Annual Review of Anthropology, Vol.
23., pp. 25-53; 1994.
FISCUS, Jonathan G., AJOT, Jerome, RADDE,Nicolas, LAPRUN, Christophe, Multiple
Dimension Levenshtein Edit Distance Calculations for Evaluating Automatic
Speech Recognition Systems During Simultaneous Speech National Institute of
Standards and Technology (NIST), 100 Bureau Drive, Stop 8940, Gaithersburg, MD
20899, USA;url: http://www.nist.gov/speech/tools/index.htm ; 2007.
FLEGE, J. E. The detection French accent by American listeners. Journal of the
Acoustical Society of America, 76, 692-707; 1984.
FLEGE, J. E. The production and perception of foreign language speech sounds. In
Human Communication and its Disorders, Vol II (H. Winitz, editor) Norwood, NJ; Ablex
Publishing; 1986.
FLEGE, J. E. The production of "new" and "similar" phones in a foreign language:
evidence for the effect of equivalence classification. Journal of Phonetics, 15, 47 –
65;1987.
FOWLER, C. A., Converging Sources of Evidence on Spoken and Perceived Rhythms of
Speech: Cyclic Production of Vowels in Monosyllabic Stress Feet, Journal of
Experimental Psychology: General, 112 (3): 386-412, 1983.
120
GARCIA, Manuel; Observations on the Human Voice, in Proceedings of The Royal
Society of London, 1854-55, In Contributions of Voice Research to Singing,
Houston, College-Hill Press; 1980.
GARNIER, M.; HENRICH, N.; SMITH, J.; WOLFE, J. Vocal tract adjustments in the high
soprano range. Journal of Acoustic Society of America, 127-6; 2010.
GARNIER, Maeva WOLFE, Joe HENRICH, Nathalie SMITH, John : Interrelationship
between vocal effort and vocal tract acoustics: a pilot study, In INTERSPEECH-
2008, 2302-2305; 2008.
GELAMO, Renata P. Organização Prosódica e Interpretação de Canções: A Frase
Entoacional em Quatro Diferentes Interpretaçòes de “Na Batucada Da Vida”;
Dissertação de Mestrado; Oritentador: Prof. Dr. Lourenço Chacon Jurado Filho; UNESP,
São José do Rio Preto; 2006.
GIORGINO T . Computing and Visualizing Dynamic Time Warping Alignments in R: The
dtw Package. Journal of Statistical Software, 31(7), 1–24. URL
http://www.jstatsoft.org/v31/i07/ . 2009a.
GIORGINO T, Tormene P . dtw: Dynamic Time Warping Algorithms. R package version
1.13-1, URL http://CRAN.R-project.org/package=dtw ; 2009b.
GOLDSTEIN, Louis; BYRD, Dani e SALTZMAN, Elliott The role of vocal tract gestural
action units in understanding the evolution of phonology. In From Action to
Language: The Mirror Neuron System, M. Arbib (ed.), 215–249. Cambridge:
Cambridge University Press. 2006
GRABE, Esther; GUSSENHOVEN, Carlos; HAAN, Judith; MARSI, Erik; POST, Brechtje.
Preaccentual pitch and speaker attitude in Dutch. Language and Speech. 41/1, 63–
85. 1998
GUSSENHOVEN, Carlos. On the grammar and semantics of sentence accents.
Dordrecht: Foris. 1984
HOWELL, P., Prediction of p-center location from the distribution of energy in the
amplitude envelope I & II, Perception and Psychophysics, 43: 90-93, 99, 1988.
121
ITAKURA F . Minimum Prediction Residual Principle Applied to Speech Recognition.
IEEE Transactions on Acoustics, Speech, and Signal Processing, 23(1), 67–72; 1975.
JANKER, P. M., Evidence for the P-Center Syllable-Nucleus-Onset Correspondence
Hypothesis, ZAS Papers in Linguistics, 7: 94-124, 1996.
JOLIVEAU, E. SMITH, J. e WOLFE, J. Vocal Tract Resonances in Singing: The Soprano
Voice, Journal of. Acoustic Society of America. 116, 2434-2439; 2004.
JONES, M. R., e PFORDRESHER, P. Q. Tracking melodic events using Joint Accent
Structure, Can. J. Exp. Psychol. 51, 271–291; 1997.
JUNGERS, Melissa K., PALMER, Caroline & SPEER, Shari R. Time after time: The
coordinating influence of tempo in music and speech; Cognitive Processing, 1-2 21-
35; International Quarterly of Cognitive Science; Ohio State University; Ohio; USA;
2002.
KALMUS, H., e FRY, D. B. On tune deafness (dysmelodia): frequency, development,
genetics and musical background, Ann. Hum. Genet. 43, 369–382; 1980.
KAY, B.A., KELSO, J.A.S., SALTZMAN, E.L., e SCHÖNER, G. Space-time behavior of
single and bimanual rhythmical movements: Data and limit cycle model. J. Exp.
Psychol.: Hum. Percept. & Perform., 13, 178-192; 1987.
KAYES, Gillyanne Belting, Range and Register: A Practical Introduction for Singers; In
PEVoC 5 Workshop; Graz, August 2003. última visita: 24.07.2011; url:
http://www.vocalprocess.co.uk/resources/belting-range-and-register.pdf
KEARNEY, Gavin; MASTERSON, Claire; ADAMS, Stephen; BOLAND, Frank; Dynamic Time
Warping for Acoustic Response Interpolation: possibilities and limitations. in 17th
European Signal Processing Conference (EUSIPCO 2009), pp 705-709, Glasgow,
Scotland, 2009.
KEATING, Patricia. The window model of coarticulation: articulatory evidence, in John
KINGSTON e Mary BECKMAN (eds.), Papers in Laboratory Phonology I: Between
the Grammar and Physics of Speech, 451-470.1990
122
KOLINSKY, Régine LIDJI, Pascale PERETZ, Isabelle BESSON, Mireille MORAIS, José
Processing interactions between phonology and melody: Vowels sing but
consonants speak; Cognition 112: 1–20; 2009.
LABOV, William. Sociolinguistics patterns. Pennsylvania: University of Pennsylvania
Press, 1972.
LADD, Dwight Robert. Intonational phonology. Cambridge: Cambridge University Press;
1996.
LAMPERTI, F. Guida teorico-pratica-elementare per lo studio del canto. Milan: Ricordi,
1864
LARGE, E.W. and KOLEN, J.F. Resonance and the perception of musical meter.
Connection Science, 6, 177-208; 1994.
LAVER. J. The phonetic description of voice quality. Cambridge University Press,
Cambridge, 1994.
LEHISTE, I. and ROSS, J. Spoken and Sung Styles in Estonian Prosody; ICPhS 1999,
1499-1500; San Francisco; 1999.
LEHISTE, I. Timing of utterances and linguistic boundaries. Journal of the Acoustical
Society of America, 51, 2018-2024; 1972.
LEHISTE, Ilse Suprasegmentals; The MIT Press, Cambridge; 1970. 2nd Edition 1977.
LEHISTE, Ilse Prosody in Speech and Singing; Proceedings of Speech Prosody 2004,
Nara, Japan; 2004.
LEINO T, KARKKAINEN P. On the effects of vocal training on the speaking voice quality
of male student actors. In: ELENIUS K, BRANDERUD P, eds. Proceedings of the
XIIIth International Congress of Phonetic Sciences, Stockholm, Sweden 13–19
August, 1995, Vol. 3 of 4. Stockholm, Sweden: Department of Speech Communication
and Music Acoustics, Royal Institute of Technology; Department of Linguistics, Stockholm
University; pp. 496–499; 1995
LEINO T, LAUKKANEN A-M, RADOLF V. Formation of the Actor’s/Speaker’s Formant: A
Study Applying Spectrum Analysis and Computer Modeling. Journal of Voice, 2009.
123
LEITNER, Christina; SCHICKBICHLER, Martin; e PETRIK, Stefan. Example-based
Automatic Phonetic Transcription, Graz University of Technology, Austria, 2010.
LÉON, Pierre Précis de phonostylistique, Paris, Nathan Université, 1991.
LERDAHL, F. The Sounds of Poetry Viewed as Music. In I. Peretz & R. Zatorre, eds., The
Cognitive Neuroscience of Music. New York: Oxford University Press; 2003.
LERDAHL, F. Tonal pitch space. New York: Oxford University Press; 2001.
LESSAC, A. The Use and Training of the Human Voice, Drama Book, New York, 2ª ed;
1967.
LINDBLOM, B. E. e SUNDBERG, J. E., Acoustical consequences of lip, tongue, jaw, and
larynx movement, Journal of the Acoustic Society of America, 50(4): 1166-1179, 1971.
LINDBLOM, B. Spectrographic study of vowel reduction. Journal of the Acoustical Society
of America 35 1773-1781; 1963.
LINDBLOM, B., e SUNDBERG, J. Observations on tongue contour length in spoken and
sung vowels. STL-QPSR, 13(4), 001-005; 1972.
LINDBLOM, B., e SUNDBERG, J. The human voice in speech and singing. Springer
Verlag; 2005.
LINDBLOM, B., SUNDBERG, J., BRANDERUD, P., e DJAMSHIDPEY, H. On the acoustics
of spread lips. Proceedings of Fonetik, TMH-QPSR, 50(1), 13-16; 2007.
LIST, G. The boundaries of speech and song. Etnomusicology 7(1): 1-16; 1963.
MANCINI, Giambattista; Practical Reflections on Figured Singing, edições de 1774 e 1777
comparadas, traduzidas e editadas por Edward Foreman, Masterworks on Singing,
Vol. VII, Pro Musica Press, Champaign, IL; 1967.
MARCUS, S. M., Acoustic determinants of Perceptual center (p-center) location,
Perception and Psychophysics, 30 (3): 247-256, 1981.
MARCUS, S. M., Perceptual-centres. PhD Thesis, Cambridge University, 1976.
MASTER S, DE BIASE N, CHIARI BM, LAUKKANEN AM. Análise acústica e
perceptivoauditiva da voz de atores e não atores masculinos: long term average
spectrum e o "formante do ator". In Anais do XIV Congresso Brasileiro de
Fonoaudiologia. Sociedade Brasileira de Fonoaudiologia – Suplemento Especial;
124
Salvador, Bahia; 2006.
MASTER, S., DE BIASE, N.G., MADUREIRA, S. What about the "actor's formant" in
actresses' voices? Journal of Voice. Mar (2); 2011.
MASTER, S., DE BIASE. N., CHIARI, B.M., LAUKKANEN, A.M. Acoustic and perceptual
analyses of Brazilian male actors' and nonactors' voices: long-term average
spectrum and the "actor's formant". Journal of Voice. Mar;22(2):146-54; 2008.
MATTOSO CÂMARA Jr, J. Contribuição à Estilística Portuguesa. Rio de Janeiro; Ao Livro
Técnico; 1977.
MATTOSO CÂMARA Jr, J. Contribuição à Estilística Portuguesa. Rio de Janeiro; Ao Livro
Técnico; 1977.
MATTOSO CÂMARA Jr, J. Estrutura da Língua Portuguesa. São Paulo; Vozes; 1970,
reeditada em 2001.
MATTOSO CÂMARA Jr, J. Estrutura da Língua Portuguesa. São Paulo; Vozes; 2001.
MEDEIROS, Beatriz R. Descrição comparativa de aspectos fonetico-acusticos
selecionados da fala e do canto em portugues brasileiro; Tese de Doutorado;
Instituto de Estudos da Linguagem. Universidade Estadual de Campinas.Campinas, SP;
2002.
MENDES, A. P., ROTHMAN, H. B., SAPIENZA, C., e BROWN, W. S., Jr. Effects of vocal
training on the acoustic parameters of the singing voice, Journal of Voice 17(4),
529–543; 2003.
MEYER D, BUCHTA C. proxy: Distance and Similarity Measures. R package version 0.4-3,
URL: http://CRAN.R-project.org/package=proxy. ;2009.
MILLER, D.G. e SCHUTTE, H.K. Formant tuning in a professional baritone, Journal of
Voice 4:3, pp. 231-237; 1990.
MILLER, Richard English, French, German and Italian Techniques of Singing: a study in
national tonal preferences and how they related to functional efficiency; The
Scarecrow Press, Inc.; 1977.
MORI A, UCHIDA S, KURAZUME R, TANIGUCHI R, HASEGAWA T, SAKOE H . Early
Recognition and Prediction of Gestures. In B Werner (ed.), Proceedings of the 18th
125
International Conference on Pattern Recognition – ICPR 2006, volume 3, pp. 560–
563. IEEE Computer Society, Los Alamitos, CA, USA. doi:10.1109/ICPR.2006.467;
2006.
MURAYAMA, J., KASHIWAGI, T., KASHIWAGI, A., e MIMURA, M. Impaired pitch
production and preserved rhythm production in a right braindamaged patient with
amusia, Brain Cogn 56, 36–42, 2004.
MURBE, D, PABST, F., HOFMANN, G., e SUNDBERG, J. Significance of auditory and
kinesthetic feedback to singers’ pitch control, Journal of Voice 16, 44–51; 2002.
MURRY, T. Pitch-matching accuracy in singers and nonsingers, Journal of Voice 4, 317–
321; 1990.
MURRY, T., e ZWINER, P. Pitch matching ability of experienced and inexperienced
singers, Journal of Voice 5, 197–202; 1991.
MYERS C, RABINER L, ROSENBERG A . Performance Tradeoffs in Dynamic Time
Warping Algorithms for Isolated Word Recognition. IEEE Transactions on Acoustics,
Speech, and Signal Processing, 28(6), 623–635; 1980.
NESPOR, M e VOGEL, I. Prosodic Phonology; Dordrecht, Netherlands; Foris Publications;
1986.
NESPOR, Marina e VOGEL, Irene. On clashes and lapses. Phonology 6, 69-116; 1989.
OHNO, Sumio e FUJISAKI, Hiroya Quantitative Analysis of the Effects of Emphasis Upon
Prosodic Features of Speech, in Eurospeech Proceedings 2001; Scandinavia; 2001.
OLIVEIRA, Leonardo e ARANTES, Pablo An algorithm for token-by-token linear
predictive coding analysis of oral monophthongs. Journal of Acoustic Society of
America, vol 125 (4) 2529, URL: http://www.biomedsearch.com/nih/algorithm-token-by-
linear-predictive/19354686.html : 2009.
PABST, F. e SUNDBERG, J., Tracking multi-channel electroglottograph measurement of
larynx height in singers, STL-QPSR, 33(2-3): 67-78, 1992.
PABST, F., e SUNDBERG, J. Tracking multi-channel electroglottograph measurement of
larynx height in singers. Scandinavian Journal of. Logopedic Phoniatry; 1993.
126
PALMER, Caroline & HUTCHINS, Sean What is Musical Prosody? In ROSS, Bryan H. The
Psychology of Learning and Motivation: advances in research and theory. Vol. 46:
245-278; Beckman Institute and Department of Psychology; University of Illinois at
Urbana-Champaign; Elsevier Inc; 2006.
PERRIER, P. About speech motor control complexity. In J. HARRINGTON & M. TABAIN
(eds), Speech Production: Models, Phonetic Processes, and Techniques.
Psychology Press: Sydney, Australia ; 2005.
PERRIER, P., PAYAN, Y., ZANDIPOUR, M., e PERKELL, J. Influences of tongue
biomechanics on speech movements during the production of velar stop
consonants: A modeling study. Journal of the Acoustical Society of America, 114,
1582-1599; 2003.
PESSOTTI, Antônio C. S. A influência da técnica vocal sobre a emissão cantada no
vernáculo; Estudos Lingüísticos XXXV, 53º GEL, São Carlos; 2005.
PESSOTTI, Antônio C. S. O estilo na interpretação cantada e falada de uma canção de
camara brasileira : dados de cinco cantoras liricas brasileiras. Dissertação de
Mestrado; UNICAMP Orientador: Eleonora Cavalcante Albano; Campinas, SP, 2007;
277p.
PETRY, Adriano; Reconhecimento automático de locutor utilizando medidas de
invariantes dinãmicas não-lineares; Tese de Doutorado, PPGC; UFRGS; 150 pp.;
Porto Alegre, 2002.
PINCZOWER, Rachel; OATES, Jennifer Vocal projection in actors: the long-term average
spectral features that distinguish comfortable acting voice from voicing with
maximal projection in male actors. Journal of Voice; September 1, 2005
R Development Core Team. R: A Language and Environment for Statistical Computing. R
Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL
http://www.R-project.org/ ; 2009.
RAPHAEL, B.N. e SCHERER, R.C. Voice modifications of stage actors: acoustic
analyses, Journal of Voice 1:1,pp. 83-87; 1987.
RAPOSO DE MEDEIROS, Beatriz. Descrição comparativa de aspectos fonetico-
acusticos selecionados da fala e do canto em portugues brasileiro / Campinas,
127
SP; Universidade Estadual de Campinas. Instituto de Estudos da Linguagem; 2002.
ROSS, J. and LEHISTE, I. The Temporal Structure of the Estonian Folk Songs. Mouton
de Gruyter: Berlin and New York; 2001.
ROSS, Jaan Same Words Performed Spoken and Sung: An Acoustic Comparison;
Proceedings of the 5th Triennial ESCOM Conference; Hanover University of Music and
Drama, Germany; 2003.
ROSSING, T., SUNDBERG, J., e TERNSTRÖM, S Acoustic comparison of soprano solo
and choir singing. STL-QPSR, 26(4), 043-058; 1985.
SALTZMAN, E., e BYRD, D. Dynamical simulations of a phase window model of relative
timing. In J.J. Ohala, Y. Hasegawa, M. Ohala, D. Granville, e A.C. Bailey, (Eds.).
Proceedings of the XIVth International Congress of Phonetic Sciences (pp. 2275-2278).
New York: American Institute of Physics; 1999.
SANCIER, M.L.; FOWLER, C. A. Gestural drift in a bilingual speaker of Brazilian
Portuguese and English, Journal of Phonetics, 25: 421-436, 1997.
SANCIER, Michele L. e FOWLER, Carol A. Gestural drift in a bilingual speaker of
Brazilian Portuguese and English; Journal of Phonetics, 25, 421 - 436; 1997
SANGUINETI, V., LABOISSIERE, R., PAYAN, Y. A control model of human tongue
movements in speech. Biological Cybernetics;77:11–22; 1997.
SAPIR S, RAMIG LO, SPIELMAN JL, FOX C. Formant centralization ratio: a proposal for
a new acoustic measure of dysarthric speech. Journal of Speech Lang Hear
Feb;53(1):114-25. Epub 2009 Nov 30, doi:10.1044/1092-4388(2009/08-0184); 2010.
SCOTTO DI CARLO, N. Contraintes phonatoires et contraintes articulatoires dans le
chant. Actes des IX° Journées de Pathologie Vocale et de Pratique Orthophonique de
Nice. GEROP, pp. 1-27, 1995.
SCOTTO DI CARLO, N. Diction et musicalité. Médecine des Arts, vol. 5, pp 4-11.1993.
SCOTTO DI CARLO, N. Etude acoustique et auditive des principaux facteurs
d'intelligibilité de la voix chantée. Actes du VII° Congrès International des Sciences
Phonétiques. Mouton, La Haye, pp. 1017-1023; 1972.
128
SCOTTO DI CARLO, N. Etude acoustique et statistique de l'influence des consonnes
sur l'attaque des voyelles subséquentes en voix chantée. Communication au II°
Symposium International de Recherches sur le Chant. T.I.P.A., vol. 4, pp. 237-260; 1977.
SCOTTO DI CARLO, N. Influence de l'articulation sur la musicalité de la phrase
chantée. Communication au VIII° Congrès International des Sciences Phonétiques.
T.I.P.A., vol. 3, pp. 117-146; 1976.
SCOTTO DI CARLO, N. L'influence de la fréquence sur l'intelligibilité des voyelles
chantées. Phonetica, vol. 42, 4, pp. 188-197, 1985.
SCOTTO DI CARLO, N. Les Divas et le Diapason. Médecine des Arts, 21, pp. 10-13, 1977.
SCOTTO DI CARLO, N. Les mimiques expressives dans le chant.(Facial Expressions in
Singing).Semiotica, 2004, 149, 1/4, pp. 37-55, 2004.
SCOTTO DI CARLO, N. Réflexes conditionnés et apprentissage du chant. La Lettre du
Musicien, 318, pp. 52-53, 2005b.
SCOTTO DI CARLO, N. Structure temporelle de la syllabe parlée et chantée. Médecine
des Arts, 52, pp. 2-11, 2005a.
SCOTTO DI CARLO, Nicole, AUTESSERRE, D. Parole, chant et musique dans l'art
lyrique, Travaux de l'Institut de Phonétique d'Aix, 1989-1990, 13 : 131-154; 1990.
SCOTTO DI CARLO, Nicole, GERMAIN, A. A perceptual study of the influence of pitch on
the intelligibility of sung vowels, Phonetica, 42, 4: 188-197; 1985.
SELKIRK, E.O. Phonology and syntax: The relation between sound and structure.
Cambridge, MA: MIT Press; 1984.
SLEVC, L. Robert e MIYAKE, Akira, Individual Differences in Second-Language
Proficiency: Does Musical Ability Matter?; Psychological Science, Vol. 17 — Number
8; 2006.
SLOBODA, J. A., WISE, K. J., e PERETZ, I. Quantifying tone deafness in the general
population, Ann. N.Y. Acad. Sci. 1060, 255–261; 2005.
SMITH, C. L. The timing of vowel and consonant gestures in Italian and Japanese. In
Actes du XIIème Congrès International des Sciences Phonétiques, Aix-en-Provence,
France, vol. 4, pp. 234-237; 1991.
129
SMITH, Leigh M. A Multiresolution Time-Frequency Analysis and Interpretation of
Musical Rhythm PhD Thesis; Department of Computer Science; University of Western
Australia; 1999.
SNODGRASS, Richard T. Developing Time-Oriented Database Applications in SQL,
Morgan Kaufmann Publishers, USA, 2000.
STEELS, Luc The synthetic modeling of language origins; Evolution of Communication
Journal, 1 (1), John Benjamins, Amsterdam; 1997
STEWART, L., von KRIEGSTEIN, K., WARREN, J. D., e GRIFFITHS, T. D. Music and the
brain: disorders of music listening, Brain 129(10), 2533– 2553; 2006.
SUNDBERG J, JOHANSSON C, WILBRAND H & YTTERBERGH C From sagittal distance
to area. A study of transverse, vocal tract cross-sectional area . Phonetica, 44: 76-
90; 1987.
SUNDBERG J., LINDBLOM, B. e LILJENCRANTS, J. Formant frequency estimates for
abruptly changing area functions: A comparison between calculations and
measurements, Journal of Acoustic Society of America, 91(6):3478-3482; 1992.
SUNDBERG, J. The perception of singing, in The Psychology of Music, editado por D.
Deutsch Academic, San Diego, pp. 171–214; 1999a.
SUNDBERG, J. The Science of the Singing Voice. Northern Illinois U. P., DeKalb, IL; 1987.
SUNDBERG, J. An articulatory interpretation of the 'singing formant'. STL-QPSR, 13(1),
045-053; 1972.
SUNDBERG, J. Formants and fundamental frequency control in singing. An
experimental study of coupling between vocal tract and voice source. STL-QPSR,
20(1), 065-078; 1979.
SUNDBERG, J. Level and center frequency of the singer's formant. TMH-QPSR, 40(3-4),
087-094; 1999b.
SUNDBERG, J. Music performance. In MOSART project workshop. Padova; 2001.
SUNDBERG, J. Observations on a professional soprano singer. STL-QPSR, 14(1), 014-
024; 1973.
130
SUNDBERG, J. The acoustics of singing voice, Scientific American; Março, pp. 104-116;
1977.
SUNDBERG, J., e ASKENFELT,T Larynx height and voice source. A relationship?. STL-
QPSR, 22(2-3), 023-036; 1981.
SUNDBERG, J., e NORDSTRÖM, P-.Raised and lowered larynx - the effect on vowel
formant frequencies. STL-QPSR, 17(2-3), 035-039; 1976.
SUNDBERG, J., FAHLSTEDT, E., e MORELL, A. Effects on the glottal voice source of
vocal loudness variation in untrained female and male voices. The Journal of the
Acoustical Society of America, 117 (2), 879–885; 2005.
TATIT, Luis. Semiótica da canção: melodia e letra. São Paulo: Escuta, 1994
TATIT, Luiz. O cancionista: composição de canções no Brasil. Rio de Janeiro: Edusp,
1996.
TERNSTRÖM, S., SUNDBERG, J., e COLLDEN, A. Articulatory F0 perturbations and
auditory feedback, J. Speech Hear. Res. 31, 187–192; 1988.
TOSI, Pier Francesco; Opinioni de’ cantori antichi e moderni, o sieno osservazioni sopra il canto
figurato; (Bologna, 1723), facsimile reimpresso por Broude Brothers, New York, 1968.
TRAUNMÜLLER, H. Modulation and demodulation in production, perception, and
imitation of speech and bodily gestures, in FONETIK 98, Dept. of Linguistics,
Stockholm University, pp. 40 – 43; 1998.
TRAUNMÜLLER, H. Analytical expressions for the tonotopical sensory scale, JASA,
SUPPL 1, VOL. 88, PP 97-100; 1990.
WILLIAMS, Brian, Biostatistics; Chapman & Hall; London, UK, 1994.
WOLFE, J. e SMITH, J. Acoustical coupling between lip valves and vocal folds,
Acoustics Australia, 36, 23-27; 2008.
WOODS, Anthony; FLETCHER, Paul, e HUGUES, Arthur, Statistics in Language Studies.
Cambridge University Press; Cambridge, UK, 1989.
131
132
9 Anexo I – Tabelas
133
134
135
Tabela 9.1: Análises não paramétricas de Conselhos (Carlos Gomes): Pearson (x2), Fisher exato e V-Cramer.
conselhos
Tonicidade + pos_SF 34,574 2 0,000 0,000 0,421Tonicidade + pos_SE 20,459 2 0,000 0,000 0,324Tonicidade + pausa 32,432 1 0,000 0,000 0,408Tonicidade + proemTom 7,676 1 0,006 0,008 0,198Tonicidade + proemDur 36,244 1 0,000 0,000 0,431Tonicidade + Tempo 90,005 1 0,000 0,000 0,679
pos_SF + pos_SE 218,180 4 0,000 0,000 0,748pos_SF + pausa 166,150 2 0,000 0,000 0,923pos_SF + proemTom 1,989 2 0,370 0,353 0,101pos_SF + proemDur 60,994 2 0,000 0,000 0,559pos_SF + Tempo 25,371 2 0,000 0,000 0,361pos_SE + pausa 115,567 2 0,000 0,000 0,770pos_SE + proemTom 0,638 2 0,727 0,739 0,057pos_SE + proemDur 45,518 2 0,000 0,000 0,483pos_SE + Tempo 16,317 2 0,000 0,000 0,289pausa + proemTom 0,582 1 0,446 0,416 0,055pausa + proemDur 73,058 1 0,000 0,000 0,612pausa + Tempo 23,334 1 0,000 0,000 0,346proemTom + proemDur 20,168 1 0,000 0,000 0,322proemTom + Tempo 4,886 1 0,027 0,037 0,158proemDur + Tempo 33,904 1 0,000 0,000 0,417
variáveis Pearson(X2) GLValor-p (X2) Fisher_exact
(p-value)V-Cramer
136
Tabela 9.2: Análises não paramétricas de Conselhos (Carlos Gomes): desvios de Freeman-Tukey.
Variáveis-InfluenciaTônica versus Sintagma Fonológico à Direita (SFD) 3,3214Tônica versus Sintagma Entoacional à Direita(SED) 2,5653Tônica versus Ocorrência de Pausa (presente) 3,2461Tônica versus Proeminência de Tom (pico) 1,7320Tônica versus Proeminência de Duração (sim) 3,4146Tônica versus Tempo (forte) 4,5167SFD/SED pareado com SFE/SEE 4,7268SFD versus Ocorrência de Pausa (presente) 5,8179SFE versus Proeminência de Tom (pico) 0,9570SFD versus Proeminência de Duração (sim) 4,2888SFD versus Tempo (forte) 2,8571SED versus Ocorrência de Pausa (presente) 4,7782SEE versus Proeminência de Tom (pico) 0,7053SED versus Proeminência de Duração (sim) 3,6933SED versus Tempo (forte) 2,0964Ocorrência de Pausa (presente) versus Proeminência de Tom (pico) 0,6767Ocorrência de Pausa (presente) versus Proeminência de Duração (sim) 4,6120Ocorrência de Pausa (presente) versus Tempo (forte) 2,7827Proeminência de Tom (pico) versus Proeminência de Duração (sim) 2,8812Proeminência de Tom (pico) versus Tempo (forte) 1,3788Proeminência de Duração (sim) versus Tempo (forte) 3,2500
Freeman Tukey - desvios
137
Tabela 9.3: Estatística Descritiva dos dados de fala e canto; loc – locutoras, cor – coralistas, sol – solistas, desvpad – desvio-padrão.
grupo média assimetria curtose média assimetria curtosefala
-10,8670 4,3545 0,0831 -0,3465 0,2200 0,1057 0,8179 -0,1270 948-14,0660 3,9731 0,3997 -1,0323 0,2299 0,1073 0,8634 0,4583 949-13,7380 3,0257 0,4641 0,4237 0,2235 0,1216 1,0950 0,2612 949-13,1654 4,2324 0,0058 -0,0923 0,2037 0,0991 0,9740 0,3631 953-14,4209 4,2825 0,5256 -0,1676 0,2039 0,1009 0,9927 0,2736 937
cor -10,2859 5,1853 0,4641 0,3033 0,2514 0,1442 1,5042 2,8050 947cor -9,2809 2,7805 -0,6347 3,1277 0,2061 0,1175 1,4605 1,7369 947cor -10,4700 3,4741 0,3098 0,0290 0,1990 0,0906 1,1694 1,3950 958cor -12,9358 3,3899 0,2125 1,7864 0,1819 0,0973 1,8258 3,5654 945cor -8,2729 2,6088 -0,5113 0,3183 0,1994 0,0979 1,3689 1,9113 945
sol -9,3336 4,5968 -0,1141 -0,3320 0,2162 0,1139 1,2187 0,8336 949sol -9,8003 4,9839 0,6310 0,1051 0,2346 0,1399 1,1535 0,6079 951sol -8,5305 4,6806 -0,0065 0,6585 0,2081 0,1108 1,1232 0,5167 945sol -11,4566 2,5141 0,0319 -0,2609 0,1909 0,0985 1,4564 1,7844 945sol -11,2289 5,5604 0,3403 -0,0615 0,2410 0,1162 1,1430 0,9910 945
canto sem acompanhamentocor -0,4773 3,8643 -0,0367 -0,2466 0,4423 0,3815 3,6791 20,0205 950cor 0,4099 3,8625 0,0215 -0,4887 0,4113 0,3579 3,0131 12,7421 950cor 0,7558 3,7628 0,0927 -0,5358 0,4281 0,3800 3,0539 12,9659 955cor -1,0151 3,9806 0,0431 -0,6164 0,4331 0,3981 3,0870 14,3458 950cor 0,3124 3,6933 0,1371 -0,4378 0,3822 0,3332 3,3298 16,1311 955
sol 0,3531 3,9083 0,0186 -0,5161 0,4211 0,4166 3,5456 17,5796 950sol -0,0653 3,8713 0,0005 -0,4691 0,4519 0,4348 3,7656 20,4503 950sol 0,0026 3,9156 0,0163 -0,4909 0,3624 0,3424 3,7667 20,0706 950sol 0,8400 3,7358 0,1851 -0,4222 0,3502 0,3339 3,9842 23,1059 950sol -0,0502 3,9938 0,0809 -0,5882 0,5059 0,4376 2,8871 11,4614 950
canto com acompanhamentocor 0,0514 3,7760 0,0414 -0,6984 0,3844 0,3485 2,9973 11,9362 953cor 0,3653 3,8795 0,0944 -0,6056 0,3834 0,3221 2,7840 10,4115 950cor 0,2776 3,7773 0,0999 -0,5212 0,3841 0,3516 3,3692 16,0636 953cor 0,0407 3,9425 0,0124 -0,6445 0,3878 0,3283 2,5127 8,1006 949cor 0,1029 3,7677 0,0646 -0,6922 0,3735 0,3369 3,7240 19,8421 954
sol 0,2238 3,9306 0,0120 -0,5258 0,3883 0,3506 2,7202 9,6915 950sol 0,0217 3,8685 0,0427 -0,4843 0,3784 0,3231 2,4621 7,7133 950sol -0,0945 3,9407 0,0162 -0,6140 0,3861 0,3529 2,8307 10,6223 950sol 0,1193 3,8161 0,1478 -0,4551 0,3845 0,3305 2,6699 9,3452 950sol -0,2883 4,4048 -0,3415 0,6287 0,3959 0,3540 2,8176 10,6164 950
desvpad desvpad nT
loclocloclocloc
138
Tabela 9.4: ANOVA entre formantes e vogais por modalidade.
F1GL F valor p sign.
grupo 2 8,2451 0,0003 Sgrupo:vogal 12 100,2512 0,0000 S
grupo:vogal: i 1 25,7964 0,0000 Sgrupo:vogal: e 1 15,8604 0,0001 Sgrupo:vogal: a 1 25,7876 0,0000 Sgrupo:vogal: o 1 212,2947 0,0000 Sgrupo:vogal: u 1 116,0646 0,0000 S
F2grupo 2 0,3785 0,6851 Ngrupo:vogal 12 161,2003 0,0000 S
grupo:vogal: i 1 232,8288 0,0000 Sgrupo:vogal: e 1 250,2927 0,0000 Sgrupo:vogal: a 1 306,1171 0,0000 Sgrupo:vogal: o 1 174,5678 0,0000 Sgrupo:vogal: u 1 287,9974 0,0000 S
F3grupo 2 11,6119 0,0000 Sgrupo:vogal 12 29,6413 0,0000 S
grupo:vogal: i 1 15,9711 0,0001 Sgrupo:vogal: e 1 4,0629 0,0445 Sgrupo:vogal: a 1 9,6048 0,0021 Sgrupo:vogal: o 1 94,0135 0,0000 Sgrupo:vogal: u 1 56,8066 0,0000 S
139Tabela 9.5: Comparações entre modalidades e cantoras (TukeyHSD)
cor solF1-Bark F1-Bark
p significância p significância0,975 N 0,918 N0,000 S 0,000 S0,000 S 0,000 S
[i]F2-Bark F2-Bark
0,653 N 0,584 N0,171 N 0,001 S0,622 N 0,016 S
F1-Bark F1-Bark0,914 N 0,721 N0,000 S 0,000 S0,000 S 0,000 S
[e]F2-Bark F2-Bark
0,394 N 0,758 N0,003 S 0,181 N0,000 S 0,038 S
F1-Bark F1-Bark0,293 N 0,010 S0,151 N 0,864 N0,003 S 0,002 S
[a]F2-Bark F2-Bark
0,987 N 0,997 N0,001 S 0,000 S0,001 S 0,000 S
F1-Bark F1-Bark1,000 N 0,967 N0,458 N 0,001 S0,451 N 0,002 S
[o]F2-Bark F2-Bark
0,971 N 0,522 N0,002 S 0,000 S0,004 S 0,000 S
F1-Bark F1-Bark0,547 N 0,996 N0,000 S 0,958 N0,004 S 0,979 N
[u]F2-Bark F2-Bark
0,824 N 0,997 N0,873 N 0,423 N0,522 N 0,384 N
canto-S-canto-C canto-S-canto-Cfala-canto-C fala-canto-Cfala-canto-S fala-canto-S
canto-S-canto-C canto-S-canto-Cfala-canto-C fala-canto-Cfala-canto-S fala-canto-S
canto-S-canto-C canto-S-canto-Cfala-canto-C fala-canto-Cfala-canto-S fala-canto-S
canto-S-canto-C canto-S-canto-Cfala-canto-C fala-canto-Cfala-canto-S fala-canto-S
canto-S-canto-C canto-S-canto-Cfala-canto-C fala-canto-Cfala-canto-S fala-canto-S
canto-S-canto-C canto-S-canto-Cfala-canto-C fala-canto-Cfala-canto-S fala-canto-S
canto-S-canto-C canto-S-canto-Cfala-canto-C fala-canto-Cfala-canto-S fala-canto-S
canto-S-canto-C canto-S-canto-Cfala-canto-C fala-canto-Cfala-canto-S fala-canto-S
canto-S-canto-C canto-S-canto-Cfala-canto-C fala-canto-Cfala-canto-S fala-canto-S
canto-S-canto-C canto-S-canto-Cfala-canto-C fala-canto-Cfala-canto-S fala-canto-S
140
10 Anexo II – Partitura
141
142
143
Figura 10.1: Partitura da linha vocal de Conselhos (Carlos Gomes).
Partitura: na codificação Lilypond:
%=============================================
% created by MuseScore Version: 0.9.5
% reviewd in MuseScore Version: 0.9.6
% Monday, January 18, 2011
%=============================================
\version "2.12.0"
#(set-default-paper-size "a4")
\paper {
line-width = 190\mm
left-margin = 10\mm
top-margin = 10\mm
bottom-margin = 20\mm
%%indent = 0 \mm
%%set to ##t if your score is less than one page:
ragged-last-bottom = ##t
ragged-bottom = ##f
%% in orchestral scores you probably want the two bold slashes
%% separating the systems: so uncomment the following line:
%% system-separator-markup = \slashSeparator
}
\header {
}
AvoiceAA = \relative c'{
\set Staff.instrumentName = #""
\set Staff.shortInstrumentName = #""
\clef treble
%staffkeysig
144
\key as \major
%bartimesig:
\time 2/4
r8 r4 ees8 | % 1
ees16 f g aes ees8 r | % 2
c' aes16 f ees f g f | % 3
ees f g aes bes8 ees | % 4
ees4~ ees8 c16 d | % 5
ees8 d16 c d a b g | % 6
c4 c8 bes16 aes | % 7
g8~ g16 g g f ees g | % 8
g4 ees'~ | % 9
ees~ ees16 r ees,8 | % 10
ees f g aes | % 11
c4~ c8 ees, | % 12
ees f g aes | % 13
des4~ des8~ des16 r | % 14
f4~ f8 ees | % 15
f ees c aes | % 16
g bes aes16 g aes f | % 17
ees4~ ees8 aes16 bes | % 18
c b c b c b c b | % 19
c4~ c16 g aes bes | % 20
c b c b c g aes bes | % 21
aes4 r8 ees' | % 22
f ees c aes | % 23
des4~ des8~ des16 r | % 24
f,4 c'8~ c16 bes | % 25
aes4 r | % 26
R2 *3 | %
r8 r4 ees8 | % 30
ees16 f g aes ees8 r | % 31
c' aes16 f ees4 | % 32
145
ees16 f g aes bes8 ees | % 33
ees4~ ees8 c16 d | % 34
ees8 d16 c d a b g | % 35
c4 r16 c bes aes | % 36
g8 g g16 f ees g | % 37
g4 ees'~ | % 38
ees~ ees16 r ees,8 | % 39
ees f g aes | % 40
c4 c8 ees, | % 41
ees f g aes | % 42
des4~ des8~ des16 r | % 43
f4~ f8 ees | % 44
f ees c aes | % 45
g bes aes16 g aes f | % 46
ees4~ ees8 aes16 bes | % 47
c b c b c b c b | % 48
c4 r8 aes16 bes | % 49
c b c b c g aes bes | % 50
aes4~ aes8 ees' | % 51
f ees c aes | % 52
des4~ des8~ des16 r | % 53
f,4 c'8~ c16 bes | % 54
aes8 r aes' r \bar "|."
}% end of last bar in partorvoice
ApartAverseA = \lyricmode { \set stanza = " 1. " Me -- ni -- na ve -- nha cá, ve -- jao que faz se por seu gos -- too ca -- sa -- men -- to quer a von -- ta -- deao ma -- ri -- dohá de fa -- zer quees -- te de -- se -- joo ca -- sa -- men -- to tra -- az _ Seo ho -- mem ve -- lho for ou sea -- in -- da ra -- paz _ To _ me, to -- me a li -- ção quee -- le qui -- ser -- lhe dar Se fun -- ções e con -- tra -- dan -- ças não qui -- ser tam -- bem não quei -- ra queé me -- lhor pra não bri -- gar Me -- ni -- na, ve -- nha cá _ ve -- ja o que faz! Pro -- cu -- re dea -- gra -- dar, sem con -- tra -- riar pron -- ta sem -- preao -- be -- de -- cer Te -- nha de -- le cui -- da -- dos com a -- mor, en -- quan -- toao res -- to, dei -- xe lá cor -- re er _ Sea -- in -- da mui -- to mo -- ço ou sea -- in -- da ra -- paz _ Na _ da, na -- da de ci -- u -- mes, que se -- ri -- a pior! _ Oh me -- ni -- na, ve -- nha cá, ve -- jao que faz! A mu -- lher só faz o ho -- mem bom e mau _ Queas -- sim co -- mo dá pão _ po de _ dar pau! Ai! }
146
\score {
<<
\context Staff = ApartA <<
\context Voice = AvoiceAA \AvoiceAA
>>
\context Lyrics = ApartAverseA\lyricsto AvoiceAA \ApartAverseA
\set Score.skipBars = ##t
%%\set Score.melismaBusyProperties = #'()
\override Score.BarNumber #'break-visibility = #end-of-line-invisible %%every bar is numbered.!!!
%% remove previous line to get barnumbers only at beginning of system.
#(set-accidental-style 'modern-cautionary)
\set Score.markFormatter = #format-mark-box-letters %%boxed rehearsal-marks
\override Score.TimeSignature #'style = #'() %%makes timesigs always numerical
%% remove previous line to get cut-time/alla breve or common time
\set Score.pedalSustainStyle = #'mixed
%% make spanners comprise the note it end on, so that there is no doubt that this note is included.
\override Score.TrillSpanner #'(bound-details right padding) = #-2
\override Score.TextSpanner #'(bound-details right padding) = #-1
%% Lilypond's normal textspanners are too weak:
\override Score.TextSpanner #'dash-period = #1
\override Score.TextSpanner #'dash-fraction = #0.5
%% lilypond chordname font, like mscore jazzfont, is both far too big and extremely ugly ([email protected]):
\override Score.ChordName #'font-family = #'roman
\override Score.ChordName #'font-size =#0
%% In my experience the normal thing in printed scores is maj7 and not the triangle. (olagunde):
\set Score.majorSevenSymbol = \markup {maj7}
>>
147
%% Boosey and Hawkes, and Peters, have barlines spanning all staff-groups in a score,
%% Eulenburg and Philharmonia, like Lilypond, have no barlines between staffgroups.
%% If you want the Eulenburg/Lilypond style, comment out the following line:
\layout {\context {\Score \consists Span_bar_engraver}}
}%% end of score-block
#(set-global-staff-size 20)
148
149
150
151
152
11 Anexo III – Espaços Vocálicos
153
154
155
Figura 11.1: Espaços vocálicos nas posições acentuais de fala das coralistas (COR). Pretônicas
156
Figura 11.2: Espaços vocálicos nas posições acentuais de fala das coralistas (COR).Tônicas
157
Figura 11.3: Espaços vocálicos nas posições acentuais de fala das coralistas (COR). Postônicas
158
Figura 11.4: Espaços vocálicos nas posições acentuais de fala das solistas (SOL). Pretônicas
159
Figura 11.5: Espaços vocálicos nas posições acentuais de fala das solistas (SOL). Tônicas
160
Figura 11.6: Espaços vocálicos nas posições acentuais de fala das solistas (SOL). Postônicas
161
Figura 11.7: Espaços vocálicos nas posições acentuais de fala das locutoras (LOC). Pretônicas
162
Figura 11.8: Espaços vocálicos nas posições acentuais de fala das locutoras (LOC). Tônicas
163
Figura 11.9: Espaços vocálicos nas posições acentuais de fala das locutoras (LOC). Postônicas
164
Figura 11.10: Espaços vocálicos nas posições acentuais da produção cantada sem acompanhamento das coralistas (COR) Pretônicas
165
Figura 11.11: Espaços vocálicos nas posições acentuais da produção cantada sem acompanhamento das coralistas (COR) Tônicas
166
Figura 11.12: Espaços vocálicos nas posições acentuais da produção cantada sem acompanhamento das coralistas (COR) Postônicas
167
Figura 11.13: Espaços vocálicos nas posições acentuais da produção cantada sem acompanhamento das solistas (SOL) Pretônicas
168
Figura 11.14: Espaços vocálicos nas posições acentuais da produção cantada sem acompanhamento das solistas (SOL) Tônicas
169
Figura 11.15: Espaços vocálicos nas posições acentuais da produção cantada sem acompanhamento das solistas (SOL) Postônicas
170
Figura 11.16: Espaços vocálicos nas posições acentuais da produção cantada com acompanhamento das coralistas (COR).Pretônicas
171
Figura 11.17: Espaços vocálicos nas posições acentuais da produção cantada com acompanhamento das coralistas (COR).Tônicas
172
Figura 11.18: Espaços vocálicos nas posições acentuais da produção cantada com acompanhamento das coralistas (COR). Postônicas
173
Figura 11.19: Espaços vocálicos nas posições acentuais da produção cantada com acompanhamento das solistas (SOL). Pretônicas
174
Figura 11.20: Espaços vocálicos nas posições acentuais da produção cantada com acompanhamento das solistas (SOL). Tônicas
175
Figura 11.21: Espaços vocálicos nas posições acentuais da produção cantada com acompanhamento das solistas (SOL). Postônicas