universidade federal do pará - pibic.ufpa.br · paulo (pucsp), universidade federal ... na janela...
TRANSCRIPT
UNIVERSIDADE FEDERAL DO PARÁPRÓ-REITORIA DE PESQUISA E PÓS-GRADUAÇÃO
DIRETORIA DE PESQUISA
PROGRAMA INSTITUCIONAL DE BOLSAS DE INICIAÇÃO CIENTÍFICA
RELATÓRIO TÉCNICO - CIENTÍFICO
Período: 01/08/2010 a 31/07/2011( ) PARCIAL(X) FINAL
IDENTIFICAÇÃO DO PROJETO
Título do Projeto de Pesquisa: Atlas Prosódico Multimédia do Português do Norte do Brasil (CNPQ /PQ2 -Processo 303455/2008-0)Nome do Orientador: Regina Célia Fernandes CruzTitulação do Orientador: DoutorFaculdade: Faculdade de LetrasUnidade: Instituto de Letras e comunicaçãoLaboratório: Laboratório de Ciências e Tecnologia da FalaTítulo do Plano de Trabalho: Atlas prosódico multimédia do Português do Norte do Brasil – AMPER-POR: variedade lingüística da zona rural de Belém (PA).Nome do Bolsista: Amanda Ariana Silva da Silva
Tipo de Bolsa: (x) PIBIC/CNPq ( ) PIBIC/CNPq-AF( ) PIBIC/UFPA( ) PIBIC/UFPA-AF( ) PIBIC/INTERIOR( ) PIBIC/FAPESPA( ) PARD( ) PARD – renovação( ) PADRC( ) Bolsistas PIBIC do edital CNPq 001/2007
INTRODUÇÃO
1
O presente relatório técnico-científico tem por objetivo relatar como se deu
o desenvolvimento das atividades referentes ao Plano de trabalho: Atlas
prosódico multimédia do Português do Norte do Brasil – AMPER-POR:
variedade lingüística da zona rural de Belém (PA) vinculado ao projeto de
pesquisa intitulado: Atlas Prosódico Multimédia do Português do Norte do
Brasil.
O plano de trabalho em questão tem por objetivo analisar
experimentalmente a variação prosódica do português falado na zona rural da
cidade de Belém (PA), a saber: Outeiro, Mosqueiro e Cotijuba. Para tal, contou
com uma bolsista PIBIC / CNPq, Amanda Ariana Silva da Silva, que a partir do
mês de junho interrompeu suas atividades na bolsa por problemas de saúde
(atestado em anexo), assim sendo Camila Roberta dos Santos Brito, voluntária do
projeto ficou responsável por concluir as atividades aqui descritas.
As atividades realizadas que serão evidenciadas neste relatório foram
realizadas de fato pela aluna voluntária autora do presente relatório, as quais
compreendem:
a) Tratamento de dados dos informantes BE05 e BE06, todos do corpus da
zona urbana de Belém - BE0 - formado por Santos Jr. (2008) e ampliado
por Silva (2010), como descrito no relatório parcial;
b) Revisão de dados dos informantes BE01 e BE04, todos do corpus da zona
urbana de Belém;
c) Pesquisa de campo para coleta de dados, realizada no bairro do Guamá em
Belém, referente a gravação com um informante BE01, com a participação
da Prof Dr Regina Cruz e da aluna voluntária Camila Roberta dos Santos
Brito, autora do presente relatório, para a complementação do corpus
proposto por Santos Jr.(2008);
d) Seleção de novos informantes para a coleta de dados em Outeiro,
Mosqueiro e Cotijuba.
Para que fique claro como as atividades foram realizadas (item material/
método) apresentaremos um breve resumo do Plano de Trabalho, justificativas e
objetivos (geral e específico) da pesquisa.
Resumo do Plano de Trabalho
2
O Plano de trabalho intitulado Atlas prosódico multimédia do Português
do Norte do Brasil – AMPER-POR: variedade linguística da zona rural de
Belém (PA) compreende a coleta, análise e caracterização das variações
prosódicas do dialeto das ilhas que fazem parte da zona rural do município de
Belém (PA): Mosqueiro, Outeiro e Cotijuba; as quais fazem parte do português
regional paraense considerado por Silva Neto (1957) como sendo o de canua
cheia de cucus de pupa a prua, por conta de sua principal marca dialetal o
alteamento das vogais posteriores em posição de sílaba tônica.
É importante ressaltar que todas as localidades estudadas no referido plano
de trabalho fazem parte da área de atuação do projeto maior: Atlas Prosódico
Multimédia do Português do Norte do Brasil (CNPQ /PQ2 -Processo
303455/2008-0), que investiga o dialeto da Amazônia interiorana paraense.
O projeto Atlas Prosódico Multimédia do Português do Norte do Brasil
é sediado no laboratório de Ciência e Tecnologia da Fala do Instituto de Letras e
Comunicação da Universidade Federal do Pará (UFPA) e conta com a infra-
estrutura deste para a execução de suas atividades. O projeto em questão já
produziu duas monografias de conclusão de Curso (SANTOS JR. 2008 e
CASTILHO 2010), há uma dissertação de mestrado em andamento referente à
formação de corpora da variedade linguística de Cametá (SANTO, em andamento)
e atualmente a Profª Drª Regina Cruz possui uma bolsa de Produtividade do CNPq
(PQ2) com este mesmo projeto pelo Edital do CNPq PQ 10/2008 (Processo
303455/2008-0).
Em se tratando das atividades realizadas em questão no presente relatório,
foram analisados, revisados e coletados amostras de moradores da zona urbana
de Belém (PA), do corpus formado por Santos Jr. (2008) e ampliado por Silva
(2010) vinculada ao projeto AMPER-POR.
Portanto, três das atividades aqui descritas estão indiretamente ligadas ao
plano IC original, apenas a seleção de novos informantes para a coleta de dados
em Outeiro, Mosqueiro e Cotijuba compreende atividade diretamente ligada ao
presente plano de trabalho IC.
Área: Teoria e Análise Linguística.
Palavras – Chave: Vogais; variações prosódicas; dialeto; português.
3
JUSTIFICATIVA
O conhecimento do sistema prosódico das línguas latinas ainda continua
muito fragmentado. Na maior parte dos casos, não se dispõe de resultados
experimentais que considerem todas as possibilidades de variação que o
fenômeno exige. A situação se agrava ainda mais quando se consideram as
investigações concluídas, seja por serem quantitativamente insignificantes, seja
por impossibilitarem estudos contrastivos capazes de dar conta deste tipo de
variação, considerando as investigações que já foram concluídas. Isto se deve a
diversos fatores:
a) a inexistência de uma abordagem objetiva, considerando que o dialetólogo
interessado neste campo de pesquisa não possui na maior parte dos casos,
formação satisfatoriamente sólida no domínio da fonética acústica
experimental;
b) a escassez de laboratórios de fonética equipados para este tipo de pesquisa;
c) a complexidade de tal análise deve considerar o enorme grau de variação física
da fala, assim como diversos outros parâmetros, seja em nível da percepção
seja em nível da produção;
d) a dificuldade de se conceber procedimentos metodológicos suficientemente
abrangentes que tornem possíveis a comparação entre as estruturas
entoacionais das diferentes línguas latinas.
Apesar de todas essas dificuldades, o interesse científico pela variação
prosódica tem tomado certo impulso nestas últimas décadas. Entretanto, os
métodos de análise e interpretação dos dados acústicos, sendo bastante
destoantes, tornam praticamente impossível a comparação dos dados obtidos a
partir dessas investigações (HIRST & DI CRISTO 1998; MORAIS 1994; MAROTTA
2000; D’ALESSANDRO ET AL 1994; BAILLY & AUBERGÉ 1997; DI CRISTO &
HIRST 1996; ROSSI 1999).
Cônscios dessa situação, os membros da equipe do Centro de Dialetologia
de Grenoble (França) desenvolveram uma metodologia comum de pesquisa
(CONTINI ET AL. no prelo; DE CASTRO MOUTINHO ET AL. 2001; ROMANO
1999) com o objetivo de contribuir para um conhecimento mais aprofundado da
variação prosódica das línguas latinas.4
É com esta configuração e com estes objetivos que nasce o Projeto Atlas
Multimédia Prosodique de I’Espace Roman (AMPER)
O Projeto “Atlas Prosódico Multimédia do Norte do Brasil” está diretamente
ligado a este projeto maior, coordenado pelos professores Michel Contini e Jean-
Pierre Lai, do Centro de Dialectologie da Universidade de Grenoble 3 (França);
Antonio Romano da Universidade de Turim (Itália) e Albert Rillard do CNRS, Paris
(França) e do qual fazem parte 11 (onze) outras instituições, além da Universidade
Federal do Pará (UFPA), responsáveis por investigar o português (AMPER-POR)
são as Universidades de Aveiro (Portugal), Universidade dos Açores (Portugal),
Universidade da Madeira (Portugal), responsáveis pela investigação do Português
Europeu (PE) e a Universidade Federal do Amazonas (UFAM), Universidade
Federal da Paraíba (UFPB), Universidade Federal do Rio de Janeiro (UFRJ),
Universidade Federal Fluminense (UFF), Pontifícia Universidade Católica de São
Paulo (PUCSP), Universidade Federal de Minas Gerais (UFMG), Universidade
Federal do Paraná (UFPR) e a Universidade Federal de Santa Catarina (UFSC),
responsáveis pela investigação do português brasileiro (PB)
A Profª. Dr. Regina Cruz é coordenadora da equipe da UFPA, e tem como
auxiliares de pesquisa as alunas: Amanda Ariana Silva da Silva (bolsista
PIBIC/CNPq da UFPA), Ilma Pinto do Espírito Santo (Mestranda CML/UFPA),
Isabel Cristina Rocha dos Remédios (Mestranda CML/UFPA) e Camila Roberta
dos Santos Brito (Aluna da Graduação em Letras/UFPA).
OBJETIVOS
O presente plano de trabalho tem como objetivo principal caracterizar a
variação prosódica dialetal do português falado na zona rural da cidade de Belém
(PA).
Nesta fase, atividades indiretamente ligadas ao plano IC original foram
realizadas, como o tratamento de dados, a revisão, análise e coleta de dados,
todas estas fases relacionadas ao corpus da zona urbana de Belém (PA).
Diretamente ligada ao presente plano IC foram selecionados novos
informantes para a coleta de dados nas ilhas de Caratateua (Outeiro), Cotijuba e
Mosqueiro.
5
Objetivos Específicos
Com a perspectiva de delinear a variação dialetal do nível prosódico do
português regional paraense, eram previstas três metas principais:
1. Constituição de um corpus prosódico com amostras dialetais do português
falado na zona rural da cidade de Belém (PA);
2. Disponibilização do corpus formado on line;
3. Análise instrumental dos aspectos prosódicos do português falado na zona
rural da cidade de Belém (PA)
Ainda nesta fase da bolsa, só foi possível gravar com um único informante
das localidades alvo, por isso todos os objetivos ficaram inviabilizados.
Entretanto, com os novos contatos estabelecidos estamos no momento
procedendo a seleção de novos informantes nativos das ilhas de Belém.
Face a tal situação, definiu-se por avançar na revisão do corpus da zona
urbana de Belém.
MATERIAIS E MÉTODOS
Todos os procedimentos metodológicos adotados nas atividades realizadas
até o presente momento seguiram as orientações estabelecidas pela equipe do
Projeto AMPER na condução da formação dos corpora para o Atlas prosódicos
multimédias das línguas românicas.
A gravação coletada foi efetuada em trabalho de campo, vindo a constituir
uma base de dados, sobre a qual incidirá a nossa análise.
O corpus é composto de 66 frases que foram estruturadas obedecendo às
mesmas restrições fonéticas e sintáticas, a fim de se manter o mesmo padrão
para todos os corpora coletados nas três variedades do português que fazem
parte do projeto AMPER-POR, a saber: português continental, português insular e
português do Brasil.
Ficou sob responsabilidade da aluna voluntária, autora do presente
relatório, dar prosseguimento as atividades iniciadas pela bolsista, referenciadas
no relatório parcial, tais como: revisão e análise dos dados referentes ao corpus
formado por Santos Jr (2008) e ampliado por Silva (2010); coleta de dados de
6
informantes para reposição do corpus da zona urbana de Belém (PA), uma vez
que constatou-se que os sinais de áudio do corpus de Santos Jr. (2008) estavam
em sua maioria com a qualidade comprometida; prosseguimento aos preparativos
para coleta de dados na Ilhas do Mosqueiro, do Outeiro e do Cotijuba prevista no
plano de trabalho IC original.
A seguir apresentaremos as atividades realizadas.
Tratamento e análise dos dados do informante BE05 e BE06
Dando continuidade as atividades realizadas pela bolsista, iniciou-se a fase
de tratamento e análise do corpus BE05, anunciado no relatório parcial.
Esta fase inicia-se pelo isolamento em arquivo individual das frases
gravadas, utilizando-se o programa PRAAT 5.0.
Esta fase ocorreu da seguinte maneira: ao abri o programa PRAAT, surgem
duas janelas: uma a direita e outra a esquerda. A da direita chamada de Paat
Picture é fechada de início, trabalhando-se somente na Praat Objects. É nesta
janela que se observa o sinal sonoro a ser segmentado. Logo após clica-se em
open, e em seguida em open long sound file, a partir dele seleciona-se
Annotate, e To TextGrid, então aparecerá uma janela com espaços escritos Mary
John Bell, que deve ser substituídos pela palavra “vogais” e Bell que deve ser
apagado, em seguida tecla-se “OK”, criando-se assim o arquivo de transcrição.
Na janela do Praat Objects, aparece abaixo do sinal correspondente o textgrid
com o mesmo nome do sinal sonoro.
Após o procedimento descrito acima, seleciona-se o sinal original
juntamente com o textgrid e clica-se no comando Edit; uma nova janela se abre
com o sinal sonoro e o arquivo de transcrição.
Em seguida fez-se a transcrição, selecionando-se as frases isoladas e
adicionando o código do informante, neste caso BE05, o código de cada frase e o
numero de vezes que esta se repetiu. Para salvar o arquivo criado, destinou-se ao
comando file e selecionou-se write textgrid to text file.
Cada frase codificada foi, portanto, armazenada em um arquivo trazendo
informações do informante, da frase e da ordem cronológica da repetição
correspondente.
Feito isso o próximo passo foi a segmentação das frases isoladas.
7
Nesta fase ainda utilizando o programa PRAAT e a janela que contem as
transcrições dos sinais sonoros, selecionou-se a frase, clicando-se em seguida na
opção file e Extract selected soud (time from 0) para arquivar o sinal sonoro da
frase isolada em WAV, passando então para a analise das vogais de cada frase.
Sendo assim abre-se a janela Praat Objects, nela aparece a opção Soud
untitled, em seguida, ainda na mesma janela clica-se em Rename para renomear
o arquivo com o “código da frase”. Aparece então outra janela Rename Object,
apaga-se a palavra untitled, e é colocado o código da frase, posteriormente tecla-
se “OK”. Salva-se o sinal sonoro na opção Save e Write to WAV file.
Nesta outra etapa cada frase foi realizada a tarefa de segmentação do sinal
sonoro, identificando apenas as vogais, sendo assim foi criado também outro
arquivo de transcrição.
Apenas as vogais foram identificadas no sinal sonoro com o símbolo <v>,
as consoantes ou intervalo consonantal não recebem nenhum código. O código
<f> identifica uma vogal que não foi pronunciada ou não apresenta um ciclo de
vibração completo.
Seguindo estes procedimentos, foram segmentadas 396 frases do
informante BE05.
Durante essa segmentação foram detectados certos problemas nos sinais
sonoros, tais como a presença de ruídos externos em algumas gravações, e
falhas no sinal sonoro. Estes problemas, por sua vez, serão melhor elucidados no
tópico “Dificuldades”.
Todas as etapas descritas acima foram aplicadas também para o
tratamento de BE06 que foi interrompido por conta das más condições do sinal de
áudio.
Revisão e análise das condições acústicas do corpus da zona urbana de Belém – BE01 e BE04 (SANTOS JR. 2008)
Como foi exposto no relatório parcial, Santos Jr. (2008) organizou todo o
corpus para posteriormente ser submetido à análise acústica, mas não o explorou,
sendo os alunos de graduação em Letras e a bolsista Amanda Ariana Silva da
Silva que procederam à segmentação das frases codificadas por Santos Jr.
(2008), e também como foi mencionado a cima, a bolsista da pesquisa apresentou
8
problemas de saúde, sendo assim a aluna voluntária, autora do presente relatório,
retomou as atividades da pesquisa em questão, revisando e analisando as frases
já segmentadas, e segmentando as que por ventura não haviam sido
segmentadas.
A orientadora do projeto enviou para a aluna voluntária os arquivos de
áudio referente aos devidos informante. Esta, por conseguinte abriu cada arquivo
de sinal sonoro codificado de BE01 e BE04 contendo as repetições para verificar
também a qualidade sonora.
As correções das segmentações foram feitas das seguintes maneiras:
Etapa 1: Abriu-se o programa PRAAT, apareceram duas janelas: Praat
Objects e Praat Picture, fecha-se a segunda (Praat Picture), seleciona-se na
barra de ferramentas da janela Praat Objects o caminho Read, em seguida o
caminho open long sound file, aparecerá outra janela na qual se deve procurar o
arquivo de mídia desejado, seleciona-se o sinal sonoro e clica-se na tecla abrir. O
arquivo aparecerá na janela do Praat Objects. Logo após, seleciona-se
novamente na barra de ferramentas da janela Paat Objects o caminho Read, em
seguida o caminho Read from file e seleciona-se o arquivo no qual esteja
acompanhado da palavra TextGrid. Selecionam-se os dois arquivos e clica-se no
caminho Edit.
Etapa 2: Aparecerá uma janela, na qual se poderão visualizar os sinais
sonoros e as vogais segmentadas.
Etapa 3: Para a correção clicou-se na vogal segmentada que necessitava
de correção utilizando o caminho na barra de ferramentas Boundary e clicou-se
em remove.
Etapa 4: Após a correção o arquivo deverá ser salvo no caminho
File<Write TextGrid to text file; aparecerá uma janela na qual deve-se clicar em
Salvar.
No trabalho de revisão, foram detectadas algumas falhas de segmentação
e os erros encontrados referiam-se exclusivamente à má segmentação das vogais.
Esta revisão tinha como finalidade selecionar as 6 melhores repetição de
cada frase, de todas as pastas do arquivo dos informantes, mas devido estes
sinais sonoros não apresentarem uma boa qualidade para a pesquisa, esta etapa
foi descartada.
9
Devido aos problemas encontrados durante essas duas fases da pesquisa,
optou-se então por descartar totalmente o corpus formado por Santos e proceder
por uma nova coleta de dados, com o objetivo de formar um novo corpus, desta
vez com a qualidade acústica exigida para este tipo de trabalho.
Trabalho de Campo referente à zona urbana de Belém – BE01
Partiu-se, portanto, para uma nova coleta de dados com objetivo de
conseguir gravações substitutivas as de Santos Jr. (2008). Gravou-se um
informante do sexo feminino, com idade de 45 anos e tendo cursado o ensino
fundamental (BE01), nativo de Belém. A coleta de dados referente a este
informante já havia sido feita, porém, devido a problemas identificados no sinal
sonoro do antigo corpus se fez necessária uma nova coleta de dados com um
novo informante e equipamento.
Para esta coleta foram utilizados um notebook, o qual continha a
apresentação dos slides necessários, um novo gravador digital M-AUDIO
Microtrack II e um microfone Shure WH 25.
Esta atividade está indiretamente ligada ao projeto IC original que
corresponde da análise da variação prosódica dialetal do português falado na
zona urbana da cidade de Belém (PA).
Mais uma vez, foram respeitados todos os critérios estabelecidos pelo
Projeto AMPER para a seleção do perfil do informante, os quais compreendem: a)
ser nativo do local ou ter vivido a maior parte de sua vida nesse local; b) ter idade
acima de 30 anos; c) pertencer a um dos três níveis de escolaridade controlados
pelo projeto (fundamental, médio ou superior). Para esta coleta de dados em
particular, foi selecionado uma informante do sexo feminino, do ensino
fundamental, com 44 anos de idade, nativa da cidade de Belém.
O informante recebeu a codificação BE01 de acordo com os critérios
estabelecidos pelo projeto Atlas Prosódico Multimídia do Português do Norte do
Brasil.
A autora do presente relatório participou, juntamente com a coordenadora
do projeto, Profª.Dr. Regina Cruz, da coleta de amostras desta informante.
10
A execução da coleta de dados ocorreu sem maiores problemas na casa da
informante, que fica localizada no bairro do Guamá, na cidade de Belém.
O corpus utilizado é composto de 66 frases que foram estruturadas
obedecendo as mesmas restrições fonéticas e sintáticas, a fim de se manter o
mesmo padrão para todos os corpora coletados nas três variedades do português
que fazem parte do projeto AMPER-POR, a saber: português continental,
português insular e português do Brasil.
As frases utilizadas nas gravações que compõem o corpus da zona urbana
de Belém e que serão analisadas neste plano de trabalho são do tipo SVC (Sujeito
+ Verbo + complemento) e suas expansões com a inclusão de Sintagmas
Adjetivais e Adverbiais. As frases foram estruturadas sintaticamente da seguinte
maneira: 1) possui apenas três personagens: O Renato, O pássaro e O bisavô; 2)
três sintagmas adjetivais: nadador, bêbado e pateta; 3) três sintagmas adverbiais
indicadores de lugar: de Mônaco, de Veneza e de Salvador; e 4) um único verbo:
gostar, representado pela imagem de um coração.
Assim, as combinações de todos os sintagmas permitiram organizar as
frases de 47 maneiras possíveis. As 66 frases do corpus correspondentes aos
sinais acústicos gravados foram codificados, por sua vez, de acordo com a
organização sintática da frase e de acordo com o tipo entoacional.
Foneticamente, as frases foram estruturadas em duas modalidades
entoacionais: declarativa e interrogativa.
Todas as frases foram constituídas por vocábulos representativos das
diversas estruturas acentuais (oxítona, paroxítona e proparoxítona) e nas diversas
posições da frase, a formar sílabas em que as vogais ocorressem no mesmo
contexto fonético de consoantes não vozeadas a fim reduzir alguns problemas
postos por fenômenos de coarticulação e garantir uma fácil e rigorosa
segmentação do sinal acústico.
Cada um dos elementos constituintes das frases possui uma representação
visual. Essas representações foram combinadas para formar as 66 frases
utilizadas para a obtenção das gravações. Os informantes não tiveram em
nenhum momento contato com as frases escritas. As gravações das repetições
foram feitas por meio da projeção dessas representações.
11
A partir das combinações dessas representações, projetou-se cada uma
das 66 frases para os informantes. Nas formas interrogativas, acrescentou-se o
ponto de interrogação: ‘?’.
No dia 08 de julho de 2011, às 16h, foi realizada coleta de dados da
informante: BE01. Foram apresentadas a ela primeiramente 10 imagens, das
quais 3 (três) representavam os núcleos dos sintagmas nominais (O Renato, O
bisavô, O Pássaro) das frases; 3 (três) qualidades (Bêbado, pateta e nadador); 3
(três) sintagmas Adverbiais (de Veneza, de Mônaco e de Salvador) e 1 (uma) que
se referia ao verbo ‘gostar de’. Era solicitado ao informante formar frases do tipo
SVC (Sujeito + Verbo + Complemento), apresentando uma modalidade
entoacional de acordo com a simbologia final de casa frase, ou seja, se houvesse
o símbolo correspondente a uma pergunta (?), o informante deveria formular um
pergunta a partir das imagens projetadas. Na falta desta simbologia, o enunciado
esperado deveria ser de uma frase declarativa.
Por meio dos slides exibidos pelo computador no programa powerpoint,
foram projetadas as figuras formadoras das 66 frases de forma visual ao
informante, sem apresentar-lhe suas formas escritas. A ela foi pedida seis
repetições da série de frases do corpus (em ordem aleatória), no momento da
gravação propriamente dita. As gravações foram feitas, havendo uma interrupção
por conta de ruídos externos. A duração total da gravação da coleta do corpus
sem contar com as interrupções foi de 54 minutos e 24 segundos.
Como cada uma das 66 frases foram repetidas 6 (seis) vezes, foram
gravadas 396 frases pela informante, que já estão sendo segmentados pela autora
do presente relatório.
Para efetuação da análise do corpus coletado, foi proposto à informante a
assinatura de um termo de consentimento, o qual consta da aceitação dos
seguintes critérios:
1. Não haverá despesas ou compensações financeiras a informante relacionada
ao estudo.
2. Os dados obtidos, na forma de gravações em áudio, serão incorporados ao
banco de dados, cujos responsáveis zelarão pelo uso e aplicabilidade das
amostras exclusivamente para fins científicos.
12
3. Compreensão de que os resultados deste estudo poderão ser publicados em
jornais profissionais ou apresentados em congressos profissionais, sem que a
identidade do informante seja revelada.
4. Aceitar participar neste estudo e em ceder os seus dados para o banco de
dados e sua utilização para fins científicos, recebendo uma cópia assinada do
formulário de consentimento.
A informante, BE01 assinou o termo de consentimento, que se encontra no
Banco de Dados do Projeto, possibilitando, portanto, a utilização dos dados para a
pesquisa.
Logo que tivermos terminado o tratamento de dados do corpus BE01 da
zona urbana de Belém, daremos prosseguimento à coleta de dados dos demais
informantes da zona urbana de Belém para substituição do antigo corpus que
apresentaram muitos problemas no sinal sonoro, e também dar prosseguimento a
coleta de dados do corpus da zona rural, que já possui informantes contatados
nas ilhas de Mosqueiro, Outeiro e Cotijuba.
RESULTADOS
Em relação a segmentação e ao tratamento de BE05 e BE06, foi
identificado que os sinais sonoros que compõem o corpus dos informantes em
questão apresentavam vários problemas, tais como a presença de ruídos externos
em algumas gravações, e falhas no sinal sonoro. Já revisão e segmentação das
amostras coletadas dos informantes BE01 e BE04, todas as frases foram
segmentadas de acordo com as orientações estabelecidas pela equipe do Projeto
AMPER, dos quais também foram detectados certos problemas nos sinais
sonoros, entendendo-se assim que devemos novamente coletar corpus referente
aos informantes BE02, BE03, BE04, BE05, BE06 da zona urbana de Belém.
Com o trabalho de campo realizado em julho de 2011, um informante do
ensino fundamental – BE01 - foi gravado para substituição do corpus da variedade
linguística da zona urbana de Belém (PA).
Em se tratando do plano IC original entendemos também que deve ser
iniciada uma nova pesquisa de campo para a coleta de dados do corpus da zona
13
rural do município de Belém, em detrimento a isto, a aluna voluntária, autora do
presente relatório, já providenciou contatar os informantes destas localidades.
PUBLICAÇÕES
O presente trabalho já está inscrito e em níveis de aceite (em anexo abaixo) em
dois eventos de cunho internacional, que são:
1- V congresso de fonética experimental – Cáceres 2011, na Espanha, que
será realizado no período de 25 a 28 de outubro de 2011;
http://www.amprae.es/congreso_fonética_experimental
O título do trabalho enviado é Atlas Prosódico Multimédia da cidade de
Belém (PA): uma visão geral, de autoria de Regina Célia Fernandes Cruz
(UFPA/CNPq) e Camila Roberta dos Santos Brito (Aluna da Graduação/ FALE-
UFPA)
2- XV IFNOPAP – Santarém-PA, que será realizado no período de 13 a 22 de
outubro;
http://ifnopap.blogspot.com/
O título do trabalho enviado é Atlas Prosódico Multimédia da zona urbana da
cidade de Belém (PA): uma visão geral, de autoria de Regina Célia Fernandes
Cruz (UFPA/CNPq) e Camila Roberta dos Santos Brito (Aluna da Graduação/
FALE-UFPA)
CONCLUSÃO
Com a realização da segmentação do corpus BE05 e BE06, e a revisão e
segmentação de BE01 e BE04 percebeu-se que os sinais sonoros possuíam
muitos problemas, que será melhor evidenciado do tópico “DIFICULDADES”. Por
tais motivos comprometerem a as atividades da pesquisa, percebemos que deve
ser realizado uma nova pesquisa de campo, para uma melhor formação dos
corpus dos informantes da zona urbana de Belém.
14
Em relação as atividades do plano IC original a aluna voluntária, autora do
presente projeto, já providenciou a seleção dos informantes das ilhas de
Caratateua (Outeiro), Cotijuba e Mosquiro, atividades estas que serão iniciadas no
segundo semestre de 2011 .
Os próximos passos compreendem:
1) Trabalho de campo para obtenção de dados para o corpus da zona urbana de
Belém (PA);
2) Trabalho de campo para obtenção de dados para o corpus da zona rural de
Belém (PA);
3) Transcrição fonética das do corpus da zona urbana e rural que serão
gravados;
4) Aplicação do script praat para obtenção das medidas acústicas dos
parâmetros de frequência fundamental, intensidade e duração de cada vogal
segmentada do corpus zona urbana e rural que serão gravados;
5) Análise acústica no programa Matlab do corpus zona urbana e rural que serão
gravados.
Procedimentos estes necessários para se delinear a variação dialetal do
nível prosódico do português falado na zona urbana e rural da cidade de Belém
(PA) e disponibilização do corpus formado on line.
REFERÊNCIAS BIBLIOGRÁFICAS
BAILLY, G. & AUBERGÉ, V. “Phonetic representation for intonation”. In J. Ph. Van Stander (ed), Progress in Speech Synthesis. New York: Springer, 1997, pp. 435-441.
CASTILHO, Francinete Carvalho. Formação de Corpora para o Atlas Dialetal Prosódico Multimídia do Norte do Brasil: Variedade Lingüística de Bragança (PA) . Bragança: UFPA/Campus de Bragança/Faculdade de Letras, 2009. (Trabalho de Conclusão de Curso em Letras). Orientador: Regina Célia Fernandes Cruz.
CONTINI, M.; LAI, J. P.; ROMANO, A. & Roullet S. “Vers um atlas prosodique parlant dês variétés romanes”. Mélanges em honneur de X. Ravier (no prelo).
D’ALESSANDRO, C.; BEAUGENDRE, F. & MERTENS, P. “Automatic stylisation of intonation: applicationsto speech synthesis”. 2nd ESCA Workshop on Speech Synthesis. New York: Mohonk, 1994, pp. 155-158.
15
DE CASTRO MOUTINHO, Lurdes; COIMBRA, R.L.; SECCA RUIVO, S. & PEREIRA BENDIHA, U. “Atlas Prosódico Multimédia: curvas de uma trajetória”. Actas do XVI Encontro Nacional da Associação Portuguesa de Lingüística. Colibri, 2001, pp. 387-39.
DI CRISTO, Albert & HIRST, Daniel. “Modelling French micromelody”. Phonetica 43 (1), 1996, pp. 11-30.
HIRST, Daniel & DI CRISTO, Albert. Intonation systems: a survey of twenty languages. Cambridge: Cambridge Univarsity Press, 1998.MAROTTA, G. “Allinamento e transcrizione dei toni accentuali complesi: uma proposta”. Atti dalle X G. di St. Del GFS (Napoli 1999). Napoli: Ist. Univ. Orientale, 2000.
MORAIS, Barbosa Joaquim. “Entoação e Prosódia”, in Holtus G. et al. (eds), Lexicon der Romanistischen Linguistik, Band IV, 2, 1994, pp. 243-248.
ROMANO, A, Analyse dês estructures prosodiques dês dialectes et de I’italien regional parlés dans lê Salento (Italie): appriche linguistique et instrumentale. Tesi de Dottorato in Sciences du Langage, Université Stendhal, Grenoble, vol.2, 1999.
SILVA, Amanda Ariana Silva da. Atlas prosodico multimedia do português do norte do brasil – AMPER-POR: variedade linguistica da zona rural de Belém (PA). Em andamento. Projeto de pesquisa de iniciação cientifica (PIBIC/CNPq) Universidade Federal do Pará, Belém, 2010. UFPA. Orientador: Regina Célia Fernandes Cruz.
SANTO, Ilma Pinto do Espírito. Atlas Prosódico Multimédia do Município de Cametá (PA). Em andamento. Dissertação (Curso de Mestrado em Letras) – Universidade Federal do Pará, Belém: UFPA. Orientador: Regina Célia Fernandes Cruz.
SANTOS JR., Manoel Fonseca dos. Formação de corpora para o Atlas Dialetal Prosódico Multimédia do Norte do Brasil: variedade lingüística de Belém. Belém: UFPA/ILC/FALE, 2008. (Trabalho de Conclusão de Curso em Letras).
SILVA NETO, Serafim da. Introdução ao Estudo da Língua Portuguesa no Brasil. 4 ed. Rio de Janeiro, Presença, 1977 [1957].
DIFICULDADES
Devido aos problemas de saúde da bolsista Amanda Ariana Silva da Silva,
as atividades do projeto atrasaram e tiveram que ser retomadas pela voluntária de
projeto, autora do presente relatório.
16
Em se tratando da segmentação dos dados dos informantes BE05, BE06,
as principais dificuldades encontradas decorrem certos problemas nos sinais
sonoros, tais como a presença de ruídos externos em algumas gravações e falhas
no sinal sonoro tais como: ruídos de obras, aviões, latidos de cachorro, etc,
comprometendo assim o sinal sonoro coletado, por estes motivos percebemos que
devemos iniciar novas coletas de dados para tais informantes.
Na segmentação e revisão dos informantse BE01 e BE04 foram percebidas
falhas no sinal sonoro tais como: cortes feitos pela má segmentação dos alunos
como foi citado no relatório anterior, fala de pessoas, choro de criança, latido de
cachorro e etc.
Não obstante, foram segmentadas e revisadas todas as frases
correspondentes ao informante BE01 e BE04, que também por apresentar
problemas no sinal sonoro, optou- se por não ser utilizado, motivo pelo qual
iniciaremos novas coletas para estes informantes.
Na execução das gravações feitas em trabalho de campo em julho de 2011,
houve a ocorrência de alguns ruídos externos os quais fizeram com que fossem
interrompidas as gravações com o informante BE01 por uma veze, tais como: fala
de pessoas, som de músicas, latidos de cachorro, etc, o que impossibilitou a
execução da pesquisa em tempo hábil, porém não houve comprometimento no
sinal sonoro coletado.
Houve também certa dificuldade de decodificação dos sintagmas para a
formação das frases por parte do informante BE01, sendo necessário demasiado
tempo para o informante acostumar-se com as imagens e assim poder formar as
frases.
PARECER DO ORIENTADOR:
Como bem explicado no corpo do relatório, o envio do presente relatório só
foi possível porque Camila Roberta dos Santos Brito, voluntária do projeto,
assumiu a condução do presente plano de trabalho quando do impedimento
inesperado da bolsista PIBIC Amanda Ariana Silva da Silva. Graças a sua
dedicação e esforço, dois trabalhos já foram aceitos, um inclusive em nível
internacional. Não sou favorável a nenhuma punição à Amanda Ariana Silva da
Silva, pois a mesma foi ocasionada por uma doença grave que a impediu 17
totalmente de exercer suas atividades de bolsista. Sensível a sua situação, Camila
Roberta dos Santos Brito tomou para si a responsabilidade de encerrar as
atividades da bolsa para que sua colega não sofresse qualquer prejuízo. E o fez
de forma séria, discreta, responsável e profissional.
INFORMAÇÕES ADICIONAIS
Solicitamos que as informações sobre o estado de saúde da bolsista Amanda
Ariana Silva da Silva não sofra ampla divulgação.
Possivelmente será Camila Roberta dos Santos Brito quem participará como
expositora do XXII Seminário de Iniciação Científica da UFPA.XXII Seminário de Iniciação Científica da UFPA.
DATA : 08/02/2010
_________________________________________Dr. Regina Celia Fernandes Cruz
Bolsista Produtividade do CNPqBolsista Fulbright
NYU Linguistics Department Visiting Scholar
____________________________________________
ASSINATURA DO ALUNO
18
Anexo I
19
Anexo III
1
Anexo IV
2
3