universidade federal do pará - pibic.ufpa.br · paulo (pucsp), universidade federal ... na janela...

22
UNIVERSIDADE FEDERAL DO PARÁ PRÓ-REITORIA DE PESQUISA E PÓS-GRADUAÇÃO DIRETORIA DE PESQUISA PROGRAMA INSTITUCIONAL DE BOLSAS DE INICIAÇÃO CIENTÍFICA RELATÓRIO TÉCNICO - CIENTÍFICO Período: 01/08/2010 a 31/07/2011 ( ) PARCIAL (X) FINAL IDENTIFICAÇÃO DO PROJETO Título do Projeto de Pesquisa: Atlas Prosódico Multimédia do Português do Norte do Brasil (CNPQ /PQ2 -Processo 303455/2008-0) Nome do Orientador: Regina Célia Fernandes Cruz Titulação do Orientador: Doutor Faculdade: Faculdade de Letras Unidade: Instituto de Letras e comunicação Laboratório: Laboratório de Ciências e Tecnologia da Fala Título do Plano de Trabalho: Atlas prosódico multimédia do Português do Norte do Brasil – AMPER-POR: variedade lingüística da zona rural de Belém (PA). Nome do Bolsista: Amanda Ariana Silva da Silva Tipo de Bolsa: (x) PIBIC/CNPq ( ) PIBIC/CNPq-AF ( ) PIBIC/UFPA ( ) PIBIC/UFPA-AF ( ) PIBIC/INTERIOR ( ) PIBIC/FAPESPA ( ) PARD ( ) PARD – renovação ( ) PADRC ( ) Bolsistas PIBIC do edital CNPq 001/2007 INTRODUÇÃO 1

Upload: truongthuan

Post on 25-Jan-2019

217 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Universidade Federal do Pará - pibic.ufpa.br · Paulo (PUCSP), Universidade Federal ... Na janela do Praat Objects, aparece abaixo do sinal correspondente o textgrid ... selecionando-se

UNIVERSIDADE FEDERAL DO PARÁPRÓ-REITORIA DE PESQUISA E PÓS-GRADUAÇÃO

DIRETORIA DE PESQUISA

PROGRAMA INSTITUCIONAL DE BOLSAS DE INICIAÇÃO CIENTÍFICA

RELATÓRIO TÉCNICO - CIENTÍFICO

Período: 01/08/2010 a 31/07/2011( ) PARCIAL(X) FINAL

IDENTIFICAÇÃO DO PROJETO

Título do Projeto de Pesquisa: Atlas Prosódico Multimédia do Português do Norte do Brasil (CNPQ /PQ2 -Processo 303455/2008-0)Nome do Orientador: Regina Célia Fernandes CruzTitulação do Orientador: DoutorFaculdade: Faculdade de LetrasUnidade: Instituto de Letras e comunicaçãoLaboratório: Laboratório de Ciências e Tecnologia da FalaTítulo do Plano de Trabalho: Atlas prosódico multimédia do Português do Norte do Brasil – AMPER-POR: variedade lingüística da zona rural de Belém (PA).Nome do Bolsista: Amanda Ariana Silva da Silva

Tipo de Bolsa: (x) PIBIC/CNPq ( ) PIBIC/CNPq-AF( ) PIBIC/UFPA( ) PIBIC/UFPA-AF( ) PIBIC/INTERIOR( ) PIBIC/FAPESPA( ) PARD( ) PARD – renovação( ) PADRC( ) Bolsistas PIBIC do edital CNPq 001/2007

INTRODUÇÃO

1

Page 2: Universidade Federal do Pará - pibic.ufpa.br · Paulo (PUCSP), Universidade Federal ... Na janela do Praat Objects, aparece abaixo do sinal correspondente o textgrid ... selecionando-se

O presente relatório técnico-científico tem por objetivo relatar como se deu

o desenvolvimento das atividades referentes ao Plano de trabalho: Atlas

prosódico multimédia do Português do Norte do Brasil – AMPER-POR:

variedade lingüística da zona rural de Belém (PA) vinculado ao projeto de

pesquisa intitulado: Atlas Prosódico Multimédia do Português do Norte do

Brasil.

O plano de trabalho em questão tem por objetivo analisar

experimentalmente a variação prosódica do português falado na zona rural da

cidade de Belém (PA), a saber: Outeiro, Mosqueiro e Cotijuba. Para tal, contou

com uma bolsista PIBIC / CNPq, Amanda Ariana Silva da Silva, que a partir do

mês de junho interrompeu suas atividades na bolsa por problemas de saúde

(atestado em anexo), assim sendo Camila Roberta dos Santos Brito, voluntária do

projeto ficou responsável por concluir as atividades aqui descritas.

As atividades realizadas que serão evidenciadas neste relatório foram

realizadas de fato pela aluna voluntária autora do presente relatório, as quais

compreendem:

a) Tratamento de dados dos informantes BE05 e BE06, todos do corpus da

zona urbana de Belém - BE0 - formado por Santos Jr. (2008) e ampliado

por Silva (2010), como descrito no relatório parcial;

b) Revisão de dados dos informantes BE01 e BE04, todos do corpus da zona

urbana de Belém;

c) Pesquisa de campo para coleta de dados, realizada no bairro do Guamá em

Belém, referente a gravação com um informante BE01, com a participação

da Prof Dr Regina Cruz e da aluna voluntária Camila Roberta dos Santos

Brito, autora do presente relatório, para a complementação do corpus

proposto por Santos Jr.(2008);

d) Seleção de novos informantes para a coleta de dados em Outeiro,

Mosqueiro e Cotijuba.

Para que fique claro como as atividades foram realizadas (item material/

método) apresentaremos um breve resumo do Plano de Trabalho, justificativas e

objetivos (geral e específico) da pesquisa.

Resumo do Plano de Trabalho

2

Page 3: Universidade Federal do Pará - pibic.ufpa.br · Paulo (PUCSP), Universidade Federal ... Na janela do Praat Objects, aparece abaixo do sinal correspondente o textgrid ... selecionando-se

O Plano de trabalho intitulado Atlas prosódico multimédia do Português

do Norte do Brasil – AMPER-POR: variedade linguística da zona rural de

Belém (PA) compreende a coleta, análise e caracterização das variações

prosódicas do dialeto das ilhas que fazem parte da zona rural do município de

Belém (PA): Mosqueiro, Outeiro e Cotijuba; as quais fazem parte do português

regional paraense considerado por Silva Neto (1957) como sendo o de canua

cheia de cucus de pupa a prua, por conta de sua principal marca dialetal o

alteamento das vogais posteriores em posição de sílaba tônica.

É importante ressaltar que todas as localidades estudadas no referido plano

de trabalho fazem parte da área de atuação do projeto maior: Atlas Prosódico

Multimédia do Português do Norte do Brasil (CNPQ /PQ2 -Processo

303455/2008-0), que investiga o dialeto da Amazônia interiorana paraense.

O projeto Atlas Prosódico Multimédia do Português do Norte do Brasil

é sediado no laboratório de Ciência e Tecnologia da Fala do Instituto de Letras e

Comunicação da Universidade Federal do Pará (UFPA) e conta com a infra-

estrutura deste para a execução de suas atividades. O projeto em questão já

produziu duas monografias de conclusão de Curso (SANTOS JR. 2008 e

CASTILHO 2010), há uma dissertação de mestrado em andamento referente à

formação de corpora da variedade linguística de Cametá (SANTO, em andamento)

e atualmente a Profª Drª Regina Cruz possui uma bolsa de Produtividade do CNPq

(PQ2) com este mesmo projeto pelo Edital do CNPq PQ 10/2008 (Processo

303455/2008-0).

Em se tratando das atividades realizadas em questão no presente relatório,

foram analisados, revisados e coletados amostras de moradores da zona urbana

de Belém (PA), do corpus formado por Santos Jr. (2008) e ampliado por Silva

(2010) vinculada ao projeto AMPER-POR.

Portanto, três das atividades aqui descritas estão indiretamente ligadas ao

plano IC original, apenas a seleção de novos informantes para a coleta de dados

em Outeiro, Mosqueiro e Cotijuba compreende atividade diretamente ligada ao

presente plano de trabalho IC.

Área: Teoria e Análise Linguística.

Palavras – Chave: Vogais; variações prosódicas; dialeto; português.

3

Page 4: Universidade Federal do Pará - pibic.ufpa.br · Paulo (PUCSP), Universidade Federal ... Na janela do Praat Objects, aparece abaixo do sinal correspondente o textgrid ... selecionando-se

JUSTIFICATIVA

O conhecimento do sistema prosódico das línguas latinas ainda continua

muito fragmentado. Na maior parte dos casos, não se dispõe de resultados

experimentais que considerem todas as possibilidades de variação que o

fenômeno exige. A situação se agrava ainda mais quando se consideram as

investigações concluídas, seja por serem quantitativamente insignificantes, seja

por impossibilitarem estudos contrastivos capazes de dar conta deste tipo de

variação, considerando as investigações que já foram concluídas. Isto se deve a

diversos fatores:

a) a inexistência de uma abordagem objetiva, considerando que o dialetólogo

interessado neste campo de pesquisa não possui na maior parte dos casos,

formação satisfatoriamente sólida no domínio da fonética acústica

experimental;

b) a escassez de laboratórios de fonética equipados para este tipo de pesquisa;

c) a complexidade de tal análise deve considerar o enorme grau de variação física

da fala, assim como diversos outros parâmetros, seja em nível da percepção

seja em nível da produção;

d) a dificuldade de se conceber procedimentos metodológicos suficientemente

abrangentes que tornem possíveis a comparação entre as estruturas

entoacionais das diferentes línguas latinas.

Apesar de todas essas dificuldades, o interesse científico pela variação

prosódica tem tomado certo impulso nestas últimas décadas. Entretanto, os

métodos de análise e interpretação dos dados acústicos, sendo bastante

destoantes, tornam praticamente impossível a comparação dos dados obtidos a

partir dessas investigações (HIRST & DI CRISTO 1998; MORAIS 1994; MAROTTA

2000; D’ALESSANDRO ET AL 1994; BAILLY & AUBERGÉ 1997; DI CRISTO &

HIRST 1996; ROSSI 1999).

Cônscios dessa situação, os membros da equipe do Centro de Dialetologia

de Grenoble (França) desenvolveram uma metodologia comum de pesquisa

(CONTINI ET AL. no prelo; DE CASTRO MOUTINHO ET AL. 2001; ROMANO

1999) com o objetivo de contribuir para um conhecimento mais aprofundado da

variação prosódica das línguas latinas.4

Page 5: Universidade Federal do Pará - pibic.ufpa.br · Paulo (PUCSP), Universidade Federal ... Na janela do Praat Objects, aparece abaixo do sinal correspondente o textgrid ... selecionando-se

É com esta configuração e com estes objetivos que nasce o Projeto Atlas

Multimédia Prosodique de I’Espace Roman (AMPER)

O Projeto “Atlas Prosódico Multimédia do Norte do Brasil” está diretamente

ligado a este projeto maior, coordenado pelos professores Michel Contini e Jean-

Pierre Lai, do Centro de Dialectologie da Universidade de Grenoble 3 (França);

Antonio Romano da Universidade de Turim (Itália) e Albert Rillard do CNRS, Paris

(França) e do qual fazem parte 11 (onze) outras instituições, além da Universidade

Federal do Pará (UFPA), responsáveis por investigar o português (AMPER-POR)

são as Universidades de Aveiro (Portugal), Universidade dos Açores (Portugal),

Universidade da Madeira (Portugal), responsáveis pela investigação do Português

Europeu (PE) e a Universidade Federal do Amazonas (UFAM), Universidade

Federal da Paraíba (UFPB), Universidade Federal do Rio de Janeiro (UFRJ),

Universidade Federal Fluminense (UFF), Pontifícia Universidade Católica de São

Paulo (PUCSP), Universidade Federal de Minas Gerais (UFMG), Universidade

Federal do Paraná (UFPR) e a Universidade Federal de Santa Catarina (UFSC),

responsáveis pela investigação do português brasileiro (PB)

A Profª. Dr. Regina Cruz é coordenadora da equipe da UFPA, e tem como

auxiliares de pesquisa as alunas: Amanda Ariana Silva da Silva (bolsista

PIBIC/CNPq da UFPA), Ilma Pinto do Espírito Santo (Mestranda CML/UFPA),

Isabel Cristina Rocha dos Remédios (Mestranda CML/UFPA) e Camila Roberta

dos Santos Brito (Aluna da Graduação em Letras/UFPA).

OBJETIVOS

O presente plano de trabalho tem como objetivo principal caracterizar a

variação prosódica dialetal do português falado na zona rural da cidade de Belém

(PA).

Nesta fase, atividades indiretamente ligadas ao plano IC original foram

realizadas, como o tratamento de dados, a revisão, análise e coleta de dados,

todas estas fases relacionadas ao corpus da zona urbana de Belém (PA).

Diretamente ligada ao presente plano IC foram selecionados novos

informantes para a coleta de dados nas ilhas de Caratateua (Outeiro), Cotijuba e

Mosqueiro.

5

Page 6: Universidade Federal do Pará - pibic.ufpa.br · Paulo (PUCSP), Universidade Federal ... Na janela do Praat Objects, aparece abaixo do sinal correspondente o textgrid ... selecionando-se

Objetivos Específicos

Com a perspectiva de delinear a variação dialetal do nível prosódico do

português regional paraense, eram previstas três metas principais:

1. Constituição de um corpus prosódico com amostras dialetais do português

falado na zona rural da cidade de Belém (PA);

2. Disponibilização do corpus formado on line;

3. Análise instrumental dos aspectos prosódicos do português falado na zona

rural da cidade de Belém (PA)

Ainda nesta fase da bolsa, só foi possível gravar com um único informante

das localidades alvo, por isso todos os objetivos ficaram inviabilizados.

Entretanto, com os novos contatos estabelecidos estamos no momento

procedendo a seleção de novos informantes nativos das ilhas de Belém.

Face a tal situação, definiu-se por avançar na revisão do corpus da zona

urbana de Belém.

MATERIAIS E MÉTODOS

Todos os procedimentos metodológicos adotados nas atividades realizadas

até o presente momento seguiram as orientações estabelecidas pela equipe do

Projeto AMPER na condução da formação dos corpora para o Atlas prosódicos

multimédias das línguas românicas.

A gravação coletada foi efetuada em trabalho de campo, vindo a constituir

uma base de dados, sobre a qual incidirá a nossa análise.

O corpus é composto de 66 frases que foram estruturadas obedecendo às

mesmas restrições fonéticas e sintáticas, a fim de se manter o mesmo padrão

para todos os corpora coletados nas três variedades do português que fazem

parte do projeto AMPER-POR, a saber: português continental, português insular e

português do Brasil.

Ficou sob responsabilidade da aluna voluntária, autora do presente

relatório, dar prosseguimento as atividades iniciadas pela bolsista, referenciadas

no relatório parcial, tais como: revisão e análise dos dados referentes ao corpus

formado por Santos Jr (2008) e ampliado por Silva (2010); coleta de dados de

6

Page 7: Universidade Federal do Pará - pibic.ufpa.br · Paulo (PUCSP), Universidade Federal ... Na janela do Praat Objects, aparece abaixo do sinal correspondente o textgrid ... selecionando-se

informantes para reposição do corpus da zona urbana de Belém (PA), uma vez

que constatou-se que os sinais de áudio do corpus de Santos Jr. (2008) estavam

em sua maioria com a qualidade comprometida; prosseguimento aos preparativos

para coleta de dados na Ilhas do Mosqueiro, do Outeiro e do Cotijuba prevista no

plano de trabalho IC original.

A seguir apresentaremos as atividades realizadas.

Tratamento e análise dos dados do informante BE05 e BE06

Dando continuidade as atividades realizadas pela bolsista, iniciou-se a fase

de tratamento e análise do corpus BE05, anunciado no relatório parcial.

Esta fase inicia-se pelo isolamento em arquivo individual das frases

gravadas, utilizando-se o programa PRAAT 5.0.

Esta fase ocorreu da seguinte maneira: ao abri o programa PRAAT, surgem

duas janelas: uma a direita e outra a esquerda. A da direita chamada de Paat

Picture é fechada de início, trabalhando-se somente na Praat Objects. É nesta

janela que se observa o sinal sonoro a ser segmentado. Logo após clica-se em

open, e em seguida em open long sound file, a partir dele seleciona-se

Annotate, e To TextGrid, então aparecerá uma janela com espaços escritos Mary

John Bell, que deve ser substituídos pela palavra “vogais” e Bell que deve ser

apagado, em seguida tecla-se “OK”, criando-se assim o arquivo de transcrição.

Na janela do Praat Objects, aparece abaixo do sinal correspondente o textgrid

com o mesmo nome do sinal sonoro.

Após o procedimento descrito acima, seleciona-se o sinal original

juntamente com o textgrid e clica-se no comando Edit; uma nova janela se abre

com o sinal sonoro e o arquivo de transcrição.

Em seguida fez-se a transcrição, selecionando-se as frases isoladas e

adicionando o código do informante, neste caso BE05, o código de cada frase e o

numero de vezes que esta se repetiu. Para salvar o arquivo criado, destinou-se ao

comando file e selecionou-se write textgrid to text file.

Cada frase codificada foi, portanto, armazenada em um arquivo trazendo

informações do informante, da frase e da ordem cronológica da repetição

correspondente.

Feito isso o próximo passo foi a segmentação das frases isoladas.

7

Page 8: Universidade Federal do Pará - pibic.ufpa.br · Paulo (PUCSP), Universidade Federal ... Na janela do Praat Objects, aparece abaixo do sinal correspondente o textgrid ... selecionando-se

Nesta fase ainda utilizando o programa PRAAT e a janela que contem as

transcrições dos sinais sonoros, selecionou-se a frase, clicando-se em seguida na

opção file e Extract selected soud (time from 0) para arquivar o sinal sonoro da

frase isolada em WAV, passando então para a analise das vogais de cada frase.

Sendo assim abre-se a janela Praat Objects, nela aparece a opção Soud

untitled, em seguida, ainda na mesma janela clica-se em Rename para renomear

o arquivo com o “código da frase”. Aparece então outra janela Rename Object,

apaga-se a palavra untitled, e é colocado o código da frase, posteriormente tecla-

se “OK”. Salva-se o sinal sonoro na opção Save e Write to WAV file.

Nesta outra etapa cada frase foi realizada a tarefa de segmentação do sinal

sonoro, identificando apenas as vogais, sendo assim foi criado também outro

arquivo de transcrição.

Apenas as vogais foram identificadas no sinal sonoro com o símbolo <v>,

as consoantes ou intervalo consonantal não recebem nenhum código. O código

<f> identifica uma vogal que não foi pronunciada ou não apresenta um ciclo de

vibração completo.

Seguindo estes procedimentos, foram segmentadas 396 frases do

informante BE05.

Durante essa segmentação foram detectados certos problemas nos sinais

sonoros, tais como a presença de ruídos externos em algumas gravações, e

falhas no sinal sonoro. Estes problemas, por sua vez, serão melhor elucidados no

tópico “Dificuldades”.

Todas as etapas descritas acima foram aplicadas também para o

tratamento de BE06 que foi interrompido por conta das más condições do sinal de

áudio.

Revisão e análise das condições acústicas do corpus da zona urbana de Belém – BE01 e BE04 (SANTOS JR. 2008)

Como foi exposto no relatório parcial, Santos Jr. (2008) organizou todo o

corpus para posteriormente ser submetido à análise acústica, mas não o explorou,

sendo os alunos de graduação em Letras e a bolsista Amanda Ariana Silva da

Silva que procederam à segmentação das frases codificadas por Santos Jr.

(2008), e também como foi mencionado a cima, a bolsista da pesquisa apresentou

8

Page 9: Universidade Federal do Pará - pibic.ufpa.br · Paulo (PUCSP), Universidade Federal ... Na janela do Praat Objects, aparece abaixo do sinal correspondente o textgrid ... selecionando-se

problemas de saúde, sendo assim a aluna voluntária, autora do presente relatório,

retomou as atividades da pesquisa em questão, revisando e analisando as frases

já segmentadas, e segmentando as que por ventura não haviam sido

segmentadas.

A orientadora do projeto enviou para a aluna voluntária os arquivos de

áudio referente aos devidos informante. Esta, por conseguinte abriu cada arquivo

de sinal sonoro codificado de BE01 e BE04 contendo as repetições para verificar

também a qualidade sonora.

As correções das segmentações foram feitas das seguintes maneiras:

Etapa 1: Abriu-se o programa PRAAT, apareceram duas janelas: Praat

Objects e Praat Picture, fecha-se a segunda (Praat Picture), seleciona-se na

barra de ferramentas da janela Praat Objects o caminho Read, em seguida o

caminho open long sound file, aparecerá outra janela na qual se deve procurar o

arquivo de mídia desejado, seleciona-se o sinal sonoro e clica-se na tecla abrir. O

arquivo aparecerá na janela do Praat Objects. Logo após, seleciona-se

novamente na barra de ferramentas da janela Paat Objects o caminho Read, em

seguida o caminho Read from file e seleciona-se o arquivo no qual esteja

acompanhado da palavra TextGrid. Selecionam-se os dois arquivos e clica-se no

caminho Edit.

Etapa 2: Aparecerá uma janela, na qual se poderão visualizar os sinais

sonoros e as vogais segmentadas.

Etapa 3: Para a correção clicou-se na vogal segmentada que necessitava

de correção utilizando o caminho na barra de ferramentas Boundary e clicou-se

em remove.

Etapa 4: Após a correção o arquivo deverá ser salvo no caminho

File<Write TextGrid to text file; aparecerá uma janela na qual deve-se clicar em

Salvar.

No trabalho de revisão, foram detectadas algumas falhas de segmentação

e os erros encontrados referiam-se exclusivamente à má segmentação das vogais.

Esta revisão tinha como finalidade selecionar as 6 melhores repetição de

cada frase, de todas as pastas do arquivo dos informantes, mas devido estes

sinais sonoros não apresentarem uma boa qualidade para a pesquisa, esta etapa

foi descartada.

9

Page 10: Universidade Federal do Pará - pibic.ufpa.br · Paulo (PUCSP), Universidade Federal ... Na janela do Praat Objects, aparece abaixo do sinal correspondente o textgrid ... selecionando-se

Devido aos problemas encontrados durante essas duas fases da pesquisa,

optou-se então por descartar totalmente o corpus formado por Santos e proceder

por uma nova coleta de dados, com o objetivo de formar um novo corpus, desta

vez com a qualidade acústica exigida para este tipo de trabalho.

Trabalho de Campo referente à zona urbana de Belém – BE01

Partiu-se, portanto, para uma nova coleta de dados com objetivo de

conseguir gravações substitutivas as de Santos Jr. (2008). Gravou-se um

informante do sexo feminino, com idade de 45 anos e tendo cursado o ensino

fundamental (BE01), nativo de Belém. A coleta de dados referente a este

informante já havia sido feita, porém, devido a problemas identificados no sinal

sonoro do antigo corpus se fez necessária uma nova coleta de dados com um

novo informante e equipamento.

Para esta coleta foram utilizados um notebook, o qual continha a

apresentação dos slides necessários, um novo gravador digital M-AUDIO

Microtrack II e um microfone Shure WH 25.

Esta atividade está indiretamente ligada ao projeto IC original que

corresponde da análise da variação prosódica dialetal do português falado na

zona urbana da cidade de Belém (PA).

Mais uma vez, foram respeitados todos os critérios estabelecidos pelo

Projeto AMPER para a seleção do perfil do informante, os quais compreendem: a)

ser nativo do local ou ter vivido a maior parte de sua vida nesse local; b) ter idade

acima de 30 anos; c) pertencer a um dos três níveis de escolaridade controlados

pelo projeto (fundamental, médio ou superior). Para esta coleta de dados em

particular, foi selecionado uma informante do sexo feminino, do ensino

fundamental, com 44 anos de idade, nativa da cidade de Belém.

O informante recebeu a codificação BE01 de acordo com os critérios

estabelecidos pelo projeto Atlas Prosódico Multimídia do Português do Norte do

Brasil.

A autora do presente relatório participou, juntamente com a coordenadora

do projeto, Profª.Dr. Regina Cruz, da coleta de amostras desta informante.

10

Page 11: Universidade Federal do Pará - pibic.ufpa.br · Paulo (PUCSP), Universidade Federal ... Na janela do Praat Objects, aparece abaixo do sinal correspondente o textgrid ... selecionando-se

A execução da coleta de dados ocorreu sem maiores problemas na casa da

informante, que fica localizada no bairro do Guamá, na cidade de Belém.

O corpus utilizado é composto de 66 frases que foram estruturadas

obedecendo as mesmas restrições fonéticas e sintáticas, a fim de se manter o

mesmo padrão para todos os corpora coletados nas três variedades do português

que fazem parte do projeto AMPER-POR, a saber: português continental,

português insular e português do Brasil.

As frases utilizadas nas gravações que compõem o corpus da zona urbana

de Belém e que serão analisadas neste plano de trabalho são do tipo SVC (Sujeito

+ Verbo + complemento) e suas expansões com a inclusão de Sintagmas

Adjetivais e Adverbiais. As frases foram estruturadas sintaticamente da seguinte

maneira: 1) possui apenas três personagens: O Renato, O pássaro e O bisavô; 2)

três sintagmas adjetivais: nadador, bêbado e pateta; 3) três sintagmas adverbiais

indicadores de lugar: de Mônaco, de Veneza e de Salvador; e 4) um único verbo:

gostar, representado pela imagem de um coração.

Assim, as combinações de todos os sintagmas permitiram organizar as

frases de 47 maneiras possíveis. As 66 frases do corpus correspondentes aos

sinais acústicos gravados foram codificados, por sua vez, de acordo com a

organização sintática da frase e de acordo com o tipo entoacional.

Foneticamente, as frases foram estruturadas em duas modalidades

entoacionais: declarativa e interrogativa.

Todas as frases foram constituídas por vocábulos representativos das

diversas estruturas acentuais (oxítona, paroxítona e proparoxítona) e nas diversas

posições da frase, a formar sílabas em que as vogais ocorressem no mesmo

contexto fonético de consoantes não vozeadas a fim reduzir alguns problemas

postos por fenômenos de coarticulação e garantir uma fácil e rigorosa

segmentação do sinal acústico.

Cada um dos elementos constituintes das frases possui uma representação

visual. Essas representações foram combinadas para formar as 66 frases

utilizadas para a obtenção das gravações. Os informantes não tiveram em

nenhum momento contato com as frases escritas. As gravações das repetições

foram feitas por meio da projeção dessas representações.

11

Page 12: Universidade Federal do Pará - pibic.ufpa.br · Paulo (PUCSP), Universidade Federal ... Na janela do Praat Objects, aparece abaixo do sinal correspondente o textgrid ... selecionando-se

A partir das combinações dessas representações, projetou-se cada uma

das 66 frases para os informantes. Nas formas interrogativas, acrescentou-se o

ponto de interrogação: ‘?’.

No dia 08 de julho de 2011, às 16h, foi realizada coleta de dados da

informante: BE01. Foram apresentadas a ela primeiramente 10 imagens, das

quais 3 (três) representavam os núcleos dos sintagmas nominais (O Renato, O

bisavô, O Pássaro) das frases; 3 (três) qualidades (Bêbado, pateta e nadador); 3

(três) sintagmas Adverbiais (de Veneza, de Mônaco e de Salvador) e 1 (uma) que

se referia ao verbo ‘gostar de’. Era solicitado ao informante formar frases do tipo

SVC (Sujeito + Verbo + Complemento), apresentando uma modalidade

entoacional de acordo com a simbologia final de casa frase, ou seja, se houvesse

o símbolo correspondente a uma pergunta (?), o informante deveria formular um

pergunta a partir das imagens projetadas. Na falta desta simbologia, o enunciado

esperado deveria ser de uma frase declarativa.

Por meio dos slides exibidos pelo computador no programa powerpoint,

foram projetadas as figuras formadoras das 66 frases de forma visual ao

informante, sem apresentar-lhe suas formas escritas. A ela foi pedida seis

repetições da série de frases do corpus (em ordem aleatória), no momento da

gravação propriamente dita. As gravações foram feitas, havendo uma interrupção

por conta de ruídos externos. A duração total da gravação da coleta do corpus

sem contar com as interrupções foi de 54 minutos e 24 segundos.

Como cada uma das 66 frases foram repetidas 6 (seis) vezes, foram

gravadas 396 frases pela informante, que já estão sendo segmentados pela autora

do presente relatório.

Para efetuação da análise do corpus coletado, foi proposto à informante a

assinatura de um termo de consentimento, o qual consta da aceitação dos

seguintes critérios:

1. Não haverá despesas ou compensações financeiras a informante relacionada

ao estudo.

2. Os dados obtidos, na forma de gravações em áudio, serão incorporados ao

banco de dados, cujos responsáveis zelarão pelo uso e aplicabilidade das

amostras exclusivamente para fins científicos.

12

Page 13: Universidade Federal do Pará - pibic.ufpa.br · Paulo (PUCSP), Universidade Federal ... Na janela do Praat Objects, aparece abaixo do sinal correspondente o textgrid ... selecionando-se

3. Compreensão de que os resultados deste estudo poderão ser publicados em

jornais profissionais ou apresentados em congressos profissionais, sem que a

identidade do informante seja revelada.

4. Aceitar participar neste estudo e em ceder os seus dados para o banco de

dados e sua utilização para fins científicos, recebendo uma cópia assinada do

formulário de consentimento.

A informante, BE01 assinou o termo de consentimento, que se encontra no

Banco de Dados do Projeto, possibilitando, portanto, a utilização dos dados para a

pesquisa.

Logo que tivermos terminado o tratamento de dados do corpus BE01 da

zona urbana de Belém, daremos prosseguimento à coleta de dados dos demais

informantes da zona urbana de Belém para substituição do antigo corpus que

apresentaram muitos problemas no sinal sonoro, e também dar prosseguimento a

coleta de dados do corpus da zona rural, que já possui informantes contatados

nas ilhas de Mosqueiro, Outeiro e Cotijuba.

RESULTADOS

Em relação a segmentação e ao tratamento de BE05 e BE06, foi

identificado que os sinais sonoros que compõem o corpus dos informantes em

questão apresentavam vários problemas, tais como a presença de ruídos externos

em algumas gravações, e falhas no sinal sonoro. Já revisão e segmentação das

amostras coletadas dos informantes BE01 e BE04, todas as frases foram

segmentadas de acordo com as orientações estabelecidas pela equipe do Projeto

AMPER, dos quais também foram detectados certos problemas nos sinais

sonoros, entendendo-se assim que devemos novamente coletar corpus referente

aos informantes BE02, BE03, BE04, BE05, BE06 da zona urbana de Belém.

Com o trabalho de campo realizado em julho de 2011, um informante do

ensino fundamental – BE01 - foi gravado para substituição do corpus da variedade

linguística da zona urbana de Belém (PA).

Em se tratando do plano IC original entendemos também que deve ser

iniciada uma nova pesquisa de campo para a coleta de dados do corpus da zona

13

Page 14: Universidade Federal do Pará - pibic.ufpa.br · Paulo (PUCSP), Universidade Federal ... Na janela do Praat Objects, aparece abaixo do sinal correspondente o textgrid ... selecionando-se

rural do município de Belém, em detrimento a isto, a aluna voluntária, autora do

presente relatório, já providenciou contatar os informantes destas localidades.

PUBLICAÇÕES

O presente trabalho já está inscrito e em níveis de aceite (em anexo abaixo) em

dois eventos de cunho internacional, que são:

1- V congresso de fonética experimental – Cáceres 2011, na Espanha, que

será realizado no período de 25 a 28 de outubro de 2011;

http://www.amprae.es/congreso_fonética_experimental

O título do trabalho enviado é Atlas Prosódico Multimédia da cidade de

Belém (PA): uma visão geral, de autoria de Regina Célia Fernandes Cruz

(UFPA/CNPq) e Camila Roberta dos Santos Brito (Aluna da Graduação/ FALE-

UFPA)

2- XV IFNOPAP – Santarém-PA, que será realizado no período de 13 a 22 de

outubro;

http://ifnopap.blogspot.com/

O título do trabalho enviado é Atlas Prosódico Multimédia da zona urbana da

cidade de Belém (PA): uma visão geral, de autoria de Regina Célia Fernandes

Cruz (UFPA/CNPq) e Camila Roberta dos Santos Brito (Aluna da Graduação/

FALE-UFPA)

CONCLUSÃO

Com a realização da segmentação do corpus BE05 e BE06, e a revisão e

segmentação de BE01 e BE04 percebeu-se que os sinais sonoros possuíam

muitos problemas, que será melhor evidenciado do tópico “DIFICULDADES”. Por

tais motivos comprometerem a as atividades da pesquisa, percebemos que deve

ser realizado uma nova pesquisa de campo, para uma melhor formação dos

corpus dos informantes da zona urbana de Belém.

14

Page 15: Universidade Federal do Pará - pibic.ufpa.br · Paulo (PUCSP), Universidade Federal ... Na janela do Praat Objects, aparece abaixo do sinal correspondente o textgrid ... selecionando-se

Em relação as atividades do plano IC original a aluna voluntária, autora do

presente projeto, já providenciou a seleção dos informantes das ilhas de

Caratateua (Outeiro), Cotijuba e Mosquiro, atividades estas que serão iniciadas no

segundo semestre de 2011 .

Os próximos passos compreendem:

1) Trabalho de campo para obtenção de dados para o corpus da zona urbana de

Belém (PA);

2) Trabalho de campo para obtenção de dados para o corpus da zona rural de

Belém (PA);

3) Transcrição fonética das do corpus da zona urbana e rural que serão

gravados;

4) Aplicação do script praat para obtenção das medidas acústicas dos

parâmetros de frequência fundamental, intensidade e duração de cada vogal

segmentada do corpus zona urbana e rural que serão gravados;

5) Análise acústica no programa Matlab do corpus zona urbana e rural que serão

gravados.

Procedimentos estes necessários para se delinear a variação dialetal do

nível prosódico do português falado na zona urbana e rural da cidade de Belém

(PA) e disponibilização do corpus formado on line.

REFERÊNCIAS BIBLIOGRÁFICAS

BAILLY, G. & AUBERGÉ, V. “Phonetic representation for intonation”. In J. Ph. Van Stander (ed), Progress in Speech Synthesis. New York: Springer, 1997, pp. 435-441.

CASTILHO, Francinete Carvalho. Formação de Corpora para o Atlas Dialetal Prosódico Multimídia do Norte do Brasil: Variedade Lingüística de Bragança (PA) . Bragança: UFPA/Campus de Bragança/Faculdade de Letras, 2009. (Trabalho de Conclusão de Curso em Letras). Orientador: Regina Célia Fernandes Cruz.

CONTINI, M.; LAI, J. P.; ROMANO, A. & Roullet S. “Vers um atlas prosodique parlant dês variétés romanes”. Mélanges em honneur de X. Ravier (no prelo).

D’ALESSANDRO, C.; BEAUGENDRE, F. & MERTENS, P. “Automatic stylisation of intonation: applicationsto speech synthesis”. 2nd ESCA Workshop on Speech Synthesis. New York: Mohonk, 1994, pp. 155-158.

15

Page 16: Universidade Federal do Pará - pibic.ufpa.br · Paulo (PUCSP), Universidade Federal ... Na janela do Praat Objects, aparece abaixo do sinal correspondente o textgrid ... selecionando-se

DE CASTRO MOUTINHO, Lurdes; COIMBRA, R.L.; SECCA RUIVO, S. & PEREIRA BENDIHA, U. “Atlas Prosódico Multimédia: curvas de uma trajetória”. Actas do XVI Encontro Nacional da Associação Portuguesa de Lingüística. Colibri, 2001, pp. 387-39.

DI CRISTO, Albert & HIRST, Daniel. “Modelling French micromelody”. Phonetica 43 (1), 1996, pp. 11-30.

HIRST, Daniel & DI CRISTO, Albert. Intonation systems: a survey of twenty languages. Cambridge: Cambridge Univarsity Press, 1998.MAROTTA, G. “Allinamento e transcrizione dei toni accentuali complesi: uma proposta”. Atti dalle X G. di St. Del GFS (Napoli 1999). Napoli: Ist. Univ. Orientale, 2000.

MORAIS, Barbosa Joaquim. “Entoação e Prosódia”, in Holtus G. et al. (eds), Lexicon der Romanistischen Linguistik, Band IV, 2, 1994, pp. 243-248.

ROMANO, A, Analyse dês estructures prosodiques dês dialectes et de I’italien regional parlés dans lê Salento (Italie): appriche linguistique et instrumentale. Tesi de Dottorato in Sciences du Langage, Université Stendhal, Grenoble, vol.2, 1999.

SILVA, Amanda Ariana Silva da. Atlas prosodico multimedia do português do norte do brasil – AMPER-POR: variedade linguistica da zona rural de Belém (PA). Em andamento. Projeto de pesquisa de iniciação cientifica (PIBIC/CNPq) Universidade Federal do Pará, Belém, 2010. UFPA. Orientador: Regina Célia Fernandes Cruz.

SANTO, Ilma Pinto do Espírito. Atlas Prosódico Multimédia do Município de Cametá (PA). Em andamento. Dissertação (Curso de Mestrado em Letras) – Universidade Federal do Pará, Belém: UFPA. Orientador: Regina Célia Fernandes Cruz.

SANTOS JR., Manoel Fonseca dos. Formação de corpora para o Atlas Dialetal Prosódico Multimédia do Norte do Brasil: variedade lingüística de Belém. Belém: UFPA/ILC/FALE, 2008. (Trabalho de Conclusão de Curso em Letras).

SILVA NETO, Serafim da. Introdução ao Estudo da Língua Portuguesa no Brasil. 4 ed. Rio de Janeiro, Presença, 1977 [1957].

DIFICULDADES

Devido aos problemas de saúde da bolsista Amanda Ariana Silva da Silva,

as atividades do projeto atrasaram e tiveram que ser retomadas pela voluntária de

projeto, autora do presente relatório.

16

Page 17: Universidade Federal do Pará - pibic.ufpa.br · Paulo (PUCSP), Universidade Federal ... Na janela do Praat Objects, aparece abaixo do sinal correspondente o textgrid ... selecionando-se

Em se tratando da segmentação dos dados dos informantes BE05, BE06,

as principais dificuldades encontradas decorrem certos problemas nos sinais

sonoros, tais como a presença de ruídos externos em algumas gravações e falhas

no sinal sonoro tais como: ruídos de obras, aviões, latidos de cachorro, etc,

comprometendo assim o sinal sonoro coletado, por estes motivos percebemos que

devemos iniciar novas coletas de dados para tais informantes.

Na segmentação e revisão dos informantse BE01 e BE04 foram percebidas

falhas no sinal sonoro tais como: cortes feitos pela má segmentação dos alunos

como foi citado no relatório anterior, fala de pessoas, choro de criança, latido de

cachorro e etc.

Não obstante, foram segmentadas e revisadas todas as frases

correspondentes ao informante BE01 e BE04, que também por apresentar

problemas no sinal sonoro, optou- se por não ser utilizado, motivo pelo qual

iniciaremos novas coletas para estes informantes.

Na execução das gravações feitas em trabalho de campo em julho de 2011,

houve a ocorrência de alguns ruídos externos os quais fizeram com que fossem

interrompidas as gravações com o informante BE01 por uma veze, tais como: fala

de pessoas, som de músicas, latidos de cachorro, etc, o que impossibilitou a

execução da pesquisa em tempo hábil, porém não houve comprometimento no

sinal sonoro coletado.

Houve também certa dificuldade de decodificação dos sintagmas para a

formação das frases por parte do informante BE01, sendo necessário demasiado

tempo para o informante acostumar-se com as imagens e assim poder formar as

frases.

PARECER DO ORIENTADOR:

Como bem explicado no corpo do relatório, o envio do presente relatório só

foi possível porque Camila Roberta dos Santos Brito, voluntária do projeto,

assumiu a condução do presente plano de trabalho quando do impedimento

inesperado da bolsista PIBIC Amanda Ariana Silva da Silva. Graças a sua

dedicação e esforço, dois trabalhos já foram aceitos, um inclusive em nível

internacional. Não sou favorável a nenhuma punição à Amanda Ariana Silva da

Silva, pois a mesma foi ocasionada por uma doença grave que a impediu 17

Page 18: Universidade Federal do Pará - pibic.ufpa.br · Paulo (PUCSP), Universidade Federal ... Na janela do Praat Objects, aparece abaixo do sinal correspondente o textgrid ... selecionando-se

totalmente de exercer suas atividades de bolsista. Sensível a sua situação, Camila

Roberta dos Santos Brito tomou para si a responsabilidade de encerrar as

atividades da bolsa para que sua colega não sofresse qualquer prejuízo. E o fez

de forma séria, discreta, responsável e profissional.

INFORMAÇÕES ADICIONAIS

Solicitamos que as informações sobre o estado de saúde da bolsista Amanda

Ariana Silva da Silva não sofra ampla divulgação.

Possivelmente será Camila Roberta dos Santos Brito quem participará como

expositora do XXII Seminário de Iniciação Científica da UFPA.XXII Seminário de Iniciação Científica da UFPA.

DATA : 08/02/2010

_________________________________________Dr. Regina Celia Fernandes Cruz

Bolsista Produtividade do CNPqBolsista Fulbright

NYU Linguistics Department Visiting Scholar

____________________________________________

ASSINATURA DO ALUNO

18

Page 19: Universidade Federal do Pará - pibic.ufpa.br · Paulo (PUCSP), Universidade Federal ... Na janela do Praat Objects, aparece abaixo do sinal correspondente o textgrid ... selecionando-se

Anexo I

19

Page 20: Universidade Federal do Pará - pibic.ufpa.br · Paulo (PUCSP), Universidade Federal ... Na janela do Praat Objects, aparece abaixo do sinal correspondente o textgrid ... selecionando-se

Anexo III

1

Page 21: Universidade Federal do Pará - pibic.ufpa.br · Paulo (PUCSP), Universidade Federal ... Na janela do Praat Objects, aparece abaixo do sinal correspondente o textgrid ... selecionando-se

Anexo IV

2

Page 22: Universidade Federal do Pará - pibic.ufpa.br · Paulo (PUCSP), Universidade Federal ... Na janela do Praat Objects, aparece abaixo do sinal correspondente o textgrid ... selecionando-se

3