contributos para o estudo da variação nnaa frequência de...
Post on 22-Sep-2020
3 Views
Preview:
TRANSCRIPT
Contributos para o estudo da variaçãoContributos para o estudo da variaçãona na frequência de ocorrência de frequência de ocorrência de
XXV Encontro Nacional da Associação Portuguesa de Linguística
22, 23 e 24 de Outubro de 2009, Faculdade de Letras da Universidade de Lisboa
na na frequência de ocorrência de frequência de ocorrência de unidades e padrões unidades e padrões fonológicosfonológicos
Joana Aguiar Universidade do Minho, CLUL
Marina VigárioUniversidade de Lisboa; Laboratório de Fonética da FLUL, CLUL
Padrões de Frequência na Fonologia do Português - Investigação e Aplicações
PTDC/LIN/70367/2006.
1
EstruturaEstrutura
� Enquadramento
� Objectivos
� Metodologia
� Resultados Obtidos: Comparação de � Resultados Obtidos: Comparação de Corpora
� Resultados Obtidos: Distribuição por Variável Externa
� Discussão e Conclusões
2
ENQUADRAMENTOENQUADRAMENTO3
EnquadramentoEnquadramento� Importância da frequência (e.g. Bybee 2002; Bybee & Hooper 2001;
Pierrehumbert 2001; Demuth 2006; Gülzow & Gagarina 2007)
Papel da frequência de palavras, unidades e padrões gramaticais noprocessamento, uso linguístico, aquisição e desenvolvimento dalinguagem:
> o efeito da frequência de palavras ou unidades e padrõesgramaticais tarefas de processamento (e.g. Dell 1990; Caramazza et al.2001);
> elevada frequência factor inibidor de processos de regularização> elevada frequência factor inibidor de processos de regularização(Bybee & Hooper 2001)
> frequência relativa de unidades e padrões fonológicos no input dacriança � poder preditor da ordem de emergência e/ou frequênciade ocorrência dessas unidades e padrões nas primeiras produções(e.g. Zamuner et al. 2004; Freitas et al. 2006; Ota 2006; Prieto 2006; Vigário et al.2006)
� Português (e.g. Andrade & Viana et al. 1994; Vigário & Falé1994; Viana et al. 1996;e vários trabalhos recentes de Vigário, Frota, Martins e colegas � projecto Padrões deFrequência na Fonologia do Português - Investigação e Aplicações PTDC/LIN/70367/2006.)
Enquadramento Metodologia Resultados Discussão e Conclusões4
EnquadramentoEnquadramento
Comparando frequências de uso nas línguas:� tipos silábicos mais de 50% CV; 22% CVC no Português, o Castelhano ou Francêsvs. entre 30% e 36% CV e CVC no Inglês e o Holandês Holandês (cf. Vigário, Frota & Freitas 2003 e referências aí citadas)
� formatos de palavras Palavras maiores do que pé binário (~mais de 2 sil.)5% no Inglês; 15% no Catalão vs. Espanhol e Português (~30%)(cf. Roak & Demuth2000; Prieto 2006; Vigário, Frota & Freitas 2006)
� Frequência agrupa/distingue línguasEnquadramento Metodologia Resultados Discussão e Conclusões
5
EnquadramentoEnquadramento
Unidade e variação dentro de cada língua: e.g. diferentes corpora, diferentes resultados, mas mesmas tendências gerais – cf.Viana et al. 1996 vs. Vigário et al. 2006 e Freitas et al. 2006
(comparação sistemática por fazer)
Qual a extensão e os limites da variação na frequência de uso de unidades e padrões fonológicos no Português?
Que factores se correlacionam com a variação?
Enquadramento Metodologia Resultados Discussão e Conclusões6
� Frequência de uso de unidades e padrões fonológicos no falar da Terra Quente Transmontana, considerando diferentes variáveis sociolinguísticas
� Comparação com dados provenientes de corpus que
Contributo para a resposta a estas Contributo para a resposta a estas questõesquestões
� Comparação com dados provenientes de corpus que inclui fala de diversos pontos de Portugal
� Desenvolvimento da investigação apresentada em Aguiar (2009).
Enquadramento Metodologia Resultados Discussão e Conclusões7
OBJECTIVOSOBJECTIVOS8
ObjectivosObjectivos(i) dar a conhecer dados novos sobre a frequência das classesmaiores de segmentos, tipos silábicos, formatos de palavra epadrão acentual, numa variedade do Português;
(ii) identificar medidas de frequência de objectos e padrõesfonológicos relativamente invariantes, no sentido em que nãoestabelecem diferenças significativas entre os corporaanalisados;analisados;
(iii) identificar padrões de variação que se correlacionam comfactores externos, como a idade e a escolaridade;
(iv) identificar medidas de frequência potencialmentediferenciadoras de variedades com eventual aplicação emáreas como a Linguística Forense.
9Enquadramento Objectivos Metodologia Resultados Discussão e Conclusões
METODOLOGIAMETODOLOGIA10
MetodologiaMetodologiaCorpora em análiseCorpora em análise
� Corpus TA90PE dados fala espontânea de indivíduos oriundos de diversas zonas
de Portugal
22994 palavras ortográficas.
� Corpus TQT dados de fala espontânea de 100 falantes da Terra Quente
Transmontana
64757 palavras ortográficas
11Enquadramento Objectivos Metodologia Resultados Discussão e Conclusões
Unidades e padrões fonológicos em Unidades e padrões fonológicos em análise: análise:
- Tamanho de PW
- Tipo de Segmento
- Padrão Acentual
- Tipos Silábicos- Tipos Silábicos
� Para a extracção e contagem dos valores de frequência foi usada a ferramenta electrónica FreP .
(FreP v1.0010 2004-2008, F. Martins, M. Vigário & S. Frota)
12Enquadramento Objectivos Metodologia Resultados Discussão e Conclusões
Sobre a Ferramenta FrePSobre a Ferramenta FreP
� Identifica e conta unidades e padrões fonológicos a partir de texto escrito, seguindo as convenções ortográficas em vigor
� Unidades e padrões: da palavra ao traço
� Fonologia lexical/obrigatória
� Corre sobre ficheiros de texto não-formatados (.txt).
� Novas versões corrigidas e com novas funcionalidades posteriores
� Em fase de conclusão, teste e avaliação
http://www.fl.ul.pt/LaboratorioFonetica/frep
13Enquadramento Objectivos Metodologia Resultados Discussão e Conclusões
RESULTADOS OBTIDOSRESULTADOS OBTIDOSCOMPARAÇÃO DE COMPARAÇÃO DE CORPORACORPORA
14
Resultados ObtidosResultados ObtidosComparação de Comparação de corporacorpora
(i) os valores relativos à frequência dos diferentes formatos de palavranão se distinguem significativamente nos dois corpora (v.p. 0,665).
Número de Sílabas por Palavra Prosódica
0% 10% 20% 30% 40% 50%
PW1
PW2
PW3 ≥
TA90PE TQT
15Enquadramento Objectivos Metodologia Resultados Discussão e Conclusões
10%
20%
30%
40%
50%
60%Tipos de Segmentos
(ii) Há diferenças estatisticamente significativas na percentagemde segmentos de tipo C, V e V-Slots (v.p. 0,00).
Vogal Consoante Glide V-Slot
TQT 43,50% 50,70% 5,73% 0,07%
TA90PE 48,00% 46,00% 5,80% 0,20%
0%
10%
(iii) A distribuição do padrão acentual é igual nos dois corpora:
sílaba final=22%, penúltima=76%, e antepenúltima=2% (v.p.0,354).
16Enquadramento Objectivos Metodologia Resultados Discussão e Conclusões
(iv) A distribuição dos tipos silábicos mais comuns é diferente nos dois corpora (v.p. 0,000).
TiposSilábicos
Corpus TQT
Corpus TA90PEFrota et al. (2006) e Vigário et. al.(2006b)
CV 46,47% 46,36%V 14,94% 15,83%CVC 10,62% 11,01%CVN 5,47% 5,37%CVGN 5,12% 5,62%CVGN 5,12% 5,62%CVG 3,69% 2,66%VC 3,09% 3,03%CCV 2,87% 2,18%VN 1,85% 2,64%CVGC 1,38% 1,21%VG 1,60% 1,51%Outros 2,91% 2,58%
17Enquadramento Objectivos Metodologia Resultados Discussão e Conclusões
Total de sílabas iniciadas por V: TQT- 21,48%; TA90PE-23,11%
RESULTADOS OBTIDOSRESULTADOS OBTIDOSFREQUÊNCIA DE UNIDADES E PADRÕES
FONOLÓGICOS NO CORPUS TQT POR
VARIÁVEIS EXTERNAS
18
Tamanho de PW
Alfândega Carrazeda Mirandela Macedo Vila Flor
PW1 28,1% 29,1% 27,5% 27,7% 28,1%
PW2 46,6% 46,1% 46,3% 45,7% 46,3%
Distribuição por Concelho (v.p. 0,000)
PW≥3 25,3% 24,8% 26,2% 26,6% 25,6%
Nas cidades a percentagem de palavras prosódicas com três oumais sílabas é superior.
19Enquadramento Objectivos Metodologia Resultados Discussão e Conclusões
Distribuição por Escolaridade
Tamanho de PW
PW1 PW2 PW≥3
Alfabetizados 27,9% 45,0% 27,0%
Analfabetos 27,5% 47,7% 24,8%
20%
30%
40%
50%
Distribuição por IdadeDistribuição por Idade
20Enquadramento Objectivos Metodologia Resultados Discussão e Conclusões
20-35 36-50 51-65 >65
PW1 29,5% 28,8% 26,3% 27,3%
PW2 43,6% 44,5% 44,8% 47,5%
PW≥ 3 26,9% 26,7% 28,9% 25,3%
20%
30%
40%
50%
Tipos de Segmentos
A análise percentual da contagem de segmentos, por grupos defalantes, revela que a sua distribuição é uniforme, à excepção dosvalores de V-Slots.
A média de V-Slots nos falantes alfabetizados é de 0,08% e nosfalantes analfabetos de 0,01%.
21Enquadramento Objectivos Metodologia Resultados Discussão e Conclusões
Padrão Acentual
Concelhos Alfândega
da Fé
Carrazeda
de
Ansiães
Mirandela Macedo
de
Cavaleiros
Vila
FlorAcento
Monossílabo 28,00% 29,39% 27,23% 27,46% 27,10%
Final 14,63% 15,86% 16,43% 14,97% 16,68%
Distribuição por Concelho
Acento
Penúltima 56,05% 53,74% 54,98% 55,85% 55,15%
Antepenúltima 1,32% 1,01% 1,36% 1,72% 1,07%
Os valores mais altos registados para as proparoxítonas dizemrespeito às cidades de Mirandela (1,36%) e Macedo (1,72%),tendência já verificada nos valores para as palavras prosódicascom três ou mais sílabas.
22Enquadramento Objectivos Metodologia Resultados Discussão e Conclusões
Distribuição por Escolaridade
Acento
Falantes
TQT
Monossílabos Final Penúltima Antepenúltima
Analfabeto 27,51% 14,61% 56,88% 1,00%
Alfabetizado 28,22% 16,09% 54,32% 1,37%
Distribuição por Idade
Acento
Idades Monossílabos Final Penúltima Antepenúltima
20-35 29,50% 16,25% 52,85% 1,40%
36-50 28,81% 15,69% 54,08% 1,41%
51-65 27,58% 16,32% 54,57% 1,53%
>65 27,75% 15,54% 55,53% 1,17%
Distribuição por Idade
23Enquadramento Objectivos Metodologia Resultados Discussão e Conclusões
Tipos Silábicos mais frequentes
Distribuição por Concelho
Distribuição por Escolaridade
A distribuição dos tipos silábicos mais frequentes por concelho da TQT não revela oscilações significativas.
CVGC
VG
Outrosrealização de vogal em final de sílaba fechada por
24
0% 10% 20% 30% 40% 50%
CV
V
CVC
CVN
CVG
CVGN
CCV
VC
VN
CVGC
Alfabetizado Analfabeto
Frequência de a- protéticos:depois alebantaram (INM4);alebantabamo-nos às seis damanhã (MNM4);
de sílaba fechada por fricativa: fize-te algum mal(INF4).
Enquadramento Objectivos Metodologia Resultados Discussão e Conclusões
Distribuição por Idade
10%
20%
30%
40%
50%
0%
CV V CVC CVN CVG CVGN CCV VC VN CVGC VG Outros
20-35 36-50 51-65 >65
Para o aumento do tipo CV e diminuição do tipo CVC, nos falantes com mais de 65 anos, poderão contribuir as paragoges de [0] e [5] em
sílaba final fechada por consoante, formando uma nova sílaba, como em: andaba só com obelhas e cabras era difícile (CNM4), nem sequerasabe (MAF4); ou de qualquera maneira (CNM4).
25Enquadramento Objectivos Metodologia Resultados Discussão e Conclusões
DISCUSSÃO E DISCUSSÃO E CONCLUSÕESCONCLUSÕES
26
Discussão e Conclusões
Apesar de em todos os parâmetros as diferenças serem dedetalhe, na medida em que não se distanciam muito do descritopara o PE, a análise da distribuição das unidades e padrõesfonológicos aqui apresentada revela que o comportamento dosfalantes não é uniforme, mas condicionado por factores externos,como a origem geográfica, a idade e a exposição a processos deescolarização.
A comparação TQT e TA90PE revela que:
(i) o tamanho de PW e a distribuição do padrão acentual são semelhantes nos dois corpora, o que poderá indicar que a sua frequência de realização é independente das especificidades de cada variedade.
(ii) Há diferenças significativas na distribuição de tipos de segmentos e tipos silábicos mais frequente.
27Enquadramento Objectivos Metodologia Resultados Discussão e Conclusões
(i) Os falantes provenientes das cidades produzem maispalavras com ≥ 3 sílabas e proparoxítonas.
Esta constatação leva-nos a questionar as possíveisinfluências que os centros de desenvolvimento industrial ecultural poderão ter na produção de palavras prosódicasmais pesadas, mesmo em contextos informais de
Dentro do espaço TQT:
mais pesadas, mesmo em contextos informais decomunicação, sendo necessária mais investigação nestedomínio.
28Enquadramento Objectivos Metodologia Resultados Discussão e Conclusões
(ii) Também a variável idade parece interferir na produção dostipos silábicos e na realização de palavras prosódicas maispesadas.
Considerando que o nível de escolaridade tem impacto nadimensão do léxico activo dos falantes, pode esperar-se quepalavras e estruturas de baixa frequência, como as V-Slots,não estejam tão disponíveis em sujeitos com níveis deinstrução formal mais baixos.
(iii) Foram assinaladas diferenças significativas na frequência deV-Slots, PW com ≥ 3 sílabas e proparoxítonas nos falantesanalfabetos.
29
instrução formal mais baixos.
Também a distribuição dos tipos silábicos é influenciadapor esta variável.
Enquadramento Objectivos Metodologia Resultados Discussão e Conclusões
Em conclusão, o presente trabalho constitui um contributopara o conhecimento da amplitude e limites da variação nafrequência de ocorrência de um conjunto de unidades epadrões fonológicos, bem como das razões subjacentes àvariação / ausência de variação encontrada.
Dado o que se conhece sobre a importância da frequência noinput para a aquisição, estes resultados têm implicações quanto
30
Para além da importância destes dados para os estudos defrequência e variação, os resultados obtidos, em conjunto comoutros dados de análise, poderão contribuir para traçar o perfillinguístico de (grupos de) falantes (Aplicação Forense).
Enquadramento Objectivos Metodologia Resultados Discussão e Conclusões
input para a aquisição, estes resultados têm implicações quantoao que se pode esperar na ordem de emergência/ frequência deunidades e padrões fonológicos nas crianças desta região.
Obrigada!
isabeljoana@portugalmail.pt
marina.vigario@mail.telepac.pt
http://www.fl.ul.pt/LaboratorioFonetica/investigadores.htm
31
32
Corpus TA90PE
• amostra do corpus do Português Falado. Documentos Autênticos, editado em CR-ROM pelo Centro de Linguística da Universidade de Lisboa e Instituto Camões.
• dados do Português de Portugal da década de 90 (CD 1).
33
MapaMapass
34
Corpus TQT
Recolha de 14 horas e 34 minutos de fala espontânea + 1h.06 min. (Rádio Ansiães)
Transcrição ortográfica, preservando o mais fielmente possível a produção oral
original.
35
Tipo Silábico mais frequente
TQT TA90PE Português/Castelhano/Francês
Inglês/Holandês
CV(N) 52% 52% 50% 30%
PW > 2 sílabas
TQT TA90PE Português/Espanhol Inglês Catalão
(cf. Vigário, Frota & Freitas 2003 e referências aí citadas)
36
TQT TA90PE Português/Espanhol Inglês Catalão
CV(N) 26% 27% ~30% 5% 15%
(cf. Roak & Demuth2000; Prieto 2006; Vigário, Frota & Freitas 2006)
top related