pontifÍcia universidade catÓlica de minas … · quadro 19 – alteração no registro do padrão...
TRANSCRIPT
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE MINAS GERAIS
Programa de Pós-Graduação Stricto Sensu em Linguística e Língua Portuguesa
Ana Paula dos Santos Pereira
Bolsista CAPES
REFLEXÕES FONOLÓGICAS SOBRE A AQUISIÇÃO DO ONSET
COMPLEXO E DA CODA NO PROCESSO DE AQUISIÇÃO DA
MODALIDADE ESCRITA DA LÍNGUA
Belo Horizonte
2015
Ana Paula dos Santos Pereira
Bolsista CAPES
REFLEXÕES FONOLÓGICAS SOBRE A AQUISIÇÃO DO ONSET
COMPLEXO E DA CODA NO PROCESSO DE AQUISIÇÃO DA
MODALIDADE ESCRITA DA LÍNGUA
Dissertação apresentada ao Programa de Pós-
Graduação em Linguística e Língua
Portuguesa da Pontifícia Universidade
Católica de Minas Gerais para obtenção do
título de Mestre em Linguística.
Orientador: Prof. Dr. Marco Antônio de
Oliveira
Área de Concentração: Fonologia
Belo Horizonte
2015
FICHA CATALOGRÁFICA
Elaborada pela Biblioteca da Pontifícia Universidade Católica de Minas Gerais
Oliveira, Marco Antônio de
O48r Reflexões fonológicas sobre a aquisição do onset complexo e da coda no
processo de aquisição da modalidade escrita da língua / Ana Paula dos Santos
Pereira, Belo Horizonte, 2015.
174 f.
Orientador: Marco Antônio de Oliveira
Dissertação (Mestrado) – Pontifícia Universidade Católica de Minas Gerais.
Programa de Pós-Graduação em Letras.
1. Língua portuguesa - Gramática. 2. Língua portuguesa - Português falado. 3.
Língua portuguesa - Português escrito. 4. Alfabetização. 5. Linguística. I.
Oliveira, Marco Antônio de. II. Pontifícia Universidade Católica de Minas
Gerais. Programa de Pós-Graduação em Letras. III. Título.
CDU: 806.90-5
Ana Paula dos Santos Pereira
REFLEXÕES FONOLÓGICAS SOBRE A AQUISIÇÃO DO ONSET
COMPLEXO E DA CODA NO PROCESSO DE AQUISIÇÃO DA
MODALIDADE ESCRITA DA LÍNGUA
Dissertação apresentada ao Programa de Pós-
Graduação em Linguística e Língua
Portuguesa da Pontifícia Universidade
Católica de Minas Gerais, como requisito
parcial para obtenção do título de Mestre em
Linguística.
____________________________________________________________
Prof. Dr. Marco Antonio de Oliveira – PUC Minas (Orientador)
____________________________________________________________
Prof. Dr. Gilcinei Teodoro de Carvalho (FALE/UFMG)
____________________________________________________________
Prof. Drª. Arabie Bezri Hermont (PUC Minas)
____________________________________________________________
Prof. Dr. Milton do Nascimento (PUC Minas)
Belo Horizonte, 04 de dezembro de 2015
Aos meus amores: pais, irmãos, filho e marido.
AGRADECIMENTOS
Antes de tudo, agradeço a Deus por me permitir viver a realização de mais um
sonho e do cumprimento de mais uma etapa importante em minha vida. Sem Ele nada
seria possível.
Aos meus pais, agradeço pelos ensinamentos, pela educação, pelo carinho, pelo
amor incondicional e por terem criado em mim a certeza de nunca desistir dos meus
sonhos e objetivos.
Aos meus queridos irmãos, André e Auzenda, agradeço pelo apoio e carinho em
todos os momentos.
Ao meu querido filho Mateus, pelo olhar compreensivo a cada ausência minha.
Obrigada, meu filho, por ser tão maduro com tão pouca idade!
Ao meu amado esposo Alessandro, por tudo que somos juntos e, principalmente,
pelo incentivo, pela paciência, pela compreensão e pelo amor que sempre teve por mim.
Obrigada, meu amor!
Aos meus amigos do Mestrado, em especial ao Carlucci, à Débora e à Maria, por
tornarem essa trajetória bem mais leve e muito mais alegre.
À PUC Minas, pela excelência, oportunidade e suporte.
À CAPES, pela concessão da bolsa de estudos.
Aos professores e funcionários do Programa de Pós-Graduação em Linguística e
Língua Portuguesa da PUC Minas, por todo carinho, atenção, dedicação e
profissionalismo.
Ao professor Hugo Mari, que me incentivou antes mesmo do meu ingresso no
Programa.
Aos professores Arabie, Mariângela e Milton, pelos conhecimentos
compartilhados.
E, por fim, em especial, ao meu querido Professor Marco Antônio, por toda
paciência, incentivo, sinceridade, clareza, disponibilidade e pela excelência em seu
profissionalismo.
RESUMO
Esta dissertação propõe uma reflexão e análise sobre a interferência da modalidade
falada nas variações dos padrões silábicos CCV e (C)VC no processo de aquisição da
modalidade escrita da língua. Com base em modelos fonológicos não lineares, e
tomando a sílaba como locus desse processo, nossa pesquisa busca compreender como
são formuladas as hipóteses de representação desses padrões silábicos, e como elas se
relacionam com ambientes estruturais e não estruturais. Nesse sentido, buscamos
comprovar a interferência da modalidade oral da língua no processo de aquisição da
modalidade escrita, o que demonstra tendência na transformação de padrões silábicos
não canônicos em CV. Isto é, o conhecimento linguístico do aprendiz controla o
processo de aprendizagem da modalidade escrita. Os fenômenos pesquisados foram
extraídos de textos escritos por alunos alfabetizados do Ensino Fundamental I. Para
tanto, adotou-se a metodologia descritiva e qualitativa, considerando-se os ambientes
selecionados como variáveis favorecedoras ou inibidoras da alteração dos padrões
analisados. Os dados foram submetidos ao conjunto de programas computacionais de
análise multivariada: Varbul. Os resultados finais comprovaram que a modalidade
falada é a base do processo de aquisição da modalidade escrita, logo, interfere de
maneira substancial na construção dos padrões silábicos.
Palavras-chave: Alfabetização. Padrões Silábicos. Modelos Fonológicos Não Lineares.
Modalidade Falada. Modalidade Escrita. Linguística.
ABSTRACT
This dissertation proposes a reflection and analysis on the interference of the spoken
form of changes in syllabic patterns and CCV (C) VC in the process of acquisition of
written language mode. Based on nonlinear phonological models, and taking the
syllable as locus of this process, our research seeks to understand how they are
formulated hypotheses of representation, these syllabic patterns and how they relate to
structural and non-structural environments. In that sense, we seek to prove the
interference of oral mode of language in writing mode acquisition process, which shows
trends in the transformation of syllabic patterns noncanonical in CV. That is, the
linguistic knowledge of the learner controls the learning process of writing mode. The
phenomena studied were drawn from texts written by literate students of Elementary
School I. The methodology is descriptive and qualitative thus considers the selected
environments as favoring or inhibiting the change of variables analyzed patterns. The
data were submitted to a set of computer programs multivariate analysis Varbul. The
final results show that the spoken form is the basis of the acquisition of the writing
mode, therefore, interfere substantially in the construction of syllabic patterns.
Keywords: Literacy. Syllabic patterns. Phonological Models Nonlinear. Spoken mode.
Style Writing. Linguistics.
LISTA DE FIGURAS
FIGURA 1 – Extensão de um traço adjacente ................................................................. 29
FIGURA 2 – Uma representação tonal típica .................................................................. 29
FIGURA 3 – Exemplo de um verbo árabe ...................................................................... 31
FIGURA 4 – Sílaba hipotética (I).................................................................................... 34
FIGURA 5 – Sílaba hipotética (II) .................................................................................. 35
FIGURA 6 – Princípios de Composição da Sílaba Básica .............................................. 38
FIGURA 7 – Condição Positiva do Ataque Completo .................................................... 44
FIGURA 8 – Tabulação Classe Social/Cidade .............................................................. 110
FIGURA 9 – Ano Escolar e Classe Gramatical ............................................................ 112
LISTA DE TABELAS
TABELA 1 – Classificação séries/anos........................................................................... 68
TABELA 2 - Representatividade .................................................................................... 76
TABELA 3 – Results parcial onset complexo ................................................................. 84
TABELA 4 – Análise Multivariada do Onset Complexo ............................................... 88
TABELA 5 - Grupo 7: Variável Independente Estrutural Número de Sílabas (...) ........ 90
TABELA 6 - Grupo 11: Variável Independente Não-Estrutural Classe Social (...) ....... 91
TABELA 7 – Grupo 6: Variável Independente Estrutural Tonicidade ........................... 92
TABELA 8 – Grupo 10: Variável Independente Não-Estrutural Sexo (...) ................... 93
TABELA 9 – Grupo 9: Variável Independente Não Estrutural Ano Escolar ................. 94
TABELA 10 – Dados cruzados: Ano Escolar e Cidade .................................................. 96
TABELA 11 – Results parcial para a coda ...................................................................... 97
TABELA 12 – Dados sobre o status de representação gráfica da coda ........................ 101
TABELA 13 - Ocorrências de “U” e “O”. .................................................................... 101
TABELA 14 – Análise Multivariada do Cancelamento de Coda ................................. 106
TABELA 15 – Grupo 10: Variável Independente Não-Estrutural Classe Social (...) . 108
TABELA 16 – Grupo 4: Variável Independente Estrutural Posição (...) ..................... 109
TABELA 17 - Grupo 11: Variável Independente Não Estrutural Cidade (...) ............. 109
TABELA 18 – Grupo 8: Variável Independente Não Estrutural Ano Escolar (...) ...... 111
TABELA 19 – Grupo 7: Variável Independente Estrutural Classe de Palavras (...).... 114
TABELA 20 – Grupo 2: Variável Independente Estrutural Sonoridade (...) ................ 114
TABELA 21 – Grupo 3: Variável Independente Estrutural Vogal da Sílaba (...) ........ 115
TABELA 22– Vibrante Pós-vocálica ............................................................................ 115
TABELA 23 – Grupo 6: Variável Independente Estrutural Número de Sílabas (...) .... 116
TABELA 24 – Análise Multivariada de Ortografia ...................................................... 117
TABELA 25 – Grupo 1: Variável Independente Estrutural Natureza da Coda (...) ...... 118
TABELA 26 – Grupo 10: Variável Independente Não-Estrutural Classe Social (...) ... 120
TABELA 27 – Grupo 5: Variável Independente Estrutural Tonicidade (...) ............... 120
TABELA 28 – Grupo 11: Variável Independente Não Estrutural Cidade (...) ............. 121
TABELA 29 – Grupo 8: Variável Independente Não Estrutural Ano Escolar (...) ...... 122
TABELA 30 – Análise Multivariada do Posicionamento Estrutural da Coda (...) .... 1222
LISTA DE QUADROS
QUADRO 1 – Padrões Silábicos do Português Brasileiro .............................................. 45
QUADRO 2 – Posições para os segmentos (I) ................................................................ 45
QUADRO 3 – Posições para os segmentos (II) .............................................................. 46
QUADRO 4 – Fonemas e ataques complexos na coda ................................................... 46
QUADRO 5 – Escala de sonoridade para o Português Brasileiro ................................... 48
QUADRO 6 – Distâncias propostas pela escala de sonoridade ...................................... 48
QUADRO 7 – Escala de sonoridade para os tipos silábicos ........................................... 52
QUADRO 8 - Aquisição da Escrita ................................................................................. 58
QUADRO 9 – Variáveis independentes não estruturais ................................................. 68
QUADRO 10 – Status da representação gráfica do onset ... ........................................... 71
QUADRO 11 – Status da representação gráfica da coda ................................................ 73
QUADRO 12- Exemplos de Codificação do Onset Complexo ...................................... 78
QUADRO 13 – Exemplo de Decodificação ................................................................... 78
QUADRO 14 – Exemplos de Codificação da Coda ........................................................ 79
QUADRO 15 - Exemplo de Decodificação ................................................................... 79
QUADRO 16 – Distância sonora entre os segmentos da sílaba ...................................... 93
QUADRO 17 – Ressilabação e silabação ..................................................................... 124
QUADRO 18 – Alteração do padrão silábico da sílaba medial na modalidade escrita 125
QUADRO 19 – Alteração no registro do padrão silábico em fronteira de palavra ....... 126
QUADRO 20 – Alteração no registro do padrão silábico por epêntese ........................ 126
QUADRO 21 – Distribuição dos fatores no processo de .............................................. 127
LISTA DE GRÁFICOS
GRÁFICO 1 – Evolução da Escrita ................................................................................. 56
GRÁFICO 2 – Variação do Onset Complexo ................................................................. 95
GRÁFICO 3 – Cancelamento de Coda em posição final de verbos .............................. 112
LISTA DE SIGLAS E ABREVIAÇÕES
C – Consoante
CCV – Consoante + Consoante + Vogal
CV – Consoante + Vogal
CVC – Consoante + Vogal + Consoante
GU – Gramática Universal
OC – Onset Complexo
PCO – Princípio do Contorno Obrigatório
PIP – Princípio da Integridade Prosódica
PLP – Princípio do Licenciamento Prosódico
PMA – Princípio de Maximização do Ataque
PPE – Princípio de Preservação de Estrutura
PSS – Princípio de Sequenciamento de Sonoridade
SPE – The Sound Pattern of English
SSP – Sonoroty Sequencing Principle
V – Vogal
SUMÁRIO
1 INTRODUÇÃO ................................................................................................................... 14
2 APRESENTAÇÃO DO PROBLEMA ............................................................................... 16 2.1 Objetivos específicos - CCV ............................................................................................. 20 2.1.1 Hipóteses para o padrão CCV ....................................................................................... 20 2.2 Objetivos específicos – (C)VC ......................................................................................... 21
2.2.1 Hipóteses para o padrão (C)VC ..................................................................................... 21
3 A FONOLOGIA .................................................................................................................. 23 3.1 A origem da fonologia gerativa ....................................................................................... 23 3.2 A Fonologia não linear ..................................................................................................... 28
3.3 Teorias da sílaba ............................................................................................................... 32
3.3.1 A estrutura silábica e sua boa formação ....................................................................... 39
3.3.2 A sílaba no Português Brasileiro ................................................................................... 43 3.3.3 Padrões silábicos no Português Brasileiro .................................................................... 44 3.3.4 Sílaba e Sonoridade ........................................................................................................ 46 3.3.5 Silabação e Ressilabação ................................................................................................ 49
4 A ESCRITA E A FONOLOGIA ........................................................................................ 53 4.1 A língua escrita ................................................................................................................. 53
4.2 Relações entre fala e escrita ............................................................................................. 54 4.3 Considerações sobre o início da aquisição da escrita .................................................... 56
4.4 As hipóteses e a hierarquia dos constituintes silábicos ................................................. 60 4.5 A sílaba: um domínio prosódico ...................................................................................... 61 4.6 Interferências na escrita: pontos menos estáveis ........................................................... 63
4.6. 1 Coda: uma posição instável ........................................................................................... 64
4.6. 2 Onset complexo: outro ponto de instabilidade ............................................................. 65
5 METODOLOGIA ................................................................................................................ 66
5.1 Classificação da pesquisa ................................................................................................. 66 5.2 O universo da pesquisa .................................................................................................... 66
5.3 Os Sujeitos ......................................................................................................................... 68 5.4 A atividade proposta ........................................................................................................ 69 5.5 Constituição do corpus ..................................................................................................... 70
5.5. 1 Variáveis não estruturais ............................................................................................... 70 5.5.2 Variáveis Estruturais ...................................................................................................... 70
5.5.3 Onset complexo: variável dependente CCV ................................................................... 71 5.5.3.1 Variáveis independentes definidas para CCV ......................................................... 71 5.5.4 Coda: variável dependente (C)VC .................................................................................. 72
5.5.4.1 Variáveis independentes definidas para (C)VC ....................................................... 73 5.6 Metodologia de análise dos dados .................................................................................. 74 5.6. 1 A codificação dos dados ................................................................................................ 78 5.6. 2 Os arquivos de ocorrências ........................................................................................... 80
6 ANÁLISE E DISCUSSÃO DOS DADOS .......................................................................... 81 6.1 O onset complexo e suas variáveis .................................................................................. 82 6.2 A coda e suas variáveis ..................................................................................................... 97
6.2.1 Os desdobramentos das codificações do primeiro grupo de variável (...) ................... 102
6.2.2 Os três arquivos e análise binomial da coda ............................................................... 105 6.2.2.1 Variação I: Cancelamento de Coda ............................................................................ 105 6.2.2.2 Variação II: Ortografia ............................................................................................... 117
6.2.2.3 Variação III: Posicionamento estrutural na sílaba ...................................................... 122
7 CONSIDERAÇÕES FINAIS ............................................................................................ 129 7.1 O onset complexo ............................................................................................................ 130 7.2 A coda .............................................................................................................................. 131
7.2.1 Variação I: Cancelamento de Coda ............................................................................. 132 7.2.2 Variação II: Ortografia da Coda ................................................................................. 134 7.2.3 Variação III: Posicionamento estrutural na sílaba .................................................... 135 7.3 Concluindo ...................................................................................................................... 135
REFERÊNCIAS ................................................................................................................... 137
ANEXOS ............................................................................................................................... 141
14
1 INTRODUÇÃO
Estudos que abordam as modalidades de fala e de escrita das línguas naturais estão
sempre presentes no leque de interesse de muitos linguistas. Esses estudos se fazem
importantes principalmente quando os pesquisadores interessados são aqueles preocupados
em implementar metodologias mais eficientes no ensino de língua materna. Desse modo, a
compreensão da relação entre as duas modalidades da língua (oral e escrita) é de muita
importância não apenas nas contribuições teóricas e na compreensão do funcionamento das
línguas naturais, mas para uma aplicação prática no ensino e no entendimento da aquisição da
modalidade escrita.
Quando escrevemos uma palavra qualquer, notamos que, ao ler esta palavra, os sons
produzidos nem sempre mantém uma relação biunívoca com a representação do som na
escrita. Isso ocorre devido a certas convenções, regras e normas, muitas das vezes, complexas,
as quais precisam ser apreendidas pelo aprendiz da escrita. Diferentemente da modalidade
falada, a modalidade escrita de uma língua exige um conjunto maior de habilidades a serem
desenvolvidas, tais como a ortografia, a morfologia e a sintaxe dos elementos usados na
interlocução, realizada por meio do texto escrito. Ao contrário da escrita, a fala parece ser
uma tarefa menos árdua, uma vez que é adquirida por volta dos dois anos de idade. Desse
modo, podemos dizer que a fala é adquirida, enquanto a escrita é aprendida. A escrita é uma
representação da fala.
A criança que ainda não está em idade escolar já domina a modalidade oral de sua
língua materna. No entanto, essa mesma criança também já possui uma relação próxima com
a modalidade escrita em muitas situações cotidianas, desde histórias infantis, até propagandas
e cartazes diversos espalhados pelas ruas, ou em revistas e livros em casa. No entanto, o
contato mais direto e sistemático com a escrita se dá no ambiente escolar.
Aprender a escrever parece ser algo simples para os adultos, os quais já dominam o
código. No entanto, para a criança trata-se de um grande desafio. Isso porque a criança precisa
aprender quais são os valores representativos com os quais está lidando. E, quase sempre, som
e letra não mantêm uma relação biunívoca.
Nesse processo de aprendizagem da modalidade escrita, a criança se apoia em um
sistema de representação baseado na fala. É muito comum, por exemplo, que a criança
produza os registros escritos da mesma forma como fala.
15
Nesse contexto, nosso trabalho surge para discutir e analisar a interferência da
modalidade falada da língua nas variações dos padrões silábicos CCV e (C)VC na modalidade
escrita.
Diante de tal interferência, nossa hipótese inicial se baseia na ideia de que o aprendiz
se vale da oralidade como base para construir a modalidade escrita, o que acarreta variações
naturais para os padrões silábicos diferentes do canônico, CV, muitas vezes interpretadas
como “erros ortográficos”.
Para apresentar nosso estudo, dividimos a presente dissertação em seis capítulos mais
as considerações finais. No primeiro capítulo, introduzimos, de forma breve, a temática de
nossa pesquisa. No segundo capítulo, apresentamos, de forma contextualizada, nosso
problema de pesquisa e nossos objetivos, assim como as perguntas e hipóteses que nortearam
este trabalho. No terceiro capítulo, abordamos a Fonologia Autossegmental, base do nosso
referencial teórico. Destacamos o papel da sílaba na compreensão da organização prosódica
da língua. No quarto capítulo, apresentamos uma discussão acerca das relações que a teoria
fonológica proposta mantém com a aquisição da modalidade escrita. No quinto capítulo,
descrevemos a metodologia adotada para a obtenção e análise dos dados. Nesse capítulo,
apresentamos, também, o modo como selecionamos os sujeitos participantes da pesquisa, bem
como a forma com a qual coletamos os dados e realizamos a constituição do corpus. No sexto
capítulo, apresentamos a análise e discussão dos resultados obtidos à luz da teoria que
fundamentou nossa pesquisa. Por fim, apresentamos as considerações finais acerca deste
estudo, as referências e os anexos que compõem este trabalho.
16
2 APRESENTAÇÃO DO PROBLEMA
A língua é um ato que opera uma correlação entre a forma interior do pensamento e o
material fonético (FRANCHI, 1992). Essa operação linguística não é um produto linear,
acabado. Há constantes alterações – sociais, históricas, geográficas, etc. – em sua produção. A
partir do momento em que propomos uma representação dessa língua, enquadramos essa
atividade em um quadro fechado, com variáveis controladas e condensadas. Essa
representação tem um status socialmente definido e, muitas vezes, afasta-se de uma suposta
representação fonética. Dessa forma, temos uma língua e duas modalidades: uma falada e uma
escrita, sendo que a segunda é dependente da primeira.
A modalidade falada é adquirida naturalmente em contextos informais do dia a dia. A
escrita, por sua vez, possui, em nossa sociedade, uma faceta institucional, sendo construída,
na maioria das vezes, no ambiente escolar por um processo conhecido como alfabetização, o
qual compreende o domínio ativo e sistemático das habilidades de ler e de escrever. Esse
domínio da leitura e da escrita é um fato histórico e não natural (MARCUSCHI, 1995). Em
nossa sociedade, esse domínio marca o início do processo de escolarização1 do sujeito, o qual
sempre foi objeto de muita discussão e pesquisa em estudos pedagógicos.
Foi a partir da década de 1980, devido aos altos índices de repetência e evasão escolar
da época, que outras áreas de conhecimento passaram a ter a alfabetização como objeto de
estudo. Como consequência, a alfabetização passou a ser considerada como um processo
multifacetado e de construção complexa.
Nesse cenário, o processo de aquisição da modalidade escrita da língua passa a ser
abordado pela linguística. Sobre isso, Soares et al. (1989) afirma que:
Essa contribuição tem privilegiado, sobretudo nos últimos anos, a alfabetização, o
que se explica pelas razões já mencionadas: de um lado, a gravidade do problema do
reiterado fracasso da escola brasileira em alfabetizar, e, de outro lado, a atual
compreensão de que o processo de alfabetização não se esgota em seus aspectos
pedagógicos e psicológicos, mas exige outras abordagens, entre as quais a análise
linguística desse processo é, sem dúvida, fundamental (SOARES ET AL., 1989, p.
05).
A importância de uma análise de base linguística para a alfabetização é legítima à
medida que consideramos a oralidade como mediadora desse processo, ou seja, é o
conhecimento sobre a modalidade falada de uma língua que controla o aprendizado dessa
1 “A escolarização, por sua vez, é uma prática formal e institucional de ensino que visa a uma formação integral
do indivíduo, sendo que a alfabetização é apenas uma das atribuições/atividades da escola. A escola tem projetos
educacionais amplos, ao passo que a alfabetização é uma habilidade restrita.” (MARCUSCHI, 1995, p. 4)
17
tecnologia, a escrita (OLIVEIRA, 2005, p.09).
De acordo com Alvarenga e Oliveira (1997, p. 128), a aprendizagem da modalidade
escrita de uma língua pressupõe um processo no qual intervêm, necessária e simultaneamente,
três elementos distintos e fundamentais: (A) um sistema sonoro, (B) um sistema gráfico e (C)
um sujeito que (re) constrói essa relação.
Nesse sentido, a aquisição da escrita é a construção de uma modalidade, uma
representação, com características e usos peculiares, que em um primeiro momento é
desenvolvida com base na modalidade falada. Logo, é natural que as crianças recorram, de
forma bastante dinâmica, à oralidade para construir suas hipóteses sobre a escrita, conduzindo
uma análise da própria fala e elaborando propostas de representação que, com o tempo, se
constituirão em representações canônicas da língua (ABAURRE, 1988)
Dessa forma, podemos afirmar que, durante o processo de construção da escrita, o
aprendiz reflete sobre as estruturas de sua língua na modalidade falada e cria hipóteses de
construção para a modalidade escrita. De acordo com Freitas (2007), parece que o fato de
iniciar a aquisição de uma nova modalidade de linguagem – a escrita – faz com que a criança
reapresente dúvidas que vivenciou no momento da aquisição da fala. Nesse sentido, é natural
que, ao apoiar-se na oralidade para construir a escrita, o aprendiz apresente problemas
estruturais que já foram superados na modalidade oral, como, por exemplo, a redução de
padrões silábicos mais complexos em comparação com o padrão canônico, CV.
Para chegar a um ponto de estabilização entre a representação proposta pelo sistema
alfabético e as hipóteses pautadas na fala, há um processo complexo e contínuo de (re)
construção dessa representação, a qual não se restringe a uma simples relação
grafema/fonema, como afirma Oliveira (2001).
[...] a construção de uma escrita alfabética e o domínio das habilidades de leitura
pressupõem a ampliação de padrões acentuais, silábicos e vocabulares, o que
extrapola a simples relação entre sons e letras. Ou seja, há passos muito semelhantes
envolvendo a aquisição da escrita e a aquisição da fala, mas não se pode dizer que as
habilidades já desenvolvidas na fala garantem essas mesmas habilidades na leitura e
na escrita. (OLIVEIRA, 2001, p.02)
Dentro da linguística, são os estudos fonológicos que permitem refletir sobre o que
está além dessa associação. Há uma série de processos que podem interferir na construção
desse novo objeto de conhecimento, já que o falante trabalha com sentenças e palavras e não
com segmentos isolados. Dessa forma, as reflexões do aprendiz ocorrem em contextos mais
amplos que apenas o de um som isolado.
18
Além disso, Abaurre (1998) afirma que o momento inicial da alfabetização coloca o
falante necessariamente às voltas não simplesmente com sílabas, mas com sua estrutura
interna, ou seja, com seus constituintes e com as relações hierárquicas entre eles
estabelecidas.
Nesse contexto, podemos afirmar que, durante esse processo de aquisição, o aprendiz
reproduz sua percepção fonológica das sílabas e, aos poucos, toma ciência dos elementos de
sua estrutura interna, além de ajustar essa percepção fonológica às convenções ortográficas.
[...] podemos pensar que o processo de aquisição da escrita proporciona ao aprendiz
momentos de retomada de conhecimentos já construídos de modo inconsciente,
particularmente daqueles relacionados à fonologia de sua língua, os quais vão se
tornando disponíveis ao acesso consciente, à medida que ele avança no processo de
aquisição da escrita (MIRANDA, MATZENAUER, 2010, p.366).
De acordo com Oliveira (2010), um dos problemas enfrentados pelo aprendiz, durante
o processo de aquisição da escrita, é a correta representação da estrutura silábica. Dessa
forma, as análises silábicas construídas hipoteticamente pelo falante são fundamentais para o
aprendizado do funcionamento desse sistema de representação durante o processo de
aquisição.
Nesse sentido, as questões que envolvem a estrutura da sílaba necessitam de uma
observação que vai além de sua sequência de segmentos. Há questões que só podem ser
discutidas dentro de um quadro teórico específico para a sílaba, já que muitos processos
fonológicos só podem ser explicados por meio de análises de estruturação silábica. Isso reflete
o papel fundamental da sílaba na aquisição da língua, logo, um papel fundamental na
aquisição da modalidade escrita.
Os estudos acerca da sílaba ganharam espaço com o desenvolvimento da Fonologia
Gerativa, a qual proporcionou o surgimento de modelos fonológicos não lineares. Dessa
forma, a sílaba passou a ocupar um lugar privilegiado nos trabalhos de Fonologia
Autossegmental dos estudos contemporâneos, base para nossas discussões.
Na perspectiva da teoria Autossegmental a estrutura silábica é posta sobre uma camada
com posições marcadas para consoantes e vogais, camada CV. Com essa configuração, um
segmento pode associar-se a uma ou mais posições dessa camada, ou, até mesmo, ficar como
elemento flutuante. No entanto, todas as associações são regidas por princípios.
Nesse sentido, a sílaba possui propriedades que não podem ser assumidas por
segmentos isolados, uma vez que ela é uma unidade abstrata de organização prosódica. Há
várias versões teóricas para a sílaba, mas, basicamente, ela é uma unidade linguística com
19
estrutura interna, entre cujos constituintes está estabelecida uma relação hierárquica. Em um
nível superior, a sílaba é constituída por onset2, o qual pode ser ramificado, e pela rima, que é
composta, obrigatoriamente, pelo núcleo e, facultativamente, pela coda. O constituinte
principal da sílaba é o núcleo que, em português, é preenchido apenas por vogal, sendo que os
demais elementos podem ser preenchidos ou não.
As teorias sobre a sílaba se propõem a compreender a existência de regras específicas
na gramática fonológica de uma língua, atestando que sua presença pode ser derivada de
princípios de silabação. Outro ponto importante é que uma vez que a estrutura silábica
organiza as cadeias segmentais em sílabas, ela mesma cria a possibilidade de
condicionamento das regras fonológicas através da referência direta à sua estrutura silábica
(ABAURRE; WETZELS, 1992, p. 10).
Nesse sentido, a análise da sílaba e dos elementos suprassegmentais será contrastada
com as hipóteses de construções dos padrões silábicos CCV e (C)VC no processo de
aquisição da modalidade escrita, de forma que se evidencie e se explique a relação da
complexidade de certos processos fonológicos como omissões, trocas ou inversões de
constituintes silábicos, com base nos princípios de silabação e ressilabação.
Oliveira (2010, p. 83) afirma que a silabação ótima é aquela que privilegia sílabas do
tipo CV, isto é, as sílabas canônicas do português, consoante e vogal. Todas as demais podem
apresentar, em algum momento, durante o processo, um ponto de instabilidade. Podemos
afirmar, então, que, por força dos padrões canônicos da língua, as sílabas diferentes de CV
configuraram um nível maior de instabilidade e, portanto, podem ser fonte de um número
maior de variações na modalidade escrita, tendo em vista a complexidade de sua estrutura
silábica.
De acordo com Abaurre (1988), o grande desafio está em sermos capazes de
interpretar todas as hipóteses que as crianças fazem no momento inicial da aquisição da
escrita, para que, assim, se possa trabalhar a partir dessas hipóteses na busca pela escrita
ortográfica socialmente valorizada.
Nosso problema se coloca com a tentativa de evidenciar e buscar sustentação teórica –
com base na Fonologia Autossegmental – para compreender quais ambientes podem gerar
instabilidade para a construção do padrão silábico com o onset complexo e com coda, no
momento inicial do processo de aquisição da escrita, relacionando-as com processos
fonológicos naturais da língua.
2 Também chamada de “ataque” por alguns autores.
20
A sílaba será nosso ponto de partida para refletir de que forma os processos
fonológicos de silabação e ressilabação impactam na construção da interação entre som e
símbolo, bem como são formuladas as hipóteses de representação e como elas se relacionam
com os ambientes estruturais e não estruturais.
Nesse sentido, o objetivo geral desta pesquisa é analisar e refletir sobre a interferência
da modalidade falada nas variações dos padrões silábicos CCV e (C)VC no processo de
aquisição da modalidade escrita. A nossa hipótese inicial é a de que o aprendiz apoia-se na
oralidade, em um primeiro momento, para construir a escrita, o que acarreta variações
naturais para padrões silábicos diferentes do canônico, ou seja, há uma tendência em
transformar padrões silábicos mais complexos em CV.
Assim, pretendemos analisar a construção dos padrões silábicos CCV e (C)VC, em
análises distintas. Na sequência, iremos verificar os padrões silábicos com seus objetivos
específicos, a fim de identificar, no processo de construção da escrita, elementos que
identifiquem marcas específicas da modalidade falada nas construções desses padrões
silábicos, o que comprovará nossa hipótese inicial.
2.1 Objetivos específicos - CCV
i) Verificar quais são os processos fonológicos que contribuem para a alteração
CCV em CV;
ii) Identificar e descrever as marcas gráficas que revelam reflexões do aprendiz
sobre a constituição hierárquica interna da sílaba;
iii) Identificar e descrever quais variáveis estruturais linguísticas interferem na
alteração desse padrão silábico;
iv) Identificar e descrever quais variáveis não estruturais interferem na alteração
do padrão silábico CCV;
v) Analisar os processos de ressilabação envolvendo o onset complexo.
2.1.1 Hipóteses para o padrão CCV
i) Processos fonológicos, como cancelamento de consoante, epêntese, metátese e
outros, aparecem nas construções silábicas iniciais;
ii) Durante a aquisição da modalidade escrita, o aprendiz reflete sobre
particularidades inerentes à modalidade falada, como, por exemplo, a
21
hierarquização de constituintes da sílaba;
iii) Variáveis estruturais como modo de articulação, vozeamento, vogal da sílaba,
nasalidade vocálica, posição da sílaba na palavra, tonicidade da sílaba, número
de sílabas e classe gramatical podem interferir na construção do padrão
silábico CCV;
iv) Variáveis não estruturais como ano escolar, sexo e classe social podem
interferir na construção do CCV;
v) Há processos de ressilabação envolvendo o onset complexo, como por
exemplo, a inserção de uma vogal epentética para transformar CCV em CV.CV.
2.2 Objetivos específicos – (C)VC
i) Verificar quais são os processos fonológicos que contribuem para a alteração
de (C)VC em CV;
ii) Identificar e descrever qual é o processo mais recorrente para a variação da
coda, cancelamento ou ressilabação;
iii) Identificar e descrever quais variáveis estruturais, linguísticas, interferem na
alteração do padrão silábico (C)VC;
iv) Identificar e descrever quais variáveis não estruturais interferem na alteração
do padrão silábico (C)VC;
v) Identificar o(s) segmento(s) mais vulneráveis à variação ortográfica de sua
representação;
vi) Analisar os processos de ressilabação envolvendo coda.
2.2.1 Hipóteses para o padrão (C)VC
i) Processos fonológicos como cancelamento de consoante, epêntese, metátese
aparecem nas construções silábicas iniciais;
ii) Acreditamos que o cancelamento de coda é a transformação mais recorrente de
(C)VC em (C)V;
iii) Variáveis estruturais como natureza da coda, sonoridade, vogal da sílaba,
posição da sílaba na palavra, tonicidade da sílaba, número de sílabas e classe
gramatical podem interferir na construção do padrão silábico (C)VC;
22
iv) Variáveis não estruturais como ano escolar, sexo e classe social podem
interferir na construção do (C)VC;
v) Com base na oralidade, acreditamos que o erro mais frequente para a coda é a
alteração de /l/, sendo um reflexo da vocalização dessa consoante, frequente na
modalidade falada da língua;
vi) Há processos de ressilabação envolvendo a coda, como, por exemplo, a
inserção de uma vogal epentética para transformar (C)VC em (C)V. CV.
Diante do contexto apresentado, dos nossos objetivos e de nossas hipóteses, bem como
da fundamentação teórica que embasa este trabalho, acreditamos que a presente pesquisa pode
contribuir para discussões teóricas e didáticas acerca do processo de aquisição da modalidade
escrita nos anos iniciais do ensino fundamental. Para tanto, apresentamos no capítulo seguinte
teorias e discussões que têm como principal objetivo fundamentar nossos dados e análises.
23
3 A FONOLOGIA
De acordo com Câmara Jr. (2007, p. 33), por muito tempo a Linguística se contentou
apenas com o aspecto físico da fala, a saber, a articulação e a emissão, isto é, preocupou-se
com o estudo que se chamou de Fonética. Foi a partir do fim do século XIX, com os
pressupostos do linguista russo Baudouim de Courtenay, e, em seguida, com os de Ferdinand
de Saussure e de Edward Sapir, que se deu um passo em direção à abstração psíquica do som.
O som passou a ser compreendido como uma organização em dois níveis diferentes, o nível
fonético e o nível fonêmico/fonológico.
Para Kenstowicz (1994, p.89), um dos fatores que iniciou o desenvolvimento da
Fonologia como um ramo da Linguística (distinta da Fonética) foi a descoberta de que os
falantes nativos julgavam, muitas vezes, sons foneticamente distintos como idênticos, isto é,
como variantes de um mesmo som subjacente, produtos de regras sistemáticas que modificam
o segmento em um determinado contexto.
A fonologia se ocupa da análise do sistema sonoro das línguas naturais. O foco desse
ramo da Linguística, nas versões gerativas e pós-gerativistas, está no processamento mental
da organização dos sons da língua. É a posse desse conhecimento que permite ao falante
perceber as palavras e as sentenças que compõem a fala. Deste modo, a fonologia se preocupa
com essa organização sonora em dois níveis: o nível de fonologia sistemática de caráter
abstrato e o nível da fonética sistemática de caráter concreto. A conversão de um nível em
outro se dá em através de processos fonológicos, entre eles os processos de estrutura silábica.
A Fonética também é uma ciência que estuda o som, mas seu principal objeto de é a
realização física, isto é, a articulação, a acústica e a percepção. Assim, a Fonética se dedica a
todos os sons que podem ser reproduzidos pelo aparelho fonador, enquanto a Fonologia se
dedica a entender como esses sons são organizados e combinados para que haja comunicação.
Essas abstrações mentais analisadas pela Fonologia são chamadas de “fonemas”.
3.1 A origem da fonologia gerativa
Os estudos linguísticos tomaram novos rumos a partir do século XX, passando a focar
nas estruturas, seja pelo viés psicológico, como em Saussure e Chomsky, seja pelo viés físico,
como no estruturalismo americano, que era de caráter antimentalista.
Na década de 1950, surgiu a Teoria Gerativa, com a publicação do livro “Syntactic
structures” de Noam Chomsky. Essa publicação rompeu alguns padrões estabelecidos pelos
24
estudos estruturalistas anteriores. Nos pressupostos gerativistas, o pesquisador posiciona-se a
favor de uma faculdade de linguagem que corresponda a uma composição genética do ser
humano, com capacidade inata para gerar estruturas sintáticas de uma língua, de forma
inconsciente – esse contexto é frequentemente chamado de “revolução cognitiva”3.
Esse domínio da linguagem sempre esteve presente nas discussões concernentes à
Filosofia, em especial à Filosofia da Linguagem. Todavia, é com a Gramática Gerativa que se
propõe um novo eixo, no qual o foco está na capacidade inata do sujeito de adquirir e dominar
sua língua natural.
Os estudos gerativistas estavam voltados para as características internas das línguas;
questionava-se a capacidade de gerar, de produzir e de interagir com expressões novas,
naturalmente, atribuindo significados e manipulando seu uso. Nesse sentido, Chomsky parte
do pressuposto de que a língua é um sistema de conhecimentos interiorizados e tem como
base um processo de aquisição inato, inconsciente. Para o autor, a gramática de uma língua
fornece dados ordenados, os quais permitem ao falante estabelecer sua competência
linguística nativa da forma mais natural possível. Nesse contexto, o que mais surpreende os
estudiosos da área são características como a autonomia, a eficiência e a rapidez com que
ocorre o processo de aquisição da linguagem.
De acordo com a Teoria Gerativa, a faculdade de linguagem “parece ser uma
verdadeira 'propriedade da espécie' variando pouco entre as pessoas e sem um correlato
significativo em qualquer outra parte. ” (CHOMSKY, 1998, p.17). Poderíamos comparar a
linguagem com um órgão do corpo, uma vez que é parte integrante do nosso organismo. Em
outras palavras, todo ser humano nasce com a mesma capacidade cognitiva para desenvolver
plenamente as relações sintáticas de sua língua.
Vale ressaltar que o interesse de Chomsky está na competência do falante, ou seja, no
conhecimento tácito, implícito, da língua. Os principais questionamentos no âmbito dos
estudos gerativistas recaem sobre o conhecimento das relações estruturais possíveis de uma
língua, as quais são articuladas sem a reflexão consciente do falante. Por outro lado, o
desempenho é entendido como o uso que o falante faz da competência em uma determinada
situação.
Nesse viés, Chomsky afirma que
3 “A perspectiva cognitiva vê o comportamento e seus produtos não como um objeto de investigação, mas como
dados que podem fornecer evidências sobre os mecanismos internos da mente e os modos como esses
mecanismos operam ao executar ações e interpretar experiências” (CHOMSKY, 1998, p. 21)
25
[...] o órgão da linguagem é a faculdade de linguagem (FL); a teoria do estado inicial
da FL, uma expressão dos genes, é a gramática universal (GU); as teorias de estados
atingidos são as gramáticas particulares; os estados propriamente ditos são as
línguas internas, 'línguas'[...] (CHOMSKY, 2006, p.77).
Os gerativistas buscavam, então, uma “adequação explicativa” que sustentasse um
modelo de Gramática Universal (GU). Esse modelo deveria mostrar que cada língua é uma
manifestação particular do estado inicial do “órgão” da linguagem, uma estrutura, a princípio,
invariante.
Chomsky (2006) compara o estado inicial da faculdade da linguagem a uma rede de
relações constituídas por princípios e controladas por parâmetros. Em outras palavras,
nasceríamos com uma rede sintática estabelecida, mas pronta para ser arranjada pelas
condições empíricas, nas quais pequenas alterações poderiam gerar impactos em todo o
sistema.
A Gramática Universal, em particular,é um sistema de princípios universais, alguns
dos quais contém parâmetros, pontos de escolha que podem ser fixados de uma
determinada maneira, dentre um número limitado de maneiras. Uma gramática
particular, então, é imediatamente derivada da Gramática Universal, por meio da
fixação de parâmetros em um determinado modo [...] (CHOMSKY, 2006, p.16).
Nesse contexto, é possível afirmar que língua não se limita a um corpus, um molde
finito de possibilidades; ela é, conforme já afirmava Humboldt (1936), “o uso infinito de
meios finitos”. Trata-se, portanto, de uma infinidade de possibilidades em um conjunto
restrito. Chomsky considera a língua como “um sistema aberto e criativo e, por isso,
disponível ao atendimento das necessidades e intenções das mais variadas condições de
comunicação. ” (CHOMSKY apud FRANCHI, 1992, p.26).
De acordo com Kenstowicz (1994, p. 1), o maior problema dos linguistas gerativistas
estava em resolver o que Chomsky (1986) chamava de “Plato's problem” – Problema de
Platão.
Platão foi um importante filósofo grego, que viveu em Atenas entre 428/427 e 348/347
a.C. Ele mostrou, em vários momentos de sua obra, sua perplexidade diante da capacidade
humana de armazenar conhecimentos e habilidades ao longo da vida. Desse modo, para
Platão, era surpreendente o fato de a espécie humana adquirir tanto conhecimento com base
em uma experiência de vida tão breve e tão fracionada. (KENEDI, 2013, p. 61). O Problema
de Platão levou Chomsky a questionar o fato de uma criança ser capaz de, em poucos anos de
contato com a língua em seu ambiente e sem passar por algum tipo de treinamento específico
e intensivo, adquirir conhecimento acerca da estrutura de sua língua.
26
Desse modo, os gerativistas consideram que as línguas são similares ou mesmo
idênticas em sua estrutura subjacente, visto que todas se desenvolvem a partir de um mesmo
núcleo comum, sendo que as diferenças entre elas estão na escolha de um conjunto de opções
de parametrização da língua. Em outras palavras, podemos entender, de forma análoga, que
todas as línguas possuem o mesmo hardware (Gramática Universal), sendo que o que muda é
o software, o qual parametriza cada língua.
É com base nesses princípios gerativistas que a Fonologia Gerativa é apresentada, em
1968, com a publicação do livro The Sound Pattern of English (SPE) – trabalho de Noam
Chomsky e Morris Halle (1968). Essa proposta de Fonologia derrubou o modelo até então
estruturalista, limitado por não ter um nível explicativo e por conflitar os níveis descritivos.
De acordo com Alvarenga (1993), a ideia de base da Fonologia Gerativa é a suposição
de que existe um conjunto mental de regras que tem como função transformar as estruturas
fonológicas profundas, subjacentes, em representações fonéticas superficiais. Nesse caso, o
autor resume o modelo gerativo padrão como
[...] a existência de dois níveis fonológicos: o nível de representação lexical e o nível
de transformações, o conjunto das regras que modificam as representações lexicais
em representação fonética de superfície. Todos os fenômenos fonológicos devem ser
analisados em uma única direção: a linha dos segmentos. ” (ALVARENGA,1993,
p.10-11, tradução livre)4.
Basicamente, a gramática contém dois níveis de representação para a estrutura
fonológica: a representação subjacente, que contém apenas informações imprevisíveis,
distintas, para cada item lexical; e a representação fonética, aquela que emerge. São as regras
e os princípios gramaticais que adicionam os traços previsíveis no nível subjacente.
Segundo esse modelo, Hernandorena (2001) afirma que
[...] o componente fonológico tem, como input o fluxo da fala estruturalmente
analisado, e como output, uma representação fonética dessa cadeia de fala. A
representação fonética consiste em uma sequência de segmentos fonéticos, os quais
são um conjunto de especificações de traços, isto é, de propriedades mínimas como
“nasalidade”, “sonoridade” e outras. A representação fonológica consiste na
representação mental dos itens lexicais em que “conjuntos de especificações de
traços fonológicos” podem manter uma correspondência unívoca ou não com o
conjunto de traços fonéticos (HERNANDORENA, 2001, p.16)
4 “[...] l'existence de deux niveaux phonologiques: le niveau de la représentation lexicale et le niveau des
transformations, l'ensemble des règles qui modifient les représentations lexicales en représentation phonétiques
de surface. Tous les phénomènes phonologiques doivent être analysés selon une seule direction: la ligne des
segments (ALVARENGA, 1993, p.10-11) .
27
Nesse caso, o falante adquire uma espécie de codificação do vocabulário da língua,
que é memorizado durante a aquisição da linguagem. Esse vocabulário seria estocado em
função de traços marcados, os quais seriam usados para distinguir e formar um determinado
“gesto” fonético. Esse “gesto” fonético implicaria na formação de um som, que tem por
função representar uma unidade mínima na fala, o segmento – um fonema.
A codificação é posta como uma atribuição de traços que marcam uma configuração
fonética assumida pelo aparelho vocal em ordem de articulação para o som correspondente.
Essa constituição de traços pode ser definida como o cruzamento de uma classificação de um
inventário de possíveis sons da fala. Em geral, cada traço tem uma posição binária, isto é,
compreende dois valores possíveis (+ ou -) e tem uma característica articulatória própria e um
som correlato. Por essa perspectiva, os segmentos fonológicos seriam matrizes de traços.
Para Kenstowicz (1994), há duas consequências positivas para essa configuração de
matrizes de traços: (i) formalizar uma noção de distância fonológica dos termos especificados
e (ii) compreender os motivos que tornam um conjunto de segmentos mais naturais que
outros. A grande contribuição da visão dos traços é que um som tende a ser padronizado com
certos outros sons no tecido total de uma língua. Essa padronização transforma os sons em
determinados agrupamentos, chamados de “classes naturais”. Isso manifesta uma forma
particular da Gramática Universal (GU) na organização de informações que determinam como
as línguas humanas são articuladas e percebidas. Assim, um sistema adequado deve ser capaz
de resolver qualquer som de qualquer língua através das propriedades de traços.
Desse modo, uma determinada sequência de sons pode ser dissecada em função de
traços binários representados por um determinado segmento, os quais serão analisados
linearmente, de acordo com a sequência dos fonemas encadeados. Cada segmento
corresponde a uma única especificação de traços e, por conseguinte, uma especificação de
traços corresponde a um segmento. Temos, então, uma relação “biunívoca”, um-para-um,
portanto, uma visão linear da Fonologia.
É nesse ponto que há um entrave metodológico para questões que exigem uma análise
e manipulação de dados que vá além da linearidade e das matrizes de propriedade, como, por
exemplo, pitch5, duração e tom. Dessa forma, pode-se afirmar que o modelo fonológico linear
descarta os elementos prosódicos da fala na análise dos dados.
5 A altura
28
3.2 A Fonologia não linear
A Fonologia Gerativa avançou rapidamente, em termos conceituais e metodológicos.
De acordo com Abaurre, em menos de duas décadas a Fonologia Gerativa desenvolveu um
quadro formal e articulado, o qual, mais do que uma teoria integrada, representa uma série de
diferentes subteorias globalmente conhecidas como fonologias não lineares. (ABAURRE;
WETZELS, 1992, p. 5).
A partir dessa teoria, propõe-se um quadro teórico que permite a associação de um
segmento a mais de um traço ou a nenhum. O segmento passa a ser visto como um elemento
que pode exibir uma determinada independência fonológica em relação aos seus traços
distintivos. Observa-se que existem propriedades nos traços que podem ser conectadas ou
desconectadas entre os segmentos, isto é, um segmento pode apagar um traço ou manifestar
um traço não característico. Portanto, temos segmentos autônomos, autossegmentos.
Em relação a essa visão autossegmental, Abaurre e Wetzels afirmam que
A teoria autossegmental de Goldsmith (1976) é basicamente uma versão enriquecida
da fonologia gerativa clássica, porque abole a restrição de bijectividade. Nesse
modelo, propõe-se: 1) alguns traços tem, cada um, seu próprio nível de
“segmentalização” (ou camada autossegmental); 2) o número de autossegmentos
não corresponde necessariamente ao número de fonemas presentes em uma
determinada sequência; e 3) os autossegmentos estão ligados a suas unidades
segmentais por meio de linhas de associação [...] ( ABAURRE; WETZELS,1992, p.
6)
O grande marco da teoria autossegmental foi romper com a relação “biunívoca”, de
modo que a relação um-para-um foi descartada. A partir de então, passou-se a evidenciar que
as relações não lineares permeiam a representação fonológica. Esse ponto de vista pode ser
representado abstratamente com a figura a seguir, em que um fragmento F pode ser
distribuído em mais de uma posição.
29
Figura 1 – Extensão de um traço adjacente6
Fonte: (KENSTOWICZ, 1994, p. 310).
Esse novo olhar sobre os traços foi demonstrado pelo estudo de línguas tonais. De
acordo com esses estudos, o tom comporta-se independentemente de outros traços. Isso
possibilitou seu isolamento em uma camada independente do segmento, portanto age
livremente. A esse respeito, Alvarenga afirma que
Este modelo, que funciona de forma satisfatória para uma grande parte das
representações fonológicas, está enfrentando dificuldades para explicar os
fenômenos que envolvem uma organização não linear dos traços da fala. A
dificuldade é intransponível no caso das línguas tonais, como muitas línguas
asiáticas e africanas, onde o padrão de distribuição de tons é colocado livremente em
relação aos segmentos com os quais esses tons se realizam (ALVARENGA, 1993,
p.11, tradução livre).7
Ainda de acordo com o autor, uma representação tonal típica é a seguinte:
Figura 2 – Uma representação tonal típica
t t t t
H H H L
H: tom alto
L: tom baixo
T: unidade portadora de tom
Fonte: (ALVARENGA, 1993, p. 11)
Um dos exemplos que Kenstowicz (1994, p. 312) coloca para demonstrar a
necessidade da independência dos segmentos é a língua tchadiana Margi, falada na Nigéria.
De acordo com o autor, essa língua ilustra bem alguns dos problemas conceituais que surgem
6 A figura representa que um traço característico de [F] pode ser distribuído a outras posições (segmentos). Nessa
concepção temos “autossegmentos”, isto é, os segmentos fonológicos possuem uma certa independência em
relação aos seus traços. 7 “Ce modele, qui fonctionne de façon satisfaisante pour une grande partie des represéntations phonologiques, se
trouve confronté à des difficultés pour expliquer des phénomènes qui supposent une organisation non unilinéaire
des traits de la parole. La difficulté devient insurmontable dans le cas des langues tonales, comme de nombreuses
langues asiatiques et africaines, pour lesquelles le patron de distribution des tons se place très librement par
rapport aux segments avec lesquels ces tons se réalisent.” (ALVARENGA, 1993, p.11)
(1) Âncora
Traço
X X
F
30
quando o tom é tratado como um traço do segmento vocálico no modelo linear, pois Margi
contrasta três tons em uma única sílaba.
A explicação lógica obtida pela análise dos dados é que a gramática do Margi analisa
o levantamento de tons, como a concatenação de um tom baixo seguido por um tom alto. Essa
sequência tem um ponto intermediário de tom que poderia ser marcado como
[+levantamento], o que contraria a premissa básica do modelo linear, no qual os traços são
binários.
John Goldsmith (1976 apud KENSTOWICZ, 1994) propõe uma solução para o
problema conceitual colocado pelo tom. De acordo com suas pesquisas, a falha estava no
método de representação fonológica do modelo padrão linear. Assim, o autor sugere que seja
permitida sobreposição de traço e propõe que uma palavra possa ser analisada em uma
representação com duas camadas (níveis): uma tonal e uma linear.
Portanto, a base do trabalho do modelo autossegmental de Goldsmith se ancora na
ideia de que o tom ocupa uma camada separada dos fonemas segmentais associados. Dessa
forma, há possibilidade de haver múltiplas associações, vogais sem tons subjacentes e tons
latentes.
Depois do trabalho de Goldsmith, pesquisadores começaram a considerar um modelo
segmental para a resolução de outros problemas fonológicos. Nesse contexto, Kenstowicz
destaca o trabalho de McCarthy sobre o semítico. Em seus estudos, McCarthy (1979/1981
apud KENSTOWICZ, 1994) mostrou que um problema notório da raiz e do padrão
morfológico nessas línguas poderia ser resolvido se uma palavra fosse analisada em termos de
morfema de raiz, associado a um modelo CVCVC, da mesma forma que uma melodia tonal
baixo/alto.
Alvarenga (1993) resume as descobertas de McCarthy da seguinte forma:
Segundo McCarthy (1981), a estrutura morfológica de um verbo árabe é organizada
em três componentes independentes: 1) sequência de consoantes, que dá o conteúdo
lexical; 2) sequência de vogais, que indicam a categoria morfológica de aspecto e de
voz verbal; 3) padrão silábico de consoantes e vogais, que indicam a categoria
derivacional [...] Assim, em vez de uma representação em um único plano,
McCarthy propôs uma representação fonológica subjacente em três camadas,
correspondendo respectivamente: consoantes, elementos silábicos C e V e vogais
(ALVARENGA, 1993, p.11-12, tradução livre). 8
8 “Selon McCarthy (1981), la structure morphologique d’um verbe arabe est organisée en trois composants
indépendants: 1) la suite des consonnes, qui donne le contenu lexical; 2) la suite des voyelles, qui indique la
catégorie morphologique d’aspect et de voix verbale; 3) le patron syllabique des consonnes et des voyelles, qui
indique la catégorie dérivationnelle. [...] Ainsi, au lieu d’une représentation sur um seul plan, McCarthy a
proposé une représentation phonologique sous-jacente en trois couches, correspondant respectivement aux
consonnes, aux éléments syllabiques C e V, et aux voyelles.” (ALVARENGA, 1993, p.11-12)
31
Vejamos um exemplo dessa estrutura na figura a seguir:
Figura 3 – Exemplo de um verbo árabe
k t b ktb (escrever)
C V VC V C CVVCVC (padrão silábico)
u i ui (passivo perfeito)
verbo conjugado: kuutib
Fonte: (KENSTOWICZ, 1994, p. 398)
De acordo com Alvarenga (1993), essa nova abordagem multilinear, ou plurilinear, foi
estendida para além do tom e da morfologia árabe e também é aplicada à harmonia vocálica,
assimilação entre segmentos, estrutura silábica, duração fonológica, alongamento
compensatório, acento, entonação etc. Para o autor, essa concepção fonológica revolucionou a
análise das línguas ocidentais.
Com interpretação semelhante, Abaurre e Wetzels (1992) afirmam que:
Tornou-se rapidamente claro que cada traço poderia exibir pelo menos algum grau
de independência fonológica, assim como todos os traços poderiam estar
individualmente envolvidos em processo de assimilação, dissimilação, epêntese,
apagamento, propagação harmônica, ou então poderiam apresentar um efeito
bloqueador com relação a processos de espalhamento (ABAURRE; WETZELS,
p.7).
Clements e Keyser (1983), a partir dessa perspectiva não linear, desenvolveram um
modelo de até três dimensões de representação fonológica com base na distinção fundamental
entre um fonema e a posição que ele ocupa na estrutura fonológica, em uma relação de um-
para-muitos, base para a concepção de uma multilinearidade.
Os autores afirmam que a noção de camada CV não é nova em fonologia. Na teoria
tradicional e estruturalista, restrições canônicas nas estruturas de certas unidades foram
frequentemente formuladas em termos de sequências de unidades abstratas C e V. A diferença
está no status desses elementos; na teoria tradicional, elas eram apenas variáveis pertencendo
exclusivamente ao vocabulário da descrição fonológica, enquanto na teoria “CV” elas são
consideradas entidades da representação fonológica formal separadas em consoantes e vogais
e organizadas em camadas independentes. (CLEMENTS; KEYSER ,1983, p. 9).
32
Clements e Keyser (1983) também destacam os estudos de McCarthy e o colocam
como base de seu trabalho, juntamente com os trabalhos de Halle e Vergnaud (1980).
Contudo, na concepção de McCarthy, o uso das unidades CV difere por uma questão de
perspectiva. McCarthy reconheceu o status independente da camada CV no árabe clássico
com base no fato de que certas sequências CV funcionam como morfemas independentes
nessa língua. Assim, ele os nomeou como morfemas de modelos prosódicos, o que fornece
uma base impressionante para a morfologia não concatenativa.
O olhar de Clements e Keyser está voltado para a fonologia silábica. Os autores nos
fornecem evidências de que a camada CV é um componente da representação subjacente,
independente de seu funcionamento no componente da formação de palavra.
Para Alvarenga (1993), a grande contribuição da proposta de Clements e Keyser
(1983) foi distinguir as posições funcionais na sílaba – os núcleos e as margens. Nessa
abordagem, a sílaba passa a ocupar um papel fundamental nas análises descritivas da Teoria
Fonológica.
Halle e Verganaud (1980 apud CLEMENTS; KEYSER ,1983, p. 9sugerem que a
camada CV também pode ser chamada de skeleton – camada esqueletal – da representação
subjacente. A noção de camada CV (ou esqueletal) é fundamental para o trabalho aqui
proposto. Isso porque, de acordo com Clements e Keyser, com a camada CV, todas as
generalizações fonológicas que motivam o reconhecimento da sílaba podem ser prontamente
capturadas sem a necessidade de mais aparato notacional.
Para compreender melhor o funcionamento de tal camada, apresentamos a seguir as
teorias que surgiram em torno da sílaba.
3.3 Teorias da sílaba
A fonologia autossegmental trouxe uma nova perspectiva para a sílaba, até então
deixada de lado pela Fonologia Gerativa padrão. Kenstowicz (1994, p. 250) considera que
uma razão para a sílaba ter ficado de lado, até então, deve-se ao fato de ela não ter nenhum
correlato fonético uniforme ou direto. A sílaba não é um som, mas uma unidade abstrata da
organização prosódica, através da qual a linguagem expressa muito de sua fonologia. Além
disso, a forma exata da sílaba varia de uma língua para outra.
Nos estudos contemporâneos, os modelos fonológicos proporcionaram que a sílaba
seja interpretada como uma organização hierárquica, possível de ser dissecada e disposta em
camadas individuais. Essas camadas manteriam entre si uma relação lógica e virtual,
33
dominadas pela prosódia da língua em análise. Como consequência, a sílaba passou a ter um
papel privilegiado dentro da Fonologia.
Kenstowicz (1994, p. 250) apresenta três justificativas para a importância da sílaba: (i)
a sílaba é um domínio natural para a afirmação de muitas restrições fonotáticas; (ii) as regras
fonológicas são frequentemente apresentadas de forma mais simples e esclarecedora quando
se referem explicitamente à sílaba; (iii) os diversos processos fonológicos são melhor
interpretados como métodos quando asseguram que a sequência de segmentos fonológicos
seja analisável através de sílabas.
Clements e Keyser (1983, p. 25) explicam que uma teoria universal da sílaba tem três
tarefas específicas. A primeira tarefa consiste no fato de que a sílaba deve especificar
expressões bem formadas da teoria. Assim, ela fornece uma notação na qual as unidades
silábicas são construídas junto com uma caracterização de matrizes admissíveis de unidades
alfabéticas. A segunda tarefa condiz com fato de que ela deve especificar parâmetros ao longo
do qual as línguas individuais variam em sua escolha de tipos silábicos. A terceira tarefa, por
sua vez, reside no fato de que a sílaba deve caracterizar a classe de regras particulares de uma
língua, as quais modificam ou ampliam a representação silábica adjacente (regras de
silabação), e explicar como essas regras são integradas dentro de uma organização geral do
componente fonológico.
Uma proposta de teoria hierárquica da sílaba foi oferecida por Kahn (1976 apud
KENSTOWICZ, 1994). Em sua proposta, o autor estende a noção de representação
fonológica proposta por Chomsky e Halle (1968) no SPE – “The Sound Pattern of English” –
inserindo uma nova camada com um “nó sílaba” – representado por S –, em que os segmentos
são associados, através de linhas, a um determinado nó sílaba.
De acordo com Clements e Keyser (1983, p. 4), o trabalho de Kahn apresenta
vantagens teóricas convincentes para que a sílaba seja reconhecida como uma unidade
hierárquica. O bom desempenho de seus estudos se deu através da distinção entre fraco e forte
no sistema de acento do inglês. No entanto, algumas questões permaneceram sem respostas,
principalmente porque o pesquisador falhou na caracterização de “sequências iniciais
possíveis” e “sequências finais possíveis”.
Como consequência, suas análises ficaram restritas à análise da língua inglesa, além de
não especificar os pontos da derivação fonológica envolvidos na construção silábica. Dessa
forma, sua análise não foi capaz de apresentar uma afirmação universal e explicar os
processos de construção de sílaba.
34
Nos estudos subsequentes, a teoria fonológica passou a tratar a sílaba por meio de uma
representação em árvore9, com galhos binários e sem limite superior, dando suporte à ideia de
que o comprimento dessa árvore dependeria do número de elementos da sílaba. Mas, segundo
Clements e Keyser (1993), uma não restrição de “galhos” na representação em árvore poderia
gerar um número alto de possibilidades de combinação a partir de CV nas línguas naturais.
Dessa forma, fez-se necessária a colocação de uma restrição material.
Outro problema ressaltado pelos autores está na análise de sílaba leve e pesada. De
acordo com eles, as evidências mostram que em muitas línguas as regras prosódicas tratam
igualmente essas sequências. No entanto, a disposição metodológica de árvores binárias
também apresenta algumas incoerências para essa disposição. Observe que V: (vogal longa) e
VC (vogal breve mais consoante) têm a mesma construção arbórea, pois são equivalentes.
Mas, se acrescentarmos uma consoante à direita, essa equivalência estrutural desaparecerá.
Observe os exemplos a seguir.
Figura 4 – Sílaba hipotética (I)
1a) Sílaba
S
W S W
p a:
[pa:]
1b) Sílaba
W S
S W
p a m
[pa:m]
Fonte: (CLEMENTS e KEYSER, 1983, p. 7)
9 A Fonologia se vale do modelo de representação arbórea usado pela Sintaxe, o qual apresenta os elementos
concatenados de dois a dois para a formação de um sintagma, sendo que, na Fonologia, os elementos são
concatenados para a formação da sílaba.
35
Figura 5 – Sílaba hipotética (II)
2a) Sílaba
W S
S W
S W
p a p
[pa:p]
2b) Sílaba
W S
S W
S W
p a m p
[pamp]
Fonte: (CLEMENTS e KEYSER, 1983, p. 7)
Nos exemplos de (1a) e (1b), temos a mesma estrutura hierárquica, o que não ocorre
com (2a) e (2b). Nesse caso, houve uma interferência na constituição arbórea devido ao
acréscimo de uma consoante – interferência de final da sílaba. Se considerarmos apenas os
exemplos (1a) e (2a), também ocorre mudança estrutural. No exemplo (2a), a vogal não mais
constitui um elemento longo e passa a ser dominado por SS, enquanto que em (1a) é
dominado por SW10.
Diante disso, Clements e Keyser concluem que “uma teoria fonológica adequada deve
prover uma caracterização uniforme das noções de sílaba ‘pesada’ e ‘leve’. (CLEMENTS;
KEYSER, 1983, p. 8, tradução livre)11. Nesse sentido, os autores complementam:
[...] Nós desejamos explorar uma nova abordagem para a sílaba. Nessa teoria, que
expande minimamente o quadro proposto por Kahn (1976), introduzimos uma
terceira camada na representação da sílaba, localizada entre a camada silábica e a
camada segmental, e que chamamos de camada CV (CLEMENTS; KEYSER, 1983,
p. 8, tradução livre) 12.
10 Nesse contexto, “S” representa strong (forte) e W representa weak (fraco). 11 “This suggests that an adequate phonological theory should provide a uniform characterization of the notions
“heavy” and “light” syllable” ” (CLEMENTS; KEYSER, 1983, p. 8) 12 “[...] we wish to explore a new approach to the syllable. In this theory, which minimally extends the
framework of Kahn (1976), we introduce a third tier in syllable representation which mediates between the
syllable tier and the segmental tier and which we call the CV-tier.” (CLEMENTS; KEYSER, 1983, p. 8)
36
Os autores afirmam, ainda, que a camada CV não é somente ou primariamente um
constituinte de análise morfológica, mas serve, em representação fonológica, para distinguir
posições funcionais da sílaba.
Para os teóricos, essa perspectiva coloca o foco na sílaba, já que as unidades da
camada CV definem por elas mesmas sua posição funcional, os picos e os não picos, na
sílaba. A hierarquização é projetada de acordo com a posição do elemento dentro da sílaba e,
não mais, pelo segmento.
[...] Na presente teoria a distinção entre "C" e "V" já não é mais redundante, uma vez
que as unidades das, elas mesmas, definem as posições funcionais (pico e não pico)
dentro da sílaba. Com relação a isso, a camada CV pode ser vista como
incorporadora da função de uma categoria de traço prévia [silábico]. No entanto, os
elementos da camada CV não são meramente análogos aos recursos [+ silábicos) e [-
silábicos], mas servem a uma função adicional, e igualmente importante, de definir
as unidades primitivas de sincronismo no nível subsilábico da representação
fonológica (CLEMENTS; KEYSER, 1983, p. 10-11, tradução livre)13.
Para Clements e Keyser (1983), o núcleo silábico é uma categoria de organização
prosódica dependente, mas formalmente distinto da sílaba. Assim, a distinção entre sílabas
leves e pesadas pode ser acomodada em termos da distinção entre núcleo simples e
ramificado. Os autores dispensam o status formal do onset e da coda por não haver evidências
linguísticas sugerindo que as regras fonológicas sempre fazem referências cruciais às
categorias onset e coda.
Assim, parece que o conjunto de condições de estrutura silábica, que define o
conjunto de sílabas bem formadas para cada língua pode ser estabelecido de modo
completamente adequado no que se refere às categorias “sílabas” e “núcleos”
(CLEMENTS; KEYSER, 1983, p.15, tradução livre)14.
Dessa forma, os autores propõem o seguinte enriquecimento mínimo da teoria de três
camadas da estrutura silábica. Eles sugerem que a representação fonológica envolva, em
adição à camada silábica, a camada CV e a camada segmental, outra camada nomeada de
“camada núcleo”, ligada a pelo menos um elemento e, no máximo, a dois da camada CV.
13 In the present theory the distinction between "C" and "V" is no longer redundant since the units of the CV-tier
themselves define functional positions (peak and nonpeak) within the syllable. In this respect the CV-tier can be
seen as subsuming the function of the earlier feature category [syllabic]. However, the elements of the CV-tier
are not merely analogues of the features [+syllabic) and [-syllabic], but serve the additional and equally
important function of defining the primitive units of timing at the sub-syllabic level of phonological
representation.” (CLEMENTS; KEYSER, 1983, p. 10-11).
14 “Thus, it appears that the set of syllable structure conditions defining the set of well-formed syllables for each
language can be stated with complete adequacy with reference to the categories “syllable” and “nucleus”.”
(CLEMENTS; KEYSER, 1983, p.15).
37
Em outras palavras, os autores propõem uma camada núcleo não como um
subconstituinte da sílaba, mas como uma camada de unidade prosódica independente em um
plano separado de representação.
Para eles, é possível demonstrar que a camada CV pode prontamente capturar todas as
generalizações fonológicas que envolvem processos de instabilidade da sílaba, por uma
análise descritiva que se restringe à Fonologia.
A respeito da pluralidade dos planos da fonologia autossegmental, Alvarenga (1993)
sugere que haja um ponto de convergência, um ponto neutro, no qual todas as linhas ou
camadas possam se encontrar. Ele define esse ponto como o “esqueleto”, projetado por
Clements e Keyser (1983), como a sequência CV.
Alvarenga segue os pressupostos de Clements e Keyser com base na interpretação de
Encrevé (1988), que adota os três níveis/camadas, propostas por Clements e Keyser (1983),
com o acréscimo de dois subníveis na camada da sílaba. Desse modo, temos, na primeira
camada, “a linha silábica organizada de uma maneira hierárquica em dois subníveis: a linha
do ataque (A) e da rima (R), a linha da rima se decompõe em núcleo (N) e coda (C)” 15; na
segunda e na terceira camadas, teremos, respectivamente, esqueleto (um nível de posições
puras) e segmento.
Para Kenstowicz (1994), a sílaba tem sido tradicionalmente vista como contendo
obrigatoriamente um núcleo, que pode ou não ser precedido por uma consoante (onset), e
pode ou não ser seguido por outra consoante (coda). A junção do núcleo com a coda é mais
forte do que a junção do onset com o núcleo. Consequentemente, a literatura tradicional
reconhece a adição de um subconstituinte: a rima – que inclui o núcleo e a coda (elo mais
forte). Dessa forma, o autor afirma que é possível atribuirmos ao núcleo um status especial, a
obrigatoriedade.
Para Kenstowicz, as formatações [CV, VC, V, CVC] constituem um inventário
primitivo das línguas, isto é, a partir desse inventário surgem configurações mais complexas.
O autor destaca o núcleo como um elemento constante na formatação das sílabas, além de ter
um tom ótimo ou carregar o acento da sílaba.
Já Clements e Keyser propõem que o primeiro conjunto de tipos silábicos compreende
a seguinte sequência [CV, V, CVC, VC]. O primeiro tipo existe em todas as línguas, enquanto
os demais podem existir ou não. Para os autores, o tipo VC é considerado como consequência
15 “[...] La ligne syllabique organisée d’une manière hièrarchique en deux sous-niveaux: la ligne des attaques (A)
et des rimes (R), la ligne rime se décomposant em noyau (N) et coda (C).” (ALVARENGA, 1993, p.14)
38
dos anteriores. Portanto, a língua que possui VC também possui os anteriores. Clements e
Keyser afirmam, ainda, que, a partir do tipo silábico CV, é possível produzir os outros tipos
silábicos com apenas duas operações: i) apagar o C inicial da sílaba, e ii) inserir um C no final
da sílaba. Para as línguas que possuem mais de um elemento V ou C na sequência CV, pode
ser resultado de uma expansão lógica. Isto é, cada língua monta sua notação silábica, em
termos de sílaba máxima. Dessa forma, o inventário silábico pode ser expandido como C* e
V* (em que o símbolo * representa um ou mais). Isso sugere o seguinte esquema: C (*) V (*)
(C (*)).
Retomando as considerações propostas por Kenstowicz, estas refletem a teoria de
representação silábica desenvolvida por Levin (1985 apud KENSTOWICZ, 1994). De acordo
com os postulados de Levin, a sílaba seria uma projeção de uma categoria primitiva simples, a
saber, o núcleo, de modo que a coda poderia ser definida como complemento, e o onset, como
especificador. Dessa maneira, a rima seria a primeira projeção da sílaba.
Considerando o núcleo como a base da sílaba, podemos afirmar que esta é construída a
partir do núcleo, isto é, para fora dele. Em consequência, podemos afirmar que todas as
línguas possuem V e CV, e as incorporações a partir dessas formatações bases são reflexos
das especificidades de uma dada língua. Nesse sentido, o entendimento da sílaba é essencial
para a compreensão de processos que operam em camadas profundas da gramática.
A respeito desses processos, Bisol (2013a, p.22) fundamenta-se nos princípios da
composição da sílaba em Selkirk (1982). A autora considera, então, os constituintes menores
que a sílaba, ou seja, os elementos nos quais as sílabas podem ser analisadas e construídas, o
ataque e a rima que, juntos, formam o padrão silábico universal: CV.
Dessa forma, Bisol propõe o seguinte esquema:
Figura 6 – Princípios de Composição da Sílaba Básica
Sílaba
ataque rima
N Cd
C V C
Fonte: (BISOL, 2013a, p.22)
39
Assim, a maior parte dos teóricos que analisam a constituição da sílaba considera a
sequência {CV, VC, V, CVC} como o inventário básico das línguas do mundo. E, assim, as
sílabas com composição mais complexas partem desse inventário. Mesmo os teóricos que não
consideram os subconstituintes da sílaba adotam, também, o núcleo como um elemento
central na sílaba e indispensável para a análise prosódica da língua.
Alvarenga, também com base em Selkirk (1982), destaca a hierarquia entre os
constituintes da sílaba como um desenvolvimento importante da Teoria Gerativa. A ideia de
ramos imposta à teoria dos constituintes da sílaba atribui insuficiência à definição de que “um
ataque é a posição consonantal que precede o núcleo, e a posição de coda é a posição
consonantal subsequente ao núcleo” 16(ALVARENGA, 1993, p. 30, tradução livre). Para o
autor, há dois níveis diferentes entre esses elementos: o ataque pertence ao nível imediato ao
nível do nó silábico, enquanto a coda pertence a um nível mais baixo.
O que ele se refere, nesse ponto, é a questão de dominância entre os constituintes. Esta
é a mesma relação proposta na sintaxe chomskiana, isto é, hierarquia ligada à ideia de árvore,
de galhos e níveis.
Na seção seguinte veremos os princípios envolvidos na composição silábica.
3.3.1 A estrutura silábica e sua boa formação
Bisol (2013a, p.26) afirma que os Princípios de Composição da Sílaba Básica (Figura
4) não são suficientes para gerar expressões bem formadas. Princípios universais e condições
línguo-específicas desempenham um papel relevante para essa boa formação. Assim, a autora
destaca os seguintes princípios: Princípio de Sequenciamento de Sonoridade (PSS)17,
Princípio da Preservação de Estrutura (PPE), Princípio da Maximização do Ataque (PMA),
Princípio do Licenciamento Prosódico (PLP) e Princípio da Integridade Prosódica (PIP).
Alvarenga (1993, p. 20), ao opor a fonologia unilinear à plurilinear, afirma, de forma
categórica, que a primeira fundamenta seus fatos em regras, enquanto a segunda em
princípios. Assim, o autor define o Princípio do Contorno Obrigatório (PCO) e o Princípio de
Sonoridade Silábica (PSS) como fundamentais para uma compreensão profunda do fenômeno
analisado, no caso aqui proposto, a sílaba.
16 “[...] qu’une attaque est la position consonantique qui précède le noyau et que la coda est la position
consonantique qui suit le noyau [...]” (ALVARENGA, 1993, p. 30)
17 O Princípio de Sequenciamento de Sonoridade ou Princípio da Sonoridade Silábica (PSS), – é uma tradução
de Sonoroty Sequencing Principle (SSP).
40
Em vez de uma formalização de regras, a fonologia autossegmental procura definir os
princípios gerais produtores e organizadores da arquitetura fonológica e dos
parâmetros específicos para cada língua, que são interpretadas como condições de boa
formação fonológica. [...] Por conseguinte, a fonologia autossegmental postula
princípios, tais como o princípio do contorno obrigatório (PCO), o princípio de
sonoridade silábica (PSS), e alguns outros que podem servir de base para possíveis
explicações dos fenômenos fonológicos. (ALVARENGA, 1993, p.20-21, tradução
livre18)
O primeiro princípio citado por Bisol e o segundo citado por Alvarenga se referem ao
mesmo princípio, em inglês chamado de “Sonoroty Sequencing Principle (SSP)”, o qual
pressupõe que a sílaba tenha um contorno sonoro, com sonoridade crescente em direção ao
núcleo e decrescente em direção à coda. Tal princípio está intimamente ligado à noção de
sílaba. De acordo com Kenstowicz (1994, p. 254), há mais de um século se tem conhecimento
de que a construção de onsets complexos e codas são guiados pelo Sonoroty Sequencing
Principle (SSP) – Princípio do Sequenciamento Sonoro, que requer um levantamento sonoro
do onset em relação ao núcleo, e um caimento da sonoridade do núcleo em direção à coda.
Nesse sentido, Alvarenga (1993) afirma que a ideia fundamental, base desse princípio,
é o fato de ele permitir uma ordem crescente e decrescente entre os segmentos vizinhos na
sequência falada. O autor cita vários teóricos que, a partir desse princípio, propõem uma
escala de sonoridade para uma análise silábica, como Hooper (1976), Lowenstamm (1981),
Selkirk (1984) e Goldsmith (1990).
Alvarenga afirma que Goldsmith (1990) apresenta o princípio da sonoridade na sílaba
como um material segmental que deve ser organizado em uma ordem crescente de sonoridade
no início da sílaba até o núcleo e em uma ordem decrescente do núcleo até o fim da sílaba. O
princípio de sonoridade é projetado como uma condição necessária no nível da silabação
básica. Para explicar a organização dos elementos segmentais na sílaba, Goldsmith adota a
escala numérica proposta por Selkirk, a qual veremos no próximo capítulo.
Bisol (2013a, p. 26) afirma que esse princípio pressupõe um contorno de sonoridade
para a sílaba, em termos de sonoridade crescente no ataque (onset) e decrescente na coda. Isso
faz com que, em português, não seja possível existir platôs19 (sonoridade plana) dentro de
18 “A la place d’une formalisation des règles, la phonologie autosegmentale cherche à définir des principes
généraux producteurs et organisateurs de l'architecture phonologique et des paramètres particuliers à chaque
langue qui sont interprétrés comme des conditions de bonne formation phonologique. [...] La phonologie
autosegmentale postule donc des principes tels que le principe du contour obligatoire (PCO) le principe de
sonorité syllabique (PSS), et quelques autres qui sont supposés être à la base des explications possibles des
phènomènes phonologiques.” (ALVARENGA, 1993, p.20-21). 19 “[...] não é admitido em sílaba do português a cadeia de dois elementos com o mesmo grau de sonoridade que
se observa em aptidão, por exemplo, não pode ser escandida como *a.pti.dão, pois formaria um platô, proibido
dentro da sílaba.” (BISOL, 2013a, p. 27).
41
uma sílaba, só “entre” sílabas. Em outras palavras, dentro de uma sílaba há segmentos de
maior ou menor intensidade sonora.
Entendendo-se por silabificação o processo de mapear uma sequência de segmentos
ao molde silábico da língua, o segmento candidato a uma determinada posição tem
de atender à hierarquia de sonoridade crescente em direção ao pico e decrescente a
partir dele. Então, porque platô, sonoridade estável, não é admitido em sílaba do
português a cadeia de dois elementos com o mesmo grau de sonoridade que se
observa em aptidão, por exemplo, não pode ser escandida como *a.pti.dão, pois
formaria um platô, proibido dentro da sílaba (BISOL, 2013a, p. 27)
Collischonn (2001, p. 103), ao tratar desse princípio, destaca a teoria de Clements
(1990) como interessante, por atribuir uma nova perspectiva aos princípios fonológicos, uma
vez que considera tais princípios muito mais como tendências do que como leis invioláveis.
O segundo princípio proposto por Alvarenga (1993) não é citado por Bisol (2013a).
Trata-se do Princípio do Contorno Obrigatório (PCO). O PCO foi proposto por Leben (1973
apud KENSTOWICZ, 1994) para análise de línguas tonais. De acordo com a proposta de
Leben, quando dois tons idênticos estão associados a duas vogais adjacentes, o tom mais à
direita é apagado e o tom da esquerda é associado à vogal livre. McCarthy (1986 apud
ALVARENGA, 1993) estendeu esse princípio para a análise de segmentos: “no nível
melódico, dois elementos idênticos adjacentes são proibidos” 20. Com base na ideia de
McCarthy e de outros teóricos, Encrevé (1988) propõe a seguinte formulação: “em uma dada
linha autossegmental, para qualquer par de autossegmentos adjacentes a e b, a é diferente de
b” 21 (ENCREVÉ, 1988, apud ALVARENGA, 1993, p. 21).
O Princípio de Preservação de Estrutura (PPE) é segundo citado por Bisol (2013a). O
PPE assegura que todas as condições lexicais, inclusive as de estrutura silábica, estão
garantidas durante todo o processo cíclico. Essa garantia proíbe, então, que sejam criadas
estruturas silábicas que não correspondam ao princípio de composição da sílaba, ou não
admitidas pelas restrições fonotáticas. Assim, sílabas que extrapolam o padrão canônico pelo
número de componentes ou que seriam proibidas pela Condição de Coda são produtos pós-
lexicais (BISOL, 2013a, p.28).
Para a autora, o PPE é desativado no pós-léxico. Isso ocorre devido à dinâmica da
língua, o que permite que alofones dialetais ou sociais possam marcar mudanças canônicas no
decorrer da história, já que a língua é um ser vivo e está sempre em mudança – o que ocorre
no pós-léxico.
20 “au niveau mélodique, deux éléments identiques adjacentes sont interdits” (ALVARENGA, 1993, p. 21) 21 “sur une ligne autossegmentale donnée, pour toute paire d’autosegments adjacents a et b, a est different de b”
(ALVARENGA, 1993, p. 21)
42
Nesse sentido, resultados diferentes de silabificação e ressilabificação são esperados,
já que a silabificação é um processo contínuo enquanto que a ressilabificação ocorre apenas
no pós-léxico, onde o PPE está desativado. (BISOL, 2013a, p.29).
Princípio de Maximização do Ataque, ou onset (PMA), terceiro princípio citado pela
autora, diz respeito ao princípio que coloca a formação do onset como prioridade sobre a
expansão das rimas. Na atribuição da estrutura silábica de uma cadeia de segmentos, os
ataques são maximizados em conformidade com os princípios de composição da sílaba básica
da língua (SELKIRK, 1982, apud BISOL, 2013a, p.30). Clements e Keyser (1983, p.37)
nomeiam esse princípio como Princípio do Onset Primeiro22.
Para o processo de silabação23, primeiro o núcleo é identificado; em seguida, as
consoantes da esquerda são ligadas a esse núcleo; e, por fim, as consoantes à direita também
são conectadas. As consoantes iniciais da sílaba são maximizadas em conformidade com as
condições estabelecidas pela língua em questão.
Bisol afirma que a silabificação/silabação é um processo de mapeamento que tem
como ponto inicial a identificação dos núcleos, em seguida, o mapeamento iterativo do ataque
e, só por fim, o da coda (BISOL, 2013a, p.30).
O princípio universal para gerar expressões bem formadas é o Princípio do
Licenciamento Prosódico (PLP), formulado por Itô (1986). De acordo com esse princípio,
todas as unidades fonológicas devem pertencer a unidades mais altas: segmento – sílaba – pé
– palavra fonológica ou frases.
Esse princípio, independentemente motivado, demanda silabificação exaustiva. Isso
significa que todo segmento de uma sequência de sons linguísticos deve ser
silabificado, respeitando os princípios universais e particulares. Se não o for, será
apagado ainda no nível lexical, ao findar a derivação, a não ser que esteja licenciado
por extraprosodicidade (BISOL, 2013a, p. 31).
De acordo com Itô (1986 apud KENTOWICZ, 1994), a silabificação é um modelo
combinado, no qual todas as unidades prosódicas de um determinado nível devem pertencer a
estruturas hierarquicamente superiores (segmento, sílaba, pé, palavra fonológica, enunciado).
Itô se fundamenta nos pressupostos de McCarty (1979), os quais demonstram que o material
fonêmico não é capaz de mapear o modelo que é suprimido. Nesse caso, Kentowicz (1993)
22 Tradução livre para “The Onset First Principle” 23 Para nomear o processo de formação de sílabas, os autores usam os termos silabificação/silabação. E para
nomear uma nova formação de sílaba de elementos já silabificados/silabados, os autores usam ressilabificação ou
ressilabação. Nesse trabalho, quando não for citação de autor, usaremos os termos silabação e ressilabação,
seguindo Oliveira.
43
explica que a teoria de McCarthy estende a regra de apagamento de consoante perdida para
uma restrição geral sobre representação fonológica, a qual postula que todo segmento
fonológico deve ser prosodicamente licenciado. (KENTOWICZ, 1994, p. 285).
De acordo com Collischonn (2001, p.103), diante desse princípio decorre que toda a
sequência fonológica é exaustivamente dividida em sílaba, isto é, qualquer segmento tem de
ser associado a uma sílaba.Em relação a esse princípio, existem dois conceitos que merecem
atenção, a saber, o conceito de ambissilabicidade e o de extrassibilicidade. O primeiro diz
respeito a consoantes que pertencem a sílabas precedentes e posteriores. Já o segundo
corresponde a um segmento que não consegue, durante a silabação, ser associado a nenhuma
sílaba, ou seja, ele não é apagado por peculiaridades da língua, podendo aparecer em outro
contexto dado. Como exemplo de extrassibilicidade, podemos citar a palavra francesa “petit”,
em que o /t/ nem sempre se realiza. De acordo com Clements e Keyser (1983), esse /t/ é
extrassilábico e somente aparece quando pode ser ressilabificado com a vogal da palavra
seguinte, uma vez que a língua francesa não aceita obstruinte na coda se a palavra seguinte
iniciar com uma consoante obstruinte ou líquida.
O último princípio universal colocado por Bisol (2013a) é o Princípio da Integridade
Prosódica (PIP). Esse princípio especifica que somente os segmentos livres podem ser
silabados, ou seja, a silabação inicial só é desfeita se a sílaba perder o núcleo, podendo, assim,
associar-se a outro núcleo e ser silabada novamente. Diferentemente, na ressilabação esse
fenômeno somente ocorre em sílabas já existentes.
Além dos princípios universais, há as condições particulares de língua que
complementam a boa formação da silabação. São as condições línguo-específicas, de natureza
fonotática, que fazem as escolhas mais restritas e favorecem a hipótese de que a sílaba possui
dois constituintes: a formação do onset e da rima. Portanto, temos dois tipos de Condição de
boa Formação: Condição de Onset e Condição de Coda. (BISOL, 2013a, p. 33).
3.3.2 A sílaba no Português Brasileiro
A Condição de Onset do português comporta dois constituintes e sua formação ocorre
com a junção da consoante à esquerda mais próxima ao núcleo. A seleção dos segmentos é
feita de acordo com a escala de sonoridade permitida pela língua. A primeira criação que se
tem é a sílaba canônica CV. Para se produzir um onset complexo, com dois constituintes, este
deve ser compatível com os critérios postos pela língua.
44
Grupos permitidos são aqueles que se compõem de obstruentes não contínuas ou
contínua labial, combinadas com líquida, vibrante simples ou lateral, excluídos os
grupos /dl/ e /vl/. [...] Os grupos /dl/ e /vl/ não existem, a não ser em raros nomes
próprios [...] Os grupos permitidos têm, na primeira posição, uma consoante [-
contínua] ou [+contínua, labial] e, na segunda, uma soante não nasal, revelando dois
graus de distanciamento de sonoridade entre os segmentos que compõem o ataque,
enquanto a rima permite minimamente um grau (BISOL, 2013a, p. 34).
Assim, podemos representar tal condição conforme figura a seguir:
Figura 7 – Condição Positiva do Ataque Complexo
Ataque/Onset
C C
[-cont, - soante] [+soante, - nasal]
[+cont, lab]
Fonte: (BISOL, 2013a, p. 34).
Em relação à Condição de Coda, esta é preenchida por qualquer soante e também por
/s/. A única obstruinte [-soante] que se apresenta nessa condição é o /s/, as demais obstruintes
são rejeitadas. Há elementos que são rejeitados pela condição de coda, mas são salvos por
epêntese, como, por exemplo, apto, afta, adversão, entre outros.
A autora acredita que a epêntese vocálica é um recurso de silabação que está
disponível em todos os níveis lexicais e, também, no pós-léxico. Quando um segmento não
satisfaz a condição de coda, por violar algum princípio ou condição particular de língua, ele
pode ficar flutuante. Nesse ponto, entraria em ação o Princípio do Licenciamento Prosódico,
legitimando uma silabação iterativa, permitindo que uma vogal seja inserida proporcionando
uma silabação ao segmento flutuante. Na seção a seguir, trataremos especificamente dos
padrões silábicos do Português Brasileiro.
3.3.3 Padrões silábicos no Português Brasileiro
Como vimos anteriormente, a partir do padrão silábico CV, as línguas configuram o
inventário silábico, determinando um número máximo e mínimo de elementos permitidos em
45
uma sílaba. Não há unanimidade entre os teóricos nos tipos de padrões silábicos do português,
mas, neste trabalho, iremos considerar a proposta de Miranda (2012, p. 125) e Oliveira (2010,
p.80), que definem esses padrões como:
Quadro 1 – Padrões Silábicos do Português Brasileiro V ida
CV vidro
VC isca
CVC porta
CCV prato
CCVC presta
CVCC perspicaz Fonte: (OLIVEIRA, 2010, p. 80)
Oliveira (2010, p. 80) resume esses padrões silábicos no esquema (C)(C)V(C)(C).
Dessa forma, pode-se afirmar que existe, em Português Brasileiro, uma configuração
estrutural de sílaba mínima composta por V e uma configuração máxima composta por
CCVCC.
Mesmo sendo um inventário bastante curioso e vasto, do ponto de vista
configuracional, há posições bem restritivas para os segmentos que podem ocupar uma
determinada posição. Tais posições podem ser observadas no quadro 2, proposto por Miranda
(2009), e no quadro 3, proposto por Alvarenga (1993).
Quadro 2 – Posições para os segmentos (I)
Posição de C Classes de segmentos
CV plosivas (/p,b,t,d,k,g/), fricativas (/f, v, s, z, S, Z/), nasais (/m, n, ñ/),
líquidas (/r,x,l,y/)
VC24 fricativas coronais (/S/), nasais (/N/)25, líquidas (/r, l/) e glides26
CCV somente líquida (/r, l/)
VCC27 somente fricativa coronal (/S/) Fonte: (MIRANDA, 2009, p. 412)
24 “A fricativa e a nasal de final de sílaba estão representadas por letra maiúscula porque nesta posição, final de
sílaba, tais consoantes ganham especificações de alguns traços da consoante seguinte. As fricativas podem ser +
ou – sonora dependendo da consoante seguinte, ou ainda podem ser alveolares, como no dialeto gaúcho, palato-
alveolares, como no dialeto carioca, por exemplo. Já as nasais, compartilham o ponto de articulação da
consoante seguinte.” (MIRANDA, 2009, 412). 25 “Com relação ao status da nasal pós-vocálica, existem propostas distintas. Enquanto para Bisol (1999:710) a
nasalidade fonológica do português decorre de uma sequência CVC [nasal], para Mateus e Andrade (2000: 131)
não se trata de uma coda mas sim de um autossegmento flutuante, sem lugar no esqueleto silábico, o qual está
diretamente ligado ao núcleo.” (MIRANDA, 2009, 412). 26 “A ideia de que glides estão em posição de coda é defendida por Bisol (1999). Já Mateus e Andrade (2000)
interpretam o glide como elemento pertencente ao núcleo ramificado.” (MIRANDA, 2009, 412). 27 “Para Bisol (1999: 704), o /S/ que ocupa esta posição liga-se à Rima pela Regra de Adjunção de /S/ (RAS), a
qual existe em função de um número muito reduzido de palavras da língua.” (MIRANDA, 2009, 412).
46
Quadro 3 – Posições para os segmentos (II)
Fonte: (ALVARENGA, 1993, p. 44)
Diante desses quadros, é possível concluir que, na posição de coda, há quatro fonemas
possíveis (/R, L, S , N28/), e poucos ataques complexos, conforme podemos observar no
quadro a seguir:
Quadro 4 – Fonemas e ataques complexos na coda
pr prato pl plátano fl flanco
br braço bl bloco fr franco
tr trato tl atlas vl -
dr drama dl29 - vr livro
kr cravo kl clamor
gr grama gl glosa Fonte: (BISOL, 2013a, p.34)
3.3.4 Sílaba e Sonoridade
O Princípio da Sonoridade Silábica (ou Sequenciamento de Sonoridade) e o Princípio
do Contorno Obrigatório estão intrinsecamente ligados à sonoridade da sílaba.
28 Para Bisol (1989), o ditongo nasal deriva de uma sequência VC subjacente, em que C se torna flutuante e uma
vogal temática é acrescida. A associação posterior do traço nasal à rima cria o ditongo nasal. (COLLISCHONN,
2001, p. 110). 29 “Os grupos /dl/ e /vl/ não existem, a não ser em raros nomes próprios como Adler e Vladimir. Também /tl/ em
início de palavra não se encontra, embora ocorra em onomatopaicos (tlim-tlim).” (BISOL, 2013a, p. 34).
47
Diante desse fato, Alvarenga (op. cit.) formula a hipótese de que esses dois princípios
são a expressão de um único princípio, nomeado por ele como Princípio do Contraste.30
Para o autor, esse é um princípio geral que controla as condições de coocorrência dos
segmentos nas sílabas. É parametrizado por cada língua e constitui a base de restrições ou de
regras fonotáticas entre os segmentos de uma sequência em uma sílaba, ou seja, em uma dada
sequência, os elementos devem manter uma determinada distância mínima entre si. Com essa
noção de distância mínima, Alvarenga introduz uma noção de escala de canonicidade. O autor
define esse princípio da seguinte maneira:
[...] em uma dada linha autossegmental, dois autossegmentos adjacentes a e b de
uma mesma unidade hierárquica devem contrastar, sendo os possíveis contrastes
medidos por meio de parâmetros específicos para cada língua.”31 (ALVARENGA,
1993, p. 41).
Nesse raciocínio, Alvarenga (1993) vai além da distância entre os elementos
adjacentes, apoiando-se em Selkirk, (1984), e propõe duas escalas de sonoridade: uma escala
numérica de afastamento entre os elementos e uma escala de estabilidade das estruturas
resultantes.
Partindo-se desse pressuposto, uma sílaba mais estável manteria uma distância maior
entre os segmentos vizinhos, ao contrário do que seria a mais instável.
Com esse foco, Alvarenga apresenta a hipótese de que, para cada par, apresentado no
quadro a seguir, a segunda coluna de fonemas é a mais escolhida pelas línguas e, se as duas
sequências existirem na língua, a segunda ocorrerá com mais frequência.
“pt” “ps”
“ps” “pr”
“gn” “gl”
“ts” “tm”
“tm” “tr”
“ks” “kl”
O autor afirma, ainda, que a coluna da esquerda será um locus de maior
variação/instabilidade que a coluna da direita.
30 Alvarenga acredita que essa sua interpretação é uma contribuição de seu trabalho à fonologia autossegmental. 31 “sur une ligne autosegmentale e donnée, deux autosegments adjacentes a et b d’une même unité hiérarchique
doivent faire contraste, les contrastes possibles étant mesurés par des paramètres particuliers à chaque langue.”
(ALVARENGA, 1993, p. 41)
48
Com base na escala de sonoridade proposta por Selkirk (1984) para o inglês,
Alvarenga e Oliveira (1997) propõem uma escala de sonoridade para o português, “a fim de
operacionalizar a noção de sonoridade, propomos a escala de sonoridade que segue”
(ALVARENGA; OLIVEIRA, 1997, p. 131).
Quadro 5 – Escala de sonoridade para o Português Brasileiro
12
11
10
9
a
E O
e o
i u
5
4
3
2
8 y w 1
7
6
5
4
3
2
1
r h
l y
m n n
v z 3
f s S
b d g
p t k
2
3
4
5
6
7
8 Fonte: (ALVARENGA; OLIVEIRA, 1997)
No Quadro 5, a coluna da esquerda indica a sonorização através do grau de abertura:
quanto maior o número, maior a abertura necessária para realizar o fonema. A coluna da
direita indica a força necessária para que o fonema se realize.
As consoantes de abertura menor são, pois, as consoantes mais fortes e as vogais de
abertura menor são, inversamente, as menos fortes. Do ponto de vista articulatório,
podemos dizer que o ótimo para as consoantes é a abertura mínima; para as vogais,
ao contrário, é a abertura máxima. [...] Como elementos limítrofes, os glides podem
aparecer, do ponto de vista funcional, seja como consoantes, seja como vogais
(ALVARENGA; OLIVEIRA, 1997, p. 132).
Se colocarmos as distâncias propostas pela escala de sonoridade nos pares dados por
Alvarenga, teremos o seguinte resultado:
Quadro 6 – Distâncias propostas pela escala de sonoridade
Segmentos Distância Segmentos Distância
“pt” 0 “ps” 2
“ps” 2 “pr” 6
“gn” 3 “gl” 4
“ts” 2 “tm” 4
“tm” 2 “tr” 6
“ks” 2 “kl” 5 Fonte: Elaborado pela autora.
49
Tomando a premissa de estabilidade com base nas distâncias entre os segmentos, é
possível concluir que as sequências de segmentos da coluna da esquerda serão mais instáveis
que as sequências de segmentos da direita, já que a coluna da esquerda possui um
“afastamento numérico” menor que a da direita.
Nesse encaminhamento, os “processos de reconstrução que operam na direção das
estruturas mais estáveis (como a epêntese, os apagamentos) deverão ser mais frequentes com
as sequências da esquerda” (ALVARENGA; OLIVEIRA, 1997, p. 134).
Como vimos, além dos princípios universais, as línguas possuem os próprios
parâmetros para conduzirem sua melhor formação silábica. Nesse sentido, com base no
princípio do contraste e na escala da sonoridade, é possível afirmar que as línguas controlam
sua boa formação fonológica mantendo-se a conveniência de aproximação de seus segmentos
e/ou estruturas, tidos como mais instáveis em relação a estruturas mais estáveis e mais
canônicas.
Nesse ponto, entrariam aplicações de processos fonológicos que, muitas vezes,
resultam em ressilabações, as quais atuam livremente nas línguas, buscando sua otimização e
estabilidade.
3.3.5 Silabação e Ressilabação32
Sendo a sílaba um ponto fundamental nas discussões fonológicas, faz-se necessário
discutirmos o processo de silabação, isto é, o modo como ocorre a formatação de uma sílaba.
Existe uma unanimidade em afirmar que o núcleo é o elemento constante e necessário para
essa formação.
Kenstowicz (op. cit.) afirma que, em muitas línguas, a silabação atribuída a uma
sequência de fonemas é previsível diante da representatividade de seus segmentos, se o
segmento for uma consoante ou uma vogal. Uma vez que o status vocálico ou consonantal do
segmento é geralmente tomado como independente da estrutura da sílaba, através de traços
distintivos, essa informação pode ser usada para formar regras de silabação. Essas regras de
construção silábica são bastante similares de uma língua para outra e, então, podem ser
visualizadas como uma contribuição da Gramática Universal. Considerando o núcleo como a
base da sílaba, podemos afirmar que a sílaba é construída a partir do núcleo, isto é, para fora
dele.
32 Para o mesmo conceito também são usados os termos “silabificação” e “ressilabificação”.
50
Para o autor, os fonólogos concordam que toda classe dos sons da fala pode ser
escalonada em termos de vogais, glides, líquidas, nasais e obstruintes – sendo a vogal a mais
sonora, e a obstruinte a menos sonora. Assim, mesmo que um onset ou uma coda sejam
complexos, eles devem seguir esse princípio, pois o pico da sonoridade sempre estará no
núcleo. Outro ponto é que vogais adjacentes frequentemente combinam para formar uma
única sílaba. Para o autor, o princípio de sequência de sonoridade faz a maior parte do
trabalho na definição das sequências bem formadas. Ele conclui que a silabação é produto da
Gramática Universal e, portanto, está presente em todas as línguas e disponível para qualquer
regra particular.
Para Kentoswicz (1994), citando Kan (1976) e Steriade (1982), a silabação pode ser
feita por uma bateria de regras aplicadas em um ponto único na derivação ou ciclicamente.
Em uma visão alternativa, há, pelo menos, uma organização rudimentar em sílabas que fixe
todos os níveis da representação fonológica (MCCARTHY, 1979 apud KENSTOWICZ,
1994).
Bisol (2013a, p. 38) afirma que o domínio da silabificação é a palavra, e que, como um
processo contínuo, ela fica disponível em todos os estratos do componente lexical,
envolvendo radicais e afixos. Já a ressilabificação atua no nível da frase, sobre elementos já
silabificados, ou seja, ela atua no nível pós-lexical. No português brasileiro, um dos processos
mais gerais é o sândi33 vocálico externo.
Kenstowicz (1994) conclui que a silabação pode ser um processo feito por uma série
de fases que envolvem a escala sonora e, sem dúvida, reflete a opção não marcada da
Gramática Universal.
Portanto, todos os segmentos devem ser silabados e pertencer a uma estrutura
prosódica superior pelo Princípio do Licenciamento Prosódico. Se isso não ocorrer, há duas
possibilidades: esse segmento pode ser apagado pela regra universal de Apagamento do
Elemento Extraviado ou ser ressilabificado.
Para Kenstowicz, há duas maneiras de alcançar o licenciamento prosódico: associação
ao modelo silábico ou atribuição de extrassilabicidade. O material que não está licenciado
prosodicamente é eliminado pelo apagamento do elemento extraviado; regras de epêntese ou
ressilabificação através de adjunção podem resgatar um segmento a ser apagado. De modo
33 Sândi é o nome da gramática do sânscrito para designar alterações morfofonêmicas, condicionadas
fonologicamente. (Bisol, 2013b, p. 53). Para Bisol (1992) o sândi vocálico do português do Brasil se desenvolve
em torno de duas ideias: a de que o ponto de partida para o sândi externo é um processo de ressilabação que
envolve duas palavras sob o domínio do mesmo enunciado e a de que, quando essas palavras se encontram e a
sequência VV se delineia, independentemente do resultado que venha provocar, degeminação ou elisão, a sílaba
que se forma é incorporada à pauta prosódica do vocábulo seguinte. (BISOL, 1992, p. 83).
51
mais geral, o licenciamento prosódico vê a silabificação como uma restrição estática nas
representações em que a presença de um elemento pode ser contingente na satisfação de
alguma condição.
Nesse encaminhamento, o autor afirma que consoantes pré-vocálicas preferem ocupar
o onset34 da sílaba. Em muitas línguas, o onsetamento de consoantes pré-vocálicas ocorre
mesmo se uma fronteira gramatical ou de palavra intervir. O resultado é um desalinhamento
das características morfológicas e da estrutura prosódica. Em algumas línguas, o onsetamento
de consoantes pré-vocálicas cruza o limite de palavra. (Kenstowicz, 1994, p.280).
Por exemplo, francês e espanhol são conhecidos por silabificar VC#35V como V.
C#V; Harris (1983) cita do espanhol Los otros estaban en el avion “Os outros estavam
no avião”, o qual silabifica na fala casual como Lo.s otro.s es.ta.ba.n e.n e.l a.vion.
(KENSTOWICZ, 1994, p. 280, tradução livre36).
Em tais casos, é natural que se pergunte se a consoante de onsetamento ocupa a coda
da sílaba anterior em uma fase mais precoce da derivação. Quando a articulação relevante é a
palavra limite, pode-se, muitas vezes, detectar a posição de coda antes. Supondo-se que regras
de construção silábica operaram exclusivamente em elementos livres (não analisados), a
ressilabificação pode ser resultado de uma regra que altera a estrutura silábica. Se as regras
fonológicas se aplicam ciclicamente, então podemos esperar consoantes para ressilabificar em
resposta a afixos vocálicos, já que a derivação procede de um ciclo para o próximo.
(KENSTOWICZ, 1994, p. 280-281)
Kenstowicz também cita Clements (1990), que interpreta a ressilabificação como
reflexo de algo mais geral como o SDP (Sonoroty Dispersion Principle) que prefere
maximizar o declive da sonoridade da demissílaba37 formado pelo onset + núcleo e minimizar
o valor do núcleo + coda. Desse modo, Kenstowicz formula uma equação que gera as
seguintes classificações:
34 Essa afirmação parte de uma tendência geral para evitar sílabas sem onset, pelo menos em meio de palavra. 35 O símbolo (#) significa fronteira morfológica. 36 “For example, French and Spanish are well known for syllabifying VC#V as V.C#v; Harris (1983) cites
Spanish Los otros estaban en el avion ‘The others were on the airplane’, which syllabifies in casual speech as
Lo.s outro.s es.ta.ba.n e.n e.l a.vion.” (KENSTOWICZ, 1994, p. 280). 37 “Na teoria de Clements (1990), as sílabas não são divididas em ataque, núcleo e coda, mas sim em duas partes
parcialmente sobrepostas, as demissílabas, sendo que o pico silábico pertence a ambas.” (COLLISCHONN,
2001, p. 102).
52
Quadro 7 – Escala de sonoridade para os tipos silábicos
a. CV: OV > NV > LV > GV
b. VC: VG > VL > VN > VO
c. CCV: OLV > ONV; OGV > NLV; NGV > LGV
d. VCC: VGL > VLN; VGN > VGO; VNO > VLO
(V = vogal, G, = glide, L = líquido, N = nasal, O = obstruinte)
Fonte: ( KENSTOWICZ, 1994, p. 283)
Kenstowicz explica essas formatações da seguinte forma: a escala classifica OLV
como o conjunto inicial de três membros mais adequado e VGL como um ótimo conjunto
final. OLV abrange a gama de sonoridade de O a V e coloca seu segundo elemento bem no
meio do (ONLGV) da escala de cinco posições. ONV e OGV também executam a gama de
sonoridade, mas combinam duas posições adjacentes e, portanto, são menos “ótimas”. NLV e
NGV são ainda são piores, uma vez que não conseguem abranger a escala; LGV é a pior de
todas, porque é composta por três posições sucessivas na parte alta da escala. O inverso VGL,
por outro lado, é a melhor rima de sílaba, uma vez que minimiza a queda de sonoridade.
O princípio SDP de Clements une uma série de generalizações que surgiram no estudo
de sílabas. De acordo com os estudos baseados na escala de sonoridade, a sílaba ótima é a CV
e pode ser encontrada em todas as línguas. Em adição, consoantes sozinhas em onset podem
ser esperadas para mover a escala de sonoridade para baixo e as consoantes sozinhas em coda
movem a escala para cima. A diferença entre a sonoridade de contatos de sílaba, isto é, a
distância da sonoridade entre o encerramento da primeira sílaba e o início da segunda é maior.
Isso posto, veremos, no capítulo seguinte, como esse quadro teórico pode nos
proporcionar reflexões acerca das marcas fonológicas no processo de aquisição da modalidade
escrita da língua, particularmente sobre a aquisição do onset complexo e da coda.
53
4 A ESCRITA E A FONOLOGIA
Neste capítulo, apresentamos uma discussão acerca das relações que a fonologia
mantém com a aquisição da escrita. Para tanto, iremos tratar da relação entre as modalidades
falada e escrita da língua, verificando o modo como a fala influencia o processo de aquisição
do sistema escrito, mais precisamente na construção da coda e do onset complexo.
4.1 A língua escrita
O sistema de escrita pode ser considerado uma conquista histórica e cultural. Isso
porque, ao longo da história da humanidade, a escrita foi a responsável por transmitir grande
parte do conhecimento do mundo e do ser humano. Diferentemente da fala, que é adquirida
naturalmente, a escrita necessita ser apreendida de forma sistemática e explícita. No que se
refere à definição dessa tecnologia, existem divergências entre teorias que lidam com a
escrita. Desse modo, a presente seção pretende apresentar algumas das definições que
abarcam o sistema escrito.
De acordo com Alvarenga (1988), a escrita é um processo de codificação que envolve,
obrigatoriamente, o conhecimento de regras de um código escrito. No caso da escrita padrão,
a codificação envolve, também, convenções e arbitrariedades ortográficas do código oficial
(ALVARENGA. 1988, p. 28).
Em complemento a esse pensamento, Morais (2005) afirma que
[...] não é apenas um código, mas um sistema notacional cuja aquisição pressupõe
um intricado trabalho cognitivo, observável também na aquisição de outros sistemas
simbólicos tais como a linguagem oral, por exemplo (MORAIS, 2005 Apud
MIRANDA 2009, p. 409)
De forma mais apurada, Oliveira (2005) argumenta que o uso do termo codificação
está relacionado “à situação em que um conjunto de elementos assume uma outra forma sem
que perca as suas características internas” (OLIVEIRA, 2005, p. 27-25).
Assim, conforme afirma Oliveira (2005), a escrita é um sistema de representação. A
diferença entre codificação e sistema de representação ocorre devido às características
intrínsecas a esses conceitos.
54
Na codificação, para sons e letras se equivalerem como um código, seria necessário
haver uma relação biunívoca, na qual uma letra representaria apenas um som, e um som seria
representado por apenas em uma letra. Em suma, em uma “situação de codificação, podemos
dizer que os conjuntos A e B são a mesma coisa, ou A=B, mudando apenas sua aparência
externa” (OLIVEIRA, 2005, p. 26).
Na representação, as relações e restrições de um determinado conjunto não precisam
ser necessariamente mantidas pelo conjunto que o representa. Assim, um conjunto A,
representado por um conjunto B, mantém entre eles uma relação de representação devido às
características internas relacionadas. Isso é o que ocorre entre o alfabeto e os sons do
português, em que nem sempre uma letra representará apenas um som, e nem sempre um som
será representado por apenas uma letra. (OLIVEIRA, 2005, p.26-27)
Miranda (2014b) pontua que a escrita é um tipo de representação da língua tanto em
aspecto significativo como em aspecto sonoro, já que segmentos e sílabas, antes subsumidos
no fluxo da fala, ganham contornos conceitualmente acessíveis. É um processo complexo que
envolve a capacidade de abstração e de reflexão.
Nesta pesquisa, iremos trabalhar com a ideia proposta por Oliveira (2005) e Miranda
(2014b), a saber, a de que a escrita é um sistema de representação. Dessa forma, assumimos
que a relação entre fala e escrita não é biunívoca.
4.2 Relações entre fala e escrita
Sob o ponto de vista mais central da realidade humana, seria possível definir o homem
como um ser que fala, mas não como um ser que escreve. Portanto, a escrita é derivada e a
fala é primária (MARCUSCHI, 1995, p.01). Dessa forma, podemos afirmar que fala e escrita
são duas modalidades de uso da língua. Assim, ao dominar a escrita, o sujeito torna-se
bimodal38.
Nesse raciocínio, a fala seria uma forma de produção textual-discursiva oral, a qual
não exige nenhuma tecnologia, de modo que o necessário já está disponível no próprio ser
humano.
A escrita, além de uma tecnologia de representação abstrata da própria fala, seria um
modo de produção textual-discursivo, com especificidades próprias (MARCUSCHI, 1995, p.
07).
38 Termo usado pelo autor para caracterizar o domínio da língua nas modalidades oral e escrita.
55
Nesse sentido, e de acordo com Oliveira (2005), vamos defender a ideia de que o
conhecimento sobre a língua falada, modalidade primária, controla o processo de
aprendizagem da língua escrita, modalidade secundária.
Logo, “quanto mais operado o processo na língua falada, tanto mais resistente é a
aprendizagem das regras de escrita, se evidentemente essas não apresentam isomorfismo
perfeito entre fala e escrita”. (MOLLICA, 2000, p.59)
Nesse viés, Oliveira (2005) não sugere que apenas o conhecimento da língua falada
tenha influência sobre o processo de aquisição da escrita. O que o autor afirma
categoricamente é que a oralidade está amplamente envolvida nesse processo, e seu
afastamento se dará de forma gradual, à medida que o aprendiz entender que a língua falada e
a língua escrita são duas modalidades distintas. Ou seja, o aprendiz se move, dentro do
processo, de hipóteses calcadas totalmente da língua falada, para uma independência absoluta,
em que a língua escrita será pautada no conhecimento linguístico construído.
Nesse sentido, Miranda (2009) afirma que
[...] podemos pensar que o processo de aquisição da escrita proporciona ao aprendiz
momentos de retomada de conhecimentos já construídos de modo inconsciente,
especialmente aqueles relacionados à fonologia de sua língua, os quais vão se
tornando disponíveis ao acesso consciente, à medida que avança o processo de
aquisição do sistema de escrita (MIRANDA, 2009, p.410).
A aprendizagem da língua escrita pressupõe um indivíduo que possui representações
semânticas e fonológicas da língua, assim como competências que lhe permitem relacionar
representações fonológicas, semânticas e ortográficas. Logo, podemos afirmar que a
aprendizagem da língua escrita pressupõe um processo no qual intervêm, simultaneamente,
três elementos distintos: (a) um sistema sonoro – as representações fonológicas da língua; (b)
um sistema gráfico – as representações ortográficas; (c) um indivíduo que (re)constrói as
relações entre A e B (ALVARENGA, 1993, p. 03)
Para explicar a evolução do processo de emancipação entre a fala e escrita,
(re)construída pelo indivíduo, Oliveira (2005) propõe a Figura a seguir:
56
Figura 1 - Evolução da Escrita
Fonte: (OLIVEIRA, 2005, p.10)
A Figura anterior representa o que seria a evolução da escrita. A linha (t) representa a
linha do tempo, ou seja, a linha que se move dentro do quadro, representando a evolução do
processo da aquisição da escrita. Nessa Figura, Oliveira resume sua concepção e proposta
acerca do modo como a escrita é adquirida. Podemos interpretar esse gráfico da seguinte
forma: em um primeiro momento, essa aquisição é totalmente pautada na fala e à medida que
a escrita evolui, ocorre um processo de independência gradativo, até que o aprendiz seja capaz
de tratar as modalidades escrita e falada como distintas e independentes. Isto é, ao estabilizar
o processo de aquisição, a escrita se torna autônoma.
4.3 Considerações sobre o início da aquisição da escrita
De acordo com alguns teóricos, o processo de aquisição da escrita se assemelha à
própria evolução da escrita na história da humanidade. Por essa perspectiva, assim como
ocorreu no início da história da escrita, o aprendiz, no início do processo, faz uso de desenhos
para escrever. Essa primeira fase tem um caráter pictográfico, uma vez que existe a tendência
de tentar estabelecer uma relação com o objeto representado. Essa tentativa é chamada de
realismo nominal. Podemos observar essa tentativa quando crianças que estão na fase inicial
da aquisição da escrita são solicitadas a escrever palavras como boi e formiga. Para grafar a
palavra boi, há uma tendência de se usar muitas letras (porque o boi é um animal grande), e
poucas para grafar a palavra formiga (porque a formiga é um animal pequeno).
No caso do exemplo descrito, o aprendiz associa a escrita, que está no plano da
expressão, com o tamanho do objeto, que está no plano do conteúdo, ou seja, do significado.
0
Fala
(t)
100 0
Aquisição
o
100
Escrita
57
Com o andamento desse processo, a criança passa a apresentar uma escrita com
características silábicas. Nessa fase, o aprendiz faz uso de uma determinada quantidade de
letras com base na quantidade de sílabas, não havendo, ainda, uma consciência sobre o
aspecto individual da relação som/letra. Com a evolução desse estágio silábico, a criança
atinge a fase em que faz uso de uma escrita alfabética.
A esse respeito, Ferreiro39 e Teberosky (1986) postulam que a criança reinventa os
sistemas de escrita, criados historicamente pelo homem. De acordo com a pesquisadora, o
sujeito constrói sua escrita de forma particular e processual, através de construções silábicas
hipotéticas, em uma tentativa de associar os sons às grafias apresentadas. Para as
pesquisadoras, esse processo de alfabetização pode ser explicado da seguinte forma: (i) escrita
pré-silábica: reproduz traços básicos de escrita, mas não há relação com os sons
representados; (ii) escrita silábica: há tentativa de relacionar som/grafia, normalmente é
atribuído uma letra para cada sílaba; (iii) escrita silábico-alfabética: é um momento de
transição, no qual a criança começa a grafar algumas sílabas. Nesse estágio, o aprendiz
percebe que uma letra não é suficiente para representar determinados sons; (iv) escrita
alfabética: nessa fase já existe a concepção de que a sílaba é formada, na maioria das vezes,
por mais de um constituinte, isto é, cada um dos caracteres da escrita corresponde a um som
que pode compor uma sílaba.
O estágio do processo de aquisição que interessa a esse trabalho é o alfabético. Nesse
estágio, a criança passa a reconhecer que a sílaba é composta por unidades menores, e isso
passa a ser representado através de hipóteses de construção de sílabas.
Sobre o estágio alfabético, Oliveira (2005) afirma que
[...] ao atingir a escrita alfabética, ela liga essa escrita aos sons que ela produz e
controla sua escrita tanto qualitativamente quanto quantitativamente [...] É
importante notar que escrever alfabeticamente não significa escrever
ortograficamente. Para que o aprendiz escreva ortograficamente é preciso enfrentar e
superar outros problemas (OLIVEIRA, 2005, p.19).
Assim, de acordo com Oliveira (2005), a evolução do processo de aquisição da escrita
acontece da seguinte forma.
39 A concepção de Oliveira, em relação ao construtivismo se diferencia pelo fator da oralidade, que não é
considerada por Ferreiro. Isto é, nos trabalhos de Ferreiro e Teberosky (1986) as várias hipóteses sobre a
construção da escrita não são correlacionadas com a atividade propriamente linguística do aprendiz. Para mais
detalhes, ver Oliveira e Nascimento (1990).
58
O aprendiz, no início do processo, toma como ponto de referência a sua própria fala.
Os sons que ele procura escrever, utilizando as letras do alfabeto, são sons muito
concretos, que ele ouve e é capaz de reproduzir. Nessa tentativa de escrever, o
aprendiz exerce o controle qualitativo e quantitativo de sua escrita, deixando-a muito
próxima de uma escrita fonética e, ao mesmo tempo, distante da escrita ortográfica
oficial. Sua escrita, nessa fase, tem o caráter de código. [...] É somente após um
certo tempo, no processo de substituição de hipóteses, que o aprendiz alcança uma
representação escrita com base na língua, ainda que não plenamente ortográfica, mas
independente de sua própria fala (OLIVEIRA, 2007, p.31).
De modo a resumir tal raciocínio, o autor apresenta o seguinte quadro:
Quadro 8 – Aquisição da Escrita
Fase Inicial Fase Final
Base Fala Base língua
Concreto Abstrato
Código Representação
Fonte: (OLIVEIRA, 2005, p.31)
Com a evolução do processo de aquisição da escrita, o aprendiz percebe que a escrita
ortográfica não está, necessariamente, pautada na fala. Ele parte do concreto (a fala) para um
nível mais abstrato de organização e de representação da escrita. Ele passa a ter dúvidas em
como representar algumas especificidades da escrita, como os padrões silábicos complexos e
a ortografia.
Essa instabilidade inicial no processo de aquisição da escrita faz parte de um processo
de emancipação e estabilização, proporcionando ao aprendiz a capacidade de refletir sobre a
própria língua - consciência metalinguística.
Nesse sentido Kato, Moreira e Tarallo afirmam que:
No processo de construção da linguagem escrita, a criança além de usar a linguagem
para compreender e produzir ideias, aprende a refletir sobre a linguagem como
objeto. A linguagem vai-se tornando alvo de pensamento e manipulação. A
capacidade de refletir sobre a linguagem é conhecida como consciência
metalinguística e se dá em vários níveis: consciência fonêmica (fonológica),
consciência de palavra, consciência de forma, consciência pragmática (KATO;
MOREIRA; TARALLO, 1998, p. 27).
59
Para Miranda (2014b), na aquisição da escrita ocorre um processo de atualização40
associado a uma reflexão sistemática sobre a estrutura formal da língua. Assim, cria-se uma
oportunidade concreta para que a criança (re)atualize seu conhecimento linguístico, já
adquirido de maneira natural e espontânea em seus primeiros anos de vida.
Miranda argumenta que as construções hipotéticas, construídas pela criança,
correspondem a uma fonte de reflexão, permitindo um processo metalinguístico sobre o
conhecimento construído da língua. Dessa forma, assim como afirma Abaurre (1988), há um
processo de desenvolvimento recíproco, em que a oralidade conduz a escrita e a escrita
permite reflexões sobre o saber linguístico já construído.
Outro aspecto a ser observado nesse processo diz respeito à segmentação de palavras
que, durante a aquisição da escrita, foge inúmeras vezes do padrão morfológico. Isso ocorre
porque o aprendiz pode escrever por palavras fonológicas, como observa Oliveira:
Quando falamos, regulamos nossa fala pelo acento, isto é, falamos por palavras
fonológicas (ou unidades de acento). Mas, quando escrevemos, nós o fazemos por
palavras morfológicas (ou unidades de sentido). Em português, como em outras
línguas, algumas palavras não têm acento próprio (e, por isso, não tem
independência sintática). Essas palavras são conhecidas pelo nome de clíticos. Um
clítico é pois, uma palavra sem autonomia fonológica e sintática. (OLIVEIRA,
2005, p. 38)
O critério de segmentação usado pela criança em textos espontâneos costuma ser o
grupo tonal ou subpartes do grupo tonal (unidade de informação carreada, na fala, por um
padrão rítmico/entoacional específico). Assim, é comum segmentar menos do que a escrita
exige. Como exemplo podemos citar casos como umbripi (um príncipe), abechou (a beijou),
entre outros. Nesse caso, as hipóteses do aprendiz não são categóricas. Assim, a criança pode
fazer segmentações além da hipótese fonética. Por isso, às vezes, ela segmenta mais do que a
ortografia exige, a partir da atribuição de conteúdos semânticos específicos a subpartes de
palavras, como por exemplo, ador -mecida (adormecida) (ABAURRE, 1985, p.27-28).
À medida que a criança constrói e reconstrói suas hipóteses na interação com a escrita,
ela passa a perceber que a modalidade escrita não é uma mera transcrição da fala. Esse
processo evolui até que as duas modalidades, fala e escrita, estejam totalmente independentes
no consciente do aprendiz.
40 “[...] quando a criança percebe que a língua é som e que ela pode registrar aquele som por meio de símbolos
gráficos, vai poder retornar a esse conhecimento, percebendo que ele tem outra dimensão, a dimensão estrutural.
Essa é a ideia de atualização a que eu me refiro [...]” (MIRANDA, 2014a, p. 13).
60
4.4 As hipóteses e a hierarquia dos constituintes silábicos
Durante o processo de aquisição da escrita, o aprendiz passa a refletir sobre a língua e
a criar hipóteses de construção sobre os moldes silábicos. Como vimos, a primeira sílaba a ser
dominada na modalidade escrita é a CV, a sílaba canônica. As sílabas que não pertencem a
esse molde podem proporcionar um número maior de construções hipotéticas, em um
processo de experimento e erro, até que se alcance e se estabilize o novo padrão.
Sobre a criação e a importância das hipóteses, Gnerre e Cagliari afirmam que “só
refletindo sobre as próprias hipóteses que a criança pode entender e aprender, sem grandes
perplexidades” (GNERRE; CAGLIARI, 1985, p. 28). Desse modo, é por meio das hipóteses
que a criança passa a ter uma relação natural com a escrita. Partindo de sua competência
linguística, ela reflete, cria hipóteses e constrói.
Nesse sentido, Nascimento e Oliveira (1990) postulam que as hipóteses são
determinadas pela competência linguística do falante.
[...] a construção do conhecimento da escrita é essencialmente mediada pela
competência linguística do aprendiz: é ela um dos fatores determinantes da
elaboração das hipóteses e estratégias por ele utilizadas na construção de seu
conhecimento sobre a escrita (NASCIMENTO; OLIVEIRA, 1990, p. 36).
Ainda sobre a relevância da competência linguística do aprendiz, Abaurre (1988)
afirma que as crianças, de modo geral, recorrem à oralidade para levantar hipóteses sobre o
sistema escrito e elaborar propostas de representação que, com o tempo, constituirão
representações canônicas da língua. A autora ainda destaca que, da mesma forma, as crianças
usam a escrita dinamicamente para conduzir uma análise da própria língua, modalidade
falada.
Dessa forma, podemos afirmar que as hipóteses de construção e reconstrução fazem
parte do processo de aquisição da modalidade escrita e também funcionam como insumo para
reflexões metalinguísticas.
Sobre essas hipóteses, Alvarenga (1993, p. 5) afirma que as construções ortográficas
construídas pelos aprendizes são produtos de uma elaboração intensa, produtiva e dinâmica.
Trata-se, portanto, do resultado de muitas hipóteses implícitas. Alvarenga (1993) afirma que
as construções que diferem das normas, chamadas por ele de variações, não são aleatórias,
isto é, são traços de aprendizagem que traduzem conflitos entre a boa formação fonológica e
as convenções ortográficas. Para o autor, analisar as variações não significa apenas medir
diferenças que separam as variações, mas, sim, buscar as causas profundas. As variações
61
marcam os caminhos que os aprendizes podem traçar com certa facilidade, quando orientados
pelos princípios fonológicos. Além disso, tais variações podem indicar os pontos de
dificuldades na aquisição das representações oficiais.
As hipóteses levantadas pelos aprendizes não são apenas sobre a construção fonética
das palavras. Igualmente importante estão as hipóteses de construção linear da sílaba. Isto é,
há hipóteses sobre a ordem correta das letras/sons. Portanto, podemos afirmar que a sílaba é
um locus de interferência fonológica, isto é, ela é alvo de (re)construções sobre a organização
dos segmentos que a compõem, nas duas modalidades, de forma recíproca.
De acordo com Massini-Cagliari (1999, p.125), a questão da linearidade propõe
reflexões que, no processo de construção de um sistema de escrita, são anteriores à busca da
ortografia.
Para Abaurre (1999), a hipótese sobre a natureza da relação existente entre o número e
a ordem das letras nas primeiras escritas
[...]é bem mais complexa e interessante do que uma simples “omissão” ou “troca de
letras” e tem relação direta com a natureza da relação entre um sistema alfabético de
escrita e a hierarquia dos constituintes silábicos. (ABAURRE, 1999, p. 174)
Dessa forma, estruturas silábicas mais complexas podem passar por hipóteses de
ordem e de quantidade de letras, envolvendo omissões e trocas. Nessa perspectiva, nosso
trabalho propõe analisar as variações nas estruturas silábicas CVC e CCV.
4.5 A sílaba: um domínio prosódico
A sílaba é um dos elementos mais estudados na fonologia contemporânea, ocupando
lugar privilegiado nos trabalhos produzidos atualmente. Várias análises têm afirmado que a
análise fonológica é enriquecida quando se considera o nível silábico. Logo, vários
fenômenos são mais bem explicados quando se postula, no quadro teórico, um nível silábico,
intermediário entre o nível da palavra e o nível do segmento. (ALVARENGA; OLIVEIRA,
1997, p. 128).
Nesse sentido, Abaurre (1999) também considera que o estatuto da sílaba está mais do
que estabelecido nas teorias fonológicas atuais, dada sua importância para a compreensão de
muitos processos fonológicos que afetam os segmentos.
62
Sobre isso, a autora afirma que “nas chamadas hierarquias prosódicas, a sílaba como
um dos domínios prosódicos postulados, serve de locus para a organização dos segmentos”
(ABAURRE, 1999, p. 179).
A meta explicativa da teoria da sílaba é dar conta da existência de regras específicas
na gramática fonológica de uma língua, demonstrando que sua presença pode ser
derivada de princípios de silabificação. [...] Outra consideração importante é a de
que, uma vez que a estrutura silábica organiza as cadeias segmentais em sílabas, essa
estrutura mesma cria a possibilidade de condicionamento das regras fonológicas
através da referência direta à estrutura silábica (ABAURRE; WETZELS, 1992, p.
10).
Nosso interesse recai sobre esse processo de silabificação, mais precisamente na
organização dos segmentos. Desse modo, a questão que nos atrai é o preenchimento de
posições silábicas. Um problema, muitas vezes episódico e eventual, que faz parte do
processo de aquisição da escrita, mas que frequentemente é confundido com o erro
ortográfico.
Abaurre (1996, p. 127), ao analisar um texto de escrita espontânea, produzido por uma
criança em processo de aquisição da escrita, traz à discussão a hesitação da criança ao
levantar sua hipótese sobre a escrita da palavra monstro nas seguintes tentativas: MOSRTO,
MOSRTO, MOSTO, MOSTO. Para a autora, essas tentativas revelam um momento particular
de perplexidade da criança diante de algo ainda misterioso, a saber, a ordenação linear da
sílaba CVCC (MONS).
Ainda sobre essa questão, Abaurre afirma que
[...] a utilização de letras que correspondem, nas sílabas, a posições que ainda não
identificou, e cuja identificação talvez dependa de uma segmentação e ordenação
linear dos sons da própria fala, processo por sua vez, no qual será provavelmente
auxiliada pela tentativa de compreensão desse aspecto para ela misterioso da escrita,
com o qual demonstra, nesse texto, estar começando a preocupar-se. (ABAURRE,
1996, p. 131).
De acordo com essa perspectiva, não se trata de um “problema ortográfico”, como
aqueles que envolvem a escolha de uma determinada letra correta dentre outras que podem
representar na escrita determinado fonema. A questão está em decidir sobre o número de
segmentos que devem ser representados, bem como sobre a posição que cada um deve ocupar
na sílaba (ABAURRE, 1999, p.176).
Logo, estruturas mais complexas, as quais apresentam coda ou onset complexo, fazem
com que o aprendiz reflita e levante hipóteses sobre as posições lineares dos segmentos
silábicos. Assim como na aquisição da fala, “há uma ordem obedecida pelas crianças
63
relativamente à aquisição do padrão silábico e [os teóricos] são unânimes em atestar a
seguinte sequência: CV, V >> CVV >> CVC >> CCV, CCVC...” (MIRANDA, 2009, p. 413)
Dessa forma, postulamos que a criança, durante a aquisição da escrita, cria hipóteses
para os segmentos que preenchem a sílaba, assim como o fez na aquisição na modalidade
falada, com base em seus modelos linguísticos internalizados. Isto é, ocorre um processo
metalinguístico que permite que o aprendiz (re)construa a aquisição da modalidade escrita
com base no seu conhecimento linguístico, tendo a sílaba um papel fundamental na reflexão
das hipóteses e no domínio prosódico.
4.6 Interferências na escrita: pontos menos estáveis
Como já pontuado, partimos da premissa de que a aquisição da modalidade escrita da
língua é pautada, inicialmente, na oralidade. Essa dependência traz algumas questões que são
próprias da modalidade falada, entre elas, a construção interna da sílaba – o ponto de partida
de todo o processo.
Para discutirmos essa construção interna da sílaba e suas especificidades, usaremos a
ideia de canonicidade e instabilidade, proposta por Alvarenga (1993). A canonicidade é a
noção de “ótimo” estrutural, ou seja, a estrutura privilegiada pela língua. No caso do
português, a estrutura privilegiada é uma consoante seguida de vogal - CV. Pela perspectiva
da canonicidade, as demais estruturas silábicas apresentam, em graus maiores ou menores,
pontos de instabilidade. Logo, “todas as sílabas diferentes de CV serão, de maneira geral,
fontes virtuais de variação na língua falada e, consequentemente, na língua escrita.”
(ALVARENGA, 1995, p.27).
No presente trabalho, nosso olhar recai sobre a instabilidade na construção da coda e
do onset complexo. Como vimos na seção anterior, ocorre uma série de hipóteses, na escrita
espontânea, com base na oralidade, isto é, as reflexões do aprendiz partem de seu
conhecimento linguístico da língua, modalidade falada.
Nesse sentido, podemos inferir que as variações e hipóteses construídas pelo aprendiz
não ocorrem ao acaso, mas são motivadas por um conjunto complexo de parâmetros, por
condicionamentos ou variáveis que podem favorecer ou inibir determinada possibilidade de
variação (MOLLICA, 2000, p.14).
Essas variações podem ter como determinante um fator estrutural ou não estrutural.
Por fator estrutural, entendemos que são variações condicionadas e propiciadas por
64
interferências fonológicas da própria língua. Já os não estruturais são fatores externos,
influências do meio social do aprendiz.
4.6. 1 Coda: uma posição instável
Como visto anteriormente, o onset é uma posição forte, isto e, uma posição
consonantal estável, ao passo que a coda é uma posição fraca, isto é, uma posição consonantal
instável. De acordo com essa premissa, podemos afirmar que uma consoante qualquer
localizada entre duas vogais será interpretada como um ataque/onset, uma vez que, a
princípio, dada a distribuição das forças, um ataque/onset sempre tem preferência sobre a
coda (ALVARENGA, 1993, p. 38).
Como vimos na seção 2.3.2, além dos princípios universais, há condições particulares
impostas por cada língua que complementam a boa formação silábica. Em português, de
acordo com Bisol 2013a, a posição de coda é preenchida por qualquer soante e também por
/s/. Qualquer segmento diferente desses pode ser rejeitado pela posição, salvo por algum
processo fonológico de ressilabificação, como, por exemplo: afta/afita, pacto/páquito,
advérbio/adivérbio, corrupção/corrupição - salvo por inserção de uma vogal epentética.
Essa particularidade não é apenas da língua portuguesa, mas das línguas românicas em
geral. Sobre isso, Collischonn afirma que
Em latim, qualquer consoante poderia aparecer em posição final de sílaba (exceto
kʷ, gʷ, f e h), enquanto o português arcaico e as outras línguas romance mostram
uma tendência forte para reduzir ou mesmo eliminar sílabas fechadas através de uma
variedade de processos históricos, como a simplificação de geminadas e de grupos
consonantais, a vocalização e a monotongação. O resultado disso é que as sílabas só
podiam ser fechadas por soantes ou /s/. Por efeito de um processo tardio de
empréstimos, sílabas fechadas por obstruentes voltaram a fazer parte do léxico
português. São essas formas que o português brasileiro tende a modificar,
transformando sílabas fechadas (CVC) em uma sequência de sílabas abertas
(CV.CV) (COLLISCHONN, 2002, p. 207).
Além desse licenciamento imposto pela língua para a posição de coda, existe outra
implicação: a canonicidade da sílaba CV. Formatações silábicas diferentes da privilegiada
pela língua apresentam pontos de instabilidades maiores ou menores.
Logo, a posição de coda das sílabas é instável, isto é, há possibilidades de variações de
pronúncia, situação que se reflete no processo de aquisição da escrita.
65
4.6. 2 Onset complexo: outro ponto de instabilidade
Vimos no Capítulo 3 que a língua possui “condição de onset”, ou seja, a língua possui
condição particular que permite o licenciamento dos segmentos que podem formar o onset e o
onset complexo. Para que um onset complexo seja produzido, ele deve ser compatível com os
critérios postos pela língua.41
Também vimos que um dos princípios de composição da sílaba básica é o Princípio de
Maximização do Onset, a saber, os onsets são priorizados no processo de silabação da língua.
Então, a língua apresenta tendência de maximizar a distância entre a consoante e a vogal.
Quando há a inserção de uma segunda consoante no onset, essa maximização entre a
consoante e a vogal é diminuída. Isso ocorre porque, na língua portuguesa, a segunda
consoante sempre possui o traço [+soante]42 e apresentará, portanto, uma distância menor em
relação à vogal [+soante].
De acordo com essa perspectiva, podemos afirmar que a segunda posição do onset
complexo também pode apresentar instabilidade, já que pode ser omitida para maximizar a
distância sonora entre os segmentos, o que satisfaz uma preferência da língua.
Assim, podemos afirmar que esse ponto de instabilidade pode causar processos de
reestruturação silábica, por omissão ou metátese, o que também pode ser refletido no processo
de aquisição da escrita, uma vez que o aprendiz pode preferir a representação de CV à CCV.
Vimos nesse capítulo uma discussão mais detalhada acerca da relação entre fala e
escrita no processo de aquisição da escrita. Para dar continuidade às nossas discussões, o
capítulo a seguir irá descrever a metodologia usada para coleta e análise dos dados da
pesquisa realizada.
41 Ver Figura 7 da seção 3.3.2. 42 Com exceção do /s/.
66
5 METODOLOGIA
Neste capítulo vamos apresentar a metodologia adotada para a realização da pesquisa,
visando aplicar os pressupostos teóricos com os quais fundamentamos o presente trabalho.
A metodologia utilizada nesta pesquisa foi construída com base em três pilares
principais, a saber, (i) a sílaba é o locus para a organização dos segmentos; (ii) a produção de
escrita inicial do aprendiz está pautada na modalidade falada da língua; e (iii) os modelos
fonológicos adotados indicam que o onset complexo e a coda são menos estáveis que as
demais configurações silábicas. Partindo desses pressupostos, elegemos (i) as duas variáveis
dependentes; e (ii) as variáveis independentes que especificaram os respectivos contextos de
ocorrência. Dessa forma, quantificamos, dentro de um determinado universo, a instabilidade
dos padrões silábicos CCV e (C)VC na escrita, considerados aqui como variáveis
dependentes, em função de seu contexto de ocorrência, o qual é caracterizado por um
conjunto de variáveis independentes.
5.1 Classificação da pesquisa
Para a composição do presente trabalho, utilizamos a pesquisa descritiva, tendo em
vista os objetivos gerais já apresentados. De acordo com Gil (2002, p. 42), pesquisas
descritivas têm como objetivo primordial a descrição das características de determinada
população ou fenômeno ou, então, o estabelecimento de relações entre variáveis. Além disso,
pesquisas descritivas também são classificadas de acordo com o procedimento técnico
utilizado. No âmbito das pesquisas descritivas, a que realizamos neste trabalho se enquadra na
tipologia “Levantamento”, uma vez que a obtenção dos dados aqui apresentados foi realizada
em um ambiente controlado. Após a coleta dos dados, foi feita uma análise quantitativa dos
fenômenos observados. Por fim, após a tabulação dos resultados obtidos, foi realizada a
análise qualitativa.
5.2 O universo da pesquisa
A pesquisa possui dois universos: escolas de Belo Horizonte43 e escolas de Cuiabá.
Vamos nomeá-los de universo I e universo II.
O universo I é constituído por 3 escolas e 4 corpora, sendo eles:
43 Essas redações fazem parte da amostra analisada por Alvarenga (1993) em sua tese.
67
(i) Escola Estadual Mariano de Abreu
a) Método de alfabetização global44;
b) Método de alfabetização fônico
(ii) Colégio Zilah Frotta (Método de alfabetização global)
(iii) Colégio Santo Agostinho (Método de alfabetização fônico)
O universo II é constituído por 2 escolas e 2 corpora:
(i) Escola Municipal Professora Hilda Caetano de Oliveira Leite (Método de
alfabetização misto)
(ii) Colégio Gasparzinho (Método de alfabetização misto)
No universo I, coletamos uma amostra com 160 redações, sendo 40 por ano escolar.
De forma análoga, no universo II a amostra coletada contou com 80 redações, sendo 20 por
ano escolar. 45 É importante ressaltar que, em 2011, o Ensino Fundamental sofreu alterações
em sua organização, incorporando o 9º ano na formação básica do aprendiz. No formato
anterior (oito anos de duração), a criança iniciava o Ensino Fundamental com idade entre seis
e sete anos. No formato vigente, a criança inicia o Ensino Fundamental com idade entre cinco
e seis anos.
Desse modo, para manter a equivalência das idades dos universos I e II, fizemos a sua
correspondência entre as séries. Assim, para o universo I, utilizamos dados do 1º ano
(aprendizes com idades entre seis e sete anos) e, para o universo II, utilizamos dados do 2º
ano (aprendizes com idade entre seis e sete anos), e assim sucessivamente.
As análises foram feitas nas redações do 2º ano ao 5º ano, os quais eram denominados,
até 2010, como séries (da 1ª série a 4ª série). A distribuição e a classificação das séries/anos
escolares ficaram definidas como:
44 O Método de alfabetização foi apresentado apenas como uma informação sobre o processo de alfabetização
adotado pela escola. As análises realizadas não serão feitas com base nessa informação. 45 “Assegurar a todas as crianças um tempo mais longo no convívio escolar, mais oportunidades de aprender e
um ensino de qualidade. Essa é a proposta do MEC com a implantação do ensino fundamental de nove anos. A
intenção é fazer com que aos seis anos de idade a criança esteja no primeiro ano do ensino fundamental e
termine esta etapa de escolarização aos 14 anos. A ampliação do ensino fundamental começou a ser discutida no
Brasil em 2004, mas o programa só teve início em algumas regiões a partir de 2005. O prazo para que o ensino
fundamental seja de nove anos em todo o Brasil é até 2010.” Fonte:
http://portal.mec.gov.br/index.php?option=com_content&view=article&id=12377:ensino-fundamental-de-nove-
anos-apresentacao&catid=313:ensino-fundamental-de-nove-anos&Itemid=627
68
Tabela 1 – Classificação séries/anos
Universo I Universo II Total
A 1ª série
2ª série
2º ano 60 redações
B 3º ano 60 redações
C 3ª série 4º ano 60 redações
D 4ª série 5º ano 60 redações
Fonte: Elaborado pela autora.
A tabela anterior mostra o número de redações coletadas em cada série/ano,
totalizando 60 redações por série/ano. Ao todo, foram coletadas 240 redações.
5.3 Os Sujeitos
As redações coletadas para esta pesquisa foram escritas por crianças que frequentam
os primeiros anos do Ensino Fundamental (2º ano ao 5º ano). A média de idade desses alunos
está entre 7/8 anos a 10/11 anos. Para a escolha dos sujeitos, foram consideradas mais duas
variáveis, a saber, sexo e nível socioeconômico.
Os sujeitos de escolas particulares foram considerados como pertencentes a uma classe
mais favorecida, a qual será denominada como classe A. Já os de escolas públicas foram
considerados como provenientes de uma classe menos favorecida, classe B.
Em seguida, os aprendizes foram separados por sexo (feminino ou masculino). Assim,
para a montagem do corpus, foram consideradas essas três variáveis, distribuídas de forma
igualitária entre os sujeitos.
Além disso, foi acrescentada uma quarta variável para determinar a cidade à qual o
sujeito pertence, Belo Horizonte ou Cuiabá. Por fim, as variáveis que caracterizam os sujeitos
são:
Quadro 9 – Variáveis independentes não estruturais
Variáveis Quantidade/Variável
Ano Escolar
A 60
B 60
C 60
D 60
Total 240
Sexo
Feminino 120
Masculino 120
Total 240
69
Classe Social
Classe A 120
Classe B 120
Total 240
Cidade
Belo Horizonte 160
Cuiabá 80
Total 240
Fonte: Elaborado pela autora.
5.4 A atividade proposta
Para a composição dos dados aqui analisados, nos valemos de redações produzidas por
crianças matriculadas no Ensino Fundamental. Em relação aos dados do universo I, utilizamos
a amostra de dados do professor Daniel Alvarenga, os quais estão no anexo de sua tese
intitulada Variations orthographiques, temps d’identification et apprentisage de la
langue écrite portugaise: une approche phono-cognitive. A tese, assim como seu anexo,
está disponível na Biblioteca da Faculdade de Educação da Universidade Federal de Minas
Gerais.
De acordo com Alvarenga (1993), os dados foram retirados de redações propostas
como atividade normal de sala de aula, aplicadas pela professora regente. O tema das terceiras
séries (4º ano atual) e quartas séries (5º ano atual) foi o mesmo, “Se eu pudesse”, mas
alternaram nas primeiras séries (2º ano atual) e segundas séries (3º ano atual) entre os
seguintes temas: “Era uma vez”, “Meu brinquedo favorito”, “Se eu pudesse” e “Um sonho”.
Para compor a amostra de dados do universo II, utilizamos redações produzidas por
crianças residentes na cidade de Cuiabá. A coleta dessas redações ocorreu durante o mês de
novembro de 2014. Para tanto, a pesquisadora entrou em contato com as escolas, solicitou
autorização46 e marcou uma reunião. A escolha das escolas não seguiu nenhum padrão, sendo
feita de forma aleatória.
Para formalizar a coleta de dados, foi encaminhado um envelope para cada professor
com as instruções para o desenvolvimento da atividade e com as folhas próprias para a
redação.
É importante ressaltar que, nas instruções enviadas aos professores, orientou-se que
estes não interferissem e não esclarecessem nenhuma dúvida em relação à grafia. A folha
apresentava o tema da redação e solicitava o nome e o ano escolar47 do aluno. O tema
46 Autorização em anexo. 47 Um fato curioso é que alguns alunos tiveram dúvidas quanto ao preenchimento do “ano escolar”, colocando
70
escolhido foi “Se eu pudesse”, um dos temas aplicados no universo I. A escolha desse tema se
deu por ele ter sido o mais frequente nas redações no universo I e por proporcionar ideias
mais livres, permitindo um léxico mais variado.
Com as instruções48 para a atividade proposta, foram recolhidas 78 redações da escola
I e 87 redações da escola II. A escolha das redações foi feita de forma aleatória. Além disso,
para que o padrão fosse mantido, também foram selecionadas 40 redações de cada escola.
5.5 Constituição do corpus
5.5. 1 Variáveis não estruturais
Para o andamento da codificação dos dados, as redações foram organizadas de acordo
com a escolha das variáveis não estruturais. Na definição dessas variáveis, avaliamos os
fatores que são considerados relevantes para a identificação dos sujeitos na pesquisa: ano
escolar, sexo, classe social e cidade.
A escolha da variável ano escolar se justifica pela hipótese de que com a evolução do
processo de aquisição da escrita o fenômeno pesquisado, alterações no padrão silábico CCV e
(C)VC, tenda a diminuir gradativamente.
Sobre a variável sexo, sua escolha se justifica por esse fator ter sido apontado nas
pesquisas de Sociolinguística como relevante, já que “em termos linguísticos, o sexo feminino
é mais conservador [sic] e mais sensível às instruções na escola” (MOLLICA, 2000, p.90)
Quanto à variável classe social, a Sociolinguística tem apontado que há relações
teóricas e empíricas que justificam a escolha que considere a relação entre linguagem e nível
socioeconômico. (Soares et al, 1989, p.09)
A variável cidade foi inserida posteriormente, devido ao acréscimo do corpus com
redações provenientes da cidade de Cuiabá – MT.
5.5.2 Variáveis Estruturais
As variáveis estruturais foram definidas de acordo com as possíveis relações de
condicionamentos fonológicos entre o padrão silábico analisado e os segmentos adjacentes,
além de algumas especificidades das palavras, como tonicidade e quantidade de sílaba,
nesse espaço a data da atividade, ou, até mesmo, demonstrando hesitação no preenchimento – marca constatada
por borrões e reescritas. 48 Modelo em anexo.
71
considerando as particularidades de cada variável dependente, a saber, CCV e (C)VC. Os
detalhes serão expostos nas próximas seções.
5.5.3 Onset complexo: variável dependente CCV
No levantamento realizado, foram encontrados 721 padrões CCV, realizados ou
modificados. Na primeira codificação dos dados, optamos por caracterizar o registro da
variável dependente conforme o status apresentado pelo padrão silábico, ainda que não
binomial, conforme podemos observar no quadro a seguir:
Quadro 10 – Status da representação gráfica do onset Status Descrição
P (pleno) onset complexo realizado - CCV
R (reduzido) onset complexo reduzido - CV
D (deslocado) onset complexo deslocado para outra posição na palavra - CV
E (epentético) onset complexo desfeito pelo acréscimo de uma vogal - C(V)CV
Fonte: Elaborado pela autora.
Com essa identificação, foi possível registrar numericamente as hipóteses criadas
pelos aprendizes, além de facilitar o manuseio dos dados por tipo de fenômeno e inferir as
possíveis interferências de fatores estruturais no contexto da variação.
O programa computacional escolhido para fazer a análise multivariada é binomial.
Portanto, a variável dependente só poderia ter dois valores – a ocorrência ou a não ocorrência
do fenômeno pesquisado. Dessa forma, em outro arquivo, fizemos a recodificação dessa
variável com status binomial: código (1) para as ocorrências de CCV preservado e código (2)
para as ocorrências de CCV modificado.
5.5.3.1 Variáveis independentes definidas para CCV
A hipótese proposta por este trabalho é a de que, por influência da modalidade falada
da língua portuguesa, há uma tendência do padrão CCV ser reduzido a CV na escrita. Dessa
forma, foi preciso elencar os possíveis ambientes estruturais que poderiam contribuir para
essa alteração.
Esses ambientes formam os grupos de fatores, chamados de variáveis independentes
estruturais. Isto é, a princípio essas variáveis não possuem relação com o problema posto pela
72
variável dependente, mas fazem parte de uma análise estatística que determina,
matematicamente, se os contextos levantados favorecem ou inibem significativamente a
redução do onset complexo.
Para tanto, levamos em consideração os seguintes ambientes: modo de articulação da
primeira consoante; modo de articulação da segunda consoante; vozeamento da primeira
consoante; nasalidade vocálica (oral ou nasal); vogal da sílaba; posição da sílaba na palavra;
tonicidade da sílaba; número de sílabas da palavra e classe gramatical da palavra.
Os grupos de fatores que contêm as variáveis independentes estruturais são, portanto,
os seguintes:
(i) Modo de articulação da primeira consoante: O (oclusiva) F (fricativa)
(ii) Modo de articulação da segunda consoante: L (lateral) R (tepe) W (outra)
(iii) Vozeamento da primeira consoante: U (surda) O (sonora)
(iv) Vogal da sílaba: a e E (é) i o O (ó) u D (ditongo)
(v) Nasalidade vocálica: O (oral) N (nasal)
(vi) Posição da sílaba na palavra: F (final) M (medial) I (inicial) U49 (única)
(vii) Tonicidade da sílaba: T (tônica) A (átona)
(viii) Número de sílabas da palavra: M (monossílaba) D (dissílaba) T (trissílaba) P
(polissílaba)
(ix) Classe gramatical das palavras: A (adjetivo) N (nome) V (verbo) D (advérbio)
O (outra)
Vejamos, a seguir, um exemplo de codificação para as variáveis independentes
estruturais do onset complexo.
5.5.4 Coda: variável dependente (C)VC
Para a análise da coda, o levantamento realizado nas amostras identificou um total de
3728 ocorrências para o padrão silábico (C)VC. Assim como no onset complexo, na primeira
codificação dos dados, também optamos por fazer uma marcação mais ampla que a binomial.
49 Essa posição foi usada para palavras monossílabas
Palavra: ESTRELAS
Codificação: ORUeOMTTN
73
A atribuição do status levou em consideração o perfil gráfico apresentado na escrita. Dessa
forma, elencamos os códigos conforme o quadro a seguir:
Quadro 11 – Status da representação gráfica da coda Status Descrição
P (pleno) coda realizada - (C)VC
R (reduzido) coda reduzida - (C)V
D (deslocado) coda deslocada - (C)V
S (ressilabado) coda ressilabada - (C)V. CV
E (epentético) coda desfeita pelo acréscimo de uma vogal epentética - (C)V.C (V)
X (sem relação) posição de coda marcada sem relação grafema/fonema (C)VC
Fonte: Elaborado pela autora.
Assim como no caso do onset complexo, com essa especificação da variação foi
possível registrar numericamente as hipóteses, além de facilitar o manuseio dos dados por tipo
de ocorrência e inferir as possíveis interferências de fatores estruturais no contexto da
variação.
Na sequência, em outro arquivo, também recodificamos de forma binomial os dados
encontrados, conforme solicitado pelo programa Varbrul. Dessa forma, nossa codificação
binomial ficou determinada da seguinte forma: (1) coda preservada ou (2) não preservada; (1)
coda ortográfica e (2) coda não ortográfica; e/ou (1) coda grafada na posição correta e (2)
coda grafada em posição de onset.
5.5.4.1 Variáveis independentes definidas para (C)VC
A nossa hipótese para a análise da coda é a de que, por influência da modalidade
falada da língua portuguesa, há uma tendência de a coda ser omitida por representar um locus
de maior instabilidade na modalidade falada. Portanto, esse padrão silábico pode ser reduzido
a (C)V.
Os ambientes estruturais elencados como possíveis favorecedores ou inibidores da
redução da coda foram: natureza da coda; sonoridade do segmento seguinte; vogal da sílaba;
posição da sílaba na palavra; tonicidade da sílaba; número de sílabas da palavra e classe
gramatical da palavra.
Os grupos de fatores para as variáveis independentes estruturais são:
74
(i) Natureza da coda: R S L U O B (coda de oclusiva) N (nasal)
(ii) Sonoridade do segmento seguinte: U (consoante surda) O (consoante sonora) V
(vogal) P (pausa)
(iii) Vogal da sílaba: a e E (é) I o O (ó) U D (ditongo)
(iv) Posição da sílaba na palavra: F (final) M (medial) I (inicial) U50 (única)
(v) Tonicidade da sílaba: T (tônica) A (átona)
(vi) Número de sílabas da palavra: M (monossílaba) D (dissílaba) T (trissílaba) P
(polissílaba)
(vii) Classe gramatical da palavra: A (adjetivo) N (nome) V (verbo) D (advérbio) O (outra)
Vejamos, a seguir, um exemplo de codificação para as variáveis independentes
estruturais da coda.
Assim, todos os vocábulos foram identificados e codificados de acordo com sua
variável dependente (CCV ou (C)VC) e suas variáveis independentes. Dessa forma, o corpus
da presente pesquisa foi constituído em códigos prontos para ser inseridos em um programa
de análise multivariada.
5.6 Metodologia de análise dos dados
De acordo com Guy e Zilles (2007), a variação linguística, entendida como alternância
entre dois ou mais elementos linguísticos, não pode ser adequadamente descrita e analisada
em termos categóricos ou estritamente qualitativos.
A análise da regra variável foi desenvolvida na linguística como uma forma de dar
conta da variação estruturada, governada por regras, no uso da língua. Trata-se da
variação linguística que regularmente mostra taxas mais altas ou mais baixas de
ocorrência em determinados ambientes [...] (GUY e ZILLES, 2007, p.48).
Por essa perspectiva, os dados levantados necessitam de uma análise quantitativa que
considere os ambientes selecionados como favorecedores ou inibidores da variação. Dessa
forma, submetemos os dados ao conjunto de programas computacionais de análise
50 Essa posição foi usada para palavras monossílabas.
Palavra: PEGAR
Codificação: RVaFTDV
75
multivariada: Varbrul – do inglês Variable Rules Analysis – projetado com a finalidade de
acomodar dados de variação sociolinguística.
O GoldVarb2001 foi desenvolvido pela Universidade de York como um projeto
colaborativo entre os Departamentos de Linguagem e de Ciência Linguística e Serviços
Computacionais. Foi desenvolvido por Steve Harlow, que teve a ideia de criar o programa
para o sistema operacional Windows a partir da versão anterior GoldVarb 2.0 (RAND;
SANKOFF 1990), executável apenas em Macintosh. O GoldVarb 2001 é uma aplicação
contida em um arquivo executável simples que não requer qualquer outro software
especializado. (ROBINSON; LAWRENCE; TAGLIAMONTE, 2001)
O Programa permite que todos os dados codificados sejam acomodados. Desse modo,
o software faz uma análise multivariada que permite que uma variável linguística, nesse caso,
os tipos silábicos pesquisados, seja investigada sob a possível influência de diversos
contextos, isto é, múltiplas variáveis independentes. Além de medir os efeitos, o programa
também mede a significância dos efeitos dessas variáveis independentes sobre a ocorrência da
realização da variável dependente. Desse modo, o Varbrul permite que o pesquisador teste
hipóteses sobre a natureza, tamanho e direção dos efeitos das variáveis independentes. Pode-
se afirmar que esse programa facilita a construção de um modelo quantificado dos processos
linguísticos dentro de certos limites dos processos sociais, os quais controlam e produzem os
padrões regulares da variação sociolinguística (GUY; ZILLES, 2007, p. 105).
Para Guy e Zilles (2007), o uso do Varbrul, em detrimento ao uso de uma análise
univariada, é justificável, uma vez que uma análise multivariada procura produzir um cálculo
de efeitos que sempre controla simultaneamente todos os contextos e variáveis independentes.
Além de permitir a construção de um modelo completo e específico dos processos e efeitos, o
programa faz os testes de significância, o que não aparece em uma análise univariada.
De acordo com Guy e Zilles (2007), há justificativas consistentes que permitem a
escolha do programa Varbrul, e não de outro, para a análise multivariada no campo da
linguística variacionista. Para os autores, há vantagens que fazem dele a melhor opção para a
pesquisa sociolinguística. Primeiro, ele é dedicado à estruturação dos dados que encontramos
na linguagem natural, como uma distribuição não equilibrada entre fatores e grupos de
fatores. Segundo, muitas das células em uma rodada típica do Varbrul não possuem nenhum
dado, ou possuem apenas um dado, o que seria fatal em outros métodos. A terceira vantagem
do programa está no fato de que ele vem com rotinas que permitem recodificação e outros
manuseios dos dados.
76
E, finalmente, o Varbrul contribui para a construção de um modelo matemático dos
dados – de fato, é desenhado para isso. A modelagem matemática desse tipo é uma
das abordagens mais poderosas e sofisticadas na estatística; vai muito além do mero
objetivo de dizer sim ou não sobre se uma variável influencia outra, para tentar
articular vários resultados numa visão geral – e testável – de como funciona um
sistema inteiro. [...] O Varbrul é uma ferramenta especificamente estruturada para
facilitar tal atividade teórica do linguista, e é por isso que ele tem tido tanto sucesso
no campo da linguística variacionista (GUY; ZILLES, 2007, p.107).
Para que o Varbrul seja usado de forma correta, é necessário que a preparação dos
materiais envolva aspectos como: (i) constituição da amostra; (ii) cuidados relacionados com
a validade e confiabilidade; (iii) planejamento do sistema analítico mediante a definição das
variáveis, o que incluí a definição dos grupos de fatores; (iv) seleção dos dados; (v)
eliminação dos casos que não se enquadram nos critérios estabelecidos (em inglês chamados
de ‘don’t count cases’); (vi) preparação do arquivo de ocorrências (GUY; ZILLES, 2007, p.
108).
O termo amostra, em sociolinguística variacionista, refere-se ao grupo de indivíduos
selecionados para representar o universo do qual fazem parte. Na pesquisa aqui proposta, a
amostra é constituída por 240 redações, representando a “população”: anos escolares iniciais,
sexo feminino ou masculino, classe privilegiada ou não privilegiada e as cidades de Belo
Horizonte e Cuiabá.
Outro fator a ser considerado é a representatividade, isto é, fornecer aos informantes a
mesma probabilidade de serem incluídos na amostra. Para tanto, selecionamos 15 sujeitos de
cada perfil traçado pelas variáveis não estruturais: ano escolar, sexo e classe social, conforme
podemos observar na tabela a seguir.
Tabela 2 – Representatividade Classe social A = 120 sujeitos Classe social B = 120 sujeitos
60 SF 60 SM
15 por AE 15 por AE
60 SF 60 SM
15 por AE 15 por AE
Fonte: Elaborado pela autora.
Legenda:
(SF: sexo feminino; SM: sexo masculino; AE: ano escolar)
77
Outro ponto importante do presente estudo é a definição do corpus. De acordo com
Guy e Zilles (2007, p. 115), corpus, em sentido estrito, designa o conjunto de ocorrências (de
realizações de um fonema, de itens lexicais ou de construções sintáticas) selecionadas e
extraídas do acervo do pesquisador. A partir de nossas amostras, foram extraídas 721
ocorrências de onsets complexos e 3728 ocorrências de codas. Portanto, nosso corpus está
composto por 4.449 códigos.
Os outros aspectos citados pelos autores, tais como validade e confiabilidade,
respectivamente, se referem à relevância da variável dependente em relação ao fenômeno
estudado e à replicabilidadade da pesquisa.
Uma “regra variável” é uma regra de reescrita sensível ao contexto que relaciona um
par de variantes como x <y>, de modo que, quando a regra se aplica, ocorre “x”.
Cada uma das dimensões analíticas do contexto que determina se a regra se aplica
ou não é chamada de grupo de “fatores” (GUY; ZILLES, 2007, p.51).
Para Guy e Zilles (2007), ao se trabalhar com variáveis, é preciso ter clareza sobre a
relação que existe entre as variáveis definidas. Em estatística, há dois tipos de variáveis, a
saber, as dependentes e as independentes. A variável dependente é um fenômeno que,
normalmente, tem uma forma padrão, mas pode variar se o contexto for alterado. De modo
geral, isso implica sustentar que há algum ponto no sistema linguístico no qual se faz uma
escolha por uma dessas formas.
Juntamente com a formulação de uma regra variável [...] devem-se identificar
possíveis fatores condicionantes que possam influenciar a escolha entre as
alternantes ou aplicação da regra variável. [...] os fatores contextuais são
organizados em grupos de fatores (na terminologia desse método). Cada grupo de
fatores pode ser definido como um locus na regra variável onde ocorre o
condicionamento e consiste em uma lista exaustiva de todos os possíveis fatores
mutuamente exclusivos que podem ocorrer naquele locus. Assim os grupos de
fatores são variáveis independentes, e os fatores nos grupos são os valores possíveis
dessa variável independente. (GUY; ZILLES, 2007, p.38).
A pesquisa aqui proposta envolve dois fenômenos distintos, os quais foram analisados
separadamente. Portanto, há duas variáveis dependentes – ambas binárias. O primeiro caso é o
onset complexo, CCV, que em determinados contextos pode ser reduzido a CV. O segundo se
refere à coda, (C)VC, a qual também pode ser reduzida a (C)V ou transformada em CV.CV;
ambos podem ser transformados em uma regra variável. Os contextos que condicionam essa
variação, representados pelos grupos de fatores propostos, foram definidos de acordo com sua
provável relevância para a regra.
78
Após o planejamento da análise, partiu-se para a seleção dos dados. É importante
ressaltar que todos os dados foram identificados, no primeiro momento, em meio físico
(papel) e, em seguida, codificados no arquivo de ocorrências.
5.6. 1 A codificação dos dados
Na inserção da codificação, o Varbrul considera tudo que está após a abertura dos
parênteses e desconsidera o que estiver após ponto e vírgula (;), conforme podemos observar
no exemplo a seguir:
Quadro 12 - Exemplos de Codificação do Onset Complexo
Fonte: Elaborado pela autora.
A primeira posição do código caracteriza o status da variável dependente, e as demais
posições estão relacionadas às variáveis independentes. Observa-se que o único código
alterado, de uma para a outra, corresponde ao status da variável dependente, nesse caso o
CCV. Em estrelas esse status é P (pleno), ou seja, o onset complexo foi representado na
escrita. Já em estelas o onset complexo não foi realizado, portanto seu status é R (reduzido).
Vamos à decodificação das demais posições.
Quadro 13 – Exemplo de Decodificação CCV/ CCV: TRE/TE
02ª posição O /t/ é uma oclusiva
03ª posição R segunda consoante : /R/
04ª posição U primeira consoante /t/ : desvozeada
05ª posição e vogal da sílaba: /e/
06ª posição O vogal oral
07ª posição M posição da sílaba na palavra: medial
08ª posição T sílaba tônica
09ª posição T palavra trissílaba
10ª posição N classe de palavra: substantivo
11ª posição A ano escolar: 2º51
12ª posição F sexo: feminino
13ª posição A classe social: A
51 Nomenclatura atual.
1º (PORUeOMTTNAFAC; ESTRELAS
2º (RORUeOMTTNAFAC; ESTELAS
79
14ª posição C cidade: Cuiabá
Fonte: Elaborado pela autora.
Vejamos, agora, exemplos de codificação da coda:
Quadro 14 – Exemplos de Codificação da Coda
Fonte: Elaborado pela autora.
Assim como no onset complexo, a primeira posição do código caracteriza o status da
variável dependente e as demais posições estão relacionadas às variáveis independentes. No
primeiro exemplo, temos uma ocorrência plena do padrão silábico, portanto, o status da
primeira posição é pleno. Já no segundo há uma redução do padrão silábico; (C)VC é
reduzido a CV, portanto, o status é marcado como reduzido. A seguir, apresentamos um
quadro com as demais decodificações.
Quadro 15- Exemplo de Decodificação
(PRVaFTDVAMBB; PEGAR
Fonte: Elaborado pela autora.
Como já mencionamos, o programa considera tudo que está após a abertura dos
parênteses e desconsidera o que estiver registrado depois do ponto-e-vírgula. Isso permite que
o pesquisador faça anotações sobre os dados na própria linha. A primeira posição sempre será
considerada pelo programa como variável dependente e todas as demais, antes do ponto e
vírgula, como variáveis independentes.
52 Nomenclatura atual.
1º (PRVaFTDVAMBB; PEGAR
2º (RRVaFTDVAMBB; PEGA
(C)VC/ (C)VC: GAR/GA
02ª posição R natureza da coda
03ª posição V sonoridade do segmento seguinte: vogal
04ª posição a vogal da sílaba: /a/
05ª posição F posição da sílaba na palavra: final
06ª posição T sílaba tônica
07ª posição D palavra dissílaba
08ª posição V classe de palavra: verbo
09ª posição A ano escolar: 2º52
10ª posição M sexo: masculino
11ª posição B classe social: B
12ª posição B cidade: Belo Horizonte
80
5.6. 2 Os arquivos de ocorrências
Os arquivos de ocorrências foram rotulados de acordo com o fenômeno pesquisado e
numerados em conformidade com o universo das amostras: Coda_Arquivo Mãe_BH;
Coda_Arquivo Mãe_CB; Onset Complexo_Arquivo Mãe_BH; Onset Complexo_Arquivo
Mãe_CB. Depois, esses arquivos foram transformados em apenas dois, sendo um de Coda e
um de Onset, e renomeados de acordo com as necessidades de recodificação surgidas na
análise dos dados.
De posse dos dados codificados, iniciou-se a análise estatística. Os procedimentos
iniciais da análise foram a conferência da codificação (programa Checktok)53 e a geração do
arquivo de ocorrências (programa Readtok). Após essa primeira etapa, realizamos os cálculos
de percentuais através do programa Makecell. O uso do Makecell pressupõe a elaboração de
um arquivo de condições que permite considerar os grupos de fatores que foram considerados
na rodada em questão e, dentro dos grupos, quais foram os fatores considerados. A primeira
posição do código foi tratada pelo programa como a variável dependente e, em seguida, as
variáveis independentes, conforme a inserção programada.
Na sequência, consideraram-se, com base nos percentuais, os primeiros resultados e
avaliaram-se os fatores propostos no planejamento da análise, assim como a distribuição dos
dados dentro de um determinado grupo, isto é, dentro do campo de uma determinada variável
independente.
O presente capítulo apresentou a metodologia usada para a coleta dos dados e para a
análise quantitativa do corpus que compõe esta pesquisa. No próximo capítulo,
apresentaremos nosso corpus e a análise quantitativa, efetuada pelo GoldVarb2001, bem
como a interpretação dos resultados obtidos.
53 Nesse ponto, há a conferência dos códigos propostos para cada posição; por ex. se na posição 2 foram
incluídos os códigos O e F, ele acusará como erro códigos que não sejam O e F, nessa posição.
81
6 ANÁLISE E DISCUSSÃO DOS DADOS
Neste capítulo, apresentamos uma proposta de análise e discussão acerca da
influência da modalidade falada da língua nos padrões silábicos complexos, especificamente,
o CCV e (C)VC, a partir dos dados anteriormente descritos.
Vimos que o aprendiz constrói sua escrita com base em sua língua falada, ou seja, a
competência linguística do falante controla as hipóteses sobre o sistema escrito até que, de
forma gradativa, este seja capaz de reconhecer as particularidades e a independência da
modalidade escrita de sua língua. Vimos, também, que todo esse processo de aquisição da
modalidade escrita tem como base a sílaba, que é uma unidade abstrata de organização
prosódica, construída sobre padrões estruturados e é capaz de organizar seus elementos e criar
possibilidades de condicionamentos, com base em princípios e condições fonológicas.
Portanto, o processo de aquisição da modalidade escrita de uma língua leva o falante a
refletir sobre uma unidade complexa e locus de vários processos fonológicos. Desse modo,
com base em nosso quadro teórico e nos dados obtidos por meio do programa Varbrul,
buscamos evidenciar e analisar as interferências da modalidade falada nos processos de
silabação e ressilabação dos padrões silábicos CCV e (C)VC, baseados no levantamento de
construções desses padrões silábicos em textos espontâneos de alunos dos anos iniciais do
Ensino Fundamental.
Sobre o modo como é feita uma análise linguística do processo de aquisição da escrita,
Alvarenga, citado em Kato et al, apresenta uma observação interessante ao afirmar que
“[...] um promissor ponto de partida para uma adequada análise linguística do
processo de alfabetização seria a identificação e estudo dos “erros” cometidos pelos
alunos, na tentativa de transferir o sistema fonológico para o sistema ortográfico,
durante os primeiros anos de escolaridade. Essa investigação permitirá explicitar as
hipóteses criadas pelos alunos no processo de aprendizagem da leitura-escrita. Ao
invés, assim, de partir de construtos linguísticos teóricos para explicar o processo de
alfabetização, partir-se-ia das “realizações” dos alunos que, analisadas e explicadas à
luz daqueles construtos linguísticos, levariam à compreensão da alfabetização
enquanto processo linguístico e, em decorrência, permitiam definir o pressuposto
para a organização do material didático e para a formação dos professores, de modo
a minimizar a ocorrência de “erros”, e a tornar o processo de alfabetização menos
lento, mais eficiente e menos oneroso (SOARES54 et al Apud KATO; MOREIRA;
TARALLO, 1998, p. 137).
54 Material informativo sobre a pesquisa de Soares et al, o qual foi fornecido a Kato, Moreira e Tarallo.
82
Desse modo, nossa análise verifica os erros para se conhecer as hipóteses levantadas
pelos aprendizes a respeito da escrita de sua língua.
Como descrito em nosso capítulo sobre a metodologia, usamos o Programa Varbrul
para a coleta dos dados aqui apresentados. Após a digitação e a verificação de todos os
códigos, solicitamos o Results do programa Varbrul. Esse comando é responsável por gerar
um relatório chamado Cell Creation, no qual constam informações como quantidade de grupo
de fatores, número de células, valor de aplicação, número total de fatores e outras
informações.
Logo abaixo, no relatório gerado, estão os grupos distribuídos em fatores, com seus
respectivos números absolutos e em percentuais, considerados de acordo com o valor de
aplicação informado ao programa pela pesquisadora. É importante destacar que, neste
trabalho, o valor de aplicação foi dois (2).
Com base nesses primeiros dados, foi possível fazer as recodificações para a
eliminação dos nocautes (quando obtivemos 100% de aplicação ou 0% de aplicação em
relação a um determinado fator), ou seja, fusões de fatores dentro de um mesmo grupo e, até
mesmo, eliminação de grupos de fatores inteiros.
Na sequência, apresentamos a análise dos dados obtidos. Primeiro, a análise referente
ao onset complexo e, depois, referente à coda.
6.1 O onset complexo e suas variáveis55
Antes de iniciarmos nossa análise acerca dos dados de onset complexo (OC), obtidos
pelo Varbrul, acreditamos ser válido olhar de perto para os processos que alteraram CCV em
CV. Isso será possível devido ao tamanho do corpus formado pelas palavras com alterações
na estrutura CCV.
As quatorze palavras com alterações na estrutura CCV são: entou/entrou, tomba/
tromba (2 ocorrências), spanar/planar, ladão/ladrão, compa/compra, gande/grande,
atars/atrás, tombra/tromba (2 ocorrências), probes/pobres, peresa/presa, chiar/criar e
estrupa/estupra - única trissílaba. Para nossa análise, vamos verificar cada caso. A palavra
chiar foi considerada como alteração de OC, pois a letra grafada (h) para a posição C2 não
tem correspondência fonética56. Já palavras como planta/pranta, apesar de não estarem de
55 Nesta seção, por questões práticas, vamos nos referir ao onset complexo como OC. 56 O registro da palavra “chiar” encontra-se em um texto com mais quatro palavras “criar” escritas sem variação,
assim como outras palavras de OC. Portanto, mesmo compondo o corpus, parece ser uma variação ocasional.
83
acordo com as normas ortográficas, não foram considerados como variação de onset
complexo por apresentarem a posição C2 com correspondência fonética.
Outro caso específico é atars. Nessa grafia, é possível notar que a criança percebe que
há a presença do segmento “r” na sílaba, mas ainda não estabilizou as posições dos
constituintes hierárquicos. Essa palavra reflete a tentativa de reajustamento dos elementos
dentro da sílaba. Sobre esse raciocínio, Abaurre afirma que
[...] as crianças ao iniciarem a aprendizagem da escrita alfabética, começam também
a analisar a estrutura interna das sílabas, reajustando suas representações fonológicas
de forma a acomodar os constituintes das sílabas e sua hierarquia. Tal procedimento
de análise reflete-se e suas escritas iniciais das sílabas complexas (ABAURRE,
1999, p.179).
Também observamos um único caso de epêntese em peresa (presa). Aqui, houve a
inserção de uma vogal entre as duas consoantes, resultando em uma nova reestruturação
silábica: CCV => CV.CV. Esta é uma hipótese de construção da criança para resolver o
problema da construção da sílaba CCV, já que CV é a sílaba canônica, sendo a primeira a ser
dominada na fala e refletindo-se, assim, na escrita.
Os demais casos podem ser divididos em dois grupos de reestruturação silábica:
omissão ou metátese. No que se refere aos casos de omissão, observamos sete palavras em
que a segunda consoante de CCV foi simplesmente omitida. Acreditamos que tal omissão
ocorreu pelas mesmas razões do caso anterior de epêntese. Desse modo, na dúvida sobre a
representação da estrutura silábica, a criança grafa aquela que ela já domina, nesse caso CV.
Devido ao fato de sua percepção ser mais marcada, o contraste fônico é maior entre o
primeiro segmento, a C1, e a vogal, V. Dessa forma, a canonicidade é decisiva e transforma
CCV em CV.
O grupo de reestruturação por metátese comporta as palavras tombra (2), probes e
estrupa, nas quais houve uma transposição de consoante entre as sílabas. Esse processo
fonológico segmental é comum na fala (palavras como largato, largatixa, cardeneta, drento
etc). Assim, de acordo com nossa hipótese, tal processo pode ser encontrado na escrita, que,
inicialmente, é baseada na fala. Observamos que a sílaba não foi grafada corretamente, mas
houve a marcação dessa segunda consoante em outro lugar da palavra. Desse modo, foi
possível identificar que a criança domina a estrutura CCV, pois conseguiu representá-la57,
mas ainda não apresenta precisão no reconhecimento linear do padrão silábico analisado.
57 Essas palavras entraram nas estatísticas, pois a sílaba que deveria ser grafada como CCV foi grafada como CV.
84
A seguir, apresentamos uma tabela parcial do primeiro Results58 gerado para o onset
complexo.
Tabela 3 – Results parcial Onset Complexo CELL CREATION
=============
Name of token file: C:\Users\ana\Desktop\Varbrul\arquivos derivados\ONSET
COMPLEXO_ARQUIVO PADRAO 1 E 2.tkn
Name of condition file: Untitled.cnd
(
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
)
Number of cells: 415
Application value(s): 2
Total no. of factors: 37
Non-
Group Apps apps Total %
-------------------------------
1 (2)
O N 15 672 687 95
% 2 97
F N 0 34 34 4
% 0 100 * KnockOut *
Total N 15 706 721
% 2 97
-------------------------------
4 (5)
i N 1 195 196 27
% 0 99
a N 7 167 174 24
% 4 95
o N 5 91 96 13
% 5 94
D N 1 28 29 4
% 3 96
e N 1 177 178 24
% 0 99
u N 0 24 24 3
58 O relatório na íntegra pode ser visto no Anexo I.
85
% 0 100 * KnockOut *
O N 0 19 19 2
% 0 100 * KnockOut *
E N 0 5 5 0
% 0 100 * KnockOut *
Total N 15 706 721
% 2 97
-------------------------------
5 (6)
M N 0 119 119 16
% 0 100 * KnockOut *
F N 7 164 171 23
% 4 95
U N 0 11 11 1
% 0 100 * KnockOut *
I N 8 412 420 58
% 1 98
Total N 15 706 721
% 2 97
-------------------------------
7 (8)
T N 1 261 262 36
% 0 99
D N 14 306 320 44
% 4 95
M N 0 11 11 1
% 0 100 * KnockOut *
P N 0 128 128 17
% 0 100 * KnockOut *
Total N 15 706 721
% 2 97
-------------------------------
8 (9)
N N 6 341 347 48
% 1 98
D N 2 20 22 3
% 9 90
V N 6 184 190 26
% 3 96
O N 0 48 48 6
% 0 100 * KnockOut *
A N 1 113 114 15
% 0 99
Total N 15 706 721
86
% 2 97
-------------------------------
Name of new cell file: Untitled.cel
Fonte: Varbrul
Legenda:
Grupo 1 (2) Modo de articulação da primeira consoante: O (oclusiva) F (fricativa).
Grupo 4 (5) Vogal da sílaba: a e E (é) i o O (ó) u D (ditongo).
Grupo 5 (6) Posição da sílaba na palavra: F (final) M (medial) I (inicial) U59 (única).
Grupo 7 (8) Número de sílabas da palavra: M (monossílaba) D (dissílaba) T (trissílaba) P (polissílaba).
Grupo 8 (9) Classe gramatical das palavras: A (adjetivo) N (nome) V (verbo) D (advérbio) O (outros).
Nesse relatório parcial, é possível observar os nocautes que precisam ser eliminados,
além de fatores com percentuais muito próximos ou iguais que podem ser amalgamados.
Descobrir que uma diferença entre fatores dentro de uma mesma variável não é
significativa e eliminar essa distinção através de amalgamações justificadas
linguisticamente ajuda muito a “limpar” os resultados da pesquisa, ou seja, eliminar
detalhes que em nada contribuem para o melhor entendimento do fenômeno variável
em exame (BRESCANCINI, 2002, p.71).
Iniciando nossa análise pelos nocautes, notamos que, no grupo 1 (2) temos o nocaute
para os OC que apresentam como primeira consoante uma fricativa. Na verdade, trata-se de
um dado curioso, uma vez que das 721 palavras com OC, coletadas dos 240 textos analisados,
apenas 34 apresentaram uma consoante fricativa (/f/ ou /v/) na primeira posição do padrão
silábico CCV. Dessas 34 palavras, nenhuma deixou de ter seu padrão CCV grafado
corretamente, isto é, nenhuma dessas palavras teve seu padrão CCV transformado em CV.
A princípio, não consideramos a eliminação desse grupo uma boa opção devido à
disparidade da distribuição de oclusivas e fricativas. Para acabar com esse nocaute, sem a
necessidade de eliminação do grupo, inserimos dois dados fictícios, um para Belo Horizonte e
outro para Cuiabá, com a finalidade estrita de eliminar um nocaute. A inserção de dado
fictício é uma das orientações apresentadas por GUY e ZILLES (2007, p. 162) para a
eliminação de nocautes, quando a conveniência for sustentada pelos dados.
Os dados fictícios inseridos fazem parte das palavras encontradas no corpus. Isto é,
retiramos do corpus da pesquisa duas palavras com o CCV pleno e, após a alteração,
categorizamos como reduzido – frente>fente e friozinho>fiozinho. A escolha levou em
consideração dois dados estruturais que apresentaram relevância nos relatórios iniciais:
tonicidade (um onset tônico e outro átono) e número de sílabas da palavra (uma dissílaba e
59 Essa posição foi usada para palavras monossílabas.
87
outra trissílaba). Em relação aos dados não estruturais, mantivemos a tendência na incidência
das omissões nas oclusivas: série inicial (A), sexo masculino (M) e classe social
desfavorecida (B).
Após a tabulação e análise desses dados, fizemos outro arquivo sem o grupo 1(2), ou
seja, desconsiderando-se o modo de articulação da primeira consoante do OC. Os resultados
apresentados não interferiram nesta análise, comparada àquela que inclui os dados fictícios.
Dessa forma, para uma melhor fidelização aos dados, optamos por eliminar esse grupo de
fatores, já que a análise não seria comprometida.
No grupo 4 (5), encontramos nocautes para as vogais médias baixas ( [E] [O] ) e para a
vogal alta [u]. Para solucionarmos esse nocaute, distribuímos as vogais de acordo com o
aspecto articulatório relativo ao movimento de avanço (anterioridade) e recuo (posterioridade)
da língua. Em seguida, esse grupo foi recodificado como A (vogal anterior: i, e, E); P (vogal
posterior: u, o, O); C (vogal central: a); e D (ditongo).
Além disso, foi incluído, após essa reanálise, outro grupo (já descrito na metodologia)
que caracteriza o aspecto articulatório relativo à oralidade e nasalidade das vogais.
Entendemos, na reanálise, que esse aspecto pode influenciar no registro do OC.
O grupo 5 (6) apresentou nocaute para palavras que possuem OC na sílaba medial,
como, por exemplo Á-fri-ca, e em monossílabas, como pra, nomeadas aqui como posição
única. Para esses casos, a ocorrência foi zero, isto é, não houve omissão da segunda consoante
nessas posições. Já as sílabas com OC na posição inicial, por exemplo, Dra-gão,
apresentaram redução de 1%. Dessa forma, foi possível recodificarmos por meio da
amalgamação das posições: inicial, medial e única, renomeadas para posição não final a
posição final permaneceu como estava.
Em relação ao número de sílabas da palavra, verificamos que houve nocaute, também
com zero omissões ligadas a esse ambiente, em monossílabas e polissílabas. Vale destacar que
ambas possuem os menores números de ocorrências nos dados, 11 e 128, respectivamente.
Para solucionar esse nocaute, colocamos um fator D para palavras com até duas sílabas e um
fator T para palavras com três ou mais sílabas.
O último nocaute ocorreu no grupo 8 (9). As palavras pertencentes a esse grupo foram
analisadas conforme a classe gramatical. A princípio, dividimos as classes gramaticais em
nome, advérbio, verbo, adjetivo e outros. Após o nocaute, com o fator “outros”, fizemos a
amalgamação de “advérbio” e “outros”, já que essas duas classes apresentam características
gramaticais consideravelmente diversas das demais.
88
Os grupos de fatores relacionados às variáveis não estruturais, codificados nas quatro
últimas posições (09, 10, 11 e 12), não apresentaram nocautes. Essas variáveis caracterizam
os sujeitos da pesquisa em ano escolar, sexo, classe social e cidade.
Após a resolução dos nocautes, geramos novamente o Results. Nesse momento,
solicitamos ao programa a análise binomial com a rodada step-up/step-down.
O step-up inicia a análise dos dados de forma individual e vai incluindo, no decorrer
dos níveis, os demais grupos de fatores, até conjugar todos os grupos de fatores propostos
para essa análise. Já o step-down inicia a análise com todos os grupos e vai retirando-os na
tentativa de encontrar a melhor significância. Em outras palavras, o step-up realiza a análise
com a inclusão de grupo por grupo e, de forma oposta, o step-down retira grupo por grupo
durante a rodada do programa. Os dois processos têm como objetivo encontrar a melhor
significância.
O ideal para o programa é encontrar a rodada que apresenta a significância mais
próxima de 0, e com o log likelihood60 mais alto (também mais próximo de 0, já que esse
número possui valor negativo).
Os resultados de peso relativo dos fatores fundamentam-se na probabilidade de
aplicação da regra. Esses resultados podem evidenciar efeito neutro (peso relativo .50), efeito
favorecedor (peso relativo acima de .50) ou efeito desfavorecedor (peso relativo abaixo de
.50).
Os resultados dessa análise para o onset complexo são apresentados na tabela a seguir:
Tabela 4 – Análise multivariada do onset complexo Stepping up
Run # 50, 63 cells:
Convergence at Iteration 10
Input 0,002
Group # 6 -- T: 0,769, A: 0,364
Group # 7 -- T: 0,269, D: 0,765
Group # 9 -- A: 0,334, B: 0,850, C: 0,504, D: 0,375
Group #10 -- M: 0,738, F: 0,254
Group #11 -- B: 0,736, A: 0,361
Log likelihood = -46,277 Significance = 0,007
Groups selected while stepping up: 7 11 6 10 9
60“Para se conhecer a taxa de aplicação de uma regra variável através de um modelo matemático, é necessário
que haja adequação entre modelo e dados. No estudo de regra variável, essa medida de adequação é realizada
pelo critério de likelihood máximo (Sankoff, 1988, p. 990). Desse modo, para um determinado modelo e um
conjunto de dados, o likelihood indica o grau de probabilidade de os dados terem sido gerados pelo modelo. Os
valores probabilísticos que resultam no valor mais alto do likelihood são considerados os mais prováveis de
terem sido gerados pelo modelo. ” (BRESCANCINI, 2002, p.36-36).
89
Best stepping up run: #50
Stepping down
Run # 122, 63 cells:
Convergence at Iteration 10
Input 0,002
Group # 6 -- T: 0,769, A: 0,364
Group # 7 -- T: 0,269, D: 0,765
Group # 9 -- A: 0,334, B: 0,850, C: 0,504, D: 0,375
Group #10 -- M: 0,738, F: 0,254
Group #11 -- B: 0,736, A: 0,361
Log likelihood = -46,277 Significance = 0,119
Groups eliminated while stepping down: 2 8 1 3 4 5 12
Best stepping up run: #50
Best stepping down run: #122
Fonte: Varbrul
Legenda
Variáveis estruturais:
Grupo 01 - Modo de a articulação da segunda consoante: L (lateral) R (tepe) W (outra).
Grupo 02 - Vozeamento da primeira consoante: U (surda) O (sonora).
Grupo 03 - Vogal da sílaba: a e E (é) i o O (ó) u D (ditongo).
Grupo 04 - Nasalidade vocálica: O (oral) N (nasal).
Grupo 05 - Posição da sílaba na palavra: F (final) M (medial) I (inicial) U61 (única).
Grupo 06 - Tonicidade da sílaba: T (tônica) A (átona).
Grupo 07 - Número de sílabas da palavra: D (até duas sílabas) T (com três ou mais sílabas).
Grupo 08 - Classe gramatical das palavras: A (adjetivo) N (nome) V (verbo) D (advérbio) O (outros).
Variáveis não estruturais:
Grupo 09 - Ano escolar: A (2º ano) B (3º ano) C (4º ano) D (5º ano).
Grupo 10 - Sexo: M (masculino) F (feminino).
Grupo 11 - Classe Social: A (favorecida) B (desfavorecida).
Grupo 12 – Cidade: B (Belo Horizonte) C (Cuiabá).
A quinquagésima rodada foi indicada pelo step-up como a melhor, com a
convergência62 atingida na décima interação. O nível de significância considerado pelo
programa foi de 0,00763. Isso significa que há 99,3% de chance de que o resultado
apresentado pelo programa no stepping up seja verdadeiro. No stepping down, os grupos
eliminados não coincidem com os grupos escolhidos pelo stepping up, o que atribui aos dados
uma margem de erro ainda menor.
O peso relativo dos grupos de fatores tem como base o valor de referência de 0.5, o
qual é o ponto neutro - equivale à média dos fatores e, portanto, não contribuiu de forma
61 Essa posição foi usada para palavras monossílabas 62 “Para que os resultados convirjam, o que sinaliza uma boa adequação ao modelo dos dados, a convergência
deve ser alcançada antes da vigésima primeira interação.” (Brescancini, 2002, p. 37) 63 O nível de significância desejado é abaixo de 0.05, ou seja, a partir de 95% de chance de que o resultado
apresentado pelo programa seja verdadeiro.
90
qualitativa para a análise. Quando o peso relativo é superior a 0.5, significa que esse fator
favoreceu a aplicação da regra, e quando é menor que 0.5, ele desfavoreceu a aplicação da
regra.
Todos os grupos que estão na melhor rodada indicada pelo programa apresentam com
uma boa margem de diferença o peso relativo que favorece a aplicação da regra e o peso
relativo que desfavorece.
Os grupos indicados foram postos em ordem de relevância pelo Varbrul, nesse caso, 7
11 6 10 9. Em seguida, os grupos foram analisados de acordo com a sequência dada pelo
programa, com o intuito de esclarecer os dados numéricos obtidos.
O grupo eleito como o mais relevante diz respeito ao número de sílabas da palavra que
contém o OC. Assim, os resultados foram distribuídos conforme tabela a seguir.
Tabela 5 - Grupo 7: Variável Independente Estrutural Número de Sílabas
- palavras com até duas sílabas “D” e com três ou mais “T” Fator Aplicação./Total % Peso Relativo
T 1/390 0,26 0,269
D 13/331 3,93 0,765
Total 14/721 1,94 -
Fonte: Elaborado pela autora.
A maior frequência e o peso relativo apresentado pelas palavras com até duas sílabas
demonstram que esse contexto favorece a aplicação da regra. A quase totalidade das palavras
que apresentaram problemas na representação de uma determinada sílaba CCV são compostas
por até duas sílabas.
De acordo com Oliveira (2010, p. 86), as palavras trissílabas são mais canônicas do
que as palavras que apresentam um número diferente de sílabas. Essa afirmação pode ser
explicada através do Princípio do Contorno Obrigatório (PCO). Na língua portuguesa, a
palavra ideal é a trissílaba paroxítona, isto é, aquela composta por sílaba átona + sílaba
tônica + sílaba átona. Essa preferência fonológica poderia explicar porque as palavras com
até duas sílabas sofreram mais interferências nas sílabas CCV.
O segundo grupo escolhido pelo programa como o mais relevante foi o grupo 11. Esse
grupo apresenta a variável classe social. Como relatado na metodologia, os textos pertencem a
dois tipos de escola: pública e particular. Os alunos de escola particular correspondem à classe
favorecida “A” e os alunos de escola pública correspondem à classe desfavorecida “B”. A
tabela a seguir apresenta os resultados do grupo 11.
91
Tabela 6 - Grupo 11: Variável Independente Não-Estrutural Classe Social
- classe favorecida “A” e classe não favorecida “B” Fator Aplic./Total % Peso Relativo
A 4/463 0,86 0,361
B 10/258 3,88 0,736
Total 14/721 1,94 -
Fonte: Elaborado pela autora
De acordo com os resultados apresentados na tabela anterior, há dois dados bem
marcantes. O primeiro é o peso relativo. Há um grande favorecimento na aplicação da regra
por parte da classe desfavorecida, grupo B, em oposição à classe favorecida, grupo A, que
desfavorece à aplicação da regra. O outro dado numérico contrastante é a diferença entre a
quantidade de palavras escritas pelas crianças das classes A e B. A classe favorecida escreveu
79% mais palavras com OC do que a classe desfavorecida.
O fato de que a classe B apresentaria uma quantidade maior de “erros” na grafia de
OC já era esperado. No entanto, a diferença numérica entre a quantidade de palavras com OC
registrada pelas classes foi um dado inesperado.
Alvarenga e Oliveira (1997, p. 151) afirmam que a única explicação possível para a
diferença entre as classes fica por conta dos recursos pedagógicos que a criança tem à sua
disposição, tanto em sala quanto em casa. Isso porque, certamente, as crianças pertencentes à
classe desfavorecida, de uma maneira geral, possuem menos recursos à disposição do que
aquelas que pertencem à classe mais favorecidas.
Nosso próximo grupo, colocado na terceira posição de importância pelo Varbrul, diz
respeito à tonicidade da sílaba na qual ocorre o OC. Os dados obtidos estão distribuídos na
tabela a seguir:
92
Tabela 7 – Grupo 6: Variável Independente Estrutural Tonicidade
- onset complexo em posição átona “A” e onset complexo em posição tônica
T”
Fonte: Elaborado pela autora.
De acordo com os dados da tabela anterior, é possível observar que o processo de
instabilidade da sílaba CCV ocorreu em maior número nas sílabas tônicas, sendo que o
número total de OC em sílabas tônicas corresponde a um pouco menos da metade dos casos
de OC em sílabas átonas. Isto é, há mais que o dobro de OC em sílabas átonas, porém,
aparentemente, os OC das átonas são mais estáveis.
Na verdade, vimos que ocorre o oposto do esperado. Alvarenga (1995, p. 28) afirma
que “em função da estabilidade da sílaba tônica, pode-se sugerir que a sílaba fraca seja um
ponto mais frequente de variações ortográficas que a sílaba forte ou tônica”. Para uma
possível explicação, recorreremos à estrutura silábica.
Como vimos no capítulo 2, Alvarenga propõe uma escala de sonoridade com base em
uma escala numérica de afastamento entre os elementos. O autor afirma que uma sílaba mais
estável mantém uma distância maior entre os segmentos vizinhos, e a mais instável, um
distanciamento menor.
Partindo desse pressuposto, voltamos às palavras que sofreram alterações em suas
sílabas tônicas CCV. As sílabas tônicas são: T r AS - T r O - P r E - D r ÃO - P r AR - G r
AN. Focando nos três primeiros segmentos CCV, temos: Oclusiva + r + Vogal, conforme é
possível observar no quadro a seguir:
Fator Aplic./Total % Peso Relativo
A 3/493 0,61 0,364
T 11/228 4,82 0,769
Total 14/721 1,94 -
93
Quadro 16 – Distância sonora entre os segmentos da sílaba64 CCV Distância sonora
entre C1/C2 e C2/V
Distância sonora entre C1/V -
cancelamento de C2
T r A 1 + 7 + 12
6 5
1 + 0 + 12
11
T r O 1 + 7 + 12
6 3
1 + 0 + 10
09
P r E 1 + 7 + 12
6 3
1 + 0 + 10
09
D r à 1 + 7 + 12
6 5
1 + 0 + 12
11
P r A 1 + 7 + 12
6 5
1 + 0 + 12
11
G r A 1 + 7 + 12
6 5
1 + 0 + 12
11
Fonte: Elaborado pela autora.
Por essa perspectiva, podemos supor que os processos de interferência estrutural
silábica ocorrem na tentativa de otimizar o distanciamento sonoro, a fim de enfatizar as curvas
sonoras, as quais estariam mais marcadas nas sílabas tônicas devido à sua posição na palavra.
Em outras palavras, podemos dizer que as sílabas tônicas tornam essa percepção entre
os segmentos adjacentes de CCV mais sensíveis. Desse modo, as sílabas tônicas estariam
mais propícias à sofrerem processos de reestruturações sonoras, maximizando o Princípio de
Sequenciamento de Sonoridade no auge sonoro da palavra.
Na sequência, a tabela a seguir apresenta os dados sobre a variável não estrutural
Sexo.
Tabela 8 – Grupo 10: Variável Independente Não-Estrutural Sexo
- sexo feminino “F” e sexo masculino “M”
Fonte: Elaborado pela autora.
64 Na primeira linha de cada quadro da segunda coluna está pontuado o valor sonoro de cada segmento da sílaba.
Logo abaixo consta a informação sobre as distâncias entre esses valores. Enquanto que na terceira coluna há a
informação da distância sonora maximizada pelo cancelamento da segunda consoante da sílaba.
Fator Aplic./Total % Peso Relativo
F 2/354 0,56 0,254
M 12/367 3,27 0,738
Total 14/721 1,94 -
94
A maior frequência e o peso relativo apresentados por M mostram que esse fator
favorece a aplicação da regra para alteração de CCV. Observe que 86% dos problemas
encontrados em CCV são cometidos pelo sexo masculino, e apenas 14% pelo sexo feminino.
Esse resultado já era esperado. De forma geral, o sexo feminino utiliza com mais
frequência a forma de prestígio, tanto na fala quanto na escrita. Nossos resultados, nesse
sentido, confirmam a afirmação de Mollica a respeito da escrita de meninos e de meninas na
escola. Segundo a autora, crianças do sexo feminino tendem a ser mais conservadoras e,
portanto, mais sensíveis às normas escolares (MOLLICA, 2000, p. 90). Nesse sentido,
Alvarenga e Oliveira afirmam que
[...] as mulheres/meninas são mais atentas do que os homens/meninos ao prestígio.
Isto significa que elas abraçarão mais rapidamente as marcas de prestígio, mas
significa também que elas reagirão mais fortemente a qualquer fenômeno
estigmatizado. Este efeito aparece praticamente em todos os estudos
sociolinguísticos feitos até hoje (ALVARENGA e OLIVEIRA, 1997, p.152).
Diante do exposto, é importante salientar que nossos dados acerca do onset complexo
só ratificam tais afirmações.
A última variável escolhida pelo Varbrul como relevante para a aplicação da regra é a
variável Ano Escolar. Vejamos os resultados conforme tabela a seguir.
Tabela 9 – Grupo 9: Variável Independente Não Estrutural Ano Escolar65
- 2ºano (A), 3ºano (B), 4ºano (C) e 5ºano (D)
Fonte: Elaborado pela autora.
Os resultados apresentados na tabela anterior nos permitem concluir que, com um peso
relativo de 0.85, o fator B (atual 3º ano – 8/9 anos) contribui de forma significativa para a
aplicação da regra. Podemos afirmar, também, que mais da metade dos problemas de CCV
(57%) estão nesse fator. Os fatores A e D, anos escolares extremos da nossa análise, não
65 Nomenclatura atual.
Fator Aplic./Total % Peso Relativo
A 2/224 0,89 0,334
B 8/148 5,41 0,850
C 2/146 1,37 0,504
D 2/203 0,99 0,375
Total 14/721 1,94 -
95
contribuem para a aplicação da regra, e o fator C apresenta neutralidade. Logo, podemos
afirmar que o problema de OC está localizado no fator B (atual 3º ano – 8/9 anos).
Sobre o aumento de erros ao longo do processo de escolarização, Soares et al afirmam
que
[...] possivelmente se explica, de um lado, pelo “zelo” da professora das primeiras
séries em evitar o erro, tarefa que cumpre através do controle das palavras a que são
expostos os alunos e através de técnicas que associam fala/escrita, artificialmente,
fazendo da fala um simulacro da escrita. [...] Nas séries seguintes, esse controle se
torna impossível, graças à ampliação do repertório do aluno. [...] O aluno passará a
não cometer mais erros quando descobrir a postura adequada: a escrita é um código
de representação, não de transcrição da fala (Soares et al, 1989, p.24).
Para ilustrar esse movimento de acomodação da escrita nessa primeira fase do
processo de aquisição (Ensino Fundamental I), elaboramos um gráfico com base nos valores
dos “pesos relativos” da variável Ano Escolar.
Gráfico 2 – Variação do Onset Complexo
Fonte: Elaborado pela autora.
No gráfico anterior, cruzando a curva, temos a linha de tendência com o objetivo de
mostrar o padrão da queda do onset complexo, com base nos dados matemáticos inseridos. De
acordo com a teoria, podemos interpretar como um processo contínuo, crescente e
decrescente, sempre que o aprendiz sai da zona de conforto, considerada aqui como ano A, e
amplia seu vocabulário, podendo haver um índice maior de “erros”, até que ocorra a
acomodação dos novos dados lexicais.
A; 0,334
B; 0,85
C; 0,504
D; 0,375
0
0,2
0,4
0,6
0,8
1
1,2
Pes
o R
ela
tivo
Ano Escolar
96
Dessa forma, podemos afirmar que, no início do processo, há um momento neutro, um
momento de novas descobertas66, não considerado aqui. Na sequência, temos o ano escolar A,
no qual se espera que a criança já tenha autonomia para escrever de forma alfabética. Para a
acomodação dessa escrita alfabética, há um controle mais preciso por parte dos professores e
um vocabulário mais restrito.
Um dado curioso apresentado pela tabela 9 é o de que as crianças do ano A
escreveram mais palavras com OC do que todas as crianças dos demais anos. Além disso, as
crianças do Ano A apresentaram apenas dois problemas estruturais de CCV (atars e entou),
assim como os anos C e D.
Isso fez com voltássemos aos dados para buscarmos uma explicação para esse fato. No
arquivo de dados, é possível visualizar um maior número de dados do ano A de Belo
Horizonte. Para acessarmos a quantidade exata, solicitamos ao programa a tabulação dos
dados entre os anos escolares e as cidades. O resultado pode ser conferido na tabela a seguir:
Tabela 10 – Dados cruzados: Ano Escolar e Cidade Name of new cell file: Untitled.cel
CROSS TABULATION
================
# Cell file: C:\Users\ana\Desktop\Varbrul - Results 1\arquivos
derivados\Onset\Abril com dados corrigidos\Onset_dados finais 07-
04.cel
# Conditions: Untitled.cnd
Group #9 -- horizontally.
Group #12 -- vertically.
A % B % C % D % · %
+ - - - - + - - - - + - - - - + - - - - + - - - -
B 2: 2 1: 4 5: 0 0: 0 0| 6 1
-: 168 99: 84 95: 59 100: 100 100| 411 99
·: 170 : 88 : 59 : 100 | 417 + - - - - + - - - - + - - - - + - - - - + - - - -
C 2: 0 0: 4 7: 2 2: 2 2| 8 3
-: 54 100: 56 93: 85 98: 101 98| 296 97
·: 54 : 60 : 87 : 103 | 304 +---------+---------+---------+---------+---------
· 2: 2 1: 8 5: 2 1: 2 1| 14 2
-: 222 99: 140 95: 144 99: 201 99| 707 98
·: 224 : 148 : 146 : 203 | 721
Fonte: Elaborado pela autora.
Observe que, em números absolutos, as crianças dos anos A da cidade Belo Horizonte
escreveram um pouco mais que o triplo de palavras com OC (170) que as crianças dos anos A
66 Nessa pesquisa não consideramos o 1º ano (antigo pré-escolar).
97
da cidade Cuiabá (54). Mesmo considerando que analisamos o dobro de textos do universo
B67, o número continua desproporcional.
Voltando à origem dos dados, identificamos que há 20 textos da cidade B com a
proposta de redação “Meu brinquedo preferido”. Como consequência, há no corpus 48 vezes
a palavra brinquedo e 38 vezes a palavra preferido e nenhum problema com a estrutura CCV
dessas palavras. Isso dá um total de 86 palavras com OC que fazem parte de um vocabulário
controlado pelo próprio texto.
Isso nos leva a ratificar a ideia de que a escrita dessas crianças, de certa forma, possui
uma autonomia menor. Isto é, elas procuraram escrever palavras que já faziam parte de seu
vocabulário controlado, o que as levou a um índice menor de erros estruturais.
Os dados mostram que, a partir do ano B, essa relação entre a criança e a escrita
passou a ser um processo mais dinâmico, incidindo em mais problemas estruturais para os
ajustes da sílaba complexa CCV. À medida que esses ajustes se acomodaram, os problemas
estruturais passaram a ser pontuais. Portanto, há uma curva crescente e decrescente na
aquisição no onset complexo no processo de aquisição da escrita.
6.2 A coda e suas variáveis
Nesta seção, apresentamos a análise da coda a partir dos dados gerados pelo programa
Vabrul2001.
A tabela a seguir contém resultados parciais do primeiro relatório68, Results, rodado
para a análise da coda, com apenas os grupos cujos fatores necessitaram de uma reanálise.
Tabela 11 – Results parcial para a coda CELL CREATION
=============
Name of token file: C:\Users\ana\Desktop\Varbrul - RESULTS 2\arquivos
derivados\CODA_ARQUIVO MÃE BHCB.tkn
Name of condition file: Untitled.cnd
(
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
67 Isto não gera um problema metodológico, pois estamos trabalhando com percentuais e pesos relativos. 68 O relatório na íntegra encontra-se no Anexo.
98
(10)
(11)
(12)
)
Number of cells: 1980
Application value(s): 2
Total no. of factors: 48
Non-
Group Apps apps Total %
-------------------------------
1 (2)
P N 0 3562 3562 0
% 0 100 * KnockOut *
R N 138 0 138 0
% 100 0 * KnockOut *
X N 10 0 10 0
% 100 0 * KnockOut *
S N 9 0 9 0
% 100 0 * KnockOut *
D N 4 0 4 0
% 100 0 * KnockOut *
E N 1 0 1 0
% 100 0 * KnockOut *
Total N 163 3562 3725
% 4 95
-------------------------------
2 (3)
R N 86 1265 1351 36
% 6 93
S N 19 547 566 15
% 3 96
L N 19 201 220 5
% 8 91
N N 38 1522 1560 41
% 2 97
B N 1 5 6 0
% 16 83
U N 0 20 20 0
% 0 100 * KnockOut *
O N 0 2 2 0
% 0 100 * KnockOut *
Total N 163 3562 3725
% 4 95
-------------------------------
3 (4)
V N 42 695 737 19
99
% 5 94
O N 63 1081 1144 30
% 5 94
U N 49 1566 1615 43
% 3 96
P N 9 220 229 6
% 3 96
Total N 163 3562 3725
% 4 95
-------------------------------
4 (5)
a N 72 1014 1086 29
% 6 93
u N 20 369 389 10
% 5 94
e N 24 1084 1108 29
% 2 97
D N 7 101 108 2
% 6 93
o N 20 501 521 13
% 3 96
i N 15 394 409 10
% 3 96
E N 0 28 28 0
% 0 100 * KnockOut *
O N 5 71 76 2
% 6 93
Total N 163 3562 3725
% 4 95
-------------------------------
5 (6)
F N 81 989 1070 28
% 7 92
U N 21 976 997 26
% 2 97
I N 48 1229 1277 34
% 3 96
M N 13 368 381 10
% 3 96
Total N 163 3562 3725
% 4 95
-------------------------------
8 (9)
V N 96 1431 1527 40
100
% 6 93
N N 35 955 990 26
% 3 96
O N 20 769 789 21
% 2 97
A N 9 285 294 7
% 3 96
D N 3 122 125 3
% 2 97
Total N 163 3562 3725
% 4 95
-------------------------------
Name of new cell file: Untitled.cel
Fonte: Varbrul
Legenda
Variáveis estruturais:
Grupo 1 (2) – Tipo de ocorrência: P (plena) R (reduzida) D (deslocada - metátese) S (ressilabada) E (desfeita por
epêntese) X (sem relação grafema/fonema).
Grupo 2 (3) - Natureza da coda: R S L U O B (para oclusiva) N (para a nasal).
Grupo 3 (4) - Sonoridade do segmento seguinte: U (surda) O (sonora) V (vogal) P (pausa).
Grupo 4 (5) - Vogal da sílaba: a e E (é) i o O (ó) u D (ditongo).
Grupo 5 (6) - Posição da sílaba na palavra: F (final) M (medial) I (inicial) U69 (única).
Grupo 8 (9) - Classe gramatical das palavras: A (adjetivo) N (nome) V (verbo) D (advérbio) O (outros).
Nesse primeiro Results, mantivemos o grupo 1 das variáveis independentes conforme
todos os tipos de ocorrências encontradas – plena; reduzida; deslocada; ressilabada; desfeita
por epêntese; e sem relação grafema/fonema. A variável dependente foi marcada como:
posição de coda preservada (1); posição de coda não preservada (2). Consideramos todas as
ocorrências não “plenas” como (2) coda não preservada.
É importante ressaltar que, no parágrafo anterior, há uma incoerência metodológica na
definição das ocorrências que seriam codificadas como (1) ou como (2). Essa incoerência
ocorre porque, para o Varbrul, não há como ter, dentro do mesmo fator, 100% ou 0% de
aplicação da regra, de modo que isso acaba resultando em nocaute. Para que o programa
analise a aplicação da regra, é preciso que, em um determinado fator, ocorra pelo menos uma
ocorrência diferente das demais. Logo, não há como colocar todas as plenas como (1) e as
demais como (2) e vice-versa. Assim, conforme essa definição, a variável dependente ficou
distribuída da seguinte forma.
69 Essa posição foi usada para palavras monossílabas.
101
Tabela 12 – Dados do status de representação gráfica da coda
Fonte: Elaborado pela autora.
Para resolvermos esse problema, reagrupamos os fatores, preservando uma relação
lógica entre as ocorrências. Porém, após as recodificações, nos deparamos mais uma vez com
nocautes, os quais serão discutidos mais adiante.
Além do Grupo 1, no grupo 2 (3) os fatores “U” e “O” também apresentaram nocaute.
Na verdade, esse nocaute também ocorreu por uma questão de lógica no tratamento dos dados
pelo Varbrul. O “U” é o código que representa a vogal /u/ que foi usada na escrita para
substituir a representação da coda /l/ (reflexo do processo de vocalização do /l/ que ocorre na
fala). O “O” foi usado para codificar quando a letra “l” foi substituída pela vogal “o”, um
processo de hipercorreção. A seguir, apresentamos a tabela com as ocorrências de “U” e “O”.
Tabela 13 - Ocorrências de “U” e “O”.
Fonte: Elaborado pela autora.
Assim como no caso dos fatores do grupo 1, não há como mantermos as ocorrências
de “U” e “O” como fatores de natureza de coda. Essas ocorrências devem ser categorizadas
como variação ortográfica de coda. Para essa categorização, porém, foi preciso que todas as
ocorrências do grupo 1 fossem revistas, conforme veremos na próxima seção.
Nos demais grupos, não houve casos com nocaute. Porém, alguns resultados
apresentaram percentuais muito próximos. Desse modo, para medições mais precisas, é
Coda Preservada Coda Não preservada Aplicação da regra
P 3562 casos 0% = Nocaute
R 138 casos 100% = Nocaute
X 10 casos 100% = Nocaute
S 09 casos 100% = Nocaute
D 04 casos 100% = Nocaute
E 01 caso 100% = Nocaute
Coda Preservada Coda Não preservada Aplicação da regra
U - 20 casos 100% = Nocaute
O - 02 casos 100% = Nocaute
102
necessário amalgamar alguns fatores. Iremos pontuar os casos de acordo com a ordem dos
grupos apresentados no relatório.
O grupo 3 (4) refere-se à sonorização do segmento que vem após a coda. Esse grupo é
composto por quatro ambientes, porém o relatório apresentou apenas dois percentuais: 3%
para os fatores segmento surdo e pausa e 5% para os fatores segmento sonoro e vogal.
Portanto, foi possível recodificá-los em apenas dois fatores: U para os primeiros (segmento
surdo e pausa) e O para os dois últimos (segmento sonoro e vogal).
O próximo grupo a ter o número de fatores reduzido é o 4 (5). Como vimos, esse
grupo analisa a relação da vogal da sílaba com a aplicação da regra. No primeiro relatório, as
vogais maximamente diferenciadas não demonstraram nenhuma vantagem que justificasse a
permanência dessa distribuição. Desta forma, para uma melhor performance de leitura dos
dados pelo programa, reduzimos os oito fatores em quatro, assim como fizemos no caso do
onset. Para tanto, as vogais foram redistribuídas de acordo com o aspecto articulatório
movimento de avanço (anterioridade) e recuo (posterioridade) da língua. A recodificação
desse grupo ficou estabelecida como: A (vogal anterior: i, e, E); P (vogal posterior: u, o, O); C
(vogal central: a); e D (ditongo).
Na sequência, temos o grupo 5 (6), que apresenta a posição da sílaba analisada na
palavra. Nesse grupo, temos quatro fatores, sendo que três apresentaram percentuais
próximos. Esses fatores correspondem às posições não finais da palavra (U: 2%, I: 3% e M:
3%). Portanto, assim como no caso do onset, recodificamos as posições inicial, medial e única
como não final e a posição final permaneceu como estava – final.
Nosso último grupo a ser recodificado, com base no primeiro Results, é o grupo 8 (9),
que analisa as palavras considerando sua classe gramatical. A princípio, esse grupo foi
dividido em: nome, advérbio, verbo, adjetivo e outros. Após a análise dos percentuais de
ocorrências, distribuímos essa classificação da seguinte forma: Nome e Adjetivo = 3% = N;
Advérbio e Outros = 2% = O; e Verbo = 6%.
Com os nocautes e os fatores com percentuais próximos resolvidos, foi gerado
novamente o Results. No entanto, em decorrência da codificação dada ao grupo 1 (2),
ocorreram, novamente, problemas de nocaute.
6.2.1 Os desdobramentos das codificações do primeiro grupo de variável independente 1 (2)
Como vimos no início deste capítulo, o grupo 1 (2) da coda apresentou algumas
peculiaridades em relação à sua codificação. Diante de tais peculiaridades, foi preciso analisar
103
a aplicação da regra para a coda e, ao mesmo tempo, relacioná-la com a hipótese registrada
pelo aprendiz, quando não foi conforme as normas gramaticais da língua.
Nessa primeira codificação, colocamos no grupo 1 (2) a ocorrência da coda
(identificada como plena) juntamente com suas variações possíveis. Assim, na determinação
do valor de aplicação para a variável dependente, optamos por (1) posição de coda preservada
e (2) posição de coda não preservada. Para todos os fatores P (posição preservada), atribuímos
(1) e, para os demais, atribuímos (2). Essas atribuições geraram nocautes, pois, de acordo com
a nossa distribuição dos dados, não havia a possibilidade de ocorrer (1) e (2) dentro de um
mesmo fator.
Logo, não foi possível balizar os valores qualitativos da variável dependente com o
primeiro grupo 1 (2). Diante disso, foi necessário encontrar outra solução para que todas essas
informações fossem relatadas.
Por conveniência, no manuseio dos dados, listamos70 aqueles que não fossem de codas
plenas ou canceladas. Desse modo, foi possível visualizar de forma mais geral a manipulação
dessas recodificações.
Para resolver essa incoerência metodológica, realizamos três recodificações na
tentativa de mantermos dentro do grupo 1 as variações de coda. Vejamos, a seguir, as
recodificações realizadas.
I) Grupo 1 dividido em dois fatores: P (posição original de coda preservada) e R
(posição de coda original alterada)
Os fatores anteriores P (coda plena), X (sem relação grafema/fonema), S (ressilabada)
e E (desfeita por epêntese) foram recodificados como P; já os fatores R (removida) e D
(deslocada - metátese) foram recodificados como R.
Após essas alterações, também foi necessário modificar o valor qualitativo da variável
dependente, pois, nessa recodificação, o grupo 1 é aquele que identifica a posição original da
coda. Para tanto, nossa variável dependente ficou determinada como: 1 (ortográfica) e 2 (não
ortográfica). Nesse caso, o valor de aplicação da regra continuou como (2). Essa alteração
permitiu especificar a posição da coda e, também, identificar a variação ortográfica.
70 Relação das palavras por ocorrência distinta de plena ou cancelamento: X > corprar (comprar), naton (natal -
3), dormin (dormir), tei (tem), azuz (azul), param (parar), monte (morte), futebos (futebol). S > pasano, matano,
cantano, ganhano, poluino, istado zunido, boriço, supero-me, pura aí. D > porde (poder), midingo (mendigo),
pegra (pegar), ne (em). E > adivogado.
104
De acordo com essa nova recodificação, a conjugação do grupo 1 com a variável
dependente ficou com a seguinte disposição: P poderia ter valor 1 ou 2 e R só valor 2 –
devido à ausência da coda por cancelamento ou metátese.
É importante observar que, com essa configuração, temos um problema metodológico
e um problema teórico. Em se tratando de metodologia, o problema encontra-se nos nocautes
do Results, já que todo fator R terá 100% de aplicação da regra – valor 2. Quanto à teoria, o
problema ocorre ao considerarmos S e E como P. Uma das hipóteses desta pesquisa é que o
aprendiz tem a tendência em transformar sílabas não canônicas em sílabas canônicas,
alterando, para isso, sua estrutura. Portanto, não há como considerarmos S, coda transferida
para posição de onset, e E, coda ressilabada por epêntese, como um fator P (posição original
preservada).
II) Grupo 1 dividido em quatro fatores: O (ortográfica), N (não ortográfica), C
(cancelada) e S (coda transferida para posição de onset)
Nesse caso, os valores da variável dependente passaram a ser especificados,
novamente, como (1) Coda preservada e (2) Coda não preservada. Com esses valores, a
conjugação da variável dependente com o primeiro grupo ficou da seguinte forma: O1 - N1 -
C2 - S2.
Essa nova especificação apresentou, mais uma vez, um problema metodológico, o que
gerou o nocaute. Isso porque os dois primeiros fatores do G1 foram “coda ortográfica” e
“coda não ortográfica”. Para esses dois fatores, não é possível haver valor (2) – coda não
preservada, pois, se houve categorização da ortografia, isso significa que ela foi registrada,
logo, esses fatores recebem o valor (1). Assim, não é possível haver contraste.
Os dois outros fatores também apresentaram o mesmo problema. O cancelamento da
coda ou sua transferência para a posição de onset indicaram que não houve coda preservada
na sua posição. Desse modo, não houve aplicação de valor (1) para os dois últimos casos (C e
S). Assim, não foi possível prosseguir com essa configuração, já que é preciso haver pelo
menos um valor oposto dentro de um mesmo fator.
Devido à complexidade da relação lógica entre o grupo 1 e a variável dependente,
poderíamos apenas excluir o Grupo 1 e analisarmos esses casos a parte, conforme os
fenômenos apresentados. No entanto, se isso fosse feito, esses fenômenos não passariam por
uma análise multivariada.
105
III) Grupo 1 dividido em dois fatores: P (coda ortográfica ou não ortográfica) e S
(coda cancelada ou transferida para onset)
Nesse caso, a variável dependente continuou a mesma da recodificação anterior. Com
essa configuração, foi possível verificar valores diferentes dentro do mesmo fator: 1P (coda
preservada e ortográfica), 2P (coda preservada e não ortográfica), 1S (transferida para posição
de onset) e 2S (coda cancelada).
Com essa distribuição, não verificamos problema com nocaute, uma vez que, em cada
fator houve a possibilidade de ocorrer valores diferentes, isto é, em todos os fatores
verificamos valores 1 e 2. Além disso, todos os fenômenos fazem parte da análise.
No entanto, observamos um problema conceitual. Isso porque, ao relacionarmos 2 e P,
estamos confirmando que há codas plenas com sua posição não preservada, o que é
incoerente. Além disso, há uma redundância entre o grupo 1 e o valor (1) da variável
dependente, visto que todos os fatores P necessariamente são (1). Diante de tais incoerências
conceituais, essa recodificação foi descartada.
A partir dessas tentativas, concluímos que não seria possível conjugarmos a variável
dependente com todos os fatores propostos para o grupo 1 em apenas um arquivo, uma vez
que esses dados estão relacionados a fenômenos de natureza distinta – cancelamento de coda,
ortografia de coda e (re)posicionamento estrutural da coda na sílaba.
Dessa forma, excluímos o grupo 1 e dividimos os dados do arquivo conforme o tipo de
variação apresentado pela hipótese construída pelo aprendiz. Nesse sentido, os arquivos foram
reorganizados e renomeados para: Variação I: Cancelamento de Coda; Variação II: Ortografia
da Coda; e Variação III: Posicionamento da Coda na estrutura silábica.
Essa nova disposição dos dados apresentou alguns nocautes, os quais serão discutidos
e solucionados nas seções seguintes.
6.2.2 Os três arquivos e análise binomial da coda
6.2.2.1 Variação I: Cancelamento de Coda
O arquivo de variação de coda está composto por 3728 codificações de sílabas com
coda. Dessas codificações, observamos o cancelamento em 137, ou seja, não foi observado,
nos textos que compõem nosso corpus, o registro de coda em 137 codificações.
106
Devido à nova configuração dos dados, houve nocaute no fator B do grupo natureza de
coda, pois não houve cancelamento de coda com oclusiva71. Dessa forma, recodificamos os
seis casos de coda com oclusiva com o código S (o qual representava apenas a coda /s/). Isso
se deu porque, foneticamente, elas (oclusiva e fricativa) estão mais próximas que as demais
codas codificadas, sendo ambas [-soante].
Após esse reagrupamento, foi gerado novamente o Results com análise binomial e
com a rodada step-up/step-down. Os resultados dessa análise estão apresentados na tabela a
seguir.
Tabela 14 – Análise multivariada do Cancelamento de Coda
Stepping up
Run # 60, 980 cells:
Convergence at Iteration 8
Input 0,015
Group # 2 -- O: 0,584, U: 0,414
Group # 3 -- C: 0,500, P: 0,629, A: 0,413, D: 0,549
Group # 4 -- F: 0,637, N: 0,444
Group # 6 -- D: 0,503, M: 0,366, T: 0,589, P: 0,634
Group # 7 -- V: 0,618, N: 0,457, O: 0,362
Group # 8 -- A: 0,658, B: 0,573, C: 0,326, D: 0,493
Group #10 -- A: 0,356, B: 0,777
Group #11 -- C: 0,631, B: 0,362
Log likelihood = -466,245 Significance = 0,036
Groups selected while stepping up: 10 4 11 8 7 2 3 6
Best stepping up run: #60
71 Esse dado é interessante pois confirma o apoio da escrita na fala, já que não é comum o cancelamento de
oclusiva na modalidade falada. Para resolver a questão de não preferência da coda e, também, sua não
preferência de oclusiva na coda, a língua prefere a inserção de uma vogal epentética, transformando, assim, a
coda em onset. Logo, é comum encontrarmos nas duas modalidades palavras como adivogado, mas raramente
avogado.
107
Stepping down
Run # 90, 1262 cells:
Convergence at Iteration 8
Input 0,014
Group # 1 -- R: 0,617, S: 0,432, L: 0,633, N: 0,402
Group # 2 -- O: 0,577, U: 0,421
Group # 3 -- C: 0,501, P: 0,607, A: 0,423, D: 0,607
Group # 6 -- D: 0,542, M: 0,305, T: 0,612, P: 0,611
Group # 7 -- V: 0,602, N: 0,436, O: 0,418
Group # 8 -- A: 0,649, B: 0,578, C: 0,323, D: 0,498
Group #10 -- A: 0,357, B: 0,774
Group #11 -- C: 0,639, B: 0,353
Log likelihood = -463,936 Significance = 0,070
Groups eliminated while stepping down: 4 9 5
Best stepping up run: #60
Best stepping down run: #90
Fonte: Varbrul
Conforme a tabela anterior, é possível verificar que a sexagésima rodada foi indicada
como melhor pelo stepping up; a convergência foi alcançada na oitava interação; e o nível de
significância dessa rodada ficou em 0.036. Logo, a probabilidade de estarmos cometendo um
erro ao aceitarmos essa hipótese experimental é de 3,6%. Assim, há 96,4% de chance de que
os dados apresentados estejam corretos.
O primeiro grupo eliminado no stepping down coincide com o grupo escolhido no
stepping up. Porém, não consideramos esse fator devido ao nível de significância apresentado
pelo stepping up – acima de 95%. E, além disso, esse grupo eliminado ficou em segundo
lugar na ordem de relevância do stepping up. Já o grupo 1 aparece como escolhido pelo
stepping down, mas será desconsiderado por não constar no stepping up, o qual tomamos
como base.
Em todos os grupos escolhidos pelo stepping up, há nitidamente ambientes
favorecedores e desfavorecedores da aplicação da regra. Isto é, não se verificou resultados que
colocam todos os fatores, de um mesmo grupo, próximos à margem de neutralidade – 0.5.
108
Os grupos de fatores selecionados pelo programa, em ordem de prioridade, foram: 10
– 4 – 11 – 8 – 7 – 2 – 3 – 6, os quais correspondem, respectivamente, às variáveis: classe
social, posição da sílaba na palavra, cidade, ano escolar, classe gramatical das palavras,
segmento seguinte, vogal da sílaba e número de sílabas da palavra.
A variável classe social foi escolhida como a mais relevante na combinação dos
ambientes que favorecem a aplicação da regra. Os resultados foram semelhantes aos
apresentados pelo onset complexo – A: 0.361 e B: 0.736
Tabela 15 – Grupo 10: Variável Independente Não-Estrutural Classe Social
- classe favorecida “A” e classe não favorecida “B” Fator Aplic./Total % Peso Relativo
A 37/2524 1,47 0,356
B 100/1204 8,30 0,777
Total 137/3728 3,67 -
Fonte: Elaborado pela autora.
Os resultados apresentados na tabela anterior apontam que o contexto classe
desfavorecida contribuiu para a aplicação da regra, com um peso relativo em 0.777. Em
outras palavras, este grupo social apresenta tendência em não representar a coda na escrita –
reflexo de um processo fonológico da modalidade falada. Assim, nos registros desses
aprendizes, observamos uma maior transformação, na escrita, do padrão silábico (C)VC em
(C)V.
Diante desses resultados, verificamos um dado curioso: a classe A escreveu mais que o
dobro de palavras com codas. Se colocarmos em percentual, temos 8,3% de cancelamento de
codas pela classe B e 1,5% para a classe A
Como já vimos na seção sobre o OC, uma justificativa para essa diferença está no fato
de que os aprendizes da classe A estão em contato com mais recursos pedagógicos, tanto na
escola quanto em casa.
O próximo grupo ocupa a segunda posição na ordem de relevância do programa. Essa
variável estrutural diz respeito à posição da sílaba na palavra. Em relação a essa variável,
nossa pressuposição era a de que a haveria mais cancelamento em coda em posição final de
palavra. Vejamos os dados na tabela a seguir.
109
Tabela 16 – Grupo 4: Variável Independente Estrutural Posição da Sílaba na Palavra –
final “F” e não final “N” Fator Aplic./Total % Peso Relativo
F 72/1070 6,73 0,637
N 65/2658 2,45 0,444
Total 137/3728 3,67 -
Fonte: Elaborado pela autora.
Conforme nossa hipótese inicial, a posição de coda em final de palavra favorece a
aplicação da regra, com um peso relativo de 0.637. De acordo com Mollica (2000), pesquisas
demonstram que o destravamento silábico incide mais em posição de final de sílaba. Desse
modo, nossos dados ratificam essa afirmação.
O terceiro grupo corresponde à relação entre as cidades dos sujeitos da pesquisa –
Belo Horizonte e Cuiabá.
Tabela 17 - Grupo 11: Variável Independente Não Estrutural Cidade – Belo Horizonte
“B” e Cuiabá “C” Fator Aplic./Total % Peso Relativo
B 36/1812 1,99 0,362
C 101/1916 5,27 0,631
Total 137/3728 3,67 -
Fonte: Elaborado pela autora.
A tabela anterior mostra o favorecimento da aplicação da regra no ambiente Cuiabá e
o desfavorecimento no ambiente Belo Horizonte. O resultado apresentado não era o esperado
para essa variável72. Acreditávamos que não haveria uma diferença considerável entre as
cidades, considerando que ambas são capitais e possuem recursos financeiros e tecnológicos
semelhantes. A hipótese que tínhamos para essa variável era a neutralidade, ou próximo à
neutralidade.
Devido a diferença ser relevante, cruzamos os dados das variáveis Cidades e Classe
Social, a fim de verificar se a variação estava localizada. Vejamos, a seguir, a tabulação
realizada.
72 A princípio, essa variável foi projetada para um melhor manuseio dos dados no programa.
110
Figura 8 – Tabulação Classe Social/Cidade A % B % · %
+ - - - - + - - - - + - - - -
C 2: 26 2: 75 12| 101 5
-: 1281 98: 534 88| 1815 95
·: 1307 : 609 | 1916
+ - - - - + - - - - + - - - -
B 2: 11 1: 25 4| 36 2
-: 1206 99: 570 96| 1776 98
·: 1217 : 595 | 1812
+---------+---------+---------
· 2: 37 1: 100 8| 137 4
-: 2487 99: 1104 92| 3591 96
·: 2524 : 1204 | 3728
Fonte: Elaborado pela autora.
O cruzamento dessas variáveis nos permitiu verificar que a classe favorecida de
Cuiabá apresentou o dobro dos erros (2%), em comparação com a mesma classe social de
Belo Horizonte (1%). A comparação entre as classes B nos revela um percentual de variação
triplicado – 4% em Belo Horizonte e 12% em Cuiabá. Mas o fato que toma nossa atenção é a
relação entre os fatores A e B de Cuiabá.
Esses fatores representam aprendizes que estão separados por alguns quilômetros de
distância, mas evidenciam uma disparidade considerável na relação entre os aprendizes que
possuem uma escolarização privada e os que possuem uma escolarização pública, com um
percentual seis vezes maior – 12%. Pressupomos que essa diferença ocorra durante o processo
de aquisição da escrita devido aos acessos aos materiais e mídias disponíveis para o público
mais favorecido.
Portanto, podemos concluir que a classe social desfavorecida da cidade de Cuiabá é a
classe que mais favorece o cancelamento da coda, na escrita.
Sugerimos que seja feita uma análise mais detalhada sobre a relação dessa variável
com os processos de construção dos padrões silábicos, como por exemplo, uma análise que
leve em consideração fatores externos à escola, como as políticas públicas e os indicadores de
desenvolvimento regional.
A próxima variável trata da distribuição do cancelamento de coda por ano escolar.
111
Tabela 18 – Grupo 8: Variável Independente Não Estrutural Ano Escolar73
- 2ºano (A), 3ºano (B), 4ºano (C) e 5ºano (D)
Fonte: Elaborado pela autora.
Diferentemente dos dados apresentados pelo onset, nos quais a redução de CCV a CV
se mostrou como uma curva em relação aos anos escolares iniciais, o cancelamento da coda
apresentou peso relativo favorável à aplicação da regra nas séries iniciais (2º ano e 3º ano).
No entanto, apresentou peso relativo desfavorável no 4º ano e desfavorável para neutro no 5º
ano.
Esse resultado nos leva a pensar em mais duas variáveis: posição da sílaba na palavra
e classe gramatical, a fim de verificar se há uma distribuição aleatória ou se a variação está
concentrada em uma determinada classe gramatical. Desse modo, cruzamos os dados da
variável Ano Escolar com a variável Classe Gramatical e constatamos que o percentual mais
alto de cancelamento por ano está na classe “verbo”, assim como os cancelamentos em
posição final.
73 Nomenclatura atual.
Fator Aplic./Total % Peso Relativo
A 44/793 5,55 0,658
B 39/816 4,78 0,573
C 18/997 1,81 0,326
D 36/1122 3,21 0,493
Total 137/3728 3,67 -
112
Figura 9 - Ano Escolar e Classe Gramatical CROSS TABULATION
V % N % O % · %
+ - - - - + - - - - + - - - - + - - - -
A 2: 25 8: 17 5: 2 1| 44 6
-: 277 92: 294 95: 178 99| 749 94
·: 302 : 311 : 180 | 793
+ - - - - + - - - - + - - - - + - - - -
B 2: 20 6: 10 4: 9 4| 39 5
-: 321 94: 257 96: 199 96| 777 95
·: 341 : 267 : 208 | 816
+ - - - - + - - - - + - - - - + - - - -
C 2: 14 3: 4 1: 0 0| 18 2
-: 411 97: 329 99: 239 100| 979 98
·: 425 : 333 : 239 | 997
+ - - - - + - - - - + - - - - + - - - -
D 2: 28 6: 6 2: 2 1| 36 3
-: 433 94: 368 98: 285 99| 1086 97
·: 461 : 374 : 287 | 1122
+---------+---------+---------+---------
· 2: 87 6: 37 3: 13 1| 137 4
-: 1442 94: 1248 97: 901 99| 3591 96
·: 1529 : 1285 : 914 | 3728
CROSS TABULATION
F % N % · %
+ - - - - + - - - - + - - - -
V 2: 61 9: 26 3| 87 6
-: 606 91: 836 97| 1442 94
·: 667 : 862 | 1529
+ - - - - + - - - - + - - - -
N 2: 6 2: 31 3| 37 3
-: 269 98: 979 97| 1248 97
·: 275 : 1010 | 1285
+ - - - - + - - - - + - - - -
O 2: 5 4: 8 1| 13 1
-: 123 96: 778 99| 901 99
·: 128 : 786 | 914
+---------+---------+---------
· 2: 72 7: 65 2| 137 4
-: 998 93: 2593 98| 3591 96
·: 1070 : 2658 | 3728
Fonte: Elaborado pela autora.
Desse modo, podemos afirmar que, nos anos iniciais, houve maior cancelamento de
coda em posição final de verbos, em linha decrescente e crescente ao ponto neutro, p. .50.
Gráfico 3 – Cancelamento de Coda em posição final de verbos
Fonte: Elaborado pela autora.
A; 0,658
B; 0,573
C; 0,326
D; 0,493
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
Pes
o R
ela
tivo
Ano Escolar
113
Diferentemente do padrão silábico CCV, que apresentou um nível de variação baixo
no ano A – peso relativo de 0,334 –, o (C)VC apresentou o maior peso relativo nesse ano,
0,658. Como vimos, de acordo com Soares et al (1989, p. 24 ), isso ocorre porque existe um
controle maior sobre a escrita nas séries iniciais, a fim de se evitar o erro.
O alto índice para esse cancelamento de coda em posição final de verbos pode ser
atribuído à influência da modalidade falada da língua, pois, nessa fase, a relação com a
oralidade é inerente ao processo de aquisição da escrita. Por mais que haja a presença do
professor para se evitar o “erro”, assim como no onset complexo, no cancelamento da coda,
há questões fonológicas que atuam de forma mais incisiva na perpetuação da língua, o que
reflete na escrita dos aprendizes.
Sobre o cancelamento de coda em verbos na modalidade falada, mais precisamente o
/r/, Oliveira (1997) afirma que
Este caso também foi retomado e acabou comprovando uma sugestão que eu havia
feito em Oliveira (1991): fenômenos muito antigos (e este caso já está presente na
língua há, pelo menos, 500 anos! Cf. Teyssier, 1959:231-237) podem acabar
apresentando, ao seu final, uma “regularidade” neogramática. E é exatamente este o
caso aqui. Nos 480 casos de (r) final de verbo (20 casos por informantes), temos 458
cancelamentos, num total de 95,4%, o que torna o processo categórico (OLIVEIRA,
1997, p.39).
As pesquisas apontam uma tendência categórica no processo de cancelamento de coda
em final de verbo na língua falada. Nesse sentido, podemos afirmar que esse caso é menos
monitorado e controlado pelo professor. Portanto, está mais suscetível à influência da fala,
que duraria até o ano B (8/9 anos), em que também está localizado o problema de OC/CCV.
Por esse raciocínio, é razoável afirmarmos que, a partir do ano escolar C (9/10 anos), o
aprendiz passa a interagir com a escrita de forma a distanciá-la da modalidade oral. Nesse
caso, o aprendiz percebe que a escrita possui características próprias e singulares, as quais são
diferentes das características da fala.
Assim, é importante ressaltar que a influência da oralidade tem um papel mais
acentuado nos anos iniciais, como parte de um processo natural. Nesse sentido, é possível
afirmar que, à medida que esse distanciamento ocorre, de forma gradual, há uma queda nos
cancelamentos de coda, os quais podem novamente ser alterados com um aumento do léxico
do aprendiz. Essas alterações ocorrem, normalmente, no final da primeira fase do Ensino
Fundamental (ano D). Esses dados corroboram a influência da oralidade sobre a escrita.
A próxima variável apresentada refere-se à classe gramatical das palavras. Os
resultados são apresentados na tabela a seguir.
114
Tabela 19 – Grupo 7: Variável Independente Estrutural Classe de Palavras – verbo “V”,
nomes e adjetivos “N” e outros “O” Fator Aplic./Total % Peso Relativo
V 87/1529 5,69 0,618
N 37/1285 2,88 0,457
O 13/914 1,42 0,362
Total 137/3728 3,67 -
Fonte: Elaborado pela autora.
De acordo com os dados da tabela anterior, a classe dos verbos (V) favorece o
cancelamento da coda, com um peso relativo de 0.618; a classe dos nomes e adjetivos (N) e a
de outros (O) desfavorecem o processo, p. 0.457 e 0.362, respectivamente.
Conforme a discussão da variável anterior, a classe dos verbos apresentou peso
relativo favorecedor em relação ao cancelamento de coda na escrita, sendo, portanto,
considerada como um reflexo de um fenômeno que ocorre de forma quase categórica na
língua falada.
A seguir, apresentamos a variável estrutural que diz respeito à sonoridade do segmento
seguinte.
Tabela 20 – Grupo 2: Variável Independente Estrutural Sonoridade do Segmento
Seguinte – consoante sonora e vogal “O” e consoante surda e pausa “U” Fator Aplic./Total % Peso Relativo
O 90/1882 4,78 0,584
U 47/1846 2,55 0,414
Total 137/3728 3,67 -
Fonte: Elaborado pela autora.
De acordo com os dados da tabela anterior, o peso relativo indica que a sonoridade do
segmento seguinte favorece o cancelamento da coda. Conforme os resultados apresentados na
tabela, as consoantes sonoras e vogais, em posição posterior à coda, favorecem seu
cancelamento com um peso relativo de 0.58. Já o contexto de segmento seguinte, com
consoante surda ou pausa, aponta um desfavorecimento da aplicação da regra, com um peso
relativo de 0.414.
A seguir, apresentamos o penúltimo grupo evidenciado pelo programa como relevante
para a análise de cancelamento de coda. Essa variável refere-se à posição da língua em
relação ao avanço/recuo no trato oral (eixo horizontal).
115
Tabela 21 – Grupo 3: Variável Independente Estrutural Vogal da Sílaba –
central “C”, posterior “P”, anterior “A” e ditongo “D” Fator Aplic./Total % Peso Relativo
C 62/1086 5,71 0,500
P 38/987 3,85 0,629
A 35/1547 2,26 0,413
D 2/108 1,85 0,549
Total 137/3728 3,67 -
Fonte: Elaborado pela autora.
Sobre essa variável, o ambiente mais favorável à aplicação da regra foi aquele
formado pelas vogais posteriores, [u] [o] e [ᵓ], com um peso relativo de 0.629. Na sequência,
também como contexto favorecedor à regra, temos os ditongos, com 0.549. Já a vogal central
[a] apresentou-se como um ambiente neutro, enquanto as vogais anteriores [i] [e] e [ᵋ ]
apareceram como desfavoráveis à aplicação da regra, p. 0.413.
Monaretto (2002) realizou pesquisa sobre a vibrante pós-vocálica em Porto Alegre e
obteve os seguintes dados:
Tabela 22– Apagamento do r-final em verbos conforme o Contexto Precedente Aplic./Total PR
Vogal Frontal
(ter, sair)
511/677 75% 0,46
Vogal Posterior
(pôr, cantar)
624/772 81% 0,54
Total 1.135/1.449 78% -
Fonte: Monaretto (2002, p. 266).
Sobre esses dados, a autora afirma que
Observamos que a preferência do apagamento do r-final se dá no contexto
precedente de vogal posterior. Se a trajetória da evolução da vibrante anterior >
vibrante posterior > apagamento, então faz sentido pressupor que a preservação
ocorra mais com vogal frontal, e o apagamento, com vogal posterior
(MONARETTO, 2002, p.266).
116
Nossos dados confirmam os resultados obtidos por Monaretto, visto que demonstram
que o cancelamento de coda é um fenômeno que ocorre na língua falada e tem reflexo no
processo de aquisição da escrita.
O último grupo apresentado pelo programa como relevante para o fenômeno foi ao
grupo correspondente à variável estrutural, que trata do número de sílabas da palavra.
Tabela 23 – Grupo 6: Variável Independente Estrutural Número de Sílabas - palavras
com uma sílaba “M”, palavras com duas sílabas “D”, palavras com três sílabas “T” e
palavras com quatro ou mais “P” Fator Aplic./Total % Peso Relativo
D 65/1464 4,44 0,503
M 12/996 1,20 0,366
T 42/889 4,72 0,589
P 18/379 4,75 0,634
Total 137/3728 3,67 -
Fonte: Elaborado pela autora.
Os resultados apresentados na tabela anterior mostram que os contextos favoráveis à
aplicação da regra são, respectivamente, as palavras polissílabas, com 0.634 de peso relativo,
e as palavras trissílabas, com 0.589 de peso relativo. As palavras monossílabas apresentaram-
se como desfavoráveis, com 0.366, e as palavras dissílabas como neutras, com 0.503.
Mollica (2000) afirma que, na modalidade falada, há uma tendência de perda de
substância fônica em enunciados maiores.
Estudos demonstram que enunciados longos tendem a perder substância fônica em
função da dificuldade de processamento e/ou do princípio de economia ou lei do
menor esforço: não é raro encontrar-se o cancelamento da vibrante em palavra de
grande extensão como agradecer ~agradece (MOLLICA, 2000, p.14 – grifos da
autora).
Assim, é possível afirmar, com base em nossos resultados, que as palavras trissílabas e
polissílabas apresentam um maior cancelamento de coda na escrita, como reflexo de um
fenômeno que ocorre na modalidade falada da língua.
117
6.2.2.2 Variação II: Ortografia
Esta seção tem como objetivo apresentar uma análise acerca da variação II, ortografia.
No arquivo de Processo de Ortografia foram contabilizadas 3.582 sílabas analisadas. Destas,
76 apresentaram problema ortográfico na coda. É importante ressaltar que, nesse arquivo, não
estão os dados de cancelamento de coda74 (137 casos) e os dados de alteração de
posicionamento estrutural da sílaba75 (10 casos).
Assim como no arquivo de Cancelamento, fizemos um reagrupamento no grupo
relativo à natureza da coda. A letra B codificava as codas preenchidas por oclusivas – seis
casos. Porém, não houve nenhum cancelamento desse tipo de coda76. Logo, se esse código
permanecesse, teríamos um nocaute. Dessa forma, reagrupamos os casos de coda com
oclusiva no fator S (que representava apenas a coda /S/), visto que, foneticamente, elas
(oclusiva e fricativa) estão mais próximas que as demais codas codificadas, pois ambas são [-
soante].
Em seguida, geramos novamente o Results com análise binomial e com a rodada step-
up/step-down. A seguir, apresentamos a tabela com os dados obtidos através do Programa.
Tabela 24 – Análise multivariada de Ortografia Stepping up
Run # 45, 124 cells:
Convergence at Iteration 7
Input 0,006
Group # 1 -- R: 0,161, S: 0,443, L: 0,941, N: 0,738
Group # 5 -- T: 0,431, A: 0,655
Group # 8 -- A: 0,625, B: 0,622, C: 0,399, D: 0,416
Group #10 -- A: 0,397, B: 0,719
Group #11 -- C: 0,591, B: 0,407
Log likelihood = -285,680 Significance = 0,008
Groups selected while stepping up: 1 10 5 11 8
Best stepping up run: #45
Stepping down
Run # 102, 124 cells:
Convergence at Iteration 7
Input 0,006
74 Se a coda foi cancelada, não há ortografia para ser analisada. 75 Se a coda foi movida para onset, ela deixou de aparecer na posição de coda na escrita. 76 Um dos casos não foi considerado no processo de ortografia pois houve epêntese (adivogado). Portanto, não
será considerado aqui, já que alterou a posição do segmento de coda para onset.
118
Group # 1 -- R: 0,161, S: 0,443, L: 0,941, N: 0,738
Group # 5 -- T: 0,431, A: 0,655
Group # 8 -- A: 0,625, B: 0,622, C: 0,399, D: 0,416
Group #10 -- A: 0,397, B: 0,719
Group #11 -- C: 0,591, B: 0,407
Log likelihood = -285,680 Significance = 0,141
Groups eliminated while stepping down: 2 7 4 3 6 9
Best stepping up run: #45
Best stepping down run: #102
Fonte: Varbrul.
O stepping up indicou a quadragésima rodada como a melhor, com a convergência
alcançada na sétima interação. O nível de significância dessa rodada foi 0.008, o que
corresponde a 99,2% de chance de estarmos corretos ao aceitarmos os dados obtidos por essa
rodada. O acerto é quase categórico.
Nenhum grupo eliminado pelo stepping down foi indicado pelo stepping up. Além
disso, todos os grupos escolhidos como relevantes pelo stepping up também foram pelo
stepping down. Em todos os grupos relevantes houve pelo menos um ambiente favorecedor e
outro desfavorecedor para a análise da ortografia.
A ordem de relevância dos grupos estabelecida pelo programa foi: 1 – 10 – 5 – 11 – 8.
Esses grupos correspondem às variáveis: natureza da coda, classe social, tonicidade, cidade e
ano escolar.
A variável escolhida como a mais relevante para o processo de ortografia trata da
natureza da coda. Distribuímos a natureza da coda da seguinte forma: R para o /r/ pós-
vocálico, S para /s/ e /z/ e para as oclusivas, L para /l/ e N para as nasais.
Tabela 25 – Grupo 1: Variável Independente Estrutural Natureza da Coda
– /r/ “R”, /s/ e /z/ “S”, “L” /l/ e nasal “N” Fator Aplic./Total % Peso Relativo
R 2/1267 0,16 O,161
S 5/561 0,89 0,443
L 28/228 12,28 0,941
N 41/1526 2,69 0,738
Total 76/3582 2,12 -
Fonte: Elaborado pela autora.
119
De acordo com os resultados apresentados na tabela anterior, o fator R desfavoreceu a
aplicação da regra, ou seja, desfavoreceu o erro, com um peso relativo próximo a zero, 0.161.
Isso ocorreu porque não há outro grafema que também represente esse fonema. Nos dados foi
possível verificar duas variações ortográficas: dor min (dormir) e param (parar). Esses dois
casos são marcados como não ortográficos, porque, ortograficamente não correspondem à
norma padrão. No entanto, a questão, nesse caso, é mais complexa. Isso porque, nessas duas
construções hipotéticas, o aprendiz reconhece o padrão silábico como CVC, ou seja, ele
identifica a hierarquia dos constituintes silábicos, mas não identifica qual é o segmento usado
para preencher aquela coda.
Nesse sentido, Abaurre (1999) afirma que
Não se trata, aqui, de “problemas ortográficos” como aqueles envolvidos com a
correta escolha de uma dentre algumas letras que podem, na escrita, representar
determinado fonema: trata-se, isso sim, de decidir sobre o número de segmentos
que devem ser representados, bem como a posição que devem ocupar na estrutura
das sílabas (ABAURRE, 1999, p.176 – grifos da autora).
Dessa forma, podemos inferir que esse preenchimento ocorre com o segmento já
familiarizado àquela posição, nesse caso, a nasal. As duas palavras pertencem aos dados de
Cuiabá, classe social não favorecida, sendo uma do ano A (sexo feminino) e outra do ano B
(sexo masculino).
O fator S, que verifica a ortografia das codas /s/ e /z/ e oclusivas, também se
apresentou como desfavorável, com peso de 0.443. Nesse sentido, podemos pressupor que o
aprendiz resolve essa questão ortográfica de acordo com o contato que mantém com a
modalidade escrita da língua, não apresentando um problema particular durante o processo.
Com um peso relativo muito alto, 0.941, temos a coda “l”. Essa relevância ocorre
devido ao processo de vocalização da coda /l / na modalidade falada, o que se reflete na
escrita através da substituição de “l” por “u” ou “o”. Em nossos dados, verificamos a
existência de 22 palavras que se encaixam nessa explicação.77
Também como favorecedora à variação ortográfica na coda, temos a nasal, com um
peso relativo de 0.738. Isso ocorre porque, para as nasais em final de sílabas, há regras
invariantes (m antes de p e b e final de palavra) que precisam ser memorizadas e aplicadas, o
que está relacionado à memorização e não à influência direta da modalidade falada.
77 São elas: mautratar, sauvaria (4), sauvar (3), sauvarei, seuva, portátiu, sou (sol), vouta, papeu (2), soutei,
Niutom (2), devouver, mau (mal), fácio, fasio.
120
A variável não estrutural classe social foi indicada pelo programa como a segunda na
ordem de prioridade. Vejamos a tabela a seguir.
Tabela 25 – Grupo 10: Variável Independente Não-Estrutural Classe Social
- classe favorecida “A” e classe não favorecida “B” Fator Aplic./Total % Peso Relativo
A 30/2483 1,21 0,397
B 46/1099 4,19 0,719
Total 76/3582 2,12 -
Fonte: Elaborado pela autora.
De acordo com a tabela anterior, os resultados para a variável classe social são
semelhantes àqueles apresentados pelo cancelamento de coda: 0.356 para A e 0.777 para B,
também próximo aos resultados apresentados pelo onset complexo: 0.361 e 0.736.
Portanto, a classe social B apresentou-se de forma categórica como um fator
favorecedor à aplicação de regras de variação para os padrões silábicos CCV e (C)VC. Isto é,
crianças que frequentam escolas públicas tendem a alterar com mais frequência esses padrões
silábicos durante o processo de aquisição da escrita por motivos já discutidos nas seções
anteriores.
A próxima variável ficou em terceiro lugar na ordem de prioridade. Essa variável
estrutural diz respeito à tonicidade da sílaba analisada.
Tabela 27 – Grupo 5: Variável Independente Estrutural Tonicidade – tônica “T” e átona
“A” Fator Aplic./Total % Peso Relativo
T 34/2503 1,36 0,431
A 42/1079 4,26 0,655
Total 76/3582 2,12 -
Fonte: Elaborado pela autora.
Essa variável foi eliminada na análise de cancelamento de coda e apresentou valores
inversos em comparação com o fenômeno de alteração de onset complexo (A: 0.364 e T:
0.769).
De acordo com a tabela anterior, a aplicação da regra de variação ortográfica se deu
pelo favorecimento da sílaba átona, com um peso relativo de 0.655, sendo desfavorecida pelo
contexto da sílaba tônica, com peso de 0.431.
121
Esse resultado já era esperado. De acordo com Alvarenga (1995, p. 28) “em função da
estabilidade da sílaba tônica, pode-se sugerir que a sílaba fraca seja um ponto mais frequente
de variações ortográficas que a sílaba forte ou tônica”. Logo, nossos resultados sobre a
variação ortográfica ratificam a afirmação de Alvarenga (1995).
A próxima variável também apareceu como relevante para o cancelamento de coda,
analisado anteriormente. Trata-se da diferença entre as cidades de coleta dos dados.
Tabela 28 – Grupo 11: Variável Independente Não Estrutural Cidade – Belo Horizonte
“B” e Cuiabá “C” Fator Aplic./Total % Peso Relativo
C 52/1812 2,87 0,591
B 24/1770 1,36 0,407
Total 76/3582 2,12 -
Fonte: Elaborado pela autora.
Os resultados apresentados para essa variável não estavam em nossas hipóteses, pois
acreditávamos que a variável Cidade não seria um fator determinante de variações na
construção de padrões silábicos e ou ortográficos.
Os aprendizes da cidade de Cuiabá apresentaram uma maior tendência na aplicação da
regra de variação ortográfica da coda. Já os aprendizes de Belo Horizonte apresentaram-se
como desfavorecedores dessa regra.
Desse modo, o resultado foi próximo ao apresentado para o cancelamento de coda –
Cuiabá: 0.631 e Belo Horizonte: 0.362.
Acreditamos que, para uma análise mais precisa dessa variável, é necessário uma
pesquisa sincrônica e uma quantidade maior de dados. Assim como uma análise sobre os
indicadores de investimentos de políticas públicas para a educação básica e indicadores de
desenvolvimento regional.
A última variável dessa análise trata da distribuição da variação ortográfica por ano
escolar.
122
Tabela 29 – Grupo 8: Variável Independente Não Estrutural Ano Escolar78
- 2ºano (A), 3ºano (B), 4ºano (C) e 5ºano (D)
Fonte: Elaborado pela autora.
Os resultados apresentados por essa variável também se assemelham aos apresentados
pelo cancelamento de coda (A 0,658 – B 0,573 – C 0,326 – D 0,493). A justificativa para esse
resultado também está relacionada ao reflexo da modalidade falada na modalidade escrita.
Conforme os resultados apresentados na tabela 25 sobre a ortografia da coda, o
ambiente de coda que mais favoreceu a variação ortográfica foi a coda “l”, com um peso
relativo que passou de 0.9, mais precisamente 0.941. Isso se deu devido à vocalização do “l”,
que ocorre com frequência na modalidade falada, refletindo no processo de aquisição da
escrita.
Logo, tivemos uma maior concentração de variação ortográfica nas séries iniciais, aqui
codificadas como A e B, nas quais os alunos demonstraram se apoiar com mais intensidade na
modalidade falada da língua.
6.2.2.3 Variação III: Posicionamento estrutural na sílaba
No arquivo de Variação Estrutural na sílaba, foram analisadas 3.591 sílabas – sendo
que não estão registradas nesse arquivo as 137 ocorrências de cancelamento de coda79. Das
sílabas analisadas, apenas 10 apresentaram problema de posicionamento estrutural da coda.
Para dar continuidade às análises, também foi necessário reajustar os fatores do grupo
relativo à natureza da coda. O fator L foi retirado porque não houve caso de ressilabação80
com essa coda, o que gerou nocaute. Portanto, as codas de código L foram recodificadas com
o código R. A justificativa para tal amalgamação se dá pelo fato de as codas “l” e “r”
formarem o grupo das líquidas.
78 Nomenclatura atual. 79 Se a coda foi cancelada, não há posicionamento para ser analisado. 80 Como por exemplo: maleducado para o registro de mal educado.
Fator Aplic./Total % Peso Relativo
A 21/746 2,82 0,625
B 23/776 2,96 0,622
C 17/978 1,74 0,399
D 15/1082 1,39 0,416
Total 76/3582 2,12 -
123
No grupo de fatores vogal da sílaba, também foi necessário algum tipo de amálgama.
Nesse caso, não verificamos ressilabação antes de D (ditongo), portanto, houve nocaute.
Assim, recodificamos os dados dos ditongos com o código “A” (vogal posterior). Essa fusão
se deu devido ao percentual apresentado por “A” ser o menor do grupo.81 Já no grupo de
fatores sobre a sonoridade do segmento seguinte, mantivemos um dado fictício para o
segmento seguinte sonoro (O) para a eliminação de nocaute.
Após a resolução dos nocautes, foi gerado novamente o Results e solicitado a análise
binomial e rodada step-up/step-down. O resultado gerado pelo programa pode ser observado
na tabela a seguir.
Tabela 30 – Análise Multivariada do Posicionamento Estrutural da Coda na Sílaba
Binomial Varbrul
================
Name of cell file: C:\Users\ana\Desktop\Varbrul - 3 processos distintos\arquivos derivados\Processo
de Posicionamento 10-03\Cell_CODA - sem G2 - Processo de Posicionamento - 10-03.cel
Using fast, less accurate method.
Averaging by weighting factors.
Threshold, step-up/down: 0,050001
# Stepping up:
# Stepping up:
---------- Level # 0 ----------
Run # 1, 1 cells: Esta janela aparece sobre o resultado, após o programa
Convergence at Iteration 2 interromper a rodada dos dados.82
Input 0,003
Log likelihood = -74,657
---------- Level # 1 ----------
Run # 2, 5 cells:
Fonte: Varbrul.
81 Results com nocaute e sem nocaute em anexo. 82 Tradução livre: Divisão do ponto flutuante por zero.
124
O programa Varbrul não rodou os níveis da análise dos dados, uma vez que parou no
nível 1. Isso aconteceu devido ao fato de a incidência ser quase categórica para 0.0. Ou seja,
houve 10 casos de ressilabação em 3591 sílabas (C)VC, um percentual de 0,27% de
ocorrências. Logo, o programa não pôde entrelaçar os ambientes codificados para a análise
estatística multivariada.
Devido à impossibilidade de utilizarmos a análise multivariada do Varbrul,
verificamos as variáveis de forma isolada. Nosso objetivo foi verificar os percentuais e traçar
alguns possíveis padrões para as ressilabações encontradas.
A seguir estão os dez casos de ressilabações codificados no nosso corpus.
Quadro 17– Ressilabação e silabação Códigos83 Processo
2NOCNTTVBFBC (pasano)
2NOCNTTVDMBC (matano)
2NOCNTTVAFBC (ganhano)84
2NOANTPVDMBC (poluino)
2NOCNTTVDFAB (cantano)
Ressilabação por
assimilação
2SOPFATNAMAB (istado zunido)
2ROPFTMOAFBB (boriço)
2ROAFTDOCMAB (superome)
2ROPFTMODFAB (pura aí)
Ressilabação em
fronteira de palavra
2BOCNAPNAMAB (adivogado) Silabação por
epêntese
Fonte: Elaborado pela autora.
Como podemos notar, as (re)silabações ocorreram por três processos diferentes:
assimilação, fronteira de palavra e epêntese.
O maior número de alteração de posicionamento estrutural da sílaba na modalidade
escrita ocorreu devido a um processo de assimilação da língua, 50% dos casos. Esse processo
fonológico refere-se à alteração de um fonema por influência de outro que lhe está próximo.
83 O número dois identifica o valor de aplicação da regra, isto é, a alteração de CVC em CV.CV. 84 Nos dados do Varbrul, o segmento [d] dessa palavra foi codificado como surdo (U) para eliminação de
nocaute.
125
Os casos analisados apresentam a assimilação do fonema /d/, isto é, transformando
/ndo/ em /no/. Vale ressaltar que na modalidade oral, na maioria das vezes, a nasalidade
continua presente na sílaba85 anterior. Porém, o reflexo desse processo de assimilação na
modalidade escrita altera o registro do padrão silábico da sílaba medial, em que (C)VC é
transformado em CV. Portanto, categorizamos essas palavras como ressilabação por processo
de assimilação.
Quadro 18 – Alteração do padrão silábico da sílaba medial na modalidade escrita Registro sem reflexo de processo de
assimilação86
Registro com processo de assimilação
refletido
pa san do
CVC
ma tan do
CVC
ga nhan do
CVC
po lu in do
VC
can tan do
CVC
pa sa no
CV
ma ta no
CV
ga nha no
CV
po lu i no
V
can ta no
CV
Fonte: Elaborado pela autora.
Sobre os estudos acerca do processo de assimilação, Mollica (2000, p. 40) afirma que
tais regras diacrônicas, as quais se aplicam em um grande universo lexical, operam
variavelmente no estágio atual da língua portuguesa, em subconjuntos do vocabulário,
conduzido por princípios possíveis de se detectar.
[...] há itens não afetados, outros poucos afetados, outros muito afetados pela
assimilação. Essa hierarquização se baseia especialmente no parâmetro categoria
morfológica a que pertence o item, além de sua frequência e formalidade de uso. [...]
os nomes próprios quase nunca são afetados: não há casos de por exemplo Orlano e
Raimuno, enquanto as formas de gerúndio possuem chances muito grandes de
serem afetadas; os substantivos comuns e os adjetivos são pouco atingidos, e as
conjunções quando e segundo só são em junturas morfo-fonêmicas em que não há
silêncio e em que questões de processamento acham-se presentes. Paralelamente,
quanto mais frequentes e mais informais os itens, mais se processa a assimilação,
sendo o inverso verdadeiro. (MOLLICA, 2000, p.40-41 – grifos da autora)
Ainda de acordo com a autora, o ideal é que ocorra um trabalho didático dirigido,
iniciando pelas categorias mais frequentes e mais prováveis à assimilação, por outro lado, essa
85 No caso da palavra poluino a sílaba formada pela vogal /i/ não apresenta nasalidade, na modalidade oral, após
a assimilação. 86 A alteração está apenas no /ndo/, as demais letras estão conforme foram encontradas.
126
regra pode regular-se por autocorreção ao longo da escolarização, em razão da escrita, ainda
que a variação da fala continue (MOLLICA, 2000, p.41).
A ressilabação em fronteira de palavra apareceu em 4 ocorrências, 3 com /R/ e 1 com
/S/. Como visto na seção 2.3.2, em muitas línguas, as consoantes pré-vocálicas preferem
ocupar o onset da sílaba, o que ocorre, também, na língua portuguesa. Há tendência de ocorrer
onsetamento mesmo se uma fronteira gramatical ou de palavra intervir. Essa preferência
ocorre devido ao Princípio de Maximização do Onset.
Quadro 19– Alteração no registro do padrão silábico em fronteira de palavra Registro sem alteração 87
Registro com alteração do padrão
silábico
is. ta. dos # u. ni. do
CVC#V
bor # i.ço
CVC# V
su. per. # o.mem
CVC#V
pur # aí
CVC# VV
is. ta. do # zu. ni. do
CV # CV
bo. ri. ço
CV. CV
su. pe. ro.mem
V. CV
pu. ra# aí
CV. CV# VV
Fonte: Elaborado pela autora.
Dessa forma, a ressilabação é resultado de uma regra que altera a estrutura silábica,
transformando CVC.V em CV.CV. Trata-se de um processo pós-lexical, ou seja, atua no nível
da frase, sobre elementos já silabados e está relacionado ao Princípio de Maximização de
Onset. Portanto, processos como esse, característicos da modalidade falada, podem ser
encontrados na modalidade escrita, o que comprova a interferência da oralidade na escrita.
Nosso último dado refere-se a um processo de silabação de segmento flutuante com a
inserção de uma vogal epentética.
Quadro 20 –Alteração no registro do padrão silábico por epêntese Registro sem alteração 88
Registro com alteração do padrão
silábico
ad. vo. ga. do
VC. CV. CV. CV
a. di. vo. ga. do
V. CV. CV.CV. CV
inserção de uma vogal
Fonte: Elaborado pela autora.
87 A alteração está apenas na representação correta do CVC, as demais letras estão conforme foram encontradas. 88 A alteração está apenas na representação correta do CVC, as demais letras estão conforme foram encontradas.
127
De acordo com Bisol, a coda na língua portuguesa é preenchida por qualquer soante89
e por uma única obstruinte [-soante] /S/, sendo as demais rejeitadas. De acordo com Bisol
(2013a, p. 34), esse elemento torna-se um segmento flutuante. Nesse ponto, o Princípio do
Licenciamento Prosódico atua legitimando uma silabação iterativa, permitindo que uma vogal
seja inserida para que o segmento flutuante seja silabado.
No quadro a seguir vamos observar as ocorrências em relação à sua distribuição dos
fatores nas variáveis.
Quadro 21 – Distribuição dos fatores no processo de variação estrutural da sílaba
Variáveis Quantidade/Variável
Natureza da Coda
N - nasal 5
R - /R/ 3
S - /s/e /z/ 1
B - oclusiva 1
Total 10
Sonoridade do
Segmento Seguinte
Sonoro - O 10
Surdo - U 0
Total 10
Vogal da Sílaba
Central - C 5
Posterior - P 3
Anterior - A 2
Total 10
Posição da Sílaba na
Palavra
Não final - N 6
Final - F 4
Total 10
Tonicidade da Sílaba
Átona - A 2
Tônica - T 8
Total 10
Número de Sílabas na
Palavra
Monossílaba - M 2
Dissílaba - D 1
Trissílaba - T 5
Polissílaba - P 2
Total 10
Classe Gramatical da
Palavra
Verbo - V 5
Nome - V 2
Outros - O 3
Total 10
Ano A 4
89 Essa afirmação merece cuidado, uma vez que a lateral palatal, que é uma soante, não aparece em posição de
coda.
128
Ano Escolar
Ano B 1
Ano C 1
Ano D 4
Total 10
Sexo
Feminino - F 5
Masculino - M 5
Total 10
Classe Social
Classe A 5
Classe B 5
Total 10
Cidade
Belo Horizonte 6
Cuiabá 4
Total 10
Fonte: Elaborado pela autora.
A distribuição dos dados por variável nos revelou alguns contextos que favorecem a
transferência da coda para posição de onset. Vamos aos resultados por variável:
i) Em números absolutos, o maior índice de ocorrências para ressilabação ocorreu
com a coda nasal.
ii) Todas ocorreram antes de consoante soante ou vogal.
iii) A vogal central /a/ apareceu em 50% das ocorrências.
i) A maior parte das transformações ocorreu em sílaba não final, 80%.
ii) 80% estão em sílabas tônicas.
iii) Palavras com mais de três sílabas aparecem em 70% dos casos.
iv) Metade das alterações são verbos, 50%.
v) 40% dos casos estão nos anos A e D.
vi) As variáveis sexo e classe social não apresentaram diferença.
vii) 60% dos casos são dos registros da cidade de Belo Horizonte.
Diante do comportamento dessas variáveis, podemos afirmar que a alteração de coda
para onset ocorre com maior frequência em posição tônica, não final, em palavras com três ou
mais sílabas, verbos, nos anos A e D.
Para que esse fenômeno seja analisado considerando todas as variáveis, é necessário
uma coleta maior de dados, com a possibilidade de inclusão do primeiro ano escolar do
Ensino Fundamental.
A seguir, apresentaremos as considerações finais, encerrando nossa discussão sobre a
representação do onset complexo e da coda na modalidade escrita da língua.
129
7 CONSIDERAÇÕES FINAIS
A presente dissertação teve como principal fundamento os estudos fonológicos que
partem da ideia de que a organização silábica é uma organização abstrata da prosódia. Diante
de tais estudos, nosso principal objetivo foi analisar a interferência da modalidade falada na
constituição de dois padrões silábicos da escrita, a saber, CCV e (C)VC.
Para tanto, partimos da hipótese de que o aprendiz controla o aprendizado da
modalidade escrita a partir de seus conhecimentos sobre a língua falada, já internalizada.
Vimos que a escrita conquista sua independência em um processo consciente e gradativo, à
medida que o aprendiz reflete sobre a língua como um objeto de conhecimento e é capaz de
distinguir as especificidades dessas duas modalidades da língua.
Em nosso estudo, vimos que a competência linguística do aprendiz conduz e controla
seu próprio aprendizado sobre a escrita. Durante esse processo de aquisição da escrita, foi
possível verificar as marcas gráficas que nos conduziram a refletir sobre as causas que
proporcionaram tais hipóteses, as quais não foram aleatórias, e demonstraram a lógica e o
trabalho de reflexão intenso que está por trás dessa elaboração linguística.
Assim, o propósito da presente pesquisa foi investigar as possíveis variáveis que
interferem no processo de construção da escrita, com base na sílaba, causando instabilidades
nos padrões silábicos diferentes do padrão canônico, CV.
Para alcançar tal propósito, constituímos um corpus a partir de textos espontâneos dos
anos iniciais do Ensino Fundamental. A partir desse corpus, analisamos 4449 sílabas, sendo
721 para o onset complexo e 3728 para a coda. Usamos um conjunto de programas
computacionais, Varbrul, para realizar a análise quantitativa multivariada dos dados inseridos.
Com isso, nossa análise foi construída sobre três pilares: (i) a sílaba é o locus para a
organização dos segmentos silábicos, (ii) a produção da escrita, inicialmente, está pautada na
modalidade falada da língua, e (iii) os modelos fonológicos adotados indicam que o onset
complexo e a coda são menos estáveis que a configuração canônica CV.
Para compreender os resultados obtidos e analisá-los sob uma perspectiva qualitativa,
buscamos evidências e sustentação teórica. Valemos dos estudos de Kenstowicz (1994),
Clements e Keyser (1983), Alvarenga (1993), Bisol (2013a), Alvarenga e Oliveira (1997),
Oliveira (2005), Mollica (2000), Miranda (2009, 2012) e outros não menos importantes.
De modo a organizar melhor as considerações finais do presente estudo, dividimos
nossas conclusões com base nas análises quantitativas e qualitativas, sobre a interferência da
130
modalidade falada da língua, durante o processo de aquisição da escrita, nos padrões silábicos
CCV e (C)VC, a saber, o onset complexo e a coda.
7.1 O onset complexo
Os casos encontrados sobre a variação do onset complexo foram divididos em quatro
tipos: (i) variação ocasional – quando houve um deslize gráfico, o que foi comprovado
quando encontramos, no mesmo texto, a mesma palavra, mais de uma vez, representada
corretamente; (ii) problema com a organização linear da sílaba; (iii) epêntese; e (iv)
reestruturação silábica por omissão ou metátese. Nos três primeiros tipos, encontramos apenas
1 caso de cada em 721 sílabas. No último, estão os demais 11 casos.
Das 12 variáveis elencadas, encontramos 8 variáveis estruturais e 4 variáveis não
estruturais, como possíveis favorecedores de alteração. O programa escolheu apenas 5 grupos
como relevantes: número de sílabas, classe social, tonicidade, sexo e ano escolar. A ordem
está de acordo com o grau de relevância atribuído pelo programa.
Número de sílabas (P. 0.76) – As palavras que possuem duas sílabas favoreceram a
alteração do OC, o que já era esperado. Isso se justifica devido à canonicidade das
palavras trissílabas, visto que o ideal para a língua em análise é a sequência sílaba
tônica+ sílaba átona+ sílaba tônica. Relacionamos essa escolha da língua ao
Princípio do Contorno Obrigatório.
Classe social (P. 0.73) – A classe social desfavorecida apresentou-se como
favorecedora na alteração de OC. Esse resultado já era esperado e ratifica as
afirmações de Alvarenga e Oliveira (1997, p.151). Um dos motivos que contribui para
essa estatística é a disponibilidade precária dos recursos pedagógicos e culturais
ofertados a essa classe social.
Tonicidade (P. 0.76) – Sobre esse grupo, esperávamos um resultado diferente. Com
base nos estudos de Alvarenga (1993), acreditávamos que os OC que estivessem em
sílaba átona fossem mais propícios à alteração, por ser este um ponto fonético mais
instável. Nosso resultado atestou que os OC em sílabas tônicas sofrem mais alterações.
Para justificar essa constatação, buscamos explicação na escala de sonoridade proposta
por Alvarenga e Oliveira (1997). Dessa forma, concluímos que essa alteração ocorre
para otimizar o distanciamento sonoro nas sílabas mais marcadas, a saber, as tônicas.
Nesse sentido, a mudança estaria em conformidade com o Princípio do
131
Sequenciamento Sonoro, o qual pressupõe que a sílaba tenha um contorno sonoro,
com sonoridade crescente em direção ao núcleo e caimento em direção à coda.
Sexo (P. 0.73) – O sexo masculino apresenta-se como favorecedor à regra de alteração
de OC. Esse resultado já era esperado, já que as meninas se apresentam como mais
conservadoras, utilizando com mais frequência a forma de prestígio. De acordo com
Alvarenga e Oliveira (1997), isso aparece em praticamente todos os estudos
sociolinguísticos.
Ano escolar (P. 0.85) – Em relação aos anos escolares, as variações de OC estão
localizadas no 3º ano. Esperávamos que esse resultado fosse apresentado pelo 2º ano.
Isso pode ser explicado pelo fato de que, nos primeiros anos (1º e 2º), há uma
monitoração maior por parte do professor, a fim de se evitar a variação, o “erro”, o que
corrobora a afirmação de Soares et al (1989, p.24). Dessa forma, as hipóteses que
manifestam alterações podem ser mascaradas. Outro fator que contribui para esse
resultado diz respeito ao controle lexical. A maior parte das palavras com OC foram
escritas pelo 2º ano, mas as propostas de produção de texto traziam duas palavras com
OC (brinquedo e preferido), fato que condicionou o registro dessas palavras conforme
a escrita padrão. Após o 3º ano, entendemos que o aprendiz apresenta uma autonomia
maior em relação à sua escrita, logo, apresenta um número maior de variações até que
esse padrão silábico esteja estabilizado.
Portanto, para as variações do OC, temos como favorecedores à aplicação da regra de
variação duas variáveis estruturais e três variáveis não estruturais. Assim, de acordo com os
resultados da nossa pesquisa, podemos afirmar que o conhecimento sobre a modalidade falada
da língua interfere na construção do onset complexo, já que o aprendiz se apoia na oralidade
para construir sua escrita. A partir dos resultados de nossa análise multivariada, também é
possível afirmar que os meninos do 3º ano da classe social desfavorecida alteram com maior
frequência OC de sílabas tônicas de palavras trissílabas.
Passemos, agora, para as conclusões acerca da coda.
7.2 A coda
A variação da coda foi dividida em três fenômenos distintos: (i) variação por
cancelamento de coda; (ii) variação de ortografia da coda; e (iii) variação da coda no
132
posicionamento estrutural da sílaba. As variáveis foram definidas de acordo com o tipo de
fenômeno analisado.
7.2.1 Variação I: Cancelamento de Coda
Para a análise dessa variação, foram contabilizados 137 cancelamentos de coda, em
um corpus composto por 3728 ocorrências. Para essa análise, elegemos 7 variáveis estruturais
e 4 não estruturais. O programa escolheu 8 variáveis como favorecedoras: classe social,
posição da sílaba na palavra, cidade, ano escolar, classe gramatical das palavras, segmento
seguinte, vogal da sílaba e número de sílabas.
Classe social (P. 0.77) – Com um resultado semelhante ao OC, a classe social
desfavorecida também se apresentou favorável ao cancelamento da coda. A
justificativa para esse resultado é a mesma dada para a redução de OC: os aprendizes
da classe desfavorecida têm menos contato com recursos pedagógicos e culturais,
tanto em casa quanto na escola, o que também é indicado pela apresentação de um
léxico mais restrito, já que a classe social favorecida escreveu mais que o dobro de
palavras com coda.
Posição da sílaba na palavra (P. 0.63) – A posição de coda em sílaba final favorece a
aplicação da regra, isto é, o cancelamento da coda. Esse resultado era o esperado por
confirmar os dados de Mollica (2000, p. 15), o qual demonstra que o destravamento
silábico incide mais em posição final de sílaba.
Cidade (P. 0.63) – Sobre essa variável, o resultado foi surpreendente. Partindo do
pressuposto que as duas cidades são capitais e possuem recursos financeiros e
tecnológicos semelhantes, acreditávamos que o peso relativo seria aproximado a 0.5, o
que indicaria neutralidade da variável. Para um detalhamento maior, cruzamos os
dados das variáveis cidade e classe social, a fim de localizar a maior variação em
percentuais. Logo, foi possível identificar a classe social desfavorecida da cidade de
Cuiabá como uma classe que favorece o cancelamento da coda com uma disparidade
considerável (BH A: 1%; BH B: 4%; CB A: 2%; CB B: 12%). Para uma análise mais
precisa sobre a relação dessa variável com os processos de construção dos padrões
silábicos, sugerimos estudos mais detalhados, que considerem fatores externos à
escola, como as políticas públicas e os indicadores de desenvolvimento regional.
133
Ano escolar (P. 0.65) – O favorecimento à aplicação da regra de cancelamento de coda
está concentrado no 2º ano. Esse favorecimento mostra uma curva decrescente até que
se estabiliza na neutralidade no 5º ano (p. 0.49). Devido ao fato de esses resultados
serem diferentes dos apresentados por OC, esperávamos que fossem aproximados, e
contrários à justificativa de que há um monitoramento maior dos erros pelos
professores nos anos iniciais, fizemos o cruzamento de dados de ano escolar e classe
gramatical. O resultado apresentado nos revelou que a concentração desse
cancelamento está nos verbos. Nesse sentido, é possível induzir que, em relação ao
cancelamento da coda, um monitoramento do professor não é suficiente para
neutralizar um processo fonológico em andamento na língua, como é o caso do
cancelamento do /r/ em final de verbos, atestado por Oliveira (1997, p.39). Isso
corrobora nossa hipótese sobre a influência da oralidade no início do processo de
aquisição da escrita. Nesse sentido, afirmamos que, à medida que ocorre a autonomia
da modalidade escrita, particularidades como essas vão sendo administradas e
estabilizadas.
Classe gramatical das palavras (P. 0.61) – Conforme relacionamos na variável ano
escolar, a classe gramatical que favorece o cancelamento da coda é a classe verbal. De
acordo com Oliveira (1997, p. 39), o processo de cancelamento da coda em final de
verbo é um processo categórico. Portanto, esse processo será refletido na modalidade
escrita até que haja a emancipação da modalidade escrita.
Segmento seguinte (P. 0.58) – O cancelamento de coda é favorecido quando o
segmento seguinte é sonoro (consoante sonora ou vogal). Esse resultado está
relacionado ao Princípio de Sequenciamento Sonoro, o qual interpreta a preferência da
língua por uma sequência de segmentos com grau de sonoridades diferentes. Nesse
sentido, podemos afirmar que, quando ocorre uma sequência de {C VC[+soante ou
S]#C[sonora] ou V}, a língua manifesta uma tendência a favorecer o cancelamento de
coda, a fim de segurar uma sequência de três elementos sonoros.
Vogal da sílaba (P. 0.62) – O ambiente mais favorável à aplicação da regra é aquele
formado pelas vogais posteriores. Monaretto (2002, p. 266) constatou em sua pesquisa
sobre a vibrante pós-vocálica que a preferência do apagamento de /r/ final se dá no
contexto precedente de vogal posterior. Resultado que corrobora o nosso e ratifica a
influência da língua falada no processo de aquisição da escrita.
134
Número de sílabas (T: P. 0.63 e P: 0.58) – Os contextos favoráveis ao cancelamento de
coda são palavras compostas por mais de três sílabas. Esse resultado encontra respaldo
em Mollica (2000, p.14), em que se destaca que enunciados longos tendem a perder
substância fônica, favorecendo, portanto, o cancelamento da coda.
7.2.2 Variação II: Ortografia da Coda
Para a análise dessa variação, contabilizamos 3582 sílabas, sendo que destas, 76
apresentaram variação ortográfica na coda. Para essa análise, elegemos 7 variáveis estruturais
e 4 não estruturais. O programa escolheu como favorecedoras à variação de coda 5 variáveis:
natureza de coda, classe social, tonicidade, cidade e ano escolar.
Natureza de coda (L: P. 0.94 e N: P. 0.73) – A coda /l/ apresentou o contexto mais
favorecedor à variação ortográfica. Isso se justifica por este ser reflexo do processo de
vocalização que ocorre na modalidade falada. O que comprova mais uma vez nossa
hipótese de se ter a modalidade falada da língua como base para o processo de
aquisição da modalidade escrita. Outro ambiente favorecedor foi a coda nasal. Esse
ambiente é favorecedor porque, para as nasais em posição de coda, há regras
invariantes que precisam ser memorizadas. De acordo com nossa hipótese, o ambiente
/l/ apresenta uma resistência maior para ser grafado ortograficamente, por ser reflexo
de um processo fonológico que atua na língua falada.
Classe social (P. 0.71) – A classe social mais uma vez apareceu como favorecedora à
aplicação da regra de variação. A justificativa para esse resultado é o mesmo já
apresentado para as variações anteriores.
Tonicidade (P. 0.65) – O resultado dessa variável corrobora a teoria de instabilidade
proposta por Alvarenga (1993, p. 38), a qual afirma que a coda é a posição fraca da
constituição silábica, portanto, um locus maior de variação. Esse resultado foi o
oposto apresentado pelo OC, o qual se justifica com base na escala de sonoridade,
como uma tentativa de otimizar a distância entre C e V.
Cidade (P. 0.59) – Para essa variável, mais uma vez a cidade de Cuiabá apresentou-se
como favorável à aplicação da regra. Assim como sugerimos anteriormente, é
necessário realizar uma pesquisa mais específica e detalhada para considerar a relação
dessa variável com esses processos de variação.
Ano escolar (P.0.62) – Os 2º e 3º anos apresentaram-se, assim como no cancelamento
de coda, como favorecedores da variação ortográfica de coda. Esse resultado, assim
135
como o do cancelamento de coda, confirma nossa hipótese sobre a influência da
oralidade no processo de aquisição da escrita, já que a maior concentração de
variações de coda manifesta-se por reflexo de um processo de vocalização que ocorre
na modalidade falada.
7.2.3 Variação III: Posicionamento estrutural na sílaba
Para a análise da variação estrutural de posição de coda, foram contabilizados apenas
10 casos de reposicionamento de coda na escrita, em um corpus de 3591 sílabas (C)VC. O
Varbrul não rodou a análise desses casos, uma vez que o percentual de ocorrência dessa
variação foi muito baixo. Dessa forma, analisamos as variáveis de forma isolada, com o
objetivo de verificar quais os fatores apareceram com uma frequência maior dentro de cada
variável.
Os processos de (re)silabações foram divididos por fenômenos: assimilação (50%),
fronteira de palavra (40%) e epêntese (10%). Sobre a assimilação, vimos que se trata de um
processo bastante ativo na modalidade falada, refletindo-se na modalidade escrita com a
alteração do registro do padrão silábico. O segundo fenômeno, fronteira de palavra, está
relacionado ao Princípio de Maximização de Onset. Trata-se, também, de um processo que
reflete a interferência do conhecimento linguístico do aprendiz. Sobre a alteração por
inserção de epêntese, vimos que tal alteração está ligada a não aceitação de segmento
obstruinte na coda, com exceção de /S/. Assim, a língua, manifestando sua preferência pelo
onsetamento, transforma essa coda em uma nova sílaba com a inserção de uma vogal
epentética.
Com relação às variáveis, vimos que houve uma maior tendência de ocorrer
(re)silabação com: coda nasal, antes de soante, sílaba não final e tônica, palavras com mais de
três sílabas, verbos, nos anos A e D.
7.3 Concluindo
Nosso trabalho forneceu evidências que nos permitem afirmar que a modalidade
falada é a base do processo de aquisição da modalidade escrita, além de interferir de maneira
substancial na construção dos padrões silábicos. Nesse sentido, a construção da sílaba é o
locus que reflete os processos fonológicos circunstanciais ou em andamento na língua falada.
136
Constatamos que existem variáveis que apresentam ambientes favorecedores à
instabilidade de padrões diferentes de CV, precisamente, CCV e (C)VC. De acordo com
nossos dados e análises, vimos que esses padrões vão se estabilizando à medida em que o
aprendiz toma ciência de que a escrita é um objeto de conhecimento distinto, abstrato e de
representação, com especificidades e particularidades.
Desse modo, podemos afirmar que, através de processos metalinguísticos, a escrita vai
se construindo de forma cíclica, de pontos mais instáveis a pontos mais estáveis. Essa
evolução passa por construções hipotéticas, as quais fornecem evidências sobre os caminhos
que estão sendo percorridos, que envolvem a relação de fonema/grafema e a organização dos
constituintes na sílaba.
Historicamente, a variação que ocorre no sistema escrito padrão é vista como algo
ruim, que deve ser imediatamente eliminado. No entanto, nosso trabalho demonstra que essa
variação é um fenômeno natural da língua. Nesse sentido, os dados, os resultados, as análises
e as discussões teóricas que embasaram este trabalho podem instigar um novo olhar sobre as
hipóteses de construção de padrões silábicos diferentes de CV.
Com essa perspectiva, é possível levar a comunidade escolar a tomar ciência acerca da
importância em se analisar as causas, estruturais e não estruturais, que envolvem as hipóteses,
levantadas pelos aprendizes, de construções dos padrões silábicos no sistema escrito, tornando
o estudo fonológico da sílaba uma fonte para diversas discussões sobre as pedagogias de
aquisição da escrita. Além disso, nosso trabalho surge como mais um argumento para se
acreditar que o processo de aquisição da escrita não é uniforme, o que corrobora para a
eliminação de metodologias obsoletas de alfabetização.
137
REFERÊNCIAS
ABAURRE, Maria Bernadete M. Horizontes e limites de um programa de investigação em
aquisição da escrita. In: LAMPRECHT, Regina Ritter (Org.) Aquisição da linguagem:
questões e análises. Porto Alegre: EDIPUCRS, 1999, p.167-186.
ABAURRE, Maria Bernadete M. O que revelam os textos espontâneos sobre a representação
que a criança faz do objeto escrito. In: KATO, M. (Org.) A concepção da escrita pela
criança. 2 ed. Campinas, SP: Pontes, 1988, p. 135-142.
ABAURRE, Maria Bernadete M. Os estudos linguísticos e a aquisição da escrita. In:
CASTRO, M. F. P. (Org.) O método e o dado no estudo da linguagem. Campinas, SP:
EDUNICAMP, 1996. p. 111-163.
ABAURRE, Maria Bernadete M. Pósfacio. In: ROJO, R. (org). Alfabetização e letramento.
Campinas: Mercado das Letras, 1998.
ABAURRE, Maria Bernadete M.; WETZELS, Leo; Sobre a estrutura da gramática
fonológica. Cadernos de Estudos Linguísticos (UNICAMP), Vol. 23, jul/dez, p.5-18,
Campinas, 1992.
ABAURRE-GNERRE, M.B.A. & L.C. Cagliari. Textos espontâneos na 1ª série: evidências
de utilização, pela criança, da sua percepção fonética da fala para representar e segmentar a
escrita. Em Cadernos Cedes, 14, p. 25-29, 1985.
ALVARENGA, D. Análise de Variações Ortográficas. Presença Pedagógica, nº 2, editora
Dimensão, 1995.
ALVARENGA, D. Variations orthographiques, temps d’identification et apprentisage de
la langue écrite portugaise: une approche phono-cognitive. Tese de doutorado defendida na
Universidade de Paris VIII, 1993.
ALVARENGA, D.; OLIVEIRA, M. A. Canonicidade silábica e aprendizagem da escrita.
Rev. Est. Ling., Belo Horizonte, ano 6, n.5, v. 1, p.127-158, jan./jun. 1997.
BISOL, L. (Org.) Introdução a estudos de fonologia do português. Porto Alegre,
EDIPUCRS, 2001.
BISOL, L. A sílaba e seus constituintes. In: CASTILHO, Ataliba T. de (Org.) Gramática do
Português Falado: volume VII – A construção fonológica da palavra. São Paulo, SP:
Contexto, 2013a.
BISOL, L. Sândi vocálico externo. In: CASTILHO, Ataliba T. de (Org.) Gramática do
Português Falado: volume VII – A construção fonológica da palavra. São Paulo, SP:
Contexto, 2013b.
BISOL, L. Sândi Vocálico Externo: Degeminação e Elisão. Cad. Est. Ling. Campinas, (23):
83-101, Jul./Dez. 1992.
138
BRESCANCINI, Cláudia R. A análise variável e o programa VARBRUL 2S. In: BISOL,
Leda; BRESCANCINI (Org.) Fonologia e variação: recortes do português brasileiro. Porto
Alegre: EDIPUCRS, 2002, p. 13-97.
CÂMARA JR., Joaquim M. Estrutura da língua Portuguesa. Petrópolis: Vozes, ed. 40ª,
2007.
CHOMSKY, Noam. Linguagem e mente: pensamentos atuais sobre antigos problemas. Trad.
Lúcia Lobato. Brasília: Editora UNB, 1998.
CHOMSKY, Noam. Sobre natureza e linguagem. São Paulo: Martins Fontes, 2006.
CLEMENTS, G. N.; KEYSER, S. J. CV Phonology: A generative theory of the syllable.
Cambridge, MA, The MIT Press.
COLLISCHONN, Gisela. A epêntese vocálica no português do Sul do Brasil. In: BISOL,
Leda; BRESCANCINI (Org.) Fonologia e variação: recortes do português brasileiro. Porto
Alegre: EDIPUCRS, 2002, p. 205-230.
COLLISCHONN, Gisela. A sílaba em português. In: BISOL, Leda. (Org.). Introdução a
Estudos de Fonologia do Português Brasileiro. 3 ed. Porto Alegre, 2001, p. 91-119.
FERREIRO, Emília; TEBEROSKY, Ana. Psicogênese da língua escrita. Tradução de Diana
Myriam Lichtenstein et al. Porto Alegre: Artes Médicas, 1986.
FRANCHI, C. Linguagem atividade constitutiva. Cad.Est.Ling., Campinas, (22): 939,
Jan./Jul. 1992.
FREITAS, Gabriela. Erros Fonológicos: Uma ligação entre a aquisição d da fala e da escrita.
In: BONILLA, G.F.& KESKE – SOARES. Estudos em aquisição fonológica. Santa Maria:
UFSM, PPGL-Editores, 2007
GIL, Antônio Carlos. Como elaborar projetos de pesquisa. 4 ed. São Paulo: Atlas, 2002.
GUY, Gregory; ZILLES, Ana. Sociolinguística quantitativa: instrumental da análise. São
Paulo: Parábola, 2007
HERNANDORENA, Carmem L. M. Introdução a teoria fonológica. In: BISOL, Leda. (Org.).
Introdução a Estudos de Fonologia do Português Brasileiro. 3ed, Porto Alegre, 2001, p.
11-79.
KATO, M.A.; MOREIRA, N. & TARALLO, F. Estudos em alfabetização. Campinas:
EDUFJF/Pontes, 1998.
KENEDY, Eduardo. Curso Básico de Linguística Gerativa. São Paulo: Contexto, 2013.
KENSTOWICZ, Michael. Phonology in Generative Grammar. Oxford: Blackwell, 1994.
MARCUSCHI, L. M. Oralidade e escrita. Signótica: Revista do Mestrado em Letras e
Linguística/FL – UFG. Goiânia: Editora UFG. v.9, jan
139
MASSINI-CAGLIARI, G; CAGLIARI, L. C. Diante das letras. Campinas: Mercado das
letras, 1999.
MIRANDA, A. R. M. A Fonologia em dados de escrita inicial de crianças. Linguística
(Madrid), v. 30 (2), dez., p-45-80. p. 45-80. 2014b.
MIRANDA, A. R. M. A grafia de estruturas silábicas complexas na escrita de crianças das
séries iniciais. In: PINHO, Sheila Z. de (Org.) Formação de Educadores: o papel do
educador e sua formação. São Paulo, Unesp, 2009, p.409-426.
MIRANDA, A. R. M. Entrevista: A atualização do conhecimento linguístico pela criança em
fase de alfabetização. Letra A – Jornal do Alfabetizador, Belo Horizonte – CEALE/UFMG,
p.12-14, maio/jun., 2014a.
MIRANDA, A. R. M. Reflexões sobre a fonologia e a aquisição da linguagem oral e escrita.
Veredas (Online) – Edição Especial: PPG Linguística/UFJF, 2012, v. 16, p.122-140.
MIRANDA, A. R. M.; MATZENAUER, C.I. Aquisição da fala e da escrita: relações com a
Fonologia. Cadernos de Educação, Pelotas, jan/abril. 2010.
MOLLICA, Maria Cecília. Influência da fala na alfabetização. Rio de Janeiro: Tempo
Brasileiro, 2000.
MONARETTO, Valéria N. O. A vibrante pós-vocálica em Porto Alegre. In: BISOL, Leda;
BRESCANCINI (Org.) Fonologia e variação: recortes do português brasileiro. Porto Alegre:
EDIPUCRS, 2002, p. 253-268.
OLIVEIRA, M. A. Reanalisando o processo de cancelamento do (r) em final de sílaba.
Revista de Estudos Linguísticos, Belo Horizonte, v.6, n.2, p.31-58, jul/dez, 1997.
OLIVEIRA, M. A. Trabalhando com a sílaba no ensino da escrita. Revista Educação
(Especial Guia de Alfabetização). São Paulo: Segmento, p. 76-90, 2010.
OLIVEIRA, M. A.; NASCIMENTO, M. Da análise dos erros aos mecanismos envolvidos na
aprendizagem da escrita. Educação em Revista, Belo Horizonte: Faculdade de
Educação/UFMG (edição especial), n.12, p.33-43, 1990.
OLIVEIRA, Marco Antonio. Alfabetização de Adultos na UFMG: uma experiência que deu
certo, 2001. Disponível em: < http://www.pucminas.br/imagedb
/mestrado_doutorado/publicacoes/PUA_ARQ_ARQUI20121017135944.pdf?PHPSESSID=8f
8c06c0ac860ac84d2f0e8e378f8b89>. Acesso em: 05 nov. 2015.
OLIVEIRA, Marco Antônio. Conhecimento linguístico e apropriação do sistema de escrita.
Caderno do formador. Belo Horizonte: Ceale/FaE/UFMG, 2005. Disponível
em:<http://www.pucminas.br/imagedb/mestrado_doutorado/publicacoes/PUA_ARQ_ARQUI
20121017141358.pdf>. Acesso em: 05 nov. 2015.
SANKOFF, D.; TAGLIAMONTE, S.; SMITH, E. GoldVarb 200: A multivariate analysis
application for windows, Users’ Manual. 2001. Toronto: Department of Linguistics;
140
Ottawa: Department of Mathematics. Disponível em: <http://www.romanistik.uni-
freiburg.de/pusch/Download/variacionismo/GoldVarb2001_ User_manual.pdf>. Acesso em:
02 mar. 2015.
SOARES, Magda. et al. Da forma sonora da fala à forma gráfica da escrita: uma análise
linguística do processo de alfabetização. Cadernos de Estudos Linguísticos, Campinas,
n.16, p. 5-30, n.01, jan./jun. 1989.
141
ANEXOS
ANEXO I – AUTORIZAÇÕES PARA COLETA DE DADOS
142
143
ANEXO II – VISÃO PEDAGÓGICA DA ESCOLA HILDA CAETANO DE OLIVEIRA
144
ANEXO III – VISÃO PEDAGÓGICA DA ESCOLA GASPARZINHO
145
146
ANEXO IV – COLETA DE ESCRITA
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE MINAS GERAIS
Mestranda em Letras: Ana Paula dos Santos Pereira
Atividade Suporte para Coleta de Dados
Orientador: Prof. Dr. Marco Antônio de Oliveira
INSTRUÇÕES
1. Explique aos alunos que eles farão uma produção de texto que contribuirá para uma
pesquisa sobre o processo de construção da escrita.
2. Converse sobre o tema proposto.
3. Informe aos alunos que eles não serão avaliados, mas que a produção de texto servirá
como base para coleta de dados para a pesquisa.
4. A produção de texto deve entrar na rotina normal da sala de aula.
5. Os alunos podem usar lápis ou caneta; borracha ou corretivo e, se quiserem, podem
ilustrar o texto após a sua conclusão.
6. Para que haja uma padronização, a folha de registro encontra-se dentro do envelope.
7. Não há limite de linhas para o texto. Se for necessário, o aluno pode utilizar o verso da
folha.
PRODUÇÃO DE TEXTO
Se eu pudesse...
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
___________________________________________________________________________
147
ANEXO V – RESULTADOS VARBRUL CODA
Results I
CELL CREATION
=============
Name of token file: C:\Users\ana\Desktop\Varbrul - Mãe\arquivos
derivados\CODA_ARQUIVO MÃE BHCB.tkn
Name of condition file: Untitled.cnd
(
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
)
Number of cells: 1980
Application value(s): 2
Total no. of factors: 48
Non-
Group Apps apps Total %
-------------------------------
1 (2)
P N 1 3561 3562 95
% 0 99
R N 137 1 138 3
% 99 0
X N 11 0 11 0
% 100 0 * KnockOut *
S N 9 0 9 0
% 100 0 * KnockOut *
D N 4 0 4 0
% 100 0 * KnockOut *
E N 1 0 1 0
% 100 0 * KnockOut *
Total N 163 3562 3725
% 4 95
-------------------------------
2 (3)
R N 86 1265 1351 36
% 6 93
S N 19 547 566 15
148
% 3 96
L N 19 201 220 5
% 8 91
N N 38 1522 1560 41
% 2 97
B N 1 5 6 0
% 16 83
U N 0 20 20 0
% 0 100 * KnockOut *
O N 0 2 2 0
% 0 100 * KnockOut *
Total N 163 3562 3725
% 4 95
-------------------------------
3 (4)
V N 42 695 737 19
% 5 94
O N 63 1081 1144 30
% 5 94
U N 49 1566 1615 43
% 3 96
P N 9 220 229 6
% 3 96
Total N 163 3562 3725
% 4 95
-------------------------------
4 (5)
a N 72 1014 1086 29
% 6 93
u N 20 369 389 10
% 5 94
e N 24 1084 1108 29
% 2 97
D N 7 101 108 2
% 6 93
o N 20 501 521 13
% 3 96
i N 15 394 409 10
% 3 96
E N 0 28 28 0
% 0 100 * KnockOut *
O N 5 71 76 2
% 6 93
149
Total N 163 3562 3725
% 4 95
-------------------------------
5 (6)
F N 81 989 1070 28
% 7 92
U N 21 976 997 26
% 2 97
I N 48 1229 1277 34
% 3 96
M N 13 368 381 10
% 3 96
Total N 163 3562 3725
% 4 95
-------------------------------
6 (7)
T N 124 2487 2611 70
% 4 95
A N 39 1075 1114 29
% 3 96
Total N 163 3562 3725
% 4 95
-------------------------------
7 (8)
D N 74 1389 1463 39
% 5 94
M N 21 975 996 26
% 2 97
T N 49 839 888 23
% 5 94
P N 19 359 378 10
% 5 94
Total N 163 3562 3725
% 4 95
-------------------------------
8 (9)
V N 96 1431 1527 40
% 6 93
N N 35 955 990 26
% 3 96
O N 20 769 789 21
% 2 97
A N 9 285 294 7
% 3 96
D N 3 122 125 3
% 2 97
150
Total N 163 3562 3725
% 4 95
-------------------------------
9 (10)
A N 59 733 792 21
% 7 92
B N 43 773 816 21
% 5 94
C N 21 975 996 26
% 2 97
D N 40 1081 1121 30
% 3 96
Total N 163 3562 3725
% 4 95
-------------------------------
10 (11)
F N 97 1875 1972 52
% 4 95
M N 66 1687 1753 47
% 3 96
Total N 163 3562 3725
% 4 95
-------------------------------
11 (12)
A N 47 2476 2523 67
% 1 98
B N 116 1086 1202 32
% 9 90
Total N 163 3562 3725
% 4 95
-------------------------------
Total N 163 3562 3725
% 4 95
Name of new cell file: Untitled.cel
Results II
CELL CREATION
=============
Name of token file: C:\Users\ana\Desktop\Varbrul - RESULTS 2\arquivos
derivados\Coda BHCB pós nocaute.tkn
Name of condition file: Untitled.cnd
(
(1)
(2)
(3)
(4)
(5)
151
(6)
(7)
(8)
(9)
(10)
(11)
(12)
)
Number of cells: 1587
Application value(s): 2
Total no. of factors: 32
Non-
Group Apps apps Total %
-------------------------------
1 (2)
P N 74 3507 3581 96
% 2 97
R N 138 9 147 3
% 93 6
Total N 212 3516 3728
% 5 94
-------------------------------
2 (3)
R N 83 1268 1351 36
% 6 93
S N 16 551 567 15
% 2 97
L N 41 201 242 6
% 16 83
N N 72 1490 1562 41
% 4 95
B N 0 6 6 0
% 0 100 * KnockOut *
Total N 212 3516 3728
% 5 94
-------------------------------
3 (4)
O N 126 1756 1882 50
% 6 93
U N 86 1760 1846 49
% 4 95
Total N 212 3516 3728
% 5 94
-------------------------------
4 (5)
C N 85 1001 1086 29
% 7 92
P N 57 930 987 26
% 5 94
A N 68 1479 1547 41
152
% 4 95
D N 2 106 108 2
% 1 98
Total N 212 3516 3728
% 5 94
-------------------------------
5 (6)
F N 94 976 1070 28
% 8 91
N N 118 2540 2658 71
% 4 95
Total N 212 3516 3728
% 5 94
-------------------------------
6 (7)
T N 133 2478 2611 70
% 5 94
A N 79 1038 1117 29
% 7 92
Total N 212 3516 3728
% 5 94
-------------------------------
7 (8)
D N 106 1358 1464 39
% 7 92
M N 19 977 996 26
% 1 98
T N 60 829 889 23
% 6 93
P N 27 352 379 10
% 7 92
Total N 212 3516 3728
% 5 94
-------------------------------
8 (9)
V N 115 1414 1529 41
% 7 92
N N 67 1218 1285 34
% 5 94
O N 30 884 914 24
% 3 96
Total N 212 3516 3728
% 5 94
-------------------------------
9 (10)
A N 65 728 793 21
% 8 91
153
B N 62 754 816 21
% 7 92
C N 34 963 997 26
% 3 96
D N 51 1071 1122 30
% 4 95
Total N 212 3516 3728
% 5 94
-------------------------------
10 (11)
F N 114 1859 1973 52
% 5 94
M N 98 1657 1755 47
% 5 94
Total N 212 3516 3728
% 5 94
-------------------------------
11 (12)
A N 67 2457 2524 67
% 2 97
B N 145 1059 1204 32
% 12 87
Total N 212 3516 3728
% 5 94
-------------------------------
Total N 212 3516 3728
% 5 94
Name of new cell file: Untitled.cel
Results III
CELL CREATION
=============
Name of token file: C:\Users\ana\Desktop\Varbrul - RESULTS 2\arquivos
derivados\CODA pos nocaute BHCB II.tkn
Name of condition file: Untitled.cnd
(
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
154
(12)
(13)
)
Number of cells: 1955
Application value(s): 2
Total no. of factors: 36
Non-
Group Apps apps Total %
-------------------------------
1 (2)
O N 0 3507 3507 94
% 0 100 * KnockOut *
C N 137 0 137 3
% 100 0 * KnockOut *
N N 0 74 74 1
% 0 100 * KnockOut *
S N 10 0 10 0
% 100 0 * KnockOut *
Total N 147 3581 3728
% 3 96
-------------------------------
2 (3)
R N 84 1267 1351 36
% 6 93
S N 12 555 567 15
% 2 97
L N 14 228 242 6
% 5 94
N N 36 1526 1562 41
% 2 97
B N 1 5 6 0
% 16 83
Total N 147 3581 3728
% 3 96
-------------------------------
3 (4)
O N 99 1783 1882 50
% 5 94
U N 48 1798 1846 49
% 2 97
Total N 147 3581 3728
% 3 96
-------------------------------
4 (5)
C N 67 1019 1086 29
% 6 93
P N 41 946 987 26
% 4 95
155
A N 37 1510 1547 41
% 2 97
D N 2 106 108 2
% 1 98
Total N 147 3581 3728
% 3 96
-------------------------------
5 (6)
F N 74 996 1070 28
% 6 93
N N 73 2585 2658 71
% 2 97
Total N 147 3581 3728
% 3 96
-------------------------------
6 (7)
T N 109 2502 2611 70
% 4 95
A N 38 1079 1117 29
% 3 96
Total N 147 3581 3728
% 3 96
-------------------------------
7 (8)
D N 66 1398 1464 39
% 4 95
M N 14 982 996 26
% 1 98
T N 47 842 889 23
% 5 94
P N 20 359 379 10
% 5 94
Total N 147 3581 3728
% 3 96
-------------------------------
8 (9)
V N 92 1437 1529 41
% 6 93
N N 39 1246 1285 34
% 3 96
O N 16 898 914 24
% 1 98
Total N 147 3581 3728
% 3 96
-------------------------------
9 (10)
A N 48 745 793 21
156
% 6 93
B N 40 776 816 21
% 4 95
C N 19 978 997 26
% 1 98
D N 40 1082 1122 30
% 3 96
Total N 147 3581 3728
% 3 96
-------------------------------
10 (11)
F N 88 1885 1973 52
% 4 95
M N 59 1696 1755 47
% 3 96
Total N 147 3581 3728
% 3 96
-------------------------------
11 (12)
A N 42 2482 2524 67
% 1 98
B N 105 1099 1204 32
% 8 91
Total N 147 3581 3728
% 3 96
-------------------------------
12 (13)
C N 105 1811 1916 51
% 5 94
B N 42 1770 1812 48
% 2 97
Total N 147 3581 3728
% 3 96
-------------------------------
Total N 147 3581 3728
% 3 96
Name of new cell file: Untitled.cel
Results IV
CELL CREATION
=============
Name of token file: C:\Users\ana\Desktop\Varbrul - Mãe\arquivos
derivados\CODA reformulando G1 e G2 04-03.tkn
157
Name of condition file: Untitled.cnd
(
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
(13)
)
Number of cells: 1931
Application value(s): 2
Total no. of factors: 33
Non-
Group Apps apps Total %
-------------------------------
1 (2)
P N 74 3507 3581 96
% 2 97
S N 137 10 147 3
% 93 6
Total N 211 3517 3728
% 5 94
-------------------------------
2 (3)
R N 83 1268 1351 36
% 6 93
S N 15 558 573 15
% 2 97
L N 41 201 242 6
% 16 83
N N 72 1490 1562 41
% 4 95
Total N 211 3517 3728
% 5 94
-------------------------------
3 (4)
O N 125 1757 1882 50
% 6 93
U N 86 1760 1846 49
% 4 95
Total N 211 3517 3728
% 5 94
-------------------------------
4 (5)
C N 85 1001 1086 29
158
% 7 92
P N 56 931 987 26
% 5 94
A N 68 1479 1547 41
% 4 95
D N 2 106 108 2
% 1 98
Total N 211 3517 3728
% 5 94
-------------------------------
5 (6)
F N 93 977 1070 28
% 8 91
N N 118 2540 2658 71
% 4 95
Total N 211 3517 3728
% 5 94
-------------------------------
6 (7)
T N 133 2478 2611 70
% 5 94
A N 78 1039 1117 29
% 6 93
Total N 211 3517 3728
% 5 94
-------------------------------
7 (8)
D N 106 1358 1464 39
% 7 92
M N 19 977 996 26
% 1 98
T N 59 830 889 23
% 6 93
P N 27 352 379 10
% 7 92
Total N 211 3517 3728
% 5 94
-------------------------------
8 (9)
V N 115 1414 1529 41
% 7 92
N N 66 1219 1285 34
% 5 94
O N 30 884 914 24
% 3 96
Total N 211 3517 3728
159
% 5 94
-------------------------------
9 (10)
A N 64 729 793 21
% 8 91
B N 62 754 816 21
% 7 92
C N 34 963 997 26
% 3 96
D N 51 1071 1122 30
% 4 95
Total N 211 3517 3728
% 5 94
-------------------------------
10 (11)
F N 114 1859 1973 52
% 5 94
M N 97 1658 1755 47
% 5 94
Total N 211 3517 3728
% 5 94
-------------------------------
11 (12)
A N 66 2458 2524 67
% 2 97
B N 145 1059 1204 32
% 12 87
Total N 211 3517 3728
% 5 94
-------------------------------
12 (13)
C N 151 1765 1916 51
% 7 92
B N 60 1752 1812 48
% 3 96
Total N 211 3517 3728
% 5 94
-------------------------------
Total N 211 3517 3728
% 5 94
Name of new cell file: Untitled.cel
160
Results finais
Cancelamento – Ortografia – Posicionamento
Results – Processo de Cancelamento
CELL CREATION
=============
Name of token file: C:\Users\ana\Desktop\Varbrul - 3 processos
distintos\arquivos derivados\CODA - sem G2 - processo de cancelamento 10-
03.tkn
Name of condition file: Untitled.cnd
(
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
)
Number of cells: 1870
Application value(s): 2
Total no. of factors: 31
Non-
Group Apps apps Total %
-------------------------------
1 (2)
R N 81 1270 1351 36
% 5 94
S N 11 562 573 15
% 1 98
L N 14 228 242 6
% 5 94
N N 31 1531 1562 41
% 1 98
Total N 137 3591 3728
% 3 96
-------------------------------
2 (3)
O N 90 1792 1882 50
% 4 95
U N 47 1799 1846 49
% 2 97
Total N 137 3591 3728
% 3 96
-------------------------------
3 (4)
C N 62 1024 1086 29
161
% 5 94
P N 38 949 987 26
% 3 96
A N 35 1512 1547 41
% 2 97
D N 2 106 108 2
% 1 98
Total N 137 3591 3728
% 3 96
-------------------------------
4 (5)
F N 72 998 1070 28
% 6 93
N N 65 2593 2658 71
% 2 97
Total N 137 3591 3728
% 3 96
-------------------------------
5 (6)
T N 101 2510 2611 70
% 3 96
A N 36 1081 1117 29
% 3 96
Total N 137 3591 3728
% 3 96
-------------------------------
6 (7)
D N 65 1399 1464 39
% 4 95
M N 12 984 996 26
% 1 98
T N 42 847 889 23
% 4 95
P N 18 361 379 10
% 4 95
Total N 137 3591 3728
% 3 96
-------------------------------
7 (8)
V N 87 1442 1529 41
% 5 94
N N 37 1248 1285 34
% 2 97
O N 13 901 914 24
% 1 98
Total N 137 3591 3728
162
% 3 96
-------------------------------
8 (9)
A N 44 749 793 21
% 5 94
B N 39 777 816 21
% 4 95
C N 18 979 997 26
% 1 98
D N 36 1086 1122 30
% 3 96
Total N 137 3591 3728
% 3 96
-------------------------------
9 (10)
F N 83 1890 1973 52
% 4 95
M N 54 1701 1755 47
% 3 96
Total N 137 3591 3728
% 3 96
-------------------------------
10 (11)
A N 37 2487 2524 67
% 1 98
B N 100 1104 1204 32
% 8 91
Total N 137 3591 3728
% 3 96
-------------------------------
11 (12)
C N 101 1815 1916 51
% 5 94
B N 36 1776 1812 48
% 1 98
Total N 137 3591 3728
% 3 96
-------------------------------
Total N 137 3591 3728
% 3 96
Name of new cell file: Untitled.cel
163
Results – Processo de Ortografia
CELL CREATION
=============
Name of token file: C:\Users\ana\Desktop\Varbrul - 3 processos
distintos\arquivos derivados\Processo de Ortografia 10-03\CODA - sem G2 -
Processo de Ortografia - 10-03.tkn
Name of condition file: Untitled.cnd
(
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
)
Number of cells: 1816
Application value(s): 2
Total no. of factors: 31
Non-
Group Apps apps Total %
-------------------------------
1 (2)
R N 2 1265 1267 35
% 0 99
S N 5 556 561 15
% 0 99
L N 28 200 228 6
% 12 87
N N 41 1485 1526 42
% 2 97
Total N 76 3506 3582
% 2 97
-------------------------------
2 (3)
O N 36 1748 1784 49
% 2 97
U N 40 1758 1798 50
% 2 97
Total N 76 3506 3582
% 2 97
-------------------------------
3 (4)
C N 24 995 1019 28
% 2 97
P N 18 928 946 26
164
% 1 98
A N 33 1477 1510 42
% 2 97
D N 1 106 107 2
% 0 99
Total N 76 3506 3582
% 2 97
-------------------------------
4 (5)
F N 21 975 996 27
% 2 97
N N 55 2531 2586 72
% 2 97
Total N 76 3506 3582
% 2 97
-------------------------------
5 (6)
T N 34 2469 2503 69
% 1 98
A N 42 1037 1079 30
% 3 96
Total N 76 3506 3582
% 2 97
-------------------------------
6 (7)
D N 41 1357 1398 39
% 2 97
M N 8 975 983 27
% 0 99
T N 18 824 842 23
% 2 97
P N 9 350 359 10
% 2 97
Total N 76 3506 3582
% 2 97
-------------------------------
7 (8)
V N 28 1409 1437 40
% 1 98
N N 30 1216 1246 34
% 2 97
O N 18 881 899 25
% 2 97
Total N 76 3506 3582
% 2 97
-------------------------------
8 (9)
165
A N 21 725 746 20
% 2 97
B N 23 753 776 21
% 2 97
C N 17 961 978 27
% 1 98
D N 15 1067 1082 30
% 1 98
Total N 76 3506 3582
% 2 97
-------------------------------
9 (10)
F N 33 1853 1886 52
% 1 98
M N 43 1653 1696 47
% 2 97
Total N 76 3506 3582
% 2 97
-------------------------------
10 (11)
A N 30 2453 2483 69
% 1 98
B N 46 1053 1099 30
% 4 95
Total N 76 3506 3582
% 2 97
-------------------------------
11 (12)
C N 52 1760 1812 50
% 2 97
B N 24 1746 1770 49
% 1 98
Total N 76 3506 3582
% 2 97
-------------------------------
Total N 76 3506 3582
% 2 97
Name of new cell file: Untitled.cel
166
Results - Processo de Posicionamento
CELL CREATION
=============
Name of token file: C:\Users\ana\Desktop\Varbrul - 3 processos
distintos\arquivos derivados\Processo de Posicionamento 10-03\CODA - sem G2
- Processo de Posicionamento II - 11-03.tkn
Name of condition file: Untitled.cnd
(
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
)
Number of cells: 1797
Application value(s): 2
Total no. of factors: 30
Non-
Group Apps apps Total %
-------------------------------
1 (2)
R N 3 1495 1498 41
% 0 99
S N 1 555 556 15
% 0 99
N N 5 1526 1531 42
% 0 99
B N 1 5 6 0
% 16 83
Total N 10 3581 3591
% 0 99
-------------------------------
2 (3)
O N 9 1783 1792 49
% 0 99
U N 1 1798 1799 50
% 0 99
Total N 10 3581 3591
% 0 99
-------------------------------
3 (4)
C N 5 1019 1024 28
% 0 99
P N 3 946 949 26
167
% 0 99
A N 2 1616 1618 45
% 0 99
Total N 10 3581 3591
% 0 99
-------------------------------
4 (5)
F N 2 996 998 27
% 0 99
N N 8 2585 2593 72
% 0 99
Total N 10 3581 3591
% 0 99
-------------------------------
5 (6)
T N 8 2502 2510 69
% 0 99
A N 2 1079 1081 30
% 0 99
Total N 10 3581 3591
% 0 99
-------------------------------
6 (7)
D N 1 1398 1399 38
% 0 99
M N 2 982 984 27
% 0 99
T N 5 842 847 23
% 0 99
P N 2 359 361 10
% 0 99
Total N 10 3581 3591
% 0 99
-------------------------------
7 (8)
V N 5 1437 1442 40
% 0 99
N N 2 1246 1248 34
% 0 99
O N 3 898 901 25
% 0 99
Total N 10 3581 3591
% 0 99
-------------------------------
8 (9)
A N 4 745 749 20
% 0 99
168
B N 1 776 777 21
% 0 99
C N 1 978 979 27
% 0 99
D N 4 1082 1086 30
% 0 99
Total N 10 3581 3591
% 0 99
-------------------------------
9 (10)
F N 5 1885 1890 52
% 0 99
M N 5 1696 1701 47
% 0 99
Total N 10 3581 3591
% 0 99
-------------------------------
10 (11)
A N 5 2482 2487 69
% 0 99
B N 5 1099 1104 30
% 0 99
Total N 10 3581 3591
% 0 99
-------------------------------
11 (12)
C N 4 1811 1815 50
% 0 99
B N 6 1770 1776 49
% 0 99
Total N 10 3581 3591
% 0 99
-------------------------------
Total N 10 3581 3591
% 0 99
Name of new cell file: Untitled.c
169
Results - Processo de Posicionamento
Grupos com nocautes
CELL CREATION
=============
Name of token file: C:\Users\ana\Desktop\Varbrul - 3 processos
distintos\arquivos derivados\CODA - sem G2 - Processo de Posicionamento -
10-03.tkn
Name of condition file: Untitled.cnd
(
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
)
Number of cells: 1822
Application value(s): 2
Total no. of factors: 32
Non-
Group Apps apps Total %
-------------------------------
1 (2)
R N 3 1267 1270 35
% 0 99
S N 1 555 556 15
% 0 99
L N 0 228 228 6
% 0 100 * KnockOut *
N N 5 1526 1531 42
% 0 99
B N 1 5 6 0
% 16 83
Total N 10 3581 3591
% 0 99
-------------------------------
3 (4)
C N 5 1019 1024 28
% 0 99
P N 3 946 949 26
% 0 99
A N 2 1510 1512 42
% 0 99
D N 0 106 106 2
170
% 0 100 * KnockOut *
Total N 10 3581 3591
% 0 99
171
ANEXO VI – RESULTADOS VARBRUL ONSET COMPLEXO
CELL CREATION
=============
Name of token file: C:\Users\ana\Desktop\Varbrul\arquivos
derivados\ONSET COMPLEXO_ARQUIVO PADRAO 1 E 2.tkn
Name of condition file: Untitled.cnd
(
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
)
Number of cells: 415
Application value(s): 2
Total no. of factors: 37
Non-
Group Apps apps Total %
-------------------------------
1 (2)
O N 15 672 687 95
% 2 97
F N 0 34 34 4
% 0 100 * KnockOut *
Total N 15 706 721
% 2 97
-------------------------------
2 (3)
R N 14 640 654 90
% 2 97
L N 1 66 67 9
% 1 98
Total N 15 706 721
% 2 97
-------------------------------
3 (4)
O N 6 238 244 33
% 2 97
U N 9 468 477 66
% 1 98
Total N 15 706 721
% 2 97
-------------------------------
172
4 (5)
i N 1 195 196 27
% 0 99
a N 7 167 174 24
% 4 95
o N 5 91 96 13
% 5 94
D N 1 28 29 4
% 3 96
e N 1 177 178 24
% 0 99
u N 0 24 24 3
% 0 100 * KnockOut *
O N 0 19 19 2
% 0 100 * KnockOut *
E N 0 5 5 0
% 0 100 * KnockOut *
Total N 15 706 721
% 2 97
-------------------------------
5 (6)
M N 0 119 119 16
% 0 100 * KnockOut *
F N 7 164 171 23
% 4 95
U N 0 11 11 1
% 0 100 * KnockOut *
I N 8 412 420 58
% 1 98
Total N 15 706 721
% 2 97
-------------------------------
6 (7)
T N 13 215 228 31
% 5 94
A N 2 491 493 68
% 0 99
Total N 15 706 721
% 2 97
-------------------------------
7 (8)
T N 1 261 262 36
% 0 99
D N 14 306 320 44
% 4 95
173
M N 0 11 11 1
% 0 100 * KnockOut *
P N 0 128 128 17
% 0 100 * KnockOut *
Total N 15 706 721
% 2 97
-------------------------------
8 (9)
N N 6 341 347 48
% 1 98
D N 2 20 22 3
% 9 90
V N 6 184 190 26
% 3 96
O N 0 48 48 6
% 0 100 * KnockOut *
A N 1 113 114 15
% 0 99
Total N 15 706 721
% 2 97
-------------------------------
9 (10)
A N 3 221 224 31
% 1 98
B N 8 140 148 20
% 5 94
C N 1 145 146 20
% 0 99
D N 3 200 203 28
% 1 98
Total N 15 706 721
% 2 97
-------------------------------
10 (11)
M N 12 355 367 50
% 3 96
F N 3 351 354 49
% 0 99
Total N 15 706 721
% 2 97
-------------------------------
11 (12)
B N 11 247 258 35
% 4 95
A N 4 459 463 64
% 0 99
174
Total N 15 706 721
% 2 97
-------------------------------
Total N 15 706 721
% 2 97
Name of new cell file: Untitled.cel