a composição de um banco com dados de variação: transcrição e armazenamento dermeval da hora...

Post on 07-Apr-2016

212 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

A composição de um banco com dados de variação:

transcrição e armazenamento

Dermeval da Hora (UFPB/CNPq)ho_ra@hotmail.com

Linguística

Meta: determinar as propriedades das línguas naturais.

Objetivo: examinar línguas específicas com o propósito de explicar por que elas são do jeito que são.

Linguística Formal: focaliza a estrutura da língua, sem preocupar-se com o contexto em que ela é adquirida nem com o uso.

SociolinguísticaDefende que a língua existe no contexto, depende

do falante que a usa e onde está sendo usada e por quê.

Definições:- Estudo da língua em seu contexto social e o

estudo da vida social através da linguística (Coupland e Jaworski, 1997)

- A relação entre a língua e a sociedade (Trudgill, 2000)

- A correlação das variáveis dependentes com as variáveis sociais independentes (Chambers, 2003)

Sociolinguística Variacionista

Integra aspectos linguísticos e sociais da língua.

Caracteria a natureza do complexo sistema linguístico, considerando os aspectos variáveis.

Heterogeneidade Ordenada

Observação: a língua varia (heterogeneidade)

Falantes têm mais de uma forma para dizer mais ou menos a mesma coisa.

A heterogeneidade:- não é aleatória, obedece a um padrão;- reflete ordem e estrutura dentro da

gramática.

Variação e Mudança

A análise da variação objetiva colocar os traços linguísticos tais como são no contexto de onde cada um deles veio e para onde está indo – como e por quê.

Toda mudança é resultado de um processo de variação, mas nem toda variação resulta em mudança.

Identidade Social

A língua transmite informações de uma pessoa para outra, mas, ao mesmo tempo, um falante pode usá-la para estabelecer valores acerca da pessoa que está sendo ouvida. Pode determinar:

- Quem é a pessoa?- De onde veio?- A que grupo social pertence?- Qual o nível de escolaridade?

Características chaves da Sociolinguística Variacionista

O Vernacular- estilo em que a mínima atenção é dada ao

monitoramento da fala (Labov, 1972).- fala diária (Sankoff, 1974, 1980).- língua real em uso (Milroy, 1992).- fala espontânea reservada a situações

intímas ou casuais (Poplack, 1993)

Por que o vernacular?- Por ser a variedade que foi adquira

primeiro;- Porque é a variedade de fala mais livre de

hipercorreção ou mudança de estilo;- Porque é o estilo a partir do qual todos os

outros devem basear-se.O vernacular fornece “as relações

fundamentais que determinam o curso da evolução linguística” (Labov, 1984)

Comunidade Linguística

Assimetria Forma/Função

A análise variacionista defende que diferentes formas podem ser usadas para a mesma função.

Podemos dizer a mesma coisa de diferentes formas com o mesmo valor de verdade.

Variáveis Linguísticas

Diferentes formas de dizer mais ou menos a mesma coisa pode ocorrer em todos os níveis da gramática de uma língua, em todas as variedades, em todos os estilos, dialetos e registros.

a) Fonologia;b) Morfologia;c) Sintaxe

O método quantitativoAbordagem utilizada na análise variacionista,

diferente de outras áreas da linguística.Combinação de técnicas empregadas na análise

variacionista.Baseia-se na observação de que o falante faz

escolhas quando usa a língua e que essas escolhas são alternativas discretas com o mesmo valor referencial ou função gramatical. Essas escolhas variam de forma sistemática e podem ser modelas quantitativamente.

O método quantitativo

A vantagem da abordagem quantitativa está em sua habilidade para:

- modelar os fatores simultâneos e multidimensionais que têm impacto sobre as escolhas do falante;

- identificar tendências gramaticais e regularidades nos dados;

- avaliar sua relativa força e significância.

O princípio da Explicabilidade

Toda variante que é parte do contexto variável, se ela é um elemento realizado ou não no sistema, deve ser explicada.

Circunscrevendo o Contexto Variável

Como o analista determina as variantes de uma variável e os contextos em que elas variam?

1) Identificar a população total de enunciados em que o traço varia. Excluir contextos onde uma variante é categórica.

2) Decidir quantas variantes podem ser identificadas.

3) Identificar todas as subcategorias (fatores) que seriam relevantes para determinar a frequência das fromas.

Por que usar análise variacionista?

- É uma área da disciplina que envolve língua “real”, como está sendo usada;

- Ela emprega uma metodologia que é explicável pelos dados;

- Ela fornece mecanismos para analisar a língua, não simplesmente com base em si mesma, mas no nível do sistema subjacente;

- Coloca a língua no contexto, socialmente, linguisticamente, sincronicamente e diacronicamente.

Dados, dados e mais dados

Que você faz com seus dados, uma vez coletados?

O “corpus”

Componentes de um “corpus”:- gravações, fitas...- relatos de entrevistas- arquivos de transcrição- protocolo de transcrição- arquivos para análise

Transcrição dos dados

A transcrição dever ser:- detalhada o suficiente para reter

informação que possibilite uma análise linguística de forma eficiente;

- simples o suficiente para ser facilmente lida e relativamente transcrita com facilidade.

O protocolo de transcrição

O principal desafio é assegurar que os dados de fala gravados sejam representados fielmente e consistentemente. A transcrição deve revelar o que a pessoa disse sem considerar se o que foi dito segue ou não as regras da língua padrão. Ou seja, não deve haver edição com modificações da língua em sua gravação. Deve-se respeitar tudo que foi dito.

O protocolo de transcrição

O protocolo de transcrição é um documento de prática de transcrição. Ele assegura a representação consistente de palavras, frases, traços do discurso natural e traços específicos dos dados.

A variável linguística

Como encontrar uma variável linguística?

Definindo a variável linguística

A definição de uma variável linguística é o primeiro e o último passo na análise da variação. Começa com o simples ato de observar uma variação – que há duas ou mais formas alternativas de dizer a mesma coisa.

Definindo a variável linguísticaFonologia – a variável linguística é relativamente direta. As

variantes podem diferir por um ou dois traços fonológicos.

Ex.: po[h]ta x po[s]taMorfossintaxe – a alternância pode envolver flexões

variáveis, itens lexicais alternantes, diferenças sintáticas que surgem no curso de derivação da sentença.

Ex.: Os meninos... x Os menino...Sintaxe/Semântica – há ou não duas formas de dizer a

mesma coisa,quando se trata de aspectos sintáticos e semânticos?

Ex.: O menino comprou o livro... O livro foi comprado pelo menino...

Projeto VALPBIniciado em 1993, o Projeto Variação Lingüística no Estado

da Paraíba (VALPB) representa uma proposta de pesquisar a realidade lingüística da comunidade de João Pessoa, tendo em vista os seguintes objetivos:- traçar o perfil lingüístico, em nível fonético-fonológico e grama-tical dos falantes da comunidade de João Pessoa, observando fatores estruturais e sociais que interferem no uso da língua;- desenvolver estudos, em nível fonético-fonológico e gramatical, visando a subsidiar o ensino da Língua Portuguesa em todos os níveis;- estabelecer comparações, em nível regional e nacional, com estudos realizados, salientando as divergências dialetais e as semelhanças.

Projeto VALPB• A metodologia utilizada na constituição do

corpus é a utilizada pelos trabalhos de Sociolingüística que se baseiam na perspectiva variacionista. Utilizando a técnica de amostra aleatória por área, foram selecionados 60 (sessenta) informantes, com base nos seguintes requisitos:

• - ser natural de João Pessoa ou morar nessa cidade desde os cincos anos de idade;- nunca ter-se ausentado de João Pessoa por mais do que dois anos consecutivos.

Projeto VALPBA partir dos critérios mencionados, foram

selecionados os 60 (sessenta) informantes que comporiam a amostragem que constitui o corpus do VALPB, assim estratificada:

• 1) Sexo:Masculino 30 informantesFeminino 30 informantes

•2) Faixa Etária:15 a 25 anos 20 informantes26 a 49 anos 20 informantesmais de 50 anos 20 informantes

Projeto Valpb

3) Anos de escolarização:Nenhum 12 informantes1 a 4 anos 12 informantes5 a 8 anos 12 informantes9 a 11 anos 12 informantesmais de 11 anos 12 informantes

Protocolo de Transcrição do VALPB

Na transcrição dos dados foram utilizadas as normas apresentadas a seguir:

• 1) Pausas e interrupções: +• 2) Dúvida quanto à palavra: a palavra sob

dúvida está entre colchetes angulares < >Ex.: Ele <andava> muito.

• 3) Cruzamento de vozes: os enunciados pronunciados por dois falantes ao mesmo tempo são sublinhados.Ex.: Que legal!

Protocolo de Transcrição do VALPB

• 4) Pontuação:• 4.1 ponto de interrogação nas frase interrogativas e o de

exclamação em frases exclamativas são mantidos.Ex.: Aí, eu falei: que bom! Então ele perguntou: - onde você estava?

• 4.2 os outros sinais de pontuação também são mantidos.• 5) Alongamento de vogal: após a vogal alongadas são colocados

dois pontos.Ex.: Ele gostava, e co:mo gostava!

• 6) Silabação: para indicar a silabação é colocado o hífen no meio da palavra.Ex.: ca-fé, ca-mi-nha-da etc.

• 7) Repetições: letras ou sílabas repetidas são transcritas.Ex.: Aí, e e ele foi pra casa de de Carlos.

Protocolo de Transcrição do VALPB

• 8) Palavra incompleta: a palavra repetida está entre colchetes [ ].Ex.: Ele comprou um [carr], uma bicicleta.

• 9) Comentários do transcritor: atitudes não lingüísticas do informante estão entre parênteses.Ex.: Ele gosta de mim (risos).

• 10) Intrusão de outro informantes: o comentário está entre barras / /.Ex.: F1 Ah, eu acho isso muito bom, /ah, eu também acho/ mas meu pai não gosta.

• 11) Palavra ou trecho ininteligível: comentário está entre chaves { }.Ex.: Maria queria comprar {inint}, a mãe dela falou que não queria.

Protocolo de Transcrição do VALPB

• Na transcrição dos dados, foram mantidos:• a) Os apagamentos: no lugar do segmento apagado

consta zero .Ex.: ´mesmo´ = meOmo, ´brincando´ = brincanOo, ´rapaz´ = rapayO etc.

• b) Ausência de marca de concordância: também foi colocado zero .Ex.: ´As casas bonitas´= As casaO bonitaO...

• c) Itens lexicais que fazem parte da fala coloquial são mantidos.Ex.: vixi, num, cum, ni, vissi etc.

• d) Segmentos epentéticos são colocados.Ex.: Luyz, fayz, avoar, cawso etc. Quando a inserção for de glide, aparece "y" ou "w".

Protocolo de Transcrição do VALPB

• e) Casos de apagamento silábico são mantidos.Ex.: tava, ta etc.

• f) As monotongações são transcritas.Ex.: ´O rapaz roubou o ouro´ = O rapaz robô o oro. O acento dever colocado para evitar ambigüidade com outra forma existente, caso " roubo" .

VALTINS• ; simbologia

• I. ;1,2,3,4 (para, pra, pa, juntura..., respectivamente)• II. ; b (baixa,m (média) ,g (grande) - escolaridade • III. ;h (homem) e m (mulher) - sexo • IV. ;j,a,v – (jovem, adulto, velho)• V. ;l (labiais = m,p,b,f,v)• ;c (coronal = r (vibrante),l,n,t,d,s, z, j, nh,lh, ch)• ;d (dorsal = (k ©), g, r (arrasta na garganta)g com som de j é coronal• ;b (vogal baixa = a)• ;e (vogais anteriores = e, i)• ;o (vogais posteriores = o, u)• ;# (pausa)• VI. ;p,n (presenca ou ausência de vibrante na palavra seguinte)• VII. ;x,y (presença ou ausência de paralelismo formal)• VIII. Informante (1,2,3,4,5,6,7,8,9,0,a,b,c,...etc)

VALTINS• Informante 1

• (3hjblny1 eu fui pa fazê uma prova (0.20)• (3hjbcny1 alguns amigos pa nóis (3.33)• (3hjbcny1 pa dizê que ela (7.15)• (4hjblny1 pru meu irmão (7.18)• (2hjblny1 falô pra mim (7.26)• (2hjblny1 ia comprá pra mim (7.32)• (2hjblny1 comprô uma pra mim (7.35)

top related