a dadidade (ou dadidão) do dado - início · projeto de pesquisa na iniciação científica ou...

14
FREITAG A dadidade (ou dadidão) do dado www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 | A dadidade (ou dadidão) do dado Raquel Meister Ko. Freitag FREITAG, Raquel M.K. A dadidade (ou dadidão) do dado, Linguística Rio, vol.3, n.1, maio de 2017. ISSN: 2358-6826 Informações do autor Raquel Meister K.o Freitag Depto. Letras Vernáculas e PPG Letras, Universidade Federal de Sergipe Contato: [email protected] Outras informações Enviado: 19 de fevereiro de 2017 Aceito: 18 de abril de 2017 Online: 02 de junho de 2017 RESUMO: O objetivo deste texto é tecer considerações sobre a entidade “dado linguístico”, a fim de contribuir para a formação do linguista. São abordadas questões relativas à organização de bancos de dados linguísticos, considerando autoria, posse e propriedade dos dados e a aleatoriedade dos dados. PALAVRAS CHAVE: Dados linguísticos, Autoria, Aleatori- edade. Introdução São poucos os cursos de graduação em Linguística no Brasil (conheço três, todos no estado de São Paulo). 1 Enquanto a formação de engenheiros, arquitetos e geógrafos é feita em um curso de graduação em específico, no Brasil, a maioria dos linguistas advém de cursos de graduação em Letras, na habilitação licenciatura, mas tem sua formação ver- ticalidade na área em pequenos nichos de grupos de pesquisa (quando vinculados a um projeto de pesquisa na iniciação científica ou programa equivalente), ou, então, fazem-na por conta própria. A formação na academia, via inserção em grupos de pesquisa, tende a levar os jovens pesquisadores a se espelharem nos valores e no modo de fazer pesquisa dos sêniores, como que um efeito do habitus (BOURDIEU, 1974), o que leva a situações em que, muitas vezes, fazemos as coisas de um jeito porque sempre se fez assim, nem 1 Na pós-graduação, há bem mais cursos de Linguística, embora predominem os cursos de Letras, com áreas de concentração/linhas específicas para estudos linguísticos, especialmente nas regiões Norte e Nordeste. No entanto, mesmo nos programas de Linguística, a adequação aos ditames da Capes quanto à organização curricular e prazos deixa pouco espaço para aspectos mais práticos da formação. Na minha experiência, tanto como aluna de gradua- ção e pós-graduação, como orientadora de graduação e de pós-graduação, observo que a formação metodológica que prevalece na trajetória do pesquisador é aquela advinda do contato com a graduação.

Upload: duongkiet

Post on 26-Dec-2018

218 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: A dadidade (ou dadidão) do dado - Início · projeto de pesquisa na iniciação científica ou programa equivalente) ... do sintagma; como em uma abordagem da sociolinguística de

FREITAG A dadidade (ou dadidão) do dado

www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |

A dadidade (ou dadidão) do dado Raquel Meister Ko. Freitag

FREITAG, Raquel M.K. A dadidade (ou dadidão) do dado, Linguística Rio, vol.3, n.1, maio de 2017. ISSN: 2358-6826 Informações do autor Raquel Meister K.o Freitag Depto. Letras Vernáculas e PPG Letras, Universidade Federal de Sergipe Contato: [email protected] Outras informações Enviado: 19 de fevereiro de 2017 Aceito: 18 de abril de 2017 Online: 02 de junho de 2017

RESUMO: O objetivo deste texto é tecer considerações sobre a entidade “dado linguístico”, a fim de contribuir para a formação do linguista. São abordadas questões relativas à organização de bancos de dados linguísticos, considerando autoria, posse e propriedade dos dados e a aleatoriedade dos dados. PALAVRAS CHAVE: Dados linguísticos, Autoria, Aleatori-edade.

Introdução

SãopoucososcursosdegraduaçãoemLinguísticanoBrasil(conheçotrês,todos

noestadodeSãoPaulo).1Enquantoaformaçãodeengenheiros,arquitetosegeógrafosé

feitaemumcursodegraduaçãoemespecífico,noBrasil,amaioriadoslinguistasadvém

decursosdegraduaçãoemLetras,nahabilitaçãolicenciatura,mastemsuaformaçãover-

ticalidadenaáreaempequenosnichosdegruposdepesquisa(quandovinculadosaum

projetodepesquisanainiciaçãocientíficaouprogramaequivalente),ou,então,fazem-na

porcontaprópria.Aformaçãonaacademia,viainserçãoemgruposdepesquisa,tendea

levarosjovenspesquisadoresaseespelharemnosvaloresenomododefazerpesquisa

dossêniores,comoqueumefeitodohabitus(BOURDIEU,1974),oquelevaasituações

emque,muitasvezes, fazemosascoisasdeumjeitoporquesemprese fezassim,nem

1 Na pós-graduação, há bem mais cursos de Linguística, embora predominem os cursos de Letras, com áreas de concentração/linhas específicas para estudos linguísticos, especialmente nas regiões Norte e Nordeste. No entanto, mesmo nos programas de Linguística, a adequação aos ditames da Capes quanto à organização curricular e prazos deixa pouco espaço para aspectos mais práticos da formação. Na minha experiência, tanto como aluna de gradua-ção e pós-graduação, como orientadora de graduação e de pós-graduação, observo que a formação metodológica que prevalece na trajetória do pesquisador é aquela advinda do contato com a graduação.

Page 2: A dadidade (ou dadidão) do dado - Início · projeto de pesquisa na iniciação científica ou programa equivalente) ... do sintagma; como em uma abordagem da sociolinguística de

FREITAG A dadidade (ou dadidão) do dado

www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |

sempresesabeporquê,sósesabequeéassim.Aocontráriodoqueseesperaria,naaca-

demia,emgeral,hámuitopoucoespaçoparaareflexãometodológicae,porconseguinte,

paraorompimentodaspráticasjáconsagradas,gerandoinovação2.

Poroutrolado,olinguistaautodidataesbarraemumproblema:noBrasil,temos

muitonosdedicadoàapresentaçãodeteorias,interfacesereleiturasdeteorias,masnão

temosmuitadiscussãosobreametodologiaquedásuporteaessasteoriastodas.Nomá-

ximo,encontramosdescriçõesdemétodosdepesquisasucintas,navozpassiva,dandoa

falsaimpressãodequeéextremamentefácilexecutarumprocedimentometodológiconas

diferentesáreasdaLinguística.

Umachamadadepublicaçãoquetemcomoobjetivotrazeràdiscussãoaformação

dolinguistaéumaoportunidadeparalevantarpontosqueaindasãofalhos.Eumdospon-

tosqueconsiderocrucialepoucorefletidodeformaconscienteéadadidãoouadadidade

dodado.

Dadidãoedadidadenãosãopalavras,insisteemmelembrarocorretordoeditor

detexto.Paraexplicaroqueeuquerodizercomessesneologismos,primeiroprecisodis-

cutirasuaraiz,overbodar.

Qualéamelhoranáliseparaoverbodarnoportuguêsbrasileiro?Éumverbodi-

transitivo?Verboleveousuporte?Sãodiversasaspossibilidadesparafomentarumain-

vestigação linguística–verporexemploosestudosdeSilva (2005)eScher (2006).O

verbodarassumeconotaçõesmaisvulgares,quandosetornaintransitivo(ou,aomenos,

comosobjetoselípticos),oupodeaindaserhipercorrigido,comoéocasodeumapropa-

gandadexampu,quedábrilhoaoscabelos(fig.1)

2 Não é por comodismo, não é por aculturação. Eu ousaria dizer que fazemos o que sempre fazemos porque sabe-mos a que resultados vamos chegar. E precisamos chegar a um resultado para poder dar propulsão à mola do financiamento: tenho que ter X artigos publicados em revistas para poder ter chances de concorrer a um edital de fomento, ou simplesmente para ter progressões na carreira. Corre-se menos riscos ao se tentar publicar um artigo com um tema abordado ao modo do que que se espera no campo do conhecimento do que um artigo resultante do teste de novas abordagens (que podem ou não ter resultados publicáveis). Se estamos tratando da formação do linguista, é preciso trazer à tona questões que são delicadas, mas que precisam ser discutidas, como a naturalização de comportamentos na academia (apenas para situar: https://www.cartacapi-tal.com.br/revista/929/a-academia-e-seus-comportamentos-patologicos).

Page 3: A dadidade (ou dadidão) do dado - Início · projeto de pesquisa na iniciação científica ou programa equivalente) ... do sintagma; como em uma abordagem da sociolinguística de

FREITAG A dadidade (ou dadidão) do dado

www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |

Qualseriaaformadeverbaldoverbodar?Emília,doSítiodoPica-PauAmarelode

MonteiroLobato(2014[1933]),erauma“dadeiradeideias”;porquenãoumxampu“da-

dordebrilho”?Daredoarapresentamacepçõesmuitopróximas,masnãosãoamesma

coisa.Eumearriscariaadizerquenãotêmomesmovalordeverdade,porissonãopodem

serconsideradoscomovariantesdeumamesmavariávellinguística.PorqueemSociolin-

guística,analisamosdados,enãodoados!Eésobreessaentidade,odadolinguístico,que

voutratarnestetexto.3Inicialmente,discutooqueéaentidadedadolinguístico,para,em

seguida,encaminharpontuaçõessobreadadidade/dadidãodosdadosnaSociolinguís-

tica,masquesãoextensíveisaoutrasabordagens,nãosódaLinguística.

1. O que é um dado?

Nanossacultura,concretamente,dado

éumaformageométricatridimensionalcomseis

lados,utilizadaemjogos(fig.2).Maisumafaceta

dodado:suarelaçãocomasorte,comoacaso(e

comaaleatoriedadedosdados).Edado assume

outra significação: um qualquer. Isso permite

construçõescomo“dadodado”.Dadoéumtermo

técnicopolissêmicoemLinguística,eumaexpres-

sãocomo“Umdadodado”temmaisdeumainterpretação.

3 Possenti (2009[1998]) utiliza o recurso gráfico do negrito e do itálico para representar a diferença entre duas acepções de dado na Análise do Discurso (o dado dado e o dado dado). Um sentido seria o dado que é herdado, doado, mais ou menos como o xampu, e o outro sentido seria o dado que realmente é dado, que resolve, dado bom mesmo. Confesso que não consigo entender essas filigranas nesse campo, mas registro a fonte da distinção entre os dados, encaminhando para meu campo, que é de orientação mais funcional.

Figura1:Fotodoxampudoadordebrilho.

Figura2:Umdado.

Page 4: A dadidade (ou dadidão) do dado - Início · projeto de pesquisa na iniciação científica ou programa equivalente) ... do sintagma; como em uma abordagem da sociolinguística de

FREITAG A dadidade (ou dadidão) do dado

www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |

1.Umdadodado.

2.Umdadodado.

Onegritonosexcertosmarcaaposiçãodenúcleodosintagmanominal.Em(1),o

dadoéumqualquer,nosentidodeescolhidoaoacaso,e,em(2)odadoédado(nosentido

dedoado,comonoxampu).Aposiçãodenúcleoouadjuntodosintagmaocupadapordado

pode,porexemplo,distinguirasabordagensempíricasouintuitivas,emumviésaosmol-

desdadiscussãoentreformalismovs.funcionalismonodebatetravadonarevistaDelta

nosanos1990.4Aoposição“dadodado”e“dadodado”,nestedebate,distinguiriaolin-

guistadegabinete,quecria,pensaumdadoparailustrarseufenômeno(masquepoderia

serqualqueroutrodado),aolinguistadecampo,quevaiembuscadeumdadoquesaia

dealgumlugar,quesejadado/doado.Umadistinçãoentreessesdoistiposdedadopode-

riasersistematizadanaoposiçãodadoinduzidovs.dadoespontâneo.Mas,comoespero

explicitarconvincentementemaisàfrente,estaéumadistinçãofalaciosaefalseável.Para

conduziradiscussãoqueproponho,vouassumiradistinçãodedadonaposiçãodenúcleo

dosintagma;comoemumaabordagemdasociolinguísticadeorientaçãovariacionista,

voudiscutirseas formasdebasedosdeverbaisdedaredoar são intercambiáveisem

outrocontexto:nalexiabancodedados.

2. O que é um banco de dados?

Asabordagensempíricasquevisamdescreverosusoslinguísticosapartirdasre-

gularidadesprescindemdeumsuporte:osdadoslinguísticos.Osdadosestãoaí,osdados

estãonomundo.Podemosdizer,semmedodeerrar,queosdadossãogeradosesponta-

neamente.Masaindanãoexisteumamáquinaquepeguedadosnomundo,organize-ose

oscoloqueàdisposiçãodeumpesquisador,oquerevelaumgrandeproblemadanossa

área:apoucainteraçãocomáreastecnológicas,quelidamtambémcomprocessamento

4 Considero essencial para a formação de um linguista, seja qual for a sua orientação teórica, conhecer o debate na revista Delta: Votre e Naro (1989), Nascimento (1990), Dillinger (1991) e Kato (1998). Houve um tempo em que publicações eram lidas e debatidas, replicadas, treplicadas e muitos aprendiam com a exposição de diferentes pontos de vista sobre fatos da língua. Não sei dizer em que momento ou por que perdemos esse hábito de ler, discutir e compartilhar nossas impressões sobre os trabalhos em desenvolvimento. Só sei dizer que perdemos muito com essa não prática.

Page 5: A dadidade (ou dadidão) do dado - Início · projeto de pesquisa na iniciação científica ou programa equivalente) ... do sintagma; como em uma abordagem da sociolinguística de

FREITAG A dadidade (ou dadidão) do dado

www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |

dalinguagem,comoalinguísticacomputacionalqueédesenvolvidanoscursosdeCiên-

ciasdaComputação.Afinal,seSiri,daApple,Cortana,daMicrosoft,eAllo,daGoogle,as-

sistentespessoais, “entendem”seusproprietários, inclusiveemportuguêse comcerta

precisão,ésinaldequeexistetecnologiaparacaptarestímulosemáudioeostransformar

emregistroescrito,aseremprocessadosporalgoritmosdeparsing(atranscriçãoauto-

mática,umsonhodetodosquetrabalhamcomdadosdeáudio!).Noentanto,aindaesta-

mosdistantesdenosvalerdestastecnologiasparanossaspesquisas,pelomenosnoque

setemfeitoemSociolinguística,enoBrasil(eesteéoutropontoquelinguistasemfor-

maçãodeveriaminvestir:emformasdeautomatizarotrabalho,parapodermosdarconta

deumvolumemuitomaisamplodedados,enosdedicarmaistempoàanálise).

Mas,mesmoassim,pormaistecnologiaqueexista(equepotencialmenteestivés-

semosutilizando),aindarestatodoumtrabalhobraçalquesópodeserfeitoporumhu-

mano,especialmentenacoletadedadosclássicadaSociolinguísticaVariacionista,com

entrevistasgravadascomfalantes.Acoleçãodedadoscoletados(corpusouamostra)é

organizadaeconstituiumbancodedados.Paracontribuircomaformaçãodopesquisa-

dor,gostariadetrazerparaadiscussãoaspectosrelacionadosaosbancosdedadossoci-

olinguísticosrelativosaotrabalhosubjacenteàorganizaçãodosdadoseasdefiniçõesde

autoria,posseepropriedadedosprodutosderivadosdesteprocessoeàsquestõesdeale-

atoriedadedosdados.

Paraisso,voupedirlicençapara:a)sairdopadrãoacadêmico-científico,comme-

nosrigorcientíficoemaisteoranedótico,afimdemeaproximarmaiscomopúblico;e,

emdecorrênciadisso,b)meeximirdaresponsabilidadedecontaronomedossantosdos

milagresrelatados(emboraemalgunscasosissosejaimpossíveldeacontecer,dadaare-

percussãogeral).

3. Como a Sociolinguística entrou no Brasil?

Demodogeral,nãofazemossociolinguísticavariacionistadeorientaçãolaboviana

noBrasil.Compoucasexceções,fazemosumasociolinguísticademodomuitopeculiar,a

sociolinguísticavariacionistadoBrasil(cf.FREITAG,2016).Nessemodelo,paramuitos

pesquisadores,asociolinguísticaévistacomoumametodologiadegeraçãodedadospara

testagemdeteoriasedescriçãode língua(oudevariedades).Tantoque“casamentos”,

Page 6: A dadidade (ou dadidão) do dado - Início · projeto de pesquisa na iniciação científica ou programa equivalente) ... do sintagma; como em uma abordagem da sociolinguística de

FREITAG A dadidade (ou dadidão) do dado

www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |

comoaSociolinguísticaParamétricaeoSociofuncionalismo,porexemplo,foramcelebra-

dosnoBrasil,porpesquisadoresbrasileiros,tendopoucarepercussãonoexterior.Dema-

neirageral,ostítulosdostrabalhosassumidos(ereconhecidopelospares)comosocio-

linguísticos, como artigos, dissertações e teses, priorizam na posição de núcleo o

fenômenolinguísticosobanálise,deixandonaposiçãodeadjuntoacomunidadedefala

(referidanonívelgeográfico)oualgumaspectosocial.Vaiserdifícilencontrar,dentreos

pesquisadoresbrasileirosdaárea,umquebataamarcadeWilliamLabov,que,durante

toda a sua carreira, realizoumais de 1000 entrevistas sociolinguísticas, pessoalmente

(LABOV,2016).Ocontatocomoprocessodecampoampliaaspossibilidadesdeanálise

dopesquisador,namedidaemquepermitecaptarnuançasquenãoestãopresentesna

transcrição(modulaçãoeintensidadedavoz)oumesmonoáudio,comoasexpressões

faciaiseocontextofísicodaentrevista,porexemplo.

Poroutrolado,deter-seexclusivamentenaanálisedeumagrandecoleçãodeda-

dos,jásistematizadosetranscritos,permiteaopesquisadoraprofundar-seemdescrições

maisminuciosasdasregularidadesenocotejamentodedadosateorias.Comessetraba-

lho,foipossíveldepreenderumagramáticabrasileira,umanormalinguísticabrasileira

calcadanaregularidadedeusosreais,emdadosempíricos.Opesquisadordefinequeisso

ouaquiloéportuguêsbrasileiroapartirdorecortedeumfenômenoedaobservaçãoda

regularidadedeseucomportamentoemumaamostralinguísticasistemática–obancode

dados–queésocialmenteestratificada.Édessaabordagemquedecorremgeneralizações

do tipo:maior escolaridade leva àmaiorpresençademarcasde concordância,menor

faixaetárialevaamaiorusodeagente,eassimpordiante.

Mas,parachegaraessasgeneralizações,houvetodoumtrabalhoanteriordedeli-

neamento,coletaesistematizaçãodasamostraslinguísticas,quetradicionalmenteapa-

recenasmetodologiasnavozpassiva.Foramselecionadosinformantes,entrevistasforam

realizadas,osáudiosforamtranscritos.Nãoestáexplícitoosujeitoagentedetodasessas

ações.Quemfezaseleçãodosinformantes?quemgravouasentrevistas?quemtranscre-

veuoáudio?Aestratégiadavozpassivaapontaparaaideiadeempreendimentocoletivo

queéumbancodedados(sócio)linguísticos.Ousodavozpassivadáaideiadequenão

foiumapessoa,umúnicopesquisador,quemofez;foiumaequipedepesquisadores,com

diferentesfunçõeseemdiferentesfases.Adespessoalizaçãodasaçõesdeconstituiçãode

umbancodedadoslevaaquestõesdeautoriaedeposseepropriedade,umoutroponto

Page 7: A dadidade (ou dadidão) do dado - Início · projeto de pesquisa na iniciação científica ou programa equivalente) ... do sintagma; como em uma abordagem da sociolinguística de

FREITAG A dadidade (ou dadidão) do dado

www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |

que,dentrodasboaspráticasdepesquisa,precisaserdiscutidonaformaçãodolinguista

(quemsãoosdonosdosdados,maisàfrente).

UmfatorquepodetercontribuídoparaoformatodasociolinguísticanoBrasilhoje

éofinanciamentodaspesquisas,quetendeapriorizaraspropostascoletivaseamplas.

NosretrospectosdoGTdeSociolinguísticadaAnpoll,oscoordenadoresrelatamosesfor-

çosdospesquisadoresparaacaptaçãoderecursosjuntoaagênciasdefomento,comoa

Finep, Capes, CNPq e fundações estaduais, que priorizam propostas coletivas, tanto

quantoapesquisadores,comoquantoaáreasdoconhecimentoenvolvidas(talvezaexce-

ção sejamasbolsas incentivo individual –produtividade, jovenspesquisadores, etc.).5

Nestaconjuntura,projetosqueatendamadiferentesobjetosdeinvestigaçãoalinhadosa

umapropostaagrupadora,comoaconstituiçãodeumbancodedadossociolinguísticos

deumadeterminadacomunidade,tendemaserpriorizadosemfunçãodapossibilidade

deotimizaçãoderecursoseesforços.

4. Os donos dos dados

Coletardadosdátrabalho,enãodápararesumiraumalinhaemvozpassivatodo

essetrabalho(FREITAG;MARTINS;TAVARES,2012).Porisso,éimportantediscutiraau-

toriadeumbancodedados.Sãopoucosospesquisadoresquepodemdizerquetêmum

bancodedadosparachamardeseupropriamente.Issosignificaqueopesquisador,único

esolitário,desenhouaamostra,foiacampoidentificarosfalantesquepreenchiamoperfil

daestratificaçãodaamostra,elemesmoentrevistou,depoistranscreveuerevisouagra-

vaçãodeáudiodecadaumdosfalantesquefoientrevistado,paraentão,enfim,realizar

seutrabalhodepesquisa.Háaindamuitospesquisadoresquetrabalhamassim.Ninguém

conhecemelhorosseusdadosdoqueestetipodepesquisador,paraobemeparaomal.

Noladopositivo,opesquisadorqueacompanhoudodesenhodapesquisaàtranscrição

dosdadosécapazdeidentificarmuitosaspectosquenãoforamcaptadospelagravação,

elucidandodadostruncados,porexemplo.Noladonegativo,opesquisadorpodeestartão

envolvidocomseufenômenoquepodecomeçaraverdadosondenãoexiste,umaforçada

inconscientenatranscrição(ouvirdemais).Afinal,osdadossãoseusesóseus(será?).

5 Periodicamente, as ações do GT de Sociolinguística são compiladas em coletâneas organizadas, assim como balanços da área, que podem ser conferidos em Brandão (1994), Vandresen (2003), Savedra (2010).

Page 8: A dadidade (ou dadidão) do dado - Início · projeto de pesquisa na iniciação científica ou programa equivalente) ... do sintagma; como em uma abordagem da sociolinguística de

FREITAG A dadidade (ou dadidão) do dado

www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |

Arealidadedamaioriadospesquisadores,noentanto,édiferente.Osbancosde

dadoscostumamserconstruídoscoletivamente,seguindomaisoumenosumacertaes-

trutura:umpesquisadorouumgrupodepesquisadores,todossêniores,desenhamuma

amostra,definindoascategoriasdeestratificaçãodosinformanteseonúmeromínimode

falantesporcélula.6Apartirdestedesenho,ospesquisadoresinicianteseemformação

trabalhamparaencontrarosfalantesquepreenchamascélulas,entrevistá-los;transcre-

veroáudiodagravaçãocostumasertarefadospesquisadoresiniciantes(iniciaçãocien-

tífica),revisaratranscriçãocostumasertarefadospesquisadoresemformação(mestran-

dosedoutorandos).Eassimumbancodedadosnãotemumautor;temvários.Quala

parceladecontribuiçãodecadaumnesteprocessodeconstituiçãodeumbancodedados?

Aentrevistafinal,gravadaetranscrita,sóexistiriaporqueumgrupodepesquisadores

sênioresdelineouapropostadobancodedados;poroutrolado,aconcretizaçãodobanco

dedadosprojetadosóserealizariaemumempreendimentocoletivocomospesquisado-

resinicianteseemformação.

Umbancodedadoscoletivoéumempreendimentocolaborativoouvoluntário?O

quealguémganhaaoconstituirumbancodedados?Comodestaqueianteriormente,a

sociolinguísticabrasileira – assim comoasdemais áreasda ciência – é financiadapor

agênciasquevalorizamprojetosquetenhamabrangênciaamplia,visandoocompartilha-

mento,daíaênfaseembancosdedadossociolinguísticos,quepodemserutilizadosmais

deumavez,paraestudardiferentesfenômenos.Ofinanciamentodeprojetosquevisama

constituiçãodebancosdedadossociolinguísticosrecobreasdespesasdecapitalecusteio,

masnãoderecursoshumanosexclusivamenteparaessefim;paraisso,pesquisadoresini-

cianteseemformaçãoaderemaoprojeto(combolsaounão),colaborandocomaidenti-

ficaçãodeumfenômenolinguísticoasertratadoaotempoemquecontribuiparaacons-

tituiçãodobancodedados.Sejanumplanode trabalhode iniciaçãocientíficaounum

projetodemestradooudoutorado,asregrastácitasestabelecidasentreogrupoqueatua

naconstituiçãodosbancosdedadoséqueacontrapartidaaousodeumtodo(obancode

dados)écolaborarcomumaparte(entrevistas,transcrições,revisões).Oacessoaotodo

nãoégratuito;assimcomoacolaboraçãonaspartesnãoévoluntária.E,depoisdepronto,

6 “Falante”, “informante”, “sujeito”, “participante”; depois do termo “dado”, estes são outros termos usados como variantes, mas que carregam diferentes significados subjacentes e que mereceriam uma reflexão mais aprofundada (talvez, em outra oportunidade).

Page 9: A dadidade (ou dadidão) do dado - Início · projeto de pesquisa na iniciação científica ou programa equivalente) ... do sintagma; como em uma abordagem da sociolinguística de

FREITAG A dadidade (ou dadidão) do dado

www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |

umbancodedados,aindaquefinanciadocomodinheiropúblico,nãoédedomíniopú-

blico:houveumtrabalhointelectualpordetrásdesuaelaboração,desdeaconcepçãoaté

aconsecução,queconfiguraautoria.Logo,seuusodeveserreferidoapropriadamente.

Seobancodedadosfoifinanciadocomdinheiropúblicodeveriaserpúblico,no

sentidodesercompartilhadoabertamente,certo?Nemsempre,enãoporquestõesde

posseepropriedade,masporquestõesdeéticaempesquisa.Hábancosdedadosque

disponibilizamsuasamostrasnainternet.ÉocasodoIboruna(http://www.iboruna.ibi-

lce.unesp.br), que exige cadastro para acesso, do SP2010 (http://proje-

tosp2010.fflch.usp.br/node/3) totalmente aberto, doNURC-RE (OLIVEIRA Jr., 2016) e,

parcialmente, do PEUL (http://www.letras.ufrj.br/peul/amostras%201.html) e do

NURC-RJ(http://www.letras.ufrj.br/nurc-rj/),quedisponibilizamastranscrições.

Poroutrolado,nemsempreaaberturapúblicadosdadosépossível.Adocumen-

taçãosociolinguística–conjuntodeprocedimentosadotadosparaaconstituiçãodeban-

cosdedadossociolinguísticos(cf.FREITAG,asairA)–nãoéingênuanemneutra,menos

aindaasséptica,navozpassivaenaterceirapessoa.Oprocessodeseleçãodosfalantese

todooperíododetempoemquedocumentadorefalanteconvivemparagerarosdados

influenciamnosresultados.Háriscosnadocumentaçãosociolinguísticaquepodemepre-

cisamserminimizados,comaelaboraçãopréviadodesenhodapesquisa,comotreina-

mentoadequadodopesquisadordecampoecomocuidadonadivulgaçãodosresultados.

Aregulamentaçãodasquestõeséticasempesquisaenvolvendosereshumanos(os

nossosfalantessãosereshumanos)partedopontodevistaquetodaaatividadedepes-

quisaapresenta riscos.Considerandoqueexistemriscosempesquisa, a submissãode

projetosaoscomitêsdeéticatemsetornadoumprocedimentoacadadiamaisconstante,

emfunçãodosimperativosinstitucionais,relacionadosaagênciasdefinanciamentoouao

vínculodotrabalhocomainstituiçãodepesquisa.

Nuncapensamosemfazermalaoinformanteporrealizarumaentrevistasociolin-

guística,masesteprocedimentosistematicamenteadotadonasdocumentaçõessociolin-

guísticasnoBrasil,emfunçãodeseuroteiro,podelevarofalantearememorarexperiên-

ciasquepodemgerarsituaçõesdemelancolia.Aofalardecertaspassagensdesuavida,

umfalantepodeatéchorar.Seráqueofalantevaiconcordarqueseuchorosejacompar-

tilhadopublicamente(disponívelnainternet)?Ou,então,nocalordomomento,ofalante

Page 10: A dadidade (ou dadidão) do dado - Início · projeto de pesquisa na iniciação científica ou programa equivalente) ... do sintagma; como em uma abordagem da sociolinguística de

FREITAG A dadidade (ou dadidão) do dado

www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |

fazumacolocaçãopoucopoliticamentecorreta(euconheçoumaentrevistasociolinguís-

ticaemqueofalanteexpõesuaposiçãoemrelaçãoaoaumentode“homossexualismo”

nosdiasdehoje,culpadousodesupositóriosnascrianças,quese“acostumaram”eque,

porisso,osfilhosdelenuncausaramsupositório).Aindaqueobancodedadosanonimize

ofalante,certaspistasdeixadasnodecorrerdaentrevistapodemidentificá-lo,como,por

exemplo,umfalanteanonimizadonobancodedados,masquedizduranteaentrevista

queeravereadorequetrabalhounainstituiçãotalnaépocatal.Otermodeconsentimento

livreeesclarecido,requisitoobrigatórioembancosdedadoscujoprojetodeconstituição

foiapreciadoporcomitêdeéticaempesquisa,resguardaopesquisadorea instituição

queabrigaobancodedados,masnemsempreo falanteéesclarecidoaopontodeter

consciênciadequepartedesuavidavaisetornarpúblicaecompartilhada,inclusivena

internet.

“Nãodêligânciadisso”éumdadomuitointeressantecomoverbodar.Masestá

numaentrevistasociolinguística(comtermodeconsentimentolivreeesclarecidoassi-

nado)emque,emdadomomento,ainformantevangloria-sedofatodeseupaitermatado

umvizinhoeterseevadidoparaoutroestado.Pormaisinteressantequesejaodado,o

crivo finaldopesquisadoresuaresponsabilidadeperanteosdadoseasuadivulgação

podelevaraexclusãodestaentrevistadeumbancodedados,parapreservar-se(àinfor-

manteeasimesmo).

Anonimatoéumacondição,masnãoéumaobrigatoriedade.Muitasvezes,nãotem

comoanonimizar;outrasvezes,oprópriofalantequerseridentificado.Porisso,umadis-

cussãosobreosimpactosdessaspequenasdecisõesécrucialnodesenhodeumacoleta

dedados

Aindaemrelaçãoaodesenhodoprojetodedocumentaçãosociolinguísticaeas

questõeséticassubjacentes,éprecisodeixarclaroaoinformanteemquecélulasocialele

será alocado. Ao analisar o tratamento do sexo/gênero na sociolinguística brasileira,

constateique,nasperguntasdechecagemdaentrevistasociolinguística,aestratificação

porfaixaetáriaeporescolarizaçãoeramconferidas,masadesexo/gênero,não(FREITAG,

2015).Aobuscaro falanteno campo, parapreencher a célula social, presumimos seu

sexo/gênero,eessatalvezsejaumaperguntamaissimplesdesefazer.Masemestratifi-

caçõesdo tipoportuguês culto/portuguêspopular, seráqueépossívelpedir ao infor-

manteaautoindicação?Seráqueessaautoindicaçãobatecomaquelaqueépresumida

Page 11: A dadidade (ou dadidão) do dado - Início · projeto de pesquisa na iniciação científica ou programa equivalente) ... do sintagma; como em uma abordagem da sociolinguística de

FREITAG A dadidade (ou dadidão) do dado

www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |

pelodocumentador,pesquisadordecampo?Você,leitor,jásecolocounasituaçãodese

disporaconcederumaentrevistasociolinguísticaetemposdepoissereconhecercomo

umfalantedeportuguêspopular?

Otreinamentodecampododocumentadoréumaparteimportantedoprocesso

deconstituiçãodeumbancodedados,masque,muitasvezeséaligeiradaousimples-

mentesuprimida.Odiferentecausaestranhamento.Odocumentadornãopoderirnem

corrigirofalante,sóporqueelefalou“apesardosapesares”ou“nóisvinhemo”.Aindaque

sejaumareaçãoinconsciente,trazconstrangimentoaofalante,éumriscoquepodeser

evitado.Assimcomopodemserevitadososdesgastesdecorrentesdeumatranscrição

ortográficaadaptada(aquelaquemarcatraçosdafala).

Considerarasquestõesenvolvendoéticaempesquisanaconstituiçãodeumbanco

dedadoséumanecessidaderelativamenterecente,decorrentedasimposiçõesdeagên-

ciasdefomento,que,decertaforma,sãoasmesmasimposições(anecessidadedefinan-

ciamento)quederamacaradaSociolinguísticadoBrasil,combancosdedadoscoletivos

paraadescriçãolinguística.Noentanto,semprehouveoutliers,comoemtodosemcam-

posdaciência,e,nosúltimosanos,trabalhosquetomamcomopontodepartidaacomu-

nidadeeseusfatoresconstitutivos,enãoumfenômenolinguístico–comoavariaçãoeo

efeitodasredesnoMorrodosCaboclos(FERRARI,1994)eacaracterizaçãosociolinguís-

ticadacomunidadedefaladeSãoPaulo(OUSHIRO,2015),porexemplo–têmemergido,

sinalizandoumamudançadetendência,quetraznovosdesafiosenovasdiscussõesteó-

rico-metodológicasnasociolinguísticabrasileira.Seaciênciabrasileiraéfinanciadapelos

pais(http://revistagalileu.globo.com/Revista/noticia/2016/07/ciencia-no-brasil-e-ban-

cada-pelos-pais.html),talvezestesejaomomentodemudarumciclo.

5. O quão dados são os dados de um banco de dados?

Aabordagemdodado/doadocostumaserassociadaaoacaso,aleatório,nosentido

queodador/doadorseriaumapessoaqualquer.Tantoqueosestudossociolinguísticos,

pelomenosnoBrasil,costumamassumirquesuasamostrassãoprobabilísticas,aleató-

riaseestratificadas,oquequerdizerquequalquerfalantedapopulaçãodelimitadateria

omesmonúmerodechancesdeserescolhidoparapreencheracotadecadaestrato.Na

prática,sabemosqueateoriaéoutra:osfalantesquecolaboramparaaconstituiçãode

umbancodedadossociolinguísticasãoaquelesquedispõemdetempoparacolaborar,

Page 12: A dadidade (ou dadidão) do dado - Início · projeto de pesquisa na iniciação científica ou programa equivalente) ... do sintagma; como em uma abordagem da sociolinguística de

FREITAG A dadidade (ou dadidão) do dado

www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |

cedendonomínimoumahoradesuavidaparaessafinalidade.Imperamadisponibilidade

eavoluntariedade,oquelevaaummodelodecotasporconveniênciae julgamento.A

conveniênciapermiteaoperacionalidadedacoleta,noentanto, impõeàanálisemenor

poderexplanatório;pornãoatenderaumcritérioestatístico,nãopode(ou,melhor,não

deve)sergeneralizadaaumapopulação.Amostrasassimconstituídasnãopoderiam,em

tese,subsidiargeneralizaçõessobre“a”línguafaladaemtallugar.E,porserempautadas

naconveniência,limitamareplicabilidade,namedidaqueháumviésdeseleção(FREI-

TAG,asairB).

Oviésdeseleçãopodesedarnomomentodatranscriçãoimpressionísticadosda-

dos:aquiloqueétranscritonemsempreéoqueofalantefalou,masoqueotranscritor

ouviu:adependerdoseufenômeno,haverámaiorsensibilidadeparapercebê-loemarcá-

lo,emtranscriçõesortográficasadaptadasoufonéticas;ou,então,avariantedotranscri-

torsesobrepõeàvarianterealizadapelofalante,numprocessoinconscientedeacomo-

daçãolinguística.Porisso,odadodadonãoétãoaleatórioassim,nemparaumlado,nem

paraooutro.Semprehaveráumviésdeseleção.

Considerações

Teraoportunidadedediscussãodeaspectosquepermeiama formaçãodo lin-

guistaéimportanteparaformarmosumaculturadecríticaeavaliaçãodofazerdanossa

área,comoumtodo,aotempoquepodemostambémnosposicionarediscutir,resgatando

umaculturadedebate(voltoainsistirnosdebatesdaDelta).

Emtempo:recorrendoaooráculodoséculoXXI,nãoacheinenhumaocorrênciade

“dadidão”,mas1090ocorrênciaspara“dadidade”,basicamenterelacionadasaocampoda

ontologia(consultaaoGoogle,empáginasemportuguês,nadatalimitedachamadapara

apublicaçãodestaedição).7Embora“dadidade”sejamaisprodutiva,achoque“dadidão”

ficamelhor.Linguistas,eisumtemaparanovaspesquisas!

7 Na revisão, apareceram 1750 ocorrências para “dadidade” e ainda nenhuma para “dadidão”.

Page 13: A dadidade (ou dadidão) do dado - Início · projeto de pesquisa na iniciação científica ou programa equivalente) ... do sintagma; como em uma abordagem da sociolinguística de

FREITAG A dadidade (ou dadidão) do dado

www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |

Agradecimentos

Agradeçoàminhaorientadora,EdairMariaGörski,quemepermitiuentrarnumgrupode

pesquisaefazerotodosfaziam,etambémpormepermitirquebrarasregrasdevezem

quando.Agradeçoaospareceristas,aum,porsuascontribuiçõesparanovasdiscussõese,

aooutro,porme lembrardohabitusdaacademia.EagradeçoàLiviaOushiro,porsua

leituraatentaesincera.

REFERÊNCIAS

BOURDIEU, Pierre. A economia das trocas simbólicas. Trad. Sérgio Miceli. São Paulo: Perspec-tiva, 1974.

BRANDÃO, Silvia Figueredo. GT de Sociolinguística. Revista da Anpoll, v. 1, n. 1, 1994.

DILLINGER, Mike. Forma e função na lingüística. DELTA, v. 7, n. 1, p. 395-407, 1991.

FERRARI, Lilian. Variação linguística e redes sociais no Morro dos Caboclos. Tese (Doutorado em Linguística) - Universidade Federal do Rio de Janeiro, Rio de Janeiro, 1994.

FREITAG, Raquel Meister Ko. (Re)discutindo sexo/gênero na sociolinguística. In: FREITAG, Ra-quel Meister Ko.; SEVERO, Cristine Gorski (Org.). Mulheres, Linguagem e Poder - Estudos de Gênero na Sociolinguística Brasileira. São Paulo: Blücher, 2015, p. 17-74.

FREITAG, Raquel Meister Ko. Amostras sociolinguísticas: probabilísticas ou por conveniência? (a sair A).

FREITAG, Raquel Meister Ko. Documentação sociolinguística – coleta de dados e ética em pes-quisa. São Cristóvão: EdUFS (a sair B).

FREITAG, Raquel Meister Ko. Sociolinguística no/do Brasil. Cadernos de Estudos Lingüísticos, v. 58, n. 3, p. 445-460, 2016.

FREITAG, Raquel Meister Ko; MARTINS, Marco Antonio; TAVARES, Maria Alice. Bancos de da-dos sociolinguísticos do português brasileiro e os estudos de terceira onda: potencialidades e li-mitações. Alfa, v. 56, n. 3, p. 917-944, 2012.

KATO, Mary A. Formas de Funcionalismo na Sintaxe. DELTA, v. 14, n. spe, p. 00,1998.

LABOV, William. Afterword: Where are we now? Journal of Sociolinguistics, v. 20, n. 4, p. 581–602, 2016.

LOBATO, Monteiro. Reinações de Narizinho. Rio de Janeiro: Globo Livros, 2014 [1933].

NASCIMENTO, M. do. Teoria gramatical e mecanismos funcionais do uso da língua. Delta, v. 6, n. 1, p. 83-98, 1990.

OLIVIERA Jr, Miguel. NURC Digital Um protocolo para a digitalização, anotação, arquivamento e disseminação do material do Projeto da Norma Urbana Linguística Culta (NURC). CHIMERA: Ro-mance Corpora and Linguistic Studies, v. 3, n. 2, p. 149-174, 2016.

Page 14: A dadidade (ou dadidão) do dado - Início · projeto de pesquisa na iniciação científica ou programa equivalente) ... do sintagma; como em uma abordagem da sociolinguística de

FREITAG A dadidade (ou dadidão) do dado

www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |

OUSHIRO, Lívia. Identidade na pluralidade: avaliação, produção e percepção linguística na cidade de São Paulo. Tese (Doutorado em Linguística). Universidade de São Paulo, São Paulo, 2015.

POSSENTI, Sirio. O dado dado e o dado dado (o dado em análise do discurso). In: POSSENTI, Sírio. Os limites do discurso: ensaios sobre discurso e sujeito. São Paulo: Parábola, 2009, p. 23-31.

SAVEDRA, Mônica Maria Guimarães. Estudos e pesquisas em sociolinguística no contexto pluri-língue do Brasil. Revista da Anpoll, v. 1, n. 29, 2010.

SCHER, Ana Paula. Nominalizações em-ada em construções com o verbo leve dar em português brasileiro. Letras de Hoje, v. 41, n. 1, 2006.

SILVA, Leilane Ramos da. Construções lexicais complexas com o verbo dar: estruturas de signifi-cados ou instrumentos de construção de sentidos. Estudos Lingüísticos, v. 34, p. 563-568, 2005.

VANDRESEN, Paulino. A trajetória do GT de Sociolingüística da ANPOLL–1985-2001. In: C. Ron-carati; J. Abraçado (Org.). Português Brasileiro-Contato Lingüístico e História. Rio de Janeiro: 7Le-tras, 2003, p. 13-29.

VOTRE, Sebastião Josué; NARO, Anthony Julius. Mecanismos funcionais do uso da língua. DELTA, v. 5, n. 2, p. 169-184, 1989.

ABSTRACT: The goal of this text is to raise a few remarks on the entity “linguistic data” in order to con-tribute to the formation of linguists. The organization of linguistic datasets considering their authorship, pos-session, ownership and randomness are the aspects under discussion. KEYWORDS: Linguistic data. Authorship. Randomness.

FREITAG, Raquel M.K. A dadidade (ou dadidão) do dado, Linguística Rio, vol.3, n.1, maio de 2017. ISSN: 2358-6826

Enviado: 19 de fevereiro de 2017 Aceito: 18 de abril de 2017

Online: 02 de junho de 2017