verbo try e like

Download Verbo try e like

If you can't read please download the document

Upload: ana

Post on 15-May-2015

2.651 views

Category:

Technology


5 download

TRANSCRIPT

  • 1. Daniela Penharvel de Alvarenga CamposConfrontando o livro didtico de ingls:os verbos try e like numa perspectiva daLingstica de Corpus MESTRADO EM LINGSTICA APLICADA E ESTUDOS DA LINGUAGEMPONTIFCIA UNIVERSIDADE CATLICA DE SO PAULO2006

2. Daniela Penharvel de Alvarenga Campos Confrontando o livro didtico de ingls:os verbos try e like numa perspectiva da Lingstica de Corpus Dissertao apresentada Banca Examinadora da Pontifcia Universidade Catlica de So Paulo, como exigncia parcial para obteno do ttulo de MESTRE em Lingstica Aplicada e Estudos da Linguagem, sob orientao do Prof. Dr. Antonio Paulo Berber Sardinha PUC - SP 2006 3. BANCA EXAMINADORA________________________________________________________________________________________________ 4. Ao Ricardo Helena 5. (Citao opcional) 6. Agradecimentos CAPES que deu o apoio financeiro atravs da bolsa flexibilizada para que eupudesse realizar este estudo sem me afastar da sala de aula.Ao Prof. Dr. Tony Berber Sardinha por sua dedicao, pacincia e conhecimento;por sua presena nos momentos de dvida e por seus comentrios toapropriados ao bom desenvolvimento do trabalho; pelos tantos e da? ditosdurante os seminrios de orientao que me ajudaram a pensar, criticar e crescer.Aos professores do LAEL que demonstram imensa capacidade e dedicao atodos os seus alunos e em especial Prof Dr Maria Antonieta Alba Celani, Prof Dr Leila Brbara e ao Porf. Dr.Tony Berber Sardinha que meacompanharam em meu primeiro contato com a pesquisa cientfica em LingsticaAplicada.s Prof. Dr Maria Antonieta Alba Celani e Lvia Melo pelos comentrios torelevantes durante o exame de qualificao. todos os orientandos do Prof. Dr. Tony Berber Sardinha pelos palpites ecomentrios durante os seminrios de orientao. Giseli Martins Previdente Vicentini por todo o seu apoio desde o incio de meutrabalho, por dividir comigo suas dificuldades e, assim me ajudar a superar asminhas e por estar sempre disposio quando precisei. Caroline que com seu bom humor sempre tirou de letra os momentos maisdifceis. Associao Cultura Inglesa pelo apoio durante o curso, que me permitiu conclu-lo sem prejudicar meu desenvolvimento profissional. 7. Aos meus amigos e colegas professores da Cultura Inglesa por seu apoio einteresse.Ao Ricardo, por todo o seu amor, carinho e pacincia nos momentos de stress eprincipalmente por me estimular a realizar meu sonho, mesmo quando eu dizia serimpossvel. minha me Juraci pelo carinho e compreenso quando eu dizia desculpe, masno posso porque tenho que estudar....Ao meu pai, Francisco que me deixou o sonho e o exemplo de luta.Aos meus outros familiares pelo apoio e compreenso nos vrios almoos dedomingo e feriados em que no pude estar presente.A todos os meus amigos que estiveram presentes, mesmo quando eu estiveausente.Finalmente, Helena que participou da escrita da dissertao desde janeiro e aquem tenho um amor incondicional, mesmo antes de ver seu rostinho. 8. ResumoO trabalho teve como objetivo principal investigar a fraseologia dos verbostry e like em ingls e confrontar as informaes obtidas por meio da anlise dosdados com a prescrio de uso sugerida pelo livro didtico Inside Out- Upper-Intermediate, adotado pela escola em que trabalho.Para tanto, o trabalho utilizou o suporte terico da Lingstica de Corpus,que a rea que se preocupa com a coleta e explorao de corpora eletrnicos,por meio de computadores, de maneira criteriosa. Apesar de haver muitostrabalhos baseados no uso de corpora para o ensino, no h qualquer pesquisaque busque descrever o que foi descrito neste trabalho, principalmente no tocanteao uso dos dados obtidos para o ensino de lngua inglesa. Portanto, esta pesquisaprocura preencher esta lacuna.Foram levantadas trs perguntas de pesquisa relativas fraseologia dosverbos try e like, a fim de alcanar o objetivo proposto.O Corpus empregado nesta pesquisa foi o BNC (British National Corpus),um corpus de falantes nativos de ingls britnico, com diversas variedadeslingsticas, que conta com mais de 100 milhes de palavras.A anlise do corpus permitiu que fossem observadas diferenas entre o usoprescrito pelo livro didtico e o uso feito por falantes nativos de lngua inglesa, oque era o objetivo deste trabalho.A pesquisa pretende ter contribudo para a rea de Lingstica de Corpus eEnsino ao demonstrar como a utilizao de dados reais pode ser uma ferramentaimportante e essencial no ensino de lngua estrangeira. 9. Abstract The main aim of this study was to investigate the phraseology of the verbstry and like in English and confront the information gathered through the analysisof the data with the usage suggested by the course book Inside Out- Upper-Intermediate, adopted by the school I work for. In order to do so, the main theoretical support was provided by CorpusLinguistics, which is the area concerned with the collection and analysis ofcriteriously selected corpora, by means of computers. Although there are a numberof studies based on the use of corpora in teaching, there is not any studyconcerned with describing what has been described in this one, mainly in respectof the use of the data gathered to the teaching of a foreign language. Therefore,this study aims at closing this gap in literature. Three questions were investigated in order to study the phraseology of theverbs try and like, in order to reach the objective of the study. The corpus used in the study was the BNC (British National Corpus), whichis a corpus of native speakers of British English, of different linguistic varieties, thathas more than 100 million words. The corpus analysis led us to the observation of differences between theusage suggested by the course book and the usage made by native speakers ofEnglish, which was the main aim of this study. The study presented may have contributed to the existing corpus-basedresearch, especially in the area of Corpus Linguistics and the Teaching of Englishas Foreign Language, as it shows how the use of real data can be an importantand essential tool to the teaching of English as a foreign language. 10. SUMRIOIntroduo...............................................................................................11. Justificativa.......................................................................................... 42. Objetivo e perguntas de pesquisa..................................................... 53. Organizao da dissertao................................................................6Captulo 1: Fundamentao Terica....................................................71.1 Lingstica de Corpus .......................................................................71.1.1 Metodologia ou abordagem?......................................................9 1.1.2 Breve histrico...........................................................................11 1.1.3 Empirismo versus racionalismo.................................................121.1.3.1 Probabilidade e freqncia ................................................. 161.1.4 O que um corpus?.................................................................. 171.1.5 Padres....................................................................................19 1.1.5.1 Colocao............................................................................ 20 1.1.5.2 Coligao.............................................................................221.2 A Lingstica de Corpus e o ensino de lnguas................................. 24 1.2.1 Por que utilizar corpus no ensino?............................................24 1.2.2 A aplicao da Lingstica de Corpus no ensino......................27 1.2.2.1 O Currculo Lexical.............................................................. 28 1.2.2.2 Abordagem Lexical.............................................................. 29 1.2.2.3 Aprendizado Movido a Dados (DDL)................................... 301.2.3 Livro Didtico.............................................................................311.2.4 O ensino de gramtica..............................................................32 1.2.4.1 Por que ensinar gramtica?................................................34 1.2.4.2 Gramtica de Padres......................................................... 34Captulo 2:Metodologia.........................................................................372.1 Contexto de pesquisa........................................................................ 372.2 Livro didtico.....................................................................................392.3 Objetivo e perguntas de pesquisa.....................................................422.4 O corpus ........................................................................................... 422.5 Metodologia e procedimentos de anlise.......................................... 432.5.1 Ferramenta de anlise................................................................442.5.2 Procedimentos de anlise...........................................................502.6 Resumo da Metodologia................................................................... 54Captulo 3: Anlise dos dados............................................................. 553.1 Anlise de like................................................................................... 55 11. 3.1.1 Like to. 55 3.1.2 Like -ing...58 3.1.3 Like to versus like-ing.... 60 3.1.3.1 Like to be versus like being.................................................. 643.1.3.2 Like to do versus like doing663.1.3.3 Like to see versus like seeing 683.1.3.4 Like to go versus like going693.1.3.5 Like to have versus like having.713.2 Anlise de try..................................................................................... 733.2.1 Try to....733.2.2 Try ing763.2.3 Try to versus try ing.....78 3.2.3.1 Try to use versus try using.... 81 3.2.3.2 Try to get versus try getting.. 84 3.2.3.3 Try to make versus try making. 86 3.2.3.4 Try to do versus try doing 88 3.2.3.5 Try to be versus try being 903.3 Anlise de tried92 3.3.1 Tried to.92 3.3.2 Tried ing. 95 3.3.3 Tried to versus tried ing 973.3.3.1 Tried to get versus tried getting.1003.3.3.2 Tried to tell versus tried telling1023.3.3.3 Tried to put versus tried putting.1033.3.3.4 Tried to take versus tried taking 1053.3.3.5 Tried to be versus tried being 106Consideraes finais............................................................................109Referncias Bibliogrficas................................................................... 111Anexos..................................................................................................... 119Anexo1: Linhas de Concordncia: like to be............................................119Anexo 2: Linhas de Concordncia: like being.......................................... 125Anexo 3: Linhas de Concordncia: like to do...........................................131Anexo 4: Linhas de Concordncia: like doing.......................................... 134Anexo 5: Linhas de Concordncia: like to see......................................... 137Anexo 6: Linhas de Concordncia: like seeing........................................142Anexo 7: Linhas de Concordncia: like to go...........................................143 12. Anexo 8: Linhas de Concordncia: like going..........................................145Anexo 9: Linhas de Concordncia: like to have....................................... 147Anexo 10: Linhas de Concordncia: like having......................................150Anexo 11:Linhas deConcordncia:tryto 152use.........................................Anexo 12: Linhas de Concordncia: try using.......................................... 154Anexo 13: Linhas de Concordncia: try to get......................................... 156Anexo14: Linhasde Concordncia: try 167getting........................................Anexo15: Linhas de Concordncia: try to168make......................................Anexo 16: Linhas de Concordncia: try making....................................... 177Anexo 17: Linhas de Concordncia: try to do.......................................... 178Anexo18: LinhasdeConcordncia:try 184doing..........................................Anexo 19: Linhas de Concordncia: try to be.......................................... 185Anexo 20: Linhasde Concordncia:try 190being..........................................Anexo 21: Linhas de Concordncia: tried to get...................................... 191Anexo22: Linhas de Concordncia:tried 202getting.....................................Anexo 23: Linhas de Concordncia: tried to tell....................................... 203Anexo 24: Linhas de Concordncia: tried telling......................................206Anexo 25: Linhas de Concordncia: tried to put...................................... 207Anexo26: Linhasde Concordncia:tried 210putting.....................................Anexo27:Linhas deConcordncia:tried to 211take.....................................Anexo 28: Linhas de Concordncia: tried taking...................................... 214Anexo 29: Linhas de Concordncia: tried to be....................................... 215Anexo 30: Linhasde Concordncia:tried 218being.......................................Anexo 31: Pginas do livro didtico......................................................... 219Lista de FigurasFigura 1-Tela estatstica da ferramenta WordList.................................45Figura 2- Tela do WordList: palavra like no corpus.................................. 46Figura 3- Tela do WordList: palavra try no corpus................................... 47Figura 4- Tela da ferramanta Concord com algumas linhas deconcordncia de like to............................................................................. 48Figura 5- Tela do Concord com os colocados de like 13. to.............................................................................................................. 49.Lista de GrficosGrfico 1- Probabilidade de ocorrncia de infinitivo e gerndio com like. 61Grfico 2- Freqncia de uso dos cinco primeiros colocados de like noinfinitivo ou no gerndio........................................................................... 63Grfico 3- Freqncia de ocorrncia de infinitivo e gerndio com try...... 78Grfico 4- Freqncia dos cinco primeiros colocados de try no infinitivoou no gerndio.........................................................................................80Grfico 5- Freqncia de ocorrncia de infinitivo e gerndio com tried...97Grfico 6- Freqncia dos cinco primeiros colocados de tried noinfinitivo ou no gerndio........................................................................... 99Lista de QuadrosQuadro 1- Nmero de palavras por nvel.................................................28Quadro 2- classificao de corpora em relao grandeza.................... 43Quadro 3- 100 primeiros colocados de like to.......................................... 56Quadro 4- Verbos colocados de like to....................................................57Quadro 5- Colocados de like no gerndio................................................59Quadro 6- verbos que seguem like no gerndio...................................... 59Quadro 7- Colocados de like no infinitivo e no gerndio,respectivamente....................................................................................... 62Quadro 8- Colocados de try to na posio R2......................................... 74Quadro 9- Verbos colocados de try to na posio R2.............................. 75Quadro 10- Colocados de try no gerndio na posio R1....................... 76Quadro 11- Verbos colocados de try no gerndio.................................... 77Quadro 12- Colocados de try no infinitivo e no gerndio,respectivamente....................................................................................... 79Quadro 13- Freqncia de uso de infinitivo ou gerndio com verbosdeslexicalizados.......................................................................................80Quadro 14- Colocados de tried to............................................................ 93Quadro 15- Verbos colocados de tried to................................................. 94Quadro 16- Colocados de tried no gerndio............................................95Quadro 17- Verbos colocados de tried no gerndio.................................96Quadro 18- Colocados de tried no infinitivo e no gerndio,respectivamente....................................................................................... 98 14. INTRODUOVivemos em um mundo globalizado em que o conhecimento de lnguaestrangeira no apenas desejvel, mas sim fundamental. Rajagopalan (no prelo)considera que o ingls no apenas mais uma lngua; ele a commodity quemais vende no mercado de ensino de lngua estrangeira.Tendo em vista a importncia do conhecimento do ingls por parte dosalunos em geral e a busca que estes alunos fazem de aprender um ingls quesatisfaa suas necessidades imediatas de comunicao, sejam elas no mercadode trabalho ou para outros propsitos, como em relaes sociais ou viagens aoexterior, preciso que haja um novo olhar sobre o que os alunos precisamaprender e, principalmente, sobre o qu e como vamos ajud-los a faz-lo. Dentrodeste contexto, temos muitas vezes de lidar com questionamentos como em quesituao vou utilizar isto? ou saber falar assim realmente importante, j queconsigo me comunicar?, perguntas que, muitas vezes, no sabemos comoresponder.Considerando que hoje em dia os alunos de lngua estrangeira possuemmais acesso lngua fora da sala de aula do que dentro dela, seja por meio defilmes, noticirios, sries e outros programas de TV a cabo ou por meio dasinformaes via Internet, onde jornais, revistas e usurios em geral publicamtextos, proporcionar aos alunos oportunidades de aprenderem por meio dalinguagem real, parece ser lgico e necessrio. Entretanto, muitas escolas deidiomas ainda adotam livros didticos, escritos por falantes nativos1, que nemsempre esto atualizados, no apenas porque h uma demora muito grandedesde sua escrita at a sua publicao, mas, principalmente, porque a lngua viva e passvel de transformaes constantes, que o autor pode ignorar por confiarem seu saber de falante nativo.Alm do livro didtico adotado pelas escolas, h, ainda, a questo danecessidade de formar professores que estejam cada vez mais preparados para1 Hoje em dia h uma grande discusso acerca do conceito de falante nativo, que se mostra bastantecontroverso. Autores como Canagarajah (1999) e Rajagopalan, alm de outros , discutem o que seriaum falante nativo alm das implicaes de ser ou no um professor que no falante nativo de ingls.1 15. trabalhar com seus alunos considerando suas necessidades de aprendizagem. Seos alunos apresentam a necessidade cada vez maior de se comunicarem em umavariedade de situaes profissionais e sociais, preciso que o professor tambmseja capaz de compreender a lngua como instrumento de comunicao eexpresso e no apenas como cdigo. cada vez mais importante que os alunos estejam em contato com alinguagem real dentro da sala de aula para que eles possam desempenhar melhoro seu papel no mundo real. Quando viajam ao exterior, por exemplo, os alunos sedeparam com uma linguagem bastante diferente daquela fornecida pelo livrodidtico, que prev o qu cada um dos participantes falar em um determinadomomento da conversa e, ao viverem esta experincia, questionam se de fato oingls que aprenderam na escola de idiomas foi eficiente.Entretanto, preciso considerar que o livro didtico no o nicoresponsvel pela aprendizagem do aluno, at porque em muitos casos no se usalivro didtico ou o material didtico de qualidade muito questionvel e mesmoassim os alunos aprendem. Como mencionado anteriormente, existe anecessidade de contarmos com professores que estejam cientes da importnciade complementar as informaes fornecidas pelo livro didtico com seu prprioconhecimento e experincia e tambm com materiais autnticos, que possamrefletir a linguagem utilizada em situaes reais.Assim, tanto escolas como professores devem ter a preocupao de trazerpara a sala de aula materiais que estejam atualizados e que reflitam a linguagemreal. Embora esta no seja uma tarefa fcil, visto que h muitas vezes a limitaode tempo, de recursos e at de conhecimento sobre como faz-lo, professores eescolas cada vez mais podem contar com estudos baseados em corpora que tmsido publicados com a inteno de mostrar a relevncia da pesquisa baseada emdados reais e de fornecer idias , por meio da sugesto de tarefas e atividadesbaseadas em corpus.Bem como vrios professores que tambm possuem a experincia de daraulas para alunos de nvel ps-intermedirio, que muitas vezes se queixam de nover relevncia no que esto aprendendo, por j serem capazes de se comunicar,2 16. eu tambm passei por momentos em que no sabia como explicar a relevncia dealguns pontos que o livro didtico propunha, mas que eu considerava muitodetalhistas ou, de certa forma, at irrelevantes naquele momento. Em algunscasos, principalmente com tpicos gramaticais, parecia que exemplos eramcriados apenas para ilustrar uma regra, o que gerava confuso por parte dosalunos e demandava do professor um grande esforo para tentar fazer com que osalunos entendessem. Ento, a motivao deste trabalho surgiu de minhas tentativas de elucidarum dos pontos propostos pelo livro (o uso de infinitivo ou gerndio aps os verbostry e like), para melhor ajudar meus alunos a compreend-lo e enfrentou o desafiode desenvolver um estudo criterioso que pudesse ser utilizado por professores eautores de livros didticos. O tpico que foi escolhido o uso de infinitivo ou degerndio depois dos verbos try e like, que segundo o autor do livro didtico,implicaria em mudana de sentido. Assim como Souza (2005) e Vicentini (2006),que tambm desenvolveram pesquisas de mestrado baseadas no mesmo livrodidtico, propondo atividades baseadas em corpus para o ensino de ingls comolngua estrangeira, procuro aqui preencher uma lacuna em termos de pesquisa,acadmica, por meio da anlise dos verbos try e like a fim de contribuir comprofessores e autores de livros didticos, j que no h outro trabalho publicadoque trate deste assunto. Para realizar tal estudo, o suporte terico utilizado foi a Lingstica deCorpus, que pode ser definida como a rea da Lingstica que se ocupa da coletae explorao de corpora, ou conjuntos de dados lingsticos textuais, em formatolegvel por computador, que foram coletados criteriosamente com o propsito deservirem para a pesquisa de uma lngua ou variedade lingstica (BerberSardinha, 2004: 03). A partir de conceitos desenvolvidos por estudiosos decorpus, como Firth e Sinclair e tambm por Halliday, que no lingista decorpus, mas que muito contribuiu com a Lingstica de Corpus, possvel encarara linguagem de maneira diferente da que a maioria dos livros didticos prope, ouseja, entender a linguagem como um sistema probabilstico (Halliday, 1991) e apartir do princpio da idiomaticidade (Sinclair, 1987). 3 17. Alm contribuir com conceitos para o estudo da linguagem em geral, aLingstica de Corpus tambm tem sido bastante utilizada no ensino de lnguas,pois ela proporciona, conforme discutido por Hunston, Francis e Fox (1998), aoportunidade de refletirmos de maneira diferente sobre o ensino do lxico e dagramtica, duas reasgeralmentevistas como diversas e abordadasseparadamente pelos livros didticos. Dentro da Lingstica de Corpus ambos secompletam e formam uma s unidade, que no pode ser dissolvida quando seestuda um aspecto ou outro. Assim, no desenvolvimento desta pesquisa, aLingstica de Corpus foi essencial para a anlise lingstica de padres.1- JustificativaA relevncia e a necessidade deste estudo esto primeiramente baseadasem minha prtica. Sou professora de um instituto de idiomas, bastanteconceituado no mercado, com filias tanto na Grande So Paulo quanto no interiore jont-ventures no interior, em que metade das salas de aula de cada uma dasfiliais equipada com data-show e computadores que possuem acesso Internet.Embora a prpria instituio desenvolva a maioria dos materiais a serem utilizadospelos professores nestas salas de aula (chamadas de e-classes), por meio deprogramas como o PowerPoint, nenhum dos materiais desenvolvidos para o nvelpsintermedirio utiliza linhas de concordncia extradas de corpora para aanlise lingstica, como a que feita neste trabalho.Em segundo lugar este trabalho importante porque no h utraspesquisas disponveis na literatura com base em corpus que se propem aestudar este assunto. Assim, a importncia terica deste estudo est empreencher uma lacuna deixada por outros estudos e gramticas que procuramdescrever a lngua sem o uso de dados reais e sem levantamento sistemticodesses usos.Finalmente, este estudo relevante, pois fornece informaes valiosas aprofessores e autores de livros didticos. Essas informaes esto baseadas emuma anlise criteriosa de lngua autntica de falantes nativos do ingls britnico4 18. que podem vir a ser transformadas em atividades que levem os alunos aobservarem a lngua autntica, em uso, para chegarem s suas prpriasconcluses sobre determinado ponto gramatical, ao invs de lhes fornecer umaregra ilustrada por exemplos inventados.Portanto, este trabalho visa a fornecer uma contribuio original Lingstica Aplicada e mais especificamente rea de Lingstica de Corpus eensino de lngua estrangeira, j que no h muitos trabalhos publicados nestarea, lidando com a anlise lingstica e sua aplicao em sala de aula.2- Objetivo e perguntas de pesquisaA pesquisa teve como objetivo estudar a fraseologia dos verbos try e likeem corpora eletrnicos, a fim de confrontar os resultados obtidos com a pesquisae as informaes presentes no livro didtico e descobrir se h diferena desentido2.Para alcanar o objetivo exposto acima, as seguintes perguntas depesquisa foram levantadas, tanto para o verbo try como para o verbo like: 1- Quais so os padres verbais mais freqentemente utilizados pelosnativos de ingls britnico para os verbos try e like?2- Qual pode ser a relao entre os padres utilizados e seus sentidos?3- Como os sentidos advindos da padronizao corroboram ou no aprescrio indicada no livro?3- Organizao da dissertaoA dissertao est organizada em 3 captulos, sendo que o captulo 1 traz afundamentao terica, em que os principais conceitos da Lingstica de Corpus e2 Na literatura da Lingstica de Corpus no h muita clareza sobre o uso de sense que em portuguspode ser traduzida como sentido ou meaning que pode ser traduzido como significado. Portanto,embora haja tericos de outras escolas que tenham um posicionamento claro acerca deste assunto,como Vygotsky e Lyons, ao longo deste trabalho ser utilizada a traduo sentido. 5 19. o uso da Lingstica de Corpus para o ensino de lngua estrangeira so discutidos.No captulo 2, so abordados os aspectos metodolgicos, como o corpus utilizado,os conceitos fornecidos pelo livro didtico e os procedimentos de anliseempregados. No terceiro captulo, h a descrio e interpretao dos dadosextrados do corpus. Por fim, fao minhas consideraes finais e o fechamento doestudo. Nos anexos apresento todas as linhas de concordncia estudadas e aunidade do livro didtico que foi utilizada.6 20. Captulo 1: Fundamentao TericaO objetivo deste captulo descrever os pressupostos tericos queembasamesta pesquisa.Para tanto,serotratados aspectos como:consideraes tericas sobre a Lingstica de Corpus, incluindo sua definio eseu status dentro da Lingstica, um breve histrico de seu desenvolvimento, adicotomia entre as vises racionalista e empirista da linguagem e a definio deCorpus. Ser discutido, tambm, um dos principais conceitos da Lingstica deCorpus relevante para este trabalho, o conceito de padres, bem como dois outrosconceitos que fazem parte dos padres: a colocao e a coligao. Finalmente,sero enfocados dois aspectos: a gramtica e o ensino de lnguas baseados emcorpus.1.1 Lingstica de CorpusConforme dito na Introduo, o trabalho aqui proposto tem comofundamentao terica principal a Lingstica de Corpus, que por ser uma reanova, h divergncias sobre como conceitu-la. De acordo com Aijimer &Altenberg (1991: 01), a Lingstica de Corpus pode ser descrita como o estudoda linguagem com base em corpora.3 Segundo McEnery & Wilson (1996:01)pode ser mais bem definida, em termos simples, como o estudo da linguagembaseado em exemplos da linguagem usada na vida real.4 (minha trad.). Nestacitao possvel destacar um dos princpios em que se baseia a Lingstica deCorpus: a linguagem utilizada na vida real, isto , autntica.3 Corpus linguistics can be described as the study of language on the basis of text corpora4Corpus Linguistics is perhaps best described for the moment in simple terms as the study oflanguage based on examples of real life language use. 7 21. J Granger (2002:04) v a Lingstica de Corpus como uma metodologialingstica que est fundamentada no uso de colees de textos que ocorremnaturalmente, isto , corpora.5 possvel observar que Granger encara aLingstica de Corpus como uma metodologia, o que ser discutido mais adiante.Por sua vez, Berber Sardinha (2004: 03) define a Lingstica de Corpus daseguinte maneira:A Lingstica de Corpus se ocupa da coleta e da explorao de corpora, ouconjuntos de dados lingsticos textuais que foram coletados criteriosamente,com o propsito de servirem para a pesquisa de uma lngua ou variedadelingstica. Como tal, dedica-se explorao da linguagem atravs deevidncias empricas, extradas por meio do computador.Berber Sardinha, em sua definio, menciona dois aspectos, as evidnciasempricas e o uso de computador pela Lingstica de Corpus, que segundo Biber,Conrad & Reppen (1998:04), so parte integrante das quatro caractersticas queatribuem anlise baseada em corpus:- emprica, analisando os padres reais de uso em textos naturais;-utiliza uma grande e criteriosa coleo de textos, conhecidos como umcorpus, como base de anlise;-faz largo uso de computadores para a anlise, utilizando tanto tcnicasautomticas quanto interativas;- depende tanto de tcnicas qualitativas quanto quantitativas de anlise.(minha trad.)6O conceito de corpus ser discutido mais adiante neste estudo.1.1.1 Metodologia ou Abordagem?5Corpus linguistics can best be defined as a linguistic methodology which is founded on the use ofelectronic collections of naturally occurring texts, viz. corpora.6 -it is empirical, analysing the actual patterns of language use in natural texts; -it utilizes a large and principled collection of natural texts, known as a corpus, as the basis foranalysis; -it makes extensive use of computers for analysis, using both automatic and interactive techniques; -it depends on both quantitative and qualitative analytical techniques.8 22. Como vimos nas definies anteriores, a Lingstica de Corpus foiconceituada como estudo, metodologia e rea, ento um dos aspectos largamentediscutidos pelos tericos da Lingstica de Corpus se ela seria uma basemetodolgica ou uma rea de pesquisa. (Tognini-Bonelli, 2001:01). Cabe,portanto, neste momento discutir o status da Lingstica de Corpus dentro daLingstica. Monaghan (1979) j via o papel da Lingstica sob um prisma diferente,quando disse que ... a Lingstica deveria em princpio se preocupar com alinguagem em sua situao social, ao invs de simplesmente com uma coleo deunidades estruturais para serem analisadas individualmente. Segundo o ponto devista dos estudiosos britnicos neo-firthianos (Halliday e Sinclair, principalmente),a Lingstica deve ser vista como uma cincia social e aplicada, que estuda dadosautnticos, e no inventados, e que tenha como objeto de estudo o sentido, umavez que a forma e o sentido so inseparveis (Stubbs, 1993:02). Dentro dessa viso de Lingstica, como uma cincia que se encarrega doestudo a linguagem de maneira aplicada, com dados reais, possvel ver aLingstica de Corpus como sendo mais do que uma rea de estudos, dentro daLingstica, como a Psicolingstica ou a Sociolingstica. Ao invs disso, ela (aLingstica de corpus) uma base metodolgica para fazer pesquisa lingstica 7(Leech, 1992:105, minha trad.). Sendo assim, possvel dizer que a Lingstica deCorpus pode ser utilizada para estudar diversas reas da lingstica, como afontica, a sintaxe e at mesmo a sociolingstica. Ento, quais seriam os aspectos aos quais a Lingstica de Corpus dmaior ateno se comparada a outras reas da Lingstica? Segundo Leech(1992: 107), h quatro focos de ateno principais da Lingstica de Corpus: odesempenho lingstico, a descrio lingstica, modelos quantitativos equalitativos de linguagem e, finalmente, a viso emprica. No que se refere ao foco no desempenho, a Lingstica de Corpus sepreocupa com as manifestaes de linguagem que ocorrem de maneira natural,7but rather to a methodological basis for pursuing linguistic research.9 23. ou autntica, nos discursos escritos e falados. Quanto descrio lingstica, aateno da Lingstica de Corpus est voltada para descrever aspectos de umadada lngua e no da natureza da linguagem em geral; por isso, os dados acabamsendo mais concretos e tm maior possibilidade de serem observados. O terceirofoco mencionado a metodologia de estudo, em geral, tanto quantitativa quantoqualitativa, pois a freqncia de ocorrncia dos elementos de estudo quantitativa, mas sua anlise pode ser feita qualitativamente. Finalmente, a visoemprica, que se pauta pela observao, j que a observao contribui mais paraa teoria do que a teoria contribui para a observao. 8(Leech, 1992:111, minhatrad.).McEnery & Wilson (1996: 02) parecem estar de acordo com esta viso deLeech, no considerando a Lingstica de Corpus como um ramo da Lingstica,como a Sintaxe ou a Sociolingstica, uma vez que cada uma destas diferentesreas que se concentram em descrever/ explicar algum aspecto do uso dalinguagem9, ao passo que a Lingstica de Corpus pode atuar como umametodologia a ser utilizada em outras reas como o ensino, por exemplo, sem seapresentar como uma rea em si mesma.Berber Sardinha (2004: 35-37) discute qual, ento, seria o status daLingstica de Corpus. De simplesmente metodologia, como para McEnery &Wilson (1996) ou de abordagem, como para Hoey (apud Berber Sardinha, 2004),que diz que a Lingstica de Corpus seria uma rota para a lingstica. Nesteestudo, a Lingstica de Corpus ser entendida como uma abordagem, ou seja,como uma perspectiva, isto uma maneira de se chegar linguagem (BerberSardinha, 2004:37).1.1.2 Breve Histrico8... observation contributes to theory more than theory contributes to observation.9 concentrate on describing/explaining some aspect of language use 10 24. Embora muitas pessoas acreditem que a Lingstica de Corpus seja umaabordagem nova, por utilizar ferramentas tecnolgicas como o computador paraanalisar dados, o fato que a compilao de corpora vem ocorrendo desde aGrcia Antiga, segundo Berber Sardinha (2004) e, desse modo, o estudo dalinguagem com exemplos de uso pode ser visto como uma atividade bastanteantiga.Sem a ajuda de computadores, na primeira metade do sculo XX,pesquisadores como Thorndike (1921), que era um educador, coletavam eanalisavam o corpus manualmente, com o interesse principal no ensino de lxicoe gramtica para estudantes de lnguas. Alm do ensino de lnguas, a lexicografiatambm se beneficiou da coleta de amostras de linguagem autntica para aconfeco do Oxford English Dictionary (1933).Nos anos 50, nos Estados Unidos, os lingistas, entre eles Fries,acreditavam que o qu deveria ser estudado era um corpus de discursosautnticos (Leech, 1992:105).10 Foi no final dos anos 50 que nasceu o SEU(Survey of English Usage), um corpus no computadorizado que deu feio aoscorpora atuais (Berber Sardinha, 2000:326) e que seria uma referncia paraoutros corpora, que viriam mais tarde, como o Brown. O SEU, que teriaaproximadamente um milho de palavras, foi organizado em fichas e as palavrasforam analisadas gramaticalmente.Entretanto, no final dos anos 50 e incio dos 60 a Lingstica de Corpuspassou a sofrer crticas, pois com o advento da teoria gerativista de Chomsky, oparadigma passa de empirista para racionalista (o que ser discutido mais adiantena dissertao). As crticas a Lingstica de Corpus estavam fundamentadas nacoleta e anlise manual de corpora gigantescos, o que poderia ser causa de errosde anlise e, conseqentemente, generalizaes incorretas.A Lingstica de Corpus retomou seu flego com a inveno doscomputadores. Sendo mquinas, eles teriam maior capacidade de armazenar eprocessar dados e menor margem de erros. Nos anos 80 a Lingstica de Corpus10 ...a corpus of naturally occurring discourse...11 25. volta ao cenrio das pesquisas com maior fora e se desenvolve mais fortementena Europa do que nos Estados Unidos.A Gr-Bretanha possui diversas universidades que se dedicam a estudosbaseados em corpus, desenvolvendo as mais diversas reas. Alm de realizar osestudos, estas universidades tambm criaram diversos corpora que propiciaramtanto a descrio terica da linguagem quanto o desenvolvimento de materiais.Um exemplo disso o projeto COBUILD, desenvolvido pela universidade deBirmingham em parceria com a editora Collins.1.1.3 Empirismo versus RacionalismoAs vises emprica e racionalista datam de longa data. Desde a GrciaAntiga, filsofos como Plato e Aristteles, tinham vises diferentes sobre comose dava o conhecimento. Desde ento, a dicotomia entre as duas correntes depensamento, racionalista e empirista j existia. Essa discusso torna-se pertinentepara a Lingstica de Corpus porque ela baseia seus estudos em dados advindosda observao da linguagem ao invs de encarar a linguagem como algo que predefinido .Plato, que pode ser considerado nativista ou racionalista, acreditava que aorigem da linguagem era inata, ou seja, no h aprendizagem verdadeira(Sampson, 1997:04)11, tudo o que sabemos j est armazenado em nossocrebro. Corroborando esta viso, no sculo XVII, Descartes desenvolve suateoria sob um prisma mais Cristo: Deus colocou o conhecimento no crebro dacriana desde que ela est no tero da me. Podemos dizer, ento, que a origemdo conhecimento, segundo a viso racionalista, dada, ou seja, dedutiva, que vaido todo para a parte (ou da teoria para a observao).Aristteles, por sua vez, acreditava que o conhecimento era aprendido, ouseja, a inteligncia seria uma faculdade a ser desenvolvida. Da mesma maneiraque Plato, Aristteles teve seguidores de seu pensamento, como John Locke,que desenvolveu o empirismo na segunda metade do sculo XVII, segundo o qual11 There is no true learning... 12 26. apenas a experincia gera o conhecimento (Sampson, 1997:06)12. Assim, possvel dizer que no empirismo so os dados, ou a observao, que levam teoria.Essas duas correntes continuam fortes na filosofia, mas na Lingstica arelao de foras entre as duas se altera significativamente na segunda metadedosculo XXcomaGramtica Gerativo-Transformacional(e seusdesdobramentos) de Noam Chomsky.No sculo XX, na lingstica, Chomsky defende a viso nativista de Platoe Descartes e passa a ver a linguagem como universal, focando sua ateno noque as diferentes linguagens tm em comum. Para Chomsky, o conhecimentolingstico inato, o que garante que a capacidade lingstica se desenvolva muitocedo nas crianas.Chomsky acredita que o conhecimento de uma lngua se manifesta de duasmaneiras bsicas; uma delas denominada competncia (inata) e a outra seria odesempenho. Embora reconhea a existncia de ambas, Chomsky se preocupaem seu trabalho apenas com a competncia que segundo ele, permite ao falantenativo que reconhea o que possvel ou no em sua lngua, por meio de suaintuio (Leech, 1992:107).Entretanto, Chomsky no acredita que seu estudo da gramtica possa serutilizado para o ensino de lnguas. Seu estudo no se destina aplicao emcursos de lnguas, mas tem o objetivo de teorizar sobre a lngua, por isso seu focoest na competncia lingstica e no no desempenho.Assim, se olharmos para o ensino de lnguas, segundo esta viso, oprofessor poderia inventar exemplos e as aulas seriam basicamente focadas nagramtica. O ensino da gramtica, por sua vez, seria visto como parte de umsistema slot and filler em que um texto visto como uma srie de espaos embranco, que deve ser completado com uma palavra que satisfaa as restrieslocais (Sinclair, 1987:320)13.Portanto dentro de tal viso seria possvel criar12... only experience generates knowledge....13... envisaging text as a series of slots which have to be filled from a lexicon which satisfies localrestraints 13 27. sentenas inadequadas sob o ponto de vista da colocao (que ser discutidamais adiante). Se por um lado o racionalismo de Chomsky se baseia na intuio, por outrolado o empirismo que na lingstica, tem seus maiores representantes em Firth,Halliday e Sinclair, est fundamentado sobre a observao. Sampson (2001:02)diz que os dados de intuies podem ser abundantes, mas que eles soirremediavelmente falveis.14 Biber et al. (1998:09) parece concordar com estaviso dizendo que: ...estudos abrangentes de uso no podem confiar na intuio, evidncia baseada na experincia pessoal, ou em pequenas amostras; eles, ao contrrio, requerem anlise emprica de grandes quantidades de dados autnticos, como na abordagem baseada em corpus. 15 Firth foi um dos expoentes da lingstica na Gr-Bretanha e acreditava quea linguagem era muito mais do que a estrutura, ela era tambm um meio deproduzir sentido dentro de um contexto (Monaghan, 1979: 31). Para Firth, osentido a relao funcional da orao como um todo com o contexto desituao dentro do contexto de cultura (Firth, 1957:12 apud Monaghan, 1979:32)16. Este conceito de Firth serviu como base para Halliday, um de seusseguidores, criar sua teoria da Gramtica Sistmico-Funcional, em que eledesenvolve os conceitos de gnero e registro (chamados por Firth de contexto decultura e contexto de situao, respectivamente). Esta teoria de Halliday, tambmtrata da lxico-gramtica, que pode ser analisada por meio de uma abordagembaseada em corpus. Embora esta seja uma teoria de extrema importncia dentrodo cenrio da lingstica na atualidade, ela no ser trabalhada detalhadamentenesta pesquisa, por no fazer parte do escopo da mesma.14 The data of intuitions may be abundant, but they are hopelessly unreliable15 comprehensive studies of use cannot rely on intuition, anecdotal evidence, or small samples; theyrather require empirical analysis of large databases of authentic texts, as in the corpus-based approach.16 is the functional relation of the sentences as whole to the processes of a context of situation in thecontext of culture 14 28. O trabalho de Halliday traz uma grande contribuio Lingstica deCorpus, ao ver a linguagem como um sistema probabilstico, ao passo queChomsky via a linguagem como possibilidade. Para Halliday (1991:32), aimportncia da probabilidade est no em prever, mas em interpretar. Parte dosentido de escolher um termo a probabilidade com que este termo escolhido.17 Berber Sardinha (2004: 30-31) diz que a viso da linguagem comosistema probabilstico pressupe que, embora muitos traos lingsticos sejampossveis teoricamente, no ocorrem com a mesma freqncia.Um outro terico seguidor de Firth John Sinclair. Enquanto Halliday voltouseus estudos para a gramtica, Sinclair deu maior ateno ao lxico e contribuimuito para o desenvolvimento da Lingstica de Corpus Em contraste com oprincpio slot-and-filler, mencionado acima, Sinclair desenvolve o conceito deprincpio idiomtico.Segundo o princpio idiomtico, um usurio da linguagem tem ao seudispor um grande nmero de expresses pr-construdas, que constituem umaescolha nica, embora possam parecer analisveis em segmentos (Sinclair,1987:320)18. Berber Sardinha (2004:33) diz que Sinclair faz a descrio dalinguagem do ponto de vista lexical, cuja perspectiva a descrio de quaisagrupamentos lexicais so realmente empregados pelos falantes, isto , atestadospelo uso.Finalmente, possvel dizer que a importncia de realizarmos estudosbaseados em dados empricos reside no fato de podermos investigar comofalantes e escritores exploram os recursos de sua prpria linguagem. Ao invs deolharmos o que possvel teoricamente em uma lngua, ns estudamos alinguagem real utilizada em textos autnticos (Biber, Conrad & Reppen, 1998: 1)19. McEnery & Wilson (1996:87) afirmam que:17 lies not in predicting, but interpreting. Part of the meaning of choosing any term is the probabilitywith which that term is chosen.18 a language user has available to him or her a large number of semi-preconstructed phrases thatconstitute single choices, even though they might appear to be analyzable into segments19We can investigate how speakers and writers exploit the resources of their language. Rather thanlooking at what is theoretically possible in a language, we study the actual language used in naturallyoccurring texts. 15 29. Dados empricos permitem que o lingista faa afirmaes objetivas ebaseadas na linguagem como ela realmente ao invs de afirmaessubjetivas e baseadas na percepo cognitiva j internalizada do indivduo.20Nesta subseo fornecemos discutimos as vises empirista e racionalista,procurando apontar os principais tericos das duas correntes e mostrar a relaoentre o empirismo e a Lingstica de Corpus. Na prxima subseo serodiscutidos dois conceitos de grande relevncia para estudos baseados em corpus:a probabilidade e a freqncia.1.1.3.1 Probabilidade e freqnciaUm dos aspectos mencionados na discusso da viso racionalista versusemprica da linguagem, foi a viso probabilstica da linguagem pelos empiristas.Alm de dedicar mais tempo discusso da importncia da probabilidade para aLingstica de Corpus, que foi apenas mencionada anteriormente, esta subseotratar tambm da freqncia, que um aspecto relevante ao tratar deprobabilidades.Leech (1991:17), ao tratar de probabilidades, discute a importncia dossistemas probabilsticos e conclui que:Uma coisa a favor de sistemas probabilsticos de processamento dalinguagem o fato de eles serem eminentemente robustos. Eles so falveis,mas funcionam; eles produzem um resultado mais ou menos preciso, mesmoem dados de input irrestrito, de um modo que excede a maioria dos modelosde linguagem baseados em regras.2120 Empirical data enable the linguist to make statements which are objective and based on language asit really is rather than statements which are subjective and based upon the individuals own internalizedcognitive perception of the language.21one thing in favour of probabilistic language processing systems is that they are eminently robust.They are fallible, but they work; they produce a more or less accurate result, even on unrestricted inputdata, in a way that outperforms most rule-driven language modeling systems.16 30. As probabilidades esto diretamente ligadas freqncia, no sentido quequanto mais freqente for um termo, maior a probabilidade de ele ser escolhido(princpio idiomtico). Leech (1991: 16) afirma que enquanto evidente queprobabilidades detalhadas no esto disponveis intuitivamente para o falantenativo ou para o lingista, estimativas realistas de probabilidade podem ser feitasa partir das freqncias observadas no corpus.22 Neste estudo, alm de observar a freqncia de ocorrncia de verboscomplementados por outro verbo no infinitivo ou gerndio, tambm serconsiderada a probabilidade de um ou outro tipo de complementao. Para talanlise sero utilizados os conceitos de Halliday (1992) de eqiprobabilidade eskewness. Duas ocorrncias so equiprovveis na medida em que acontecemcom a mesma probabilidade, ou seja, 0,5/0,5. Entretanto, se uma das ocorrnciastem probabilidade muito maior do que a outra (0,9/0,1), ento ela skew23. 1.1.4 O que um corpus? Muitos pesquisadores buscaram definir o que seria um corpus, pois umconjuntode dados,segundo Berber-Sardinha(2004:16), noserianecessariamente um corpus. Nesta subseo, sero apresentadas algumas dasdefinies de corpus, bem como os requisitos para a elaborao de um corpus. Leech (1991:08) define um corpus como um conjunto suficientementegrande de dados de linguagem autntica a ser investigado. 24 J Sinclair (1991:171) diz que um corpus uma coleo de textos de linguagem autntica,escolhidos para caracterizar um estado ou variedade de linguagem.25 Ambosparecem ter uma preocupao comum: a autenticidade da linguagem, que umdos requisitos a ser discutido.22 While it is evident that detailed probabilities are not intuitively available to the native speaker or thelinguist, realistic estimates of probability can be made on the basis of observed corpus frequencies23 Embora o termo skew j tenha traduo em portugus (desvio), continuarei utilizando a palavra emingls ao longo da dissertao.24 a sufficiently large body of naturally occurring data of the language to be investigated25 a collection of naturally-occurring language text, chosen to characterize a state or variety oflanguage 17 31. Aarts (1991: 45) v um corpus como uma coleo de amostras de textoscorrentes. Os textos podem estar em forma falada, escrita ou intermediria, e asamostras podem ser de qualquer extenso.26Tognini-Bonelli (2004:15), por sua vez, procura resumir as diversasdefinies de corpus, por vrios autores, da seguinte forma:... muitas pessoas assumem que um corpus uma coleo de textosrepresentativos de uma dada linguagem e agrupados de maneira que possamser usados para explicar uma lngua como o ingls e como ela funciona.Geralmente acredita-se que a linguagem armazenada em um corpus autntica, que ela foi coletada de acordo com critrios explcitos de design,com um propsito especfico em mente e com a alegao de representarmaiores pores de linguagem, e seguindo critrios de tipos e registros detexto. 27Nesta dissertao ser utilizada a definio de Sanchez & Cantos (1996:08-09 apud Berber Sardinha, 2004: 18), que procurar abarcar as principaiscaractersticas de um corpus, mencionadas nas definies anteriores:Um conjunto de dados lingsticos (pertencentes ao uso oral ou escrito dalngua, ou a ambos), sistematizados segundo determinados critrios,suficientemente extensos em amplitude e profundidade, de maneira que sejamrepresentativos da totalidade do uso lingstico ou de algum de seus mbitos,dispostos de tal modo que possam ser processados por computador, com afinalidade de propiciar resultados vrios e teis para a descrio e anlise.Desta definio, podemos retirar os quatro pr-requisitos para a elaboraode um corpus computadorizado. Segundo Berber Sardinha (2004:19), so eles:1-O corpus deve ser composto de textos autnticos, em linguagem26a collection of samples of running text. The texts may be in spoken, written or intermediate forms, andthe samples may be of any length.27 most people assume that a corpus is a collection of texts taken to be representative of a givenlanguage and put together so that it can be used to explain a language such as English and how itworks. Usually the assumption is that the language stored in a corpus is naturally occurring, that it isgathered according to explicit design criteria, with a specific purpose in mind, and with a claim torepresent larger chunks of language, and following some criterion of text type and register. 18 32. natural. Por linguagem autntica entendemos textos que noforamproduzidos com o objetivodeseremestudadoslingisticamente.2-Autenticidade dos textos subentende textos escritos por falantesnativos.3-O contedo do corpus deve ser escolhido criteriosamente. Almda autenticidade dos textos, ainda preciso que o corpus obedeaa critrios estabelecidos por seus criadores, de acordo com opropsito a que se presta.4-Representatividade. O corpus deve ser uma amostra da populaoque ele pretende representar. Assim, um corpus de textosliterrios do romantismo brasileiro deve representar (ser umaamostra do) o conjunto de textos literrios do romantismobrasileiro. Depois de definir a Lingstica de Corpus, dar um breve histrico de seudesenvolvimento e definir o que um corpus, passaremos na prxima subseoao conceito de padres, que central anlise baseada em corpus. 1.1.5 PadresHunston & Francis (1999:03) afirmam que um padro uma fraseologiafreqentemente associada com (o sentido de) uma palavra, particularmente emrelao a preposies, grupos e oraes que seguem aquela palavra. 28 Maisespecificamente, elas (1999:37) definem padres como:... todas as palavras e estruturas que so regularmente associadas com a palavra e que contribuem para seu sentido. Um padro pode ser identificado se uma combinao de palavras ocorre com relativa freqncia, se ela28 a pattern is a phraseology frequently associated with (a sense of) a word, particularly in terms ofprepositions, groups, and clauses that follow that word.19 33. depende de uma escolha particular de uma palavra, e se h um sentido claro associado a ela.29Um padro, segundo Berber Sardinha (2005:216), um aspecto que podeser investigado por meio de ferramentas computacionais por ser um fenmenoprobabilstico, uma vez que o objetivo do lingista de corpus no apenas mostrarque um padro ocorre, mas sim mostrar com que freqncia ele ocorre. ParaBerber Sardinha (2005:216) um padro pode ser definido como:...uma associao regular entre itens lexicais, categorias gramaticais, semnticas ou pragmticas, observada num corpus extrada por meio da aplicaodeferramentas computacionaisoupelaobservaode concordncias.Os padres, enquanto regularidades de forma e sentido presentes naassociao entre palavras, podem ocorrer como associaes lexicais, gramaticaisou sintticas (Berber Sardinha, 2004:40). Para este estudo, cabe destacar asassociaes lexicais e as gramaticais, que sero discutidas a seguir sob os ttulosde colocao e coligao, respectivamente.1.1.5.1 ColocaoFirth foi o primeiro lingista a tratar de colocaes. Em 1957, ele j diziaque devemos julgar uma palavra pela sua companhia. 30 Ele o primeiroestudioso a relacionar sentido e colocao e a propor que se estudasse o sentidopor meio da colocao (Partington, 1998:15).O princpio idiomtico, mencionado anteriormente, garante que as palavrasno ocorram ao acaso, em um texto31 (Sinclair, 1991:110). Seguindo esteraciocnio, Sinclair (1991:170) define colocao como a ocorrncia de duas ou29 The patterns of a word can be defined as all the words and structures which are regularly associatedwith the word and which contribute to its meaning. A pattern can be identified if a combination of wordsoccurs relatively frequently, if it is dependent on a particular word choice, and if there is a clear meaningassociated with it.30 you shall judge a word by the company it keeps31 ...words do not occur at random in a text... 20 34. mais palavras a uma curta distncia uma da outra em um texto32. Partington(1998:15) considera esta definio de Sinclair como textual, uma vez que um itemse coloca com outro se ele aparece em um lugar prximo ao outro em um texto33.Leech (1974:20) define colocao a partir do conceito de sentidocolocacional. Para ele o sentido colocacional consiste em associaes que umapalavra adquire por meio dos sentidos das palavras que tendem a ocorrer ao seuredor34. Partington (1998:16) se refere a esta definio de Leech comopsicolgica ou associativa, pois ela faz parte da competncia comunicativa dofalante nativo.35Alm destas duas definies h, ainda, a de Hoey (1991: 6-7), que diz quecolocao tem sido o nome dado ao relacionamento que um item lexical tem comitens que aparecem com grande probabilidade em seu contexto (textual)36. Nestecaso, Partington (1998:16) v esta definio como estatstica, que para oslingistas de corpus parece ser uma boa definio, j que se baseia na repetiode itens que ocorre com um propsito definido, o que pode ser chamado depadres de colocao. possvel dizer que todas estas definies tm em comum o fato detratarem da colocao como uma associao entre itens lexicais que adquiremsentido a partir da juno deles. Um exemplo disso o que Sinclair (1991:110)destaca: of course; se analisarmos separadamente a preposio e o substantivono chegaremos a nenhuma concluso a respeito do sentido de tal expresso.Portanto, devido ao fato destas duas palavras estarem colocadas elas adquiremum sentido idiomtico, que no poderia ser abstrado se as olhssemos comoduas palavras separadamente.1.1.5.2 Coligao32 collocation is the occurrence of two or more words within a short space of each other in a text.33 one item collocates with another if it appears somewhere near it in a given text.34 collocative meaning consists of the associations a Word acquires on account of the meanings ofwords which tend to occur in its environment.35 it is part of a native speakers competence36 collocation has long been the name given to the relationship a lexical item has with items that appearwith greater than random probability in its (textual) context.21 35. Alm da colocao, Firth (1957) tambm desenvolveu o conceito decoligao. Entretanto, este termo foi pouco utilizado, por ter sido suprido pelotermo colocao devido ao fato de Sinclair (1991:3) no fazer distino entrelxico e gramtica.Hunston (2000:15) diz que utilizar o termo coligao importante, pois elechama a ateno para o fato de que a evidncia de muitas situaes delinguagem autntica pode ser utilizada para explicar o comportamento que tradicionalmente associado gramtica37. Hunston (2000:15) menciona tambma Maneira como Hoey definiu coligao em uma palestra em 1998:a)A companhia gramatical que uma palavra mantm (ou evitamanter) tanto em sua prpria classe como em classes superiores;b)As funes gramaticais que a classe da palavra prefere (ou evita);c)O lugar em uma seqncia que uma palavra prefere (ou evita). 38Hoey (2000: 234) considera que preciso olhar para o que ns fazemoscom a gramtica quando falamos ou escrevemos, e a que a coligao entra emcena. Segundo ele, coligao pode ser definida como a companhia gramaticalque uma palavra mantm e a posio que ela prefere, ou seja, as coligaes deuma palavra descrevem o que ela tipicamente faz gramaticalmente.39Berber Sardinha (2004:40) define coligao como associao entre itenslexicais e gramaticais. Por exemplo, o verbo like (que um dos focos destapesquisa) se associa tanto com um sintagma nominal quanto com outros verbosno infinitivo e no gerndio.J De Beaugrand (2001:11) diz que itens que tendem a ser selecionadosjuntos em combinaes gramaticais so chamados de coligveis e o resultadodisso chamado de coligao40. Esta definio pode ser complementada, pelareflexo que De Beaugrand (2001) faz a respeito de colocao e coligao, em37 the evidence of many instances of naturally occurring language can be used to explain behaviour thatis traditionally associated with grammar.38 a) the grammatical company a word keeps (or avoids keeping) either within its own group or a higherrank;b) the grammatical functions that the words group prefers (or avoids);c) the place in a sequence that a word prefers (or avoids).39 the grammatical company a word keeps and the position it prefers; in other words, a wordscolligations describe what it typically does grammatically22 36. que ele as trata como reservas sem as quais as pessoas teriam muita dificuldadeem dizer o que desejam. Alm disso, ele considera que a colocabilidade e acoligabilidade no ditam o que os falantes nativos devem dizer, mas constituem ocontexto de expectativas sobre o que os falantes nativos geralmente dizem41. no fato de permitir que tenhamos expectativas acerca do que vai ser dito,ou melhor, de como vai ser dito que reside uma das grandes vantagens de estudarcolocao e coligao. Ambas permitem que tenhamos nossa disposio asestruturas semiconstrudas, das quais Sinclair fala, ao falarmos e escrevermos enos do a oportunidade de prever o que o outro falante vai dizer. Assim, temosuma maior economia de tempo tanto na produo quanto na compreenso de umtexto. Esta seo foi dedicada a elucidar o que a Lingstica de Corpus eabordar alguns dos conceitos que permeiam esta abordagem. Na prxima seosero tratados aspectos relacionados ao uso de Lingstica de Corpus para oensino de lnguas e a contribuio da Lingstica de Corpus para ensino degramtica que sero relevantes para a anlise e interpretao dos dados. 1.2 A Lingstica de Corpus e o ensino de lnguas H vrias reas como a lexicografia, a sociolingstica e a estilstica, que sebeneficiam de estudos baseados em corpus. Alm destas, Biber et al. (1998:12)destaca que estudos baseados em corpus podem tambm ser aplicados rea deensino, uma vez que tais estudos, por contarem com grandes quantidades dedados, pode propiciar o desenvolvimento de currculos e materiais.40Items that tend to be selected together in grammatical combinations are said to be colligable, and theresult is called a colligation41do not dictate what native speakers must say, but rather constitute the background of expectationsabout what native speakers usually say. 23 37. 1.2.1 Por que utilizar corpus no ensino?Muitas pessoas acreditam que a maior vantagem de se utilizar corpora noensino de lnguas est nos exemplos autnticos que podem ser extrados doscorpora. No h dvida que esta seja uma grande vantagem, entretanto nopodemos considerar os exemplos de linguagem autntica como a nica maneirade se utilizar a Lingstica de Corpus no ensino. McEnery & Wilson (1996: 104)consideram que:Corpora, muito mais do que outras fontes de dados empricos tm um outropapel importante na pedagogia da linguagem que vai alm de simplesmenteprover exemplos mais realsticos de uso da lngua. Um nmero de estudiosostm utilizado dados provenientes de corpus para olhar criticamente para osmateriais de ensino de lnguas existentes.42A questo do ensino, sob a perspectiva de uma abordagem baseada emcorpus, mostra-se muito mais prtica, baseando o que vai ser ensinado em dadosque determinam quais itens so mais (ou menos) freqentes e que, portanto,devem (ou no) ser priorizados. Um dos motivos principais para se utilizar corpusno ensino de lnguas est no fato de muitas anlises de grandes quantidades dedados mostrarem que os programas e materiais de ensino tradicionais ignorammuitos aspectos lingsticos que so freqentes em dados de falantes nativos, eenfatizam outros que so raros43 (Aston, 2000:08).Neste sentido, Biber (2001:102) cita que as descries de uso, baseadasem corpus podem surpreender os profissionais da rea de ensino de lnguas. Emum estudo ele observou que as formas verbais simples so utilizadas mais de 20vezes mais do que as formas progressivas (ou contnuas) em conversas,enquanto muitos livros didticos baseados na proposta comunicativa enfatizam o42 Corpora, much more than other sources of empirical data have another important role in languagepedagogy that goes beyond simply providing more realistic examples of language usage. A number ofscholars have used corpus data to look critically at existing language teaching materials43 traditional language teaching syllabuses and materials ignore many linguistic features which arefrequent in native speaker data, and emphasise ones which are relatively rare. 24 38. uso de formas contnuas. A questo do livro didtico ser abordada na prximasubseo.Ainda no que se refere ao ensino, um outro ponto a favor de utilizar estudosbaseados em corpus est na abrangncia da investigao que pode ser feita.Alm da possibilidade que temos de estudar diferentes aspectos como freqncia,traos gramaticais, itens lexicais separadamente, tambm podemos estud-losjuntos e observar como eles se inter-relacionam (Conrad, 1999: 15).Os estudos baseados em corpus tambm podem proporcionar aosprofessores o conhecimento sobre aspectos estruturais por meio da observaode dados reais. Mas o seu diferencial est em permitir que os professoresobservem como as estruturas que eles vo ensinar so utilizadas de fato porfalantes nativos (Conrad, 1999: 15-16).Conrad (1999: 16) acredita que estudos baseados em corpus tambmtrazem maior segurana ao professor. Se os alunos querem saber sobre o uso, oprofessor no precisa confiar em sua intuio e, por isso no se sentir seguroquanto exatido da informao. Os exemplos provenientes do corpus podemconfirmar sua intuio e lhe garantir um apoio concreto.Um outro aspecto, mencionado no comeo desta subseo, que no podeser esquecido o fato de o corpus fornecer exemplos de linguagem autntica,seja por meio de linhas de concordncia extradas de textos, seja por meio dosprprios textos, ou parte deles, que so produzidos por falantes nativosnaturalmente. Por isso, o corpus alm de ser uma ferramenta para o professor,tambm beneficia aos alunos que buscam aprender a linguagem autntica. Aimportncia do acesso a esses exemplos na aprendizagem de lnguas est naexposio que alunos tm muito cedo em seu processo de aprendizagem a tiposde oraes e vocabulrio que eles encontraro ao ler textos genunos na lngua ouem utilizar a lngua em situaes comunicativas reais44 (McEnery & Wilson,1996:104).44Corpus examples are important in language learning as they expose students at an early stage in thelearning process to the kinds of sentences and vocabulary which they will encounter in reading genuinetexts in the language or in using the language in real communicative situations.25 39. Alm disso, cabe destacar que uma abordagem baseada em corpustambm propicia ao aluno a oportunidade de desenvolver habilidades de reflexoe anlise. Osborne (2000: 166) discute como o corpus pode ajudar o aluno arefletir sobre a gramtica em especial:Acesso a dados de corpus ir potencialmente ajudar os alunos a desfazerconceitos equivocados e desafiar descries gramaticais simplificadas,criando, ento, um ponto de partida para a reflexo crtica.45Alm de desenvolver esta habilidade reflexiva de que Osborne trata, alunosque trabalham com corpus tambm desenvolvem estratgias cognitivas elingsticas. Sripicharn (2000: 234) relata que em um estudo que Bernardini (2000)desenvolveu com alunos italianos, em que eles fizeram investigaes do corpusde maneira independente, ela pode observar que, alm de eles desenvolveremestratgias cognitivas e lingsticas, eles tambm foram capazes de interpretar egeneralizar suas descobertas, principalmente no tocante a colocaes e prosdiasemntica.Finalmente, outro aspecto que tambm deve ser considerado o de que oacesso ao corpus promove a aprendizagem autnoma. Neste caso os alunospodem fazer suas prprias descobertas a respeito da linguagem e da lnguaporque, por meio do corpus, a lngua est ao dispor do aluno o tempo todo. Almde consultar um corpus j existente, que fornea informaes sobre a lngua defalantes nativos se tiverem acesso ao computador, os alunos tambm podem criarseu prprio corpus a partir de materiais como revistas e jornais, como era feitoantes da inveno do computador, e analisar a lngua atravs da observao detais textos.1.2.2 A aplicao da Lingstica de Corpus no ensino45Access to corpus data will potentially help students clear up misconceptions and challenge over-simplified accounts of the grammar, thus providing an entry point for critical reflection 26 40. A aplicao da Lingstica de Corpus no ensino tem se concentrado emquatro reas principais, segundo Berber Sardinha (2004: 254-255):a) Descrio da linguagem nativa: esta descrio normalmente ocorre emmeios acadmicos e incorporada em materiais didticos.b) Descrio da linguagem do aprendiz: esta descrio se d com base nalinguagem produzida por aprendizes de lngua estrangeira. Do mesmo modo que aanterior, no utilizada diretamente em sala de aula e ainda est muito restrita aomeio acadmico.c) Transposio de metodologias acadmicas para a sala de aula: estaaplicao refere-se ao uso de linhas de concordncia, em sala de aula, para tirardvidas sobre usos de palavras.d) Desenvolvimento de materiais de ensino, currculos e abordagens: nestecaso temos a criao de materiais, metodologias ou abordagens baseados naexplorao de corpora ou nos conceitos da Lingstica de Corpus.Na quarta rea, citada acima, de desenvolvimento de materiais,metodologias ou abordagens, h trs propostas de utilizao da Lingstica deCorpus no ensino que se destacam: o Currculo Lexical, a Abordagem Lexical e aAprendizagem Movida a Dados (DDL- Data Dirven Learning).Nas prximas subsees os trs mtodos sero abordados brevemente,com base na discusso que Berber Sardinha (2004:282-295) faz a seu respeito.1.2.2.1 O Currculo LexicalO Currculo lexical (Lexical Syllabus) 46foi desenvolvido por Dave Willis combase nas pesquisas feitas pelos membros do projeto COBUILD que tinham como46As tradues para os termos Lxica Syllabus e DDL forma retiradas de Berber Sardinha (2004),porque tais termos no possuem uma traduo oficial para o Portugus. 27 41. objetivo a criao de um dicionrio baseado na descrio lexical da linguagem(Willis, 1990). A partir dos dados, compilados para a confeco do dicionrio,surgiram os livros didticos da srie Collins Cobuild English Course, que podemser considerados como exemplo de aplicao dos conceitos e da metodologia daLingstica de Corpus O curso basicamente centrado no lxico que ocorre com maior freqnciano corpus e nos textos que exemplificavam esses itens. Em cada nvel do cursohavia um nmero de palavras que deveria ser ensinado, esperando-se que at ofinal do curso os alunos tivessem sido expostos a 80% das palavras da lnguainglesa. NvelNmero de palavras de que osalunos tomavam conhecimento 1700 21.500 32.500 Quadro 1- Nmero de palavras47 por nvel O curso baseado na observao da lngua em uso, o que pode fazer comque os alunos contestem o conhecimento j adquirido por meio do ensinotradicional. Os autores criticam os livros que se baseiam na intuio exatamentepela possibilidade de eles trazerem informaes que no refletem os dadosextrados do corpus. A metodologia do curso baseada em tarefas, que privilegiam a fluncia eno a exatido (accuracy). Desse modo, o aluno passa a ser o responsvel porsua aprendizagem, sendo que o professor deixa de ser o conhecedor oufornecedor de conhecimento. 1.2.2.2 Abordagem Lexical47 Em ings, type, o que representa o tamanho do vocabulrio.28 42. A Abordagem Lexical (Lexical Approach), criada por Michael Lewis,tambm se baseia em conceitos da Lingstica de Corpus. Lewis (2000:126)considera que trabalhos baseados em corpus muitas vezes contradizem crenasdifundidas48. Nesta abordagem o ensino de chunks (pores), que se realizam emcolocaes privilegiado. Os chunks so ensinados por meio de textos e osalunos so estimulados a manterem cadernos lexicais em que eles anotam aspores de lngua s quais foram expostos. A gramtica, nesta abordagem, vista como algo que tem papelsecundrio, uma vez que palavras gramaticais so consideradas como itenslexicais. Lewis (2000: 147) diz que a linguagem primordialmente sentido e que osentido expresso pelo lxico.49 Embora este posicionamento da Abordagem Lexical com relao gramtica esteja de acordo com o posicionamento da Lingstica de Corpus, houtros pontos controversos. Por exemplo, no est claro qual foi o corpus utilizadona preparao das atividades e tambm parece no haver uma metodologia clara,como no Currculo Lexical. 1.2.2.3 Aprendizado Movido por Dados (DDL) O Aprendizado Movido a Dados (Data Driven Learning, ou simplesmenteDDL) foi criado por Tim Johns, inicialmente para o ensino de gramtica do ingls,mas atualmente, tem sido utilizada em outras reas, alm da gramtica, e noensino de outras lnguas. O preceito desta proposta o do aluno como48 ... contradicting some belief which is widespread.49 ... language is first about meaning and meaning is primarily conveyed by the lexis. 29 43. pesquisador, ou descobridor. Tim Johns (1991:2) considera que a pesquisa algo muito srio para ser deixada para os pesquisadores.50 A Aprendizagem Movida por Dados uma abordagem que se utiliza docomputador, como elemento central na aprendizagem, como informante, nosubstituindo o papel do professor. Nesta metodologia os alunos interagem com ocorpus por meio de tarefas de pesquisa51 (Mishan, 2004: 222), o que pode lev-los a descobrirem como a linguagem funciona em contexto real. Esta abordagem essencialmente indutiva, ou seja, a partir daobservao dos dados que os alunos chegam ao conhecimento. As tarefas soexecutadas a partir do uso de um programa concordanciador, que gera linhas deconcordncia com a palavra que os alunos desejam investigar e seguem trsprincpios indutivos, que de acordo com Berber Sardinha (2004:293) so: a) Identificao: alunos identificam padres nas linhas de concordncia; b) Classificao: alunos interpretam e classificam os dados a partir de critrios; c) Generalizao: alunos fazem generalizaes a respeito da ocorrncia. Ao seguir esta abordagem o professor deve ter conscincia de que tanto oseu papel quanto o do aluno sofrem mudanas. Enquanto o professor deixa de terpapel central no ensino e passa a no ser o fornecedor das repostas, o alunopassa a desempenhar um papel mais ativo na aprendizagem, esperando-se dele odesenvolvimento de habilidades de pesquisa e reflexo. 1.2.3 Livro Didtico A explorao de corpora no ensino tem como uma de suas reas deconcentrao o desenvolvimento de materiais de ensino e currculo, comomencionado anteriormente. O fato que, embora reconheamos a importncia dautilizao de dados empricos para uma descrio mais realista da linguagem, so50 research is too serious to be left to the researchers51 learners engaging with the corpus via research tasks30 44. ainda poucos os livros didticos que baseiam seu contedo ou suas explicaesem dados extrados de corpora. Muitos autores ainda se baseiam em suas intuies quando estoproduzindo materiais de ensino. Biber (2001:101) afirma que: O desenvolvimento de materiais para o ensino de lnguas e avaliaorequerem julgamentos sobre o uso da linguagem, pois os autores decidemque palavras e aspectos da linguagem devem incluir. Essas decises sonormalmente baseadas em suas impresses pessoais e no factuais decomo falantes e escritores usam a linguagem. Essas impresses geralmenteno so conscientes e so consideradas verdades aceitas.52Os lingistas de corpus tm cada vez mais discutido os prejuzos que aintuio de autores de materiais didticos pode causar ao ensino de lnguas. Biber(2001:101) considera que:Infelizmente, as intuies dos lingistas esto geralmente erradas.Conseqentemente, os materiais de ensino e avaliao no proporcionamuma reflexo adequada da linguagem realmente utilizada por falantes eescritores em situaes reais.53Flowerdew (2001:83) vai mais alm em sua crtica aos materiais disponveisno mercado, considerando que por eles apresentarem uma frmula no 54autntica, eles prestam um desservio aos alunos . McEnery & Wilson(1996:104) discutem a importncia de utilizar materiais baseados em corpus:Materiais no baseados em dados empricos podem ser enganadores e osestudos de corpus deveriam ser utilizados para informar a produo de52 The development of materials for language instruction and assessment requires repeated judgementsabout language use, as authors make decisions about the words and linguistic features to include. Thesedecisions have usually been based on the authors gut-level impressions and anecdotal evidence of howspeakers and writers use language. These impressions usually operate below the level of consciousnessand are often regarded as accepted truths.53 Unfortunately, linguists intuitions about language use are often wrong. As a result, teaching andassessment materials often fail to provide an accurate reflection of the language actually used byspeakers and writers in natural situations.54 in presenting an inauthentic formula are doing a disservice to learners31 45. materiais para que as escolhas mais comuns de uso recebam maior atenodo que aquelas que so menos comuns.55Finalmente, com cada vez mais estudos baseados em corpus, espera-seque esta situao atual se modifique e que os estudos deixem a academia rumoaos livros didticos e outros materiais de ensino. Hunston & Francis (1998:45)expressam essa esperana: Por causa da proliferao do uso de corpora armazenados eletronicamente entre professores e pesquisadores, h uma crescente expectativa que as descries de linguagem sero baseadas em grandes quantidades de dados autnticos, ao invs de nas intuies ou preconceitos de um autor de curso. 56 1.2.4 O ensino de gramticaEmbora o ensino de lxico seja claramente beneficiado por estudosbaseados em corpus, estudiosos como Hunston & Francis (1998) e Fox (1998),alm de John Sinclair e Biber, se preocuparam tambm com a utilizao dessesestudos para o ensino de gramtica.Fox (1998: 32) afirma que ainda hoje muitos dos currculos so baseadosem gramtica e lana duas perguntas, que procuram nos fazer questionar oensino de gramtica da maneira como vem sendo proposto pelos livros didticos:Mas a gramtica que ensinada realmente a gramtica da lngua? Aspreocupaes do livro didtico so to importantes na vida real quanto na salade aula? Os usos de tempos verbais so to claros quanto so consideradospelo livro? 5755 non-empirically based materials can be positively misleading and that corpus studies should be usedto inform the production of materials, so that the more common choices of usage are given moreattention than those which are less common.56Because of the more widespread use of electronically-stored corpora among teachers and researchersalike, there is a growing expectation that descriptions of language will be based on quantities of authenticdata rather than on a course writers intuitions and/or language prejudices.57 But is the grammar that is taught really the grammar of the language? Are the preoccupations of the 32 46. Segundo os estudos baseados no corpus Bank of English, a resposta paratodos os questionamentos acima seria no. Jeremy Clear (2000: 20-21) discute aquesto do futuro, afirmando que embora no haja um tempo futuro em ingls,muitos livros de gramtica procuram oferecer explicaes que generalizam ouoferecem regras para o uso de diferentes formas de expressar o futuro, por meiode exerccios e repeties. O autor confronta as explicaes um tanto confusas dolivro com linhas de concordncia retiradas do Bank of English, o que mostra quese retirarmos o modal will ou o going to no saberemos qual das formas utilizarnem mesmo nos apoiando nas regras oferecidas pelo livro de gramtica. Clearacredita, ainda, que no possvel que o verbo carregue o sentido de tempo, masque itens lexicais como tomorrow, next year sinalizam muito melhor o futuro.Entretanto, no podemos ignorar simplesmente a gramtica que temosatualmente. Segundo Aarts (1991:45) o corpus em sua forma mais crua serve aolingista como uma maneira de testar suas hipteses acerca da lngua, que foramexpressas sob a forma de uma gramtica formal.581.2.4.1 Por que ensinar gramtica?Um dos questionamentos mais comuns, principalmente dentro deabordagens comunicativas de ensino de lnguas, o da relevncia de se ensinargramtica aos alunos. Meunier (2002: 120) em seu estudo afirma que h grandedebate entre pesquisadores de aquisio de lngua no nativa sobre ensinar ouno gramtica. Segundo ela, h aqueles que consideram que a gramtica nodeve ser ensinada por no facilitar a aquisio da lngua estrangeira, um segundocoursebooks as important in real life as they are in the classroom? Are the uses of tenses as clear-cut asthey are presented as being?58 ...the corpus in its raw form is for the corpus linguist the test bed for his hypotheses about thelanguage, which he has expressed in a formal grammar. 33 47. grupo acredita que ela pode ser ensinada indiretamente e, finalmente, o terceiroacredita que o foco na forma benfico ao aprendizado de lnguas. Ela concluique o ensino de gramtica deve ser integrado proposta comunicativa.59O ensino de gramtica deve levar em conta uma srie de aspectos,segundo Osborne (2000: 167). preciso, segundo ele, considerar a funodaquela explicao para o aprendizado, o quo tcnicos podemos ser e fazer aescolha de que abordagem terica utilizar para tal explicao. O que deve serconsiderado acima de tudo se a gramtica vai ajud-los (os alunos) a distinguiro que uso aceitvel na lngua alvo do que no .60Alm disso, importante frisar que h aqueles alunos que se interessampela gramtica da lngua. Davies (2004: 259) diz que s vezes o objetivo dealunos mais avanados entender variao sinttica e assim ir alm das regrasapresentadas pelo livro didtico. Neste caso o uso de corpus na investigaodeste aspecto da gramtica traz aos alunos a oportunidade de observar asdiferenas entre as regras estabelecidas e o que pode ocorrer em diferentescontextos de uso.1.2.4.2 Gramtica de padresHunston & Francis (1999) desenvolveram um trabalho baseado empadres, durante o projeto COBUILD, que veio a se tornar conhecido comoGramtica de Padres. Por meio de suas observaes do corpus, durante oprojeto, elas puderam chegar formulao de uma gramtica que leva em contapadres lxico-gramaticais e sentido. Elas (1999: 03) afirmam que:Padres e lxico so mutuamente dependentes, sendo que cada padroocorre com um grupo restrito de itens lexicais e cada item lexical ocorre comum grupo restrito de padres. Alm disso, padres esto claramente ligadosao sentido, primeiramente porque em muitos casos sentidos de palavras sodiferenciados por sua ocorrncia tpica em diferentes padres; e, em segundo59 ...grammar teaching should be integrated within a communicative framework60 ... that it will ultimately help them to distinguish what is acceptable usage in the target language fromwhat is not34 48. lugar, porque as palavras que possuem um mesmo padro tendem acompartilhar um aspecto do sentido.61Hunston & Francis (1999: 14) afirmam ainda que padres gramaticaispodem ser utilizados para descrever a lngua como um todo. Por descrever alngua como um todo se entende a descrio dos itens que ocorremfreqentemente seguindo princpios e considerando que as palavras pertencentesa um dado padro no ocorrem ao acaso. Em geral, so consideradas parte dopadro todas as coisas que seguem uma palavra: sua complementao62(Hunston & Francis, 1999:49). Entretanto, em alguns casos pode ocorrer que itensque precedem a palavra em questo faam parte de seu padro.Os padres de uma palavra podem ser de dois tipos: padres de verbos epadres de substantivos. Dentro de padres verbais encontramos os padres deV-ing ( I actually like hunting) e V to inf (Children actually like to acquire skills),que sero analisados neste estudo para os verbos like e try. Os exemplos dadosforam retirados do British National Corpus (BNC), que o corpus de refernciadeste trabalho e tem por objetivo apenas ilustrar os padres verbais. Hunston &Francis (1999: 98) afirmam que h verbos que podem ser seguidos tanto porinfinitivo quanto gerndio, entretanto, no mencionam que pode haver diferenade sentido quando complementados por um ou outro.A utilizao da gramtica de padres no ensino pode privilegiarmetodologias que encorajem o aluno a pensar e observar a lngua para tirar suasprprias concluses. Algumas metodologias de ensino de lnguas vem omomento de noticing, isto , notar, observar ou prestar ateno em um item emespecial63 (Prez-Paredes & Cantos-Gmez, 2004: 251) como essencial ou, atmesmo, um pr-requisito para o aprendizado.Ao enxergar a gramtica como algo que possa ser analisado a partir dedados reais, por meio da observao de linhas de concordncia e padres, ela61 Patterns and lexis are mutually dependent, in that each pattern occurs with a restricted set of lexicalitems, and each lexical item occurs with a restricted set of patterns. In addition, patterns are closelyassociated with meaning, firstly because in many cases different senses of words are distinguished bytheir typical occurrence in different patterns; and secondly because words which share a given patterntend also to share an aspect of meaning.62 ...things that usually follow a word: its complementation.63 ... that is noting, observing or paying special attention to a particular language item35 49. deixa de ser entendida como algo prescrito por outrem e passa a ser construda apartir das descobertas e anlises feitas pelos pesquisadores, sejam eles osalunos, os professores ou os autores de livros didticos.Neste captulo foram discutidos os principais pressupostos tericos queembasam esta pesquisa. Primeiramente, discutimos os pressupostos referentes Lingstica de Corpus, que visam a esclarecer alguns os conceitos utilizadosdurante a anlise dos dados. Na segunda parte do captulo, o olhar se volta para oensino, em que buscamos mostrar a relao entre o ensino e a Lingstica deCorpus e focar principalmente no ensino de gramtica, por meio da utilizao delinhas de concordncia e do uso de padres. 36 50. CAPTULO 2: METODOLOGIANeste captulo, os procedimentos de coleta e anlise de dados seroexplicados, tomando como ponto de partida a descrio do contexto que motivou apesquisa, pois foi a partir dele que sugiram as indagaes que levaram pesquisa.2.1 O contexto de pesquisaA pesquisa foi desenvolvida em uma instituio de ensino de Ingls, quepossui 11 filiais na cidade de So Paulo e 6 distribudas entre a Grande So Pauloe o interior do estado, alm de joint-ventures, conhecida por sua tradio de 75anos e pela qualidade de seus cursos, que tem a classe mdia alta como pblico-alvo. O nvel, a que se refere esta pesquisa o ps-intermedirio, que podeenvolver tanto alunos adolescentes (em geral com mais de 14 anos) como adultos,com aproximadamente 500 horas de aprendizado.Metade das salas de aula equipada com um computador ligado Internete um projetor do tipo datashow. Alm de estimular o interesse e odesenvolvimento lingstico dos alunos por permitir a reproduo de um filme emDVD, por exemplo, tambm possvel o acesso a pginas da Internet parapesquisa, o que permite que atividades baseadas em corpus sejam utilizadas emaula. As aulas, que acontecem duas vezes por semana, tm a durao de cemminutos cada e os grupos podem possuir de doze a vinte alunos.O mtodo adotado pela instituio est inserido dentro de uma AbordagemComunicativa e busca desenvolver as quatro habilidades (produo oral e escrita,compreenso oral e leitura) de maneira equilibrada. As aulas se enquadram emum framework, que envolve as seguintes partes: 37 51. 1- Envolvimento dos alunos (engagement): no incio de cada tpico a sertrabalhado h uma atividade que objetiva engajar os alunos no tpico. Taisatividades so, em geral, perguntas relacionadas ao tpico a ser estudado;2- Exposio, observao e anlise (exposure, noticing and analysis): nestemomento, os alunos so expostos ao contedo a ser trabalhado, seja por meio deum texto escrito ou falado, tm a ateno chamada forma (ou ao item lexical)que ser estudado e a analisam, tentando concluir ou generalizar como esta forma(ou item lexical) pode ser utilizada, qual a sua funo, etc;3- Prtica (practice): nesta fase os alunos fazem atividades e exerccios denveis de dificuldade variados (desde bem controlados at mais livres), paracolocar em uso o que acabaram de analisar; e4- Tarefa Final (final task): nesta ltima parte os alunos tentam aplicar o queaprenderam em uma situao que simule uma situao real. Em geral eles tmum problema a resolver, tarefa em que eles no precisam necessariamenteproduzir o que aprenderam (non-linguisitc outcome)64, como por exemplo, comprarprodutos em uma loja, ou falar a respeito da cidade onde moram, etc.O ps-intermedirio, na instituio, um nvel considerado muito difcilpelos alunos, pois, alm de apresentar aos alunos uma grande quantidade delxico novo e estruturas gramaticais mais sofisticadas, ao final dele que osalunos so considerados aptos a realizar um teste preparado pela Universidade deCambridge, na Inglaterra, chamado FCE (First Certificate in English), que visa aavaliar o nvel de conhecimento e proficincia dos alunos. Neste nvel, segundo aUniversidade de Cambridge, que ministra os exames, os alunos so vistos comousurios independentes da lngua e espera-se que eles sejam capazes de lidarcom as estruturas principais da lngua com alguma confiana, demonstrar oconhecimento de uma grande variedade de vocabulrio e utilizar estratgiascomunicativasadequadasemumavariedadede situaes sociais(cf.:www.alte.org/can_do/framework/level3.cfm).O teste dividido em cinco partes: compreenso oral, leitura, produo oral64Willis (1999) discute a questo forma/sentido e conclui que quando os alunos tm uma tarefa, com umobjetivo pr-determinado, no importa se eles utilizam ou no o que est sendo ensinado, mas sim seeles so capazes de estabelecer comunicao e alcanar o objetivo.38 52. e escrita e gramtica e vocabulrio, que so completadas em dois dias. Maisespecificamente, em termos de gramtica e vocabulrio, os alunos so testadosem cinco tipos diferentes de exerccios, que buscam avaliar o conhecimento econtrole do sistema lingstico, alguns dos quais baseados em textosespecialmente escritos para o exame (cf: www.cambridgeesol.org/exams/fce.htm).Estas informaes so importantes, pois nos colocam diante da realidade dosalunos e do que esperado deles efetivamente ao final do nvel ps-intermedirio.2.2 Livro DidticoO livro didtico adotado pela escola o Inside Out Upper Intermediate (Kay& Jones, 2001). Pode-se dizer que este livro est inserido na abordagemcomunicativa e que os autores parecem se preocupar com o ensino de lxico emchunks, o que pode ser observado em atividades que privilegiam o uso decolocaes.Entretanto, os textos que visam a expor os alunos s estruturas gramaticaisso, em geral, adaptados, ou seja, no so autnticos e, assim, pode se dizer quea linguagem apresentada pode no refletir a linguagem utilizada de fato porfalantes nativos, o que pode ser notado, por exemplo, na unidade 5, a ltima destenvel, que tem como tpico rituais. Esta unidade, que discute, como tpicogramatical, verbos que podem ser complementados tanto por infinitivo quanto porgerndio com mudana de sentido, deve ser vista em 5 aulas de 100 minutos eapresenta, alm do tpico mencionado, ainda will/would para falar de hbitos nopresente e passado, linguagem para criticar hbitos irritantes e vocabulrio parafalar de casamentos, o que restringe o tempo para tratar de verbos no infinitivo egerndio a uma aula e meia.A parte de verbos no infinitivo e gerndio, nesta unidade, complementa oque foi visto na unidade dois, em que eram discutidos os verbos que aceitamsomente padres de infinitivo, os que apenas aceitam gerndio e os que aceitamambos sem alterao no sentido. Na unidade 5, so apresentados os verbos try,39 53. like, remember, forget e stop,como verbos que possuem diferena de sentido seseguidos por outro verbo no infinitivo ou no gerndio. Esta parte est organizada partindo de um texto em que os alunos s