padrÕes de vocabulÁrio e ensino sobre lÉxico e … · objetivos da pesquisa caracterizar léxico...
TRANSCRIPT
PADRÕES DE VOCABULÁRIO E ENSINO SOBRE LÉXICO E
DICIONÁRIOS: APROVEITAMENTO DE JORNAIS POPULARES
Bruna Rodrigues da Silva¹,
Maria José Bocorny Finatto ²(orientador)
¹ Acadêmica do curso de Letras / Licenciatura - UFRGS, Monitora SEAD/UFRGS na disciplina Léxico e Dicionários.²Docente do Instituto de Letras-UFRGS.
XXI Salão de Iniciação Científica UFRGS
Objetivos da Pesquisa
Caracterizar léxico e linguagem num texto que visa compreensão facilitada.
Contrastar o corpus do jornal Diário Gaúcho com outros corpora.
Levar vivência de pesquisa para a disciplina Léxico e Dicionários (Letras/UFRGS).
Situação Atual
A maioria dos estudos de vocabulário da escrita do português do Brasil usa jornais (ênfase em Folha de SP).
Os jornais populares não integram esse tipo de estudo.
Com isso...
Aposta: esse material também pode ser útil e importante.
Seleção: observação de jornais diários do Brasil no perfil “popular” (perfil heterogêneo).
Escolha: O melhor para estudo é o jornal Diário Gaúcho.
O porquê da escolha
• Tipo de texto já tratado em Jornalismo/Comunicação (AMARAL, 2004 e 2006; BERNARDES,
2004), mas POUCO tratado em Letras/Lingüística –oferece uma lacuna a explorar.
• Aceitação“Parte dos consumidores do DG não eram leitores
de jornal e, após seu lançamento, em 2000, a região metropolitana de Porto Alegre passou a ser
a primeira em índice de leitura de jornais no Brasil.”
(AMARAL, 2006 p.80)
do Diário Gaúcho
• Circulação145.000 exemplares vendidos por dia.
• Linguagem mais tradicional em relação a jornais do gênero popular
“Texto simples não significa texto pobre.”(MANUAL DE REDAÇÃO DO DIÁRIO GAÚCHO, 2005, p. 06)
• Participação do leitor“Cede um espaço específico à fala do seu leitor (...)”
(AMARAL, 2006, p.39)
Lingüística de Corpus
Corpus Extenso, de maneira que seja representativo
Textos autênticos, em linguagem natural
Em formato digital
Observação extensiva/empírica/contrastiva –Corpus/Corpora
Língua como um sistema probabilístico
Utilização de ferramentas eletrônicas para estatística lexical
Janeiro - 20086796 de
4807 o
4607 a
3914 e
2675 que
2616 do
2236 da
2020 para
1992 em
1938 com
1730 no
1544 na
1424 um
1179 é
1125 não
1070 os
993 uma
772 por
695 as
679 foi
Fevereiro - 20087105 de
5131 a
5078 o
4205 e
2835 do
2824 que
2366 da
2041 para
2001 com
1939 em
1892 no
1722 na
1412 um
1297 é
1170 não
1041 os
980 uma
873 por
787 h
769 as
Março - 20087135 de
5136 a
5081 o
4018 e
2859 que
2671 do
2337 da
1998 com
1951 para
1942 em
1742 no
1587 na
1471 um
1224 é
1185 os
1141 uma
1135 não
919 por
772 as
697 se
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
3 Observação das palavras mais freqüentes (mês a mês)
4 Contrastes com dados de padrões de vocabulário colhidos do Banco do Português
Banco do Português6022939 de
4289463 a
4135372 o
2906593 e
2763756 que
2433919 do
2169947 da
1760984 em
1403295 para
123337 no
1149743 é
1133466 com
1084939 os
1063093 um
1016223 na
1006853 não
836547 uma
834435 se
702611 por
675637 dos
Trimestre - DG21036 de
14966 o
14874 a
12137 e
8358 que
8122 do
6939 da
6012 para
5937 com
5873 em
5364 no
4853 na
4307 um
3700 é
3430 não
3296 os
3114 uma
2564 por
2236 as
2077 foi
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
5 Contrastes com padrões de vocabulário do jornal Zero Hora (ZH)
Zero Hora Diário Gaúcho
1 27087 de 7135 de
2 18506 a 5136 a
3 16747 o 5081 o
4 12678 e 4018 e
5 11145 do 2859 que
6 9970 que 2671 do
7 8945 da 2337 da
8 8080 em 1998 com
9 6455 com 1951 para
10 6417 para 1942 em
11 6088 no 1742 no
12 4736 na 1587 na
13 4438 os 1471 um
14 4190 um 1224 é
15 3612 não 1185 os
16 3498 é 1141 uma
17 3418 uma 1135 não
18 3218 se 919 por
19 3070 por 772 as
20 2728 dos 697 se
21 2689 as 667 foi
22 2354 r 660 anos
23 2344 ao 659 dos
24 2072 mais 624 h
25 1944 à 617 mais
26 1926 foi 584 ao
27 1850 das 545 vagas
28 1802 como 514 são
29 1505 anos 513 das
30 1452 pelo 441 r
Resultados Iniciais
Algumas listas das palavras mais freqüentemente empregadas nos textos produzidos ao longo de 2008
Descrições iniciais da linguagem empregada no jornal
Criação de material para uso em sala de aula
Diário Gaúcho(mar/2008)
Total de palavras = 160869Total de palavras
diferentes = 18127
Banco do Português(recorte jornal)
Total de palavras = 223.371.280 Total de palavras
diferentes = 582.372
Zero Hora(mar/2008)
Total de palavras = 557258Total de palavras
diferentes = 32881
1 7135 de 6022939 de 27087 de
2 5136 a 4289463 a 18506 a
3 5081 o 4135372 o 16747 o
4 4018 e 2906593 e 12678 e
5 2859 que 2763756 que 11145 do
6 2671 do 2433919 do 9970 que
7 2337 da 2169947 da 8945 da
8 1998 com 1760984 em 8080 em
9 1951 para 1403295 para 6455 com
10 1942 em 123337 no 6417 para
11 1742 no 1149743 é 6088 no
12 1587 na 1133466 com 4736 na
13 1471 um 1084939 os 4438 os
14 1224 é 1063093 um 4190 um
15 1185 os 1016223 na 3612 não
16 1141 uma 1006853 não 3498 é
17 1135 não 836547 uma 3418 uma
18 919 por 834435 se 3218 se
19 772 as 702611 por 3070 por
20 697 se 675637 dos 2728 dos
Além da descrição vocabular, utilizar o DG como fonte de estudo pode ser de grande utilidade no ensino, tanto que dados levantados originaram atividades interessantes no curso de Letras:
Os alunos manipularam os arquivos do jornal e produziram suas listas de palavras.
A partir disso, foram incentivados a produzirem um glossário esportivo baseado no corpus DG.
As atividades foram desenvolvidas na plataforma Moodle e com o apoio das ferramentas do site Textquim.
ReferênciasAMARAL, M. F., Jornalismo Popular. São Paulo: Contexto, 2006.
BERNARDES, C. B.. As Condições de produção do jornalismo popular massivo: o caso do Diário Gaúcho. Porto Alegre: UFRGS, 2004. Dissertação (mestrado), Faculdade de Biblioteconomia e Comunicação, Universidade Federal do Rio Grande do Sul, 2004.
BISOGNIN, T. R. Sem medo do internetês. Porto Alegre: AGE, 2009.
MANUAL DE REDAÇÃO DO DIÁRIO GAÚCHO. Agosto de 2005.
SARDINHA, T. B., Lingüística de Corpus. Barueri: Manole, 2004.
FLUXO DA PESQUISAARQUIVOS DG - PDF
ARQUIVOS TXT
PROCESSAMENTO
LARGA E PEQUENA ESCALA
FREQÜÊNCIAS
DE PALAVRASPADRÕES DE
FRASEEXPRESSÕES/
CONSTRUÇÕES
USOS DIVERSOS: DESCRIÇÃO DA LÍNGUA - COMPUTAÇÃO + LINGÜÍSTICA + DICIONÁRIOS
DADOS E ATIVIDADES DE ENSINO NA DISCIPLINA LÉXICO E DICIONÁRIOS – curso de Letras/UFRGS.