meta 01 anÁlise do rendimento escolardownload.inep.gov.br/download/estudos_pesquisas/edu... ·...

350
UNIVERSIDADE FEDERAL DE MINAS GERAIS CENTRO DE DESENVOLVIMENTO E PLANEJAMENTO REGIONAL Rua Curitiba, 832 – 9ª andar - Centro - 30.170-120 - Belo Horizonte-MG – Brasil Tel.: (31)3279.9144/3279.9148/3279.9149 – Fax: (31)3279.9146/3201.3657 http://www.cedeplar.ufmg.br META 01 ANÁLISE DO RENDIMENTO ESCOLAR AVALIAÇÃO DE DESEMPENHO: FATORES ASSOCIADOS 1999 A 2003 VOLUME 1 Convênio nº 29/2002 Belo Horizonte, Março/2005

Upload: vuphuc

Post on 15-Dec-2018

214 views

Category:

Documents


1 download

TRANSCRIPT

UNIVERSIDADE FEDERAL DE MINAS GERAIS CENTRO DE DESENVOLVIMENTO E PLANEJAMENTO REGIONAL

Rua Curitiba, 832 – 9ª andar - Centro - 30.170-120 - Belo Horizonte-MG – Brasil Tel.: (31)3279.9144/3279.9148/3279.9149 – Fax: (31)3279.9146/3201.3657

http://www.cedeplar.ufmg.br

META 01 ANÁLISE DO RENDIMENTO

ESCOLAR

AVALIAÇÃO DE DESEMPENHO: FATORES ASSOCIADOS

1999 A 2003

VOLUME 1

Convênio nº 29/2002

Belo Horizonte, Março/2005

SUMÁRIO VOLUME I PáginaIntrodução................................................................................................................ 4 Ação 1.1 – Processamento e preparação do microdados................................... 10

1.1 – Preparação dos microdados 4ª a 8ª série................................. Limpeza do banco de dados – 1999 a 2003.............................. Construção do dicionário de dados da base de dados “Avaliação de Desempenho: Fatores Associados”.......................... 1.2 – Conclusão da documentação e da base de dados definitiva

e completa da pesquisa longitudinal........................................... 1.3 – Disseminação da base de dados da pesquisa longitudinal

para a comunidade científica e educacional...............................

11 18

22

26

64 Ação 1.2 – Implementação da pesquisa de campo..............................................

1.1 – Elaboração da ficha escolar do aluno referente a 2002.......... 1.2 – Aplicação da ficha escolar do aluno referente a 2002............ 1.3 – Elaboração da ficha escolar do aluno referente a 2003......... 1.4 – Aplicação da ficha escolar do aluno referente a 2003............ 1.5 – Processamento e geração do Banco de Dados 8ª série

(2003) e 7ª série (2003)................................................................... Processamento dos instrumentos provas e questionários da 8ª série/2003 e da 7ª série/2003...................................................... Processamento de dados das fichas escolares da 7ª série/2002, 8ª série/2003 e da 7ª série/2003 – REP7.......................... Gerenciamento do banco de dados da 8ª série/2003............... Gerenciamento do banco de dados da 7ª série/2003-REP7.... Processamento de dados das Fichas Histórico Escolar – Alunos 1999..........................................................................................

68 71 78 88

100

111

112

114 116 124

132

Ação 1.3 – Estimativas de fatores determinantes do rendimento escolar no ensino fundamental................................................................................................

1.1 – Análise descritiva da base de dados longitudinal (4ª a 8ª série)................................................................................................

Analises descritivas dos escores clássicos para as disciplinas de matemática e de português........................................ Análises descritivas dos escores equalizados para as disciplinas de matemática e de português........................................ Análise de trajetórias segundo os escores clássicos e equalizados........................................................................................... 1.2 – Análise final dos determinantes do rendimento escolar,

com base nos dados longitudinais (4ª a 8ª séries)..................... Qualidade dos itens e processos de equalização para as provas de português e matemática de acordo com a Teoria da Resposta ao Item (TRI)......................................................................... Estimação de modelos hierárquicos longitudinais para as disciplinas de matemática e português............................................. Apêndice do relatório sobre estimação de modelos hierárquicos longitudinais para as disciplinas de matemática e português.............................................................................................. 1.3 – Avaliação do impacto do bolsa escola e renda mínima

sobre o rendimento escolar..........................................................

134

137

138

176

214

222

223

242

298

311

Ação 1.5 – Estudos sobre apermanência e transições dos alunos no sistema educacional brasileiro............................................................................................

1.1 – Análise sobre promoção, permanência e aproveitamento escolar dos alunos (4ª a 8ª série).................................................

1.2 – Avaliação do impacto do bolsa escola e renda mínima sobre o desempenho escolar (promoção, permanência escolar e aproveitamento)............................................................

328 329

339

Considerações finais.............................................................................................. 345 Bibliografia.............................................................................................................. 347 Anexos..................................................................................................................... VOLUME 2 Anexo 1 – Gráficos e tabelas do relatório de Qualidade dos itens e processos de equalização para as provas de português e matemática de acordo com a Teoria da Resposta ao Item (TRI).................................................. VOLUME 3 Anexo 2 – Dissertação “Fatores Associados ao Rendimento Escolar de Alunos da 5ª série (2000) – uma abordagem do valor adicionado e da heterogeneidade” autoria de Gláucia Alves Macedo...........................................

351

Vol. 2

Vol. 3

4

META 1 – ANÁLISE DO RENDIMENTO ESCOLAR

APRESENTAÇÃO

O cenário delineado, nas últimas décadas, para o sistema educacional

brasileiro revela importantes transformações em diversos aspectos. Destaca-se

a ampliação do acesso à escola no ensino fundamental e uma melhoria nos

níveis médios de escolarização atingidos. Entretanto, muitas lacunas ainda se

fazem notar. A escolaridade média, mensurada em termos de anos médios de

estudo, ainda se encontra abaixo da alcançada por diversos países em

desenvolvimento, enquanto persistem acentuadas desigualdades,

principalmente regionais, em termos de acesso a oportunidades educacionais

(MARTELETO, 2002).

As mudanças demográficas, principalmente a queda nos níveis de

fecundidade, a partir da década de 1970, têm proporcionado uma diminuição

proporção de população em idade de cursar a educação primária, de tal sorte

que a falta de escolas parece não ser o principal problema do sistema brasileiro

de educação e maior atenção deve ser dada a questões como a qualidade da

educação e à repetência (FLETCHER & RIBEIRO, 1987; KLEIN, 1995). Abre-

se um cenário onde assume crucial importância a investigação de aspectos

ligados à qualidade, eficácia e rendimento escolar.

De uma forma geral, a literatura da proficiência educacional, incluindo

especialmente áreas como Economia e Educação, estabelece, em geral, três

níveis de fatores aos quais a proficiência está associada: nível do aluno, nível

da turma e nível da escola (HANUSHEK, 2002; WILLMS & SOMERS, 1999;

SOARES, CÉSAR & MAMBRINI, 2001). Isto se deve ao fato dos dados

educacionais apresentarem uma estrutura hierárquica, estando os alunos

aninhados em turmas e estas aninhadas em escolas.

5

Entretanto, essa literatura não é consensual, nem quanto aos fatores

associados à proficiência, nem quanto às definições do efeito-escola e nem

quanto às suas formas de operacionalização (WILLMS, 2000; TOOD &

WOLPIN, 2003; FERRÃO & FERNANDES, 2003).

O termo efeito-escola foi definido, por FERRÃO & FERNANDES (2003), como

a proporção da variância total que está associada à variância entre as escolas,

ou seja, o quanto da variação do rendimento escolar entre os alunos é

explicado por diferenças existentes entre as escolas que eles frequentam. Nos

modelos estimados num das ações a seguir, o efeito-escola pode estar

associado ao status inicial de desempenho, à taxa linear média de crescimento

no desempenho do aluno de um período para o seguinte ou à taxa não linear

média de crescimento.

Considerando a necessidade de se conhecer melhor os fatores associados à

proficiência escolar, visando contribuir de alguma forma para a melhoria do

sistema educacional brasileiro, este relatório pretende investigar quais são os

fatores associados à proficiência educacional da quarta à oitava série do

ensino fundamental no norte, no nordeste e no centro-oeste brasileiros que,

conforme SAEB (2004), são as regiões do Brasil com os piores resultados em

termos de desempenho.

Por outro lado, têm se observado uma preocupação, por parte dos órgãos

governamentais com questões ligadas à educação de crianças provenientes de

famílias de baixa renda, principalmente visando a permanência na escola, por

meio de incentivo financeiro, buscando contribuir para a melhoria das

condições de vida no seio dessas famílias e, conseqüentemente, no país.

Nesse sentido, iniciativas vêm sendo desenvolvidas, como por exemplo o

programa bolsa escola e mais recentemente o bolsa família, visando quebrar o

círculo da transmissão intergeracional da pobreza, via educação.

Este relatório procura cumprir a descrição detalhada das atividades

relacionadas à meta 1: Análise de Rendimento Escolar. Esta meta está dividida

em quatro ações : Ação 1.1. Processamento e preparação dos microdados;

Ação 1.2. Implementação da pesquisa de campo; Ação 1.3. Estimativas de

fatores determinantes do rendimento escolar o ensino fundamental e Ação 1.5.

6

Estudos sobre a permanência de transições dos alunos no sistema educacional

brasileiro.

Cada uma dessas ações está sub-dividida em seções. Desta forma, a ação que

informa sobre o processamento e preparação dos microdados indica o

processo de “limpeza” por que passaram os dados, descreve o banco de dados

disponível em versão SAS e SPSS e sua documentação correspondente (como

por exemplo, dicionários, manual de utilização, programas para label de

variáveis e suas categorias em SPSS, dentre outros). Neste ponto vale

ressaltar que o banco de dados ainda sofre com problemas em variáveis

chaves, como por exemplo, as variáveis identificadoras do aluno e da escola e

a variável turno.

Diante dessas circunstâncias, para a estimação dos fatores determinantes do

desempenho nas disciplinas de matemática e português, a opção adotada foi

considerar apenas os alunos de trajetória completa na estimação de tais

modelos, ou seja, alunos que estiveram presentes ao longo de todas as seis

rodadas realizadas pela pesquisa. Esta opção foi escolhida em virtude da

grande quantidade de valores em branco (missings) presentes nas variáveis

preditoras, mas, principalmente, pelo fato do banco de dados, ainda,

apresentar erros na variável identificadora do aluno. Desta forma, tentou-se

minimizar problemas de identificadores diferentes para o mesmo aluno ao

longo da pesquisa, uma vez que todos os alunos considerados participaram de

todas as rodadas e, portanto, apresentavam o mesmo identificador ao longo da

pesquisa. Contudo, este relatório apresenta um apêndice, contendo resultados

de modelos estimados com alunos que participaram de pelo menos duas

rodadas da pesquisa.

Faz parte ainda desta ação o item sobre disseminação da base de dados.

Neste item são descritos os três seminários em que foram apresentados

resultados com a utilização do banco de dados da pesquisa “Avaliação de

Desempenho: Fatores Associados”.

A ação 1.2, como dito anteriormente, diz respeito à implementação da pesquisa

de campo, informando sobre a elaboração e aplicação das fichas escolares dos

alunos que cursaram a sétima série em 2002 e, a oitava em 2003. Nesta ação,

consta ainda um relatório sobre o processamento e a geração do banco de

7

dados das respectivas séries citadas acima. Consta, também, nesta ação o

processo de elaboração e da coleta da Ficha Histórico Escolar, bem como a

construção e formação do seu banco de dados. Este banco de dados foi criado

com o intuito de resgatar a trajetória escolar dos alunos que compuseram a

amostra inicial da pesquisa e vai permitir estudos futuros com o cruzamento do

banco longitudinal da pesquisa “Avaliação de Desempenho: Fatores

Associados”.

Por sua vez, a ação 1.3 é voltada a análises estatísticas, desde aquelas mais

simples até a estimação de modelos mais complexos. Esta ação está dividida

em três seções, que compreendem seis relatórios. Para a primeira seção, são

apresentados três relatórios sobre análises descritivas da base de dados

longitudinal: 1) Análises estatísticas descritivas dos escores clássicos para as

disciplinas de matemática e de português; 2) Análises estatísticas descritivas

dos escores equalizados para as disciplinas de matemática e de português e 3)

Análise de trajetórias, segundo os escores clássicos e equalizados em

matemática e português.

Nos dois primeiros relatórios podem ser encontradas análises descritivas dos

escores clássicos e equalizados por estado e por turno, separadamente para

cada disciplina. O principal objetivo desses relatórios era mostrar a diferença

nos resultados descritivos, quando se utiliza escores clássicos e escores

equalizados. Esta diferença foi também evidenciada no relatório de Análises de

Trajetórias, que mostra curvas com estrutura bem mais próxima à do padrão de

uma curva de aprendizagem, quando se utiliza os escores equalizados, ou

seja, aqueles estimados e equalizados de acordo com a Teoria da Resposta ao

Item (TRI).

Na segunda seção “Análise final dos determinantes do rendimento escolar,

com base nos dados longitudinais (quarta a oitava séries)” constam dois

relatórios: 1) Qualidade dos itens e processos de equalização para as provas

de português e matemática, de acordo com a Teoria da Resposta ao Item e 2)

Estimação de modelos hierárquicos longitudinais nas disciplinas de matemática

e de português.

No relatório sobre estimação (calibração) e equalização de acordo com a

Teoria da Resposta ao Item, inicialmente, apresenta-se uma introdução sobre

8

a TRI, incluindo além da especificação teórica do modelo, critérios, geralmente,

utilizados por especialistas da área para a determinação da qualidade dos

itens. Complementando esta introdução, a seguir é mostrado um resumo

teórico sobre processos de equalização de acordo com a TRI. Posteriormente,

são interpretados os resultados da estimação (calibração) e da qualidade dos

itens para as disciplinas de matemática e de português, assim como foram

também descritos os processos e os resultados da equalização para as provas

das referidas disciplinas.

Tendo modelado a variável latente o escore equalizado, estimado de acordo

com a TRI, passou-se então ao processo de estimação de modelos

hierárquicos longitudinais para as disciplinas de português e matemática,

separadamente. Para a estimação desses modelos, conforme mencionado

anteriormente, optou-se por trabalhar com os alunos de trajetória completa, ou

seja, alunos que estiveram presentes ao longo de todas as seis rodadas

realizadas pela pesquisa.

Esta opção foi escolhida em virtude da grande quantidade de valores em

branco (missings) presentes nas variáveis preditoras, mas, principalmente, pelo

fato do banco de dados, ainda, apresentar erros na variável identificadora do

aluno. Desta forma, tentou-se minimizar problemas de identificadores

diferentes para o mesmo aluno ao longo da pesquisa, uma vez que todos os

alunos considerados participaram de todas as rodadas e, portanto,

apresentavam o mesmo identificador ao longo da pesquisa. Contudo, este

relatório apresenta um apêndice, contendo resultados de modelos estimados

com alunos que participaram de pelo menos duas rodadas da pesquisa. Assim,

é possível observar a diferença nos modelos que consideram os alunos de

trajetória completa e aqueles que levam em conta os alunos que participaram

de pelo menos duas avaliações.

No terceiro tópico “Avaliação do impacto da bolsa escola e renda mínima sobre

o rendimento escolar”, apresenta-e um relatório com análises descritivas,

sugerindo qual o tipo de relação entre o impacto do programa bolsa escola e o

rendimento escolar.

Para a ação 1.5 “Estudos sobre a permanência e transições dos alunos no

sistema educacional brasileiro” foi realizado apenas um relatório em função da

9

falta de disponibilidade que impossibilitou a realização do segundo relatório. O

primeiro deles se refere à análise descritiva sobre a promoção, a permanência

e o aproveitamento escolar dos alunos, de 1999 a 2003. O segundo diz

respeito à avaliação do impacto do bolsa escola e renda mínima sobre o

desempenho escolar, no que tange à promoção, permanência escolar e

aproveitamento. Contudo, este último relatório não pôde ser realizado em

virtude, especialmente, da não disponibilidade dos bancos de dados de

pagamento e de freqüência. O único banco de dados disponível até o momento

é o do cadastro, por meio do qual não é possível identificar exatamente a que

data se refere cada observação. Sendo assim, espera-se que com a

disponibilidade futura desses bancos, o estudo da avaliação do impacto do

bolsa escola no rendimento - no que tange à promoção, permanência e

aproveitamento escolar – possa ser realizado com a adoção de modelagem

mais acurada e adequada a este tipo de dados.

10

AÇÃO 1.1 – PROCESSAMENTO E PREPARAÇÃO DOS MICRODADOS

APRESENTAÇÃO

Esta ação se refere ao processo de preparação dos dados que foram digitados

em formato MS Access 2000 e convertido para microdados, no formato SAS V8

Windows e em SPSS, envolvendo, portanto, todo o processo de limpeza dos

dados, a formação e a construção do banco de dados longitudinal, além do

dicionário do banco de dados referente à pesquisa “Avaliação de Desempenho:

Fatores Associados”. Faz parte, também, desta ação o processo de

disseminação de informações sobre a pesquisa “Avaliação de Desempenho:

Fatores Associados”, por meio de workshops e seminários realizados para a

comunidade científica e educacional.

Sendo assim, esta ação está dividida em três produtos:

1.1 – Preparação dos microdados 4ª a 8ª série;

1.2 - Conclusão da documentação e da base de dados definitiva e completa da

pesquisa longitudinal.

1.3 - Disseminação da base de dados da pesquisa longitudinal para a

comunidade científica e educacional.

É parte integrante deste relatório toda a documentação referente ao banco de

dados: base de dados em versão SAS e SPSS, os arquivos format e labels, e o

Dicionário da base de dados “Avaliação de Desempenho: Fatores Associados”.

Os arquivos estão sendo apresentados em mídia CD, juntamente com a versão

impressa deste relatório.

11

1.1 – PREPARAÇÃO DOS MICRODADOS 4ª a 8ª SÉRIE

APRESENTAÇÃO

A análise de rendimento escolar dos alunos que compõem o banco de dados

da pesquisa “Avaliação de Desempenho: Fatores Associados” (4ª a 8ª séries),

demandou a preparação e o processamento dos dados da base longitudinal

gerada pela pesquisa no período de 1999 a 2003.

Os dados coletados referem-se aos resultados finais dos alunos, notas nos

testes de matemática e de português aplicados para alunos de 4ª a 8ª série,

além de informações características (questionários auto declarados) de alunos,

professores e diretores, como também questionários sobre as condições das

escolas, preenchidos por aplicadores. Vale ressaltar ainda que também se

encontram disponíveis neste banco de dados os escores equalizados de

matemática e de português, de acordo com a Teoria da Resposta ao Item

(TRI).

Tendo em vista a complexidade e o volume das informações obtidas, os dados

sofreram um processamento, que incluiu diferentes etapas de crítica e

checagem de consistência das respostas, limpeza e padronização com os

demais anos, além da conversão dos dados do formato MS Access 2000 para

o formato SAS V8 Windows e o formato SPSS, procurando facilitar a sua

utilização para as análises estatísticas.

Os dados originalmente recebidos pelo CEDEPLAR, fornecidos pela Café

Software S/C estavam em formato MS Access 2000 e organizados conforme o

modelo relacional clássico para estruturação de dados.

O pesquisador da área de ciências sociais precisa dos dados, objeto da

pesquisa, em formato de microdados. Neste formato, as tabelas são

organizadas tendo como unidade estruturante uma entidade. No caso da

presente pesquisa, as entidades principais eram ESCOLA, PROFESSOR e

ALUNO. Além disso, estes dados foram coletados em diversos pontos no

12

tempo. Nada mais natural do que dividir a organização das bases de

microdados em anos, assim como outros institutos de ciências sociais

aplicadas o fazem, como, por exemplo, o IBGE e o IPEA, entre outros.

Foram então desenvolvidos programas de conversão de dados da plataforma

MS Access 20900 para a Plataforma SAS. A escolha do pacote SAS é

justificada pela comprovada eficiência no tratamento estatístico de base de

dados. As rotinas de processamento da base de 2003 seguiram o padrão

apresentado no tratamento das bases de 1999 a 2002, conforme relatório

apresentado em 2003. A forma de ligação dessas bases de microdados é

explicada e exemplificada com programas em Stata, SPSS, SAS e em SQL na

documentação anexa.

As tabelas originais em formato eram:

Referentes a escola

CAD_ESCOLA

CAP_ESCOLA_PDE

QUEST_ROTEIRO_ESCOLA_1999

QUEST_DIRETOR_1999

QUEST_ROTEIRO_ESCOLA_2000

QUEST_DIRETOR_2000

QUEST_ROTEIRO_ESCOLA_2001

QUEST_DIRETOR_2001

QUEST_ROTEIRO_ESCOLA_2002

QUEST_DIRETOR_2002

QUEST_ROTEIRO_ESCOLA_2003

QUEST_DIRETOR_2003

13

Referentes ao professor

CAD_GERAL_PROFESSOR

7REP CAD_GERAL_PROFESSOR

QUEST_PROF_1999

QUEST_PROF_2000

QUEST_PROF_2001

QUEST_PROF_2002

QUEST_PROF_2003

7REP QUEST_PROFESSOR_2003

Referentes ao aluno

CAD_GERAL_ALUNO

7REP CAD_GERAL_ALUNO

QUEST_ALUNO_1999

QUEST_ALUNO_2000

QUEST_ALUNO_2001

QUEST_PAI_2001

QUEST_ALUNO_2002

QUEST_ALUNO_2003

7REP QUEST_ALUNO_2003

FICHA_ALUNO_1999

FICHA_ALUNO_2000

FICHA_ALUNO_2001

FICHA_ALUNO_2002

FICHA_ALUNO_2003

7REP FICHA_ALUNO_2003

14

FICHA_ALUNO_REND_DISCIPLINA

7REP FICHA_ALUNO_REND_DISCIPLINA

PROVA_ALUNO

7REP PROVA_ALUNO

Referente ao relacionamento das entidade ALUNO/PROFESSOR, identificado

em toda a documentação como PROFESSOR DOCENTE

PROVA_PROFESSOR

FICHA_PROFESSOR

7REP FICHA_PROFESSOR

PROF_FUNC_DOC_ALU

PROF_FUNCAO_DOC

7REP PROF_FUNCAO_DOC

CAD_UFS

GABARITO_ALUNO

GABARITO_PROF

Ao final do processamento, optamos por fornecer bases de microdados no

formato SAS e, também, no formato SPSS, outro importante pacote estatístico

disponível no mercado.

Os arquivos são:

esco1999.sas7bdat,

esco1999.sav,

esco2000.sas7bdat,

esco2000.sav,

esco2001.sas7bdat,

esco2001.sav,

15

esco2002.sas7bdat,

esco2002.sav,

esco2003.sas7bdat,

esco2003.sav,

prof1999.sas7bdat,

prof1999.sav,

prof2000.sas7bdat,

prof2000.sav,

prof2001.sas7bdat,

prof2001.sav,

prof2002.sas7bdat,

prof2002.sav,

prof2003.sas7bdat,

prof2003.sav,

prof2003r.sas7bdat,

prof2003r.sav,

pdma0499.sas7bdat,

pdma0499.sav,

pdpo0499.sas7bdat,

pdpo0499.sav,

pdma1199.sas7bdat,

pdma1199.sav,

pdpo1199.sas7bdat,

pdpo1199.sav,

pdma2000.sas7bdat,

pdma2000.sav,

16

pdpo2000.sas7bdat,

pdpo2000.sav,

pdma2001.sas7bdat,

pdma2001.sav,

pdpo2001.sas7bdat,

pdpo2001.sav,

pdma2002.sas7bdat,

pdma2002.sav,

pdpo2002.sas7bdat,

pdpo2002.sav,

pdma2003.sas7bdat,

pdma2003.sav,

pdpo2003.sas7bdat,

pdpo2003.sav,

pdma2003r.sas7bdat,

pdma2003r.sav,

pdpo2003r.sas7bdat,

pdpo2003r.sav,

alun1999.sas7bdat,

alun1999.sav,

alun2000.sas7bdat,

alun2000.sav,

alun2001.sas7bdat,

alun2001.sav,

alun2002.sas7bdat,

alun2002.sav,

17

alun2003.sas7bdat,

alun2003.sav,

alun2003r.sas7bdat,

alun2003r.sav

18

LIMPEZA DO BANCO DE DADOS – 1999 A 2003

APRESENTAÇÃO

As atividades de limpeza do banco de dados da pesquisa “Avaliação de

Desempenho: Fatores Associados” tiveram grande importância para o produto

final da geração de uma base de dados de domínio público, tendo em vista que

elas contribuíram para garantir uma melhor qualidade da informação coletada.

As limpezas da base de dados foram iniciadas em 2002 – quando a pesquisa

passou a ser coordenada pelo CEDEPLAR/FACE/UFMG – para as bases de

cada ano da pesquisa, correspondente a cada série pesquisada (4ª a 8ª

séries). A limpeza consistiu em uma correção dos campos, seguindo uma

padronização destes campos para todo o conjunto da base.

Para os anos de 1999 a 2002 foi realizada em todas as tabelas uma

conferência de todas as respostas das questões em relação às imagens

digitalizadas encontradas.

Além disso, foi realizada a consistência dos dados das imagens em relação ao

que estava na base digitada, sendo encontrados erros de consistência.

Partindo desta conferência, foram corrigidos todos os erros encontrados nas

questões conforme as respectivas imagens: incluídos registros que estavam

faltando em algumas tabelas e excluídos registros que estavam errados em

outras.

Assim, a limpeza da base de dados, até a 7ª série - 2002, seguiu as atividades

previstas no plano de trabalho e que foram as seguintes:

19

Conferência de todos os questionários de Diretores (1999, 2000, 2001 e

2002).

Padronização de respostas nas questões do Questionário Diretor 2001.

Preenchimento das questões texto e/ou numéricas em branco, que

possuem respostas, de acordo com as imagens dos questionários.

Padronização de “W” e “w” que significa a mesma resposta (resposta em

branco), para os Questionários Diretores, Professores, Alunos e Roteiro

Escola (1999, 2000, 2001 e 2002).

Conferência de todos os Questionários Roteiros Escolas (1999, 2000, 2001

e 2002).

Inclusão do campo Comentários nos Questionários Roteiro Escola (1999,

2000, 2001 e 2002), ou seja, digitar o campo de comentários, que os

aplicadores responderam nos questionários, nas tabelas dos quatro anos,

de acordo com suas respectivas imagens.

Análise das provas de alguns professores que não estão na tabela

Prova_Professor do ano de 2000, e que possuem imagem de provas.

Conferência de todos os questionários de pais, conforme suas imagens.

Desdobramento de algumas questões da tabela Quest_Pais_2001 (25, 26 e

31), dado que tais questões permitem mais de uma resposta.

Preenchimento de questões da tabela Quest_Professor_2001 que estão em

branco e há respostas dos professores para esta questão nas imagens dos

questionários.

Revisão dos dados de Turno e Turma do questionário de diretor 1999 que

estão com respostas confusas, considerando se há necessidade destes

campos continuarem na tabela Quest_Diretor_1999.

Complementação do campo sexo da tabela Cad_Geral_Professor do

restante de registros que ainda estão em branco. Para isso foram

verificados os questionários, provas e ficha de professores.

Verificação das imagens dos questionários de alunos com páginas inteiras

em branco (tabela Quest_Aluno_1999).

20

Revisão e padronização das informações relativas a tabela Ficha_Aluno.

Por exemplo, os alunos com média zero que foram aprovados. O “zero”

atribuído a estes alunos não corresponde a uma nota zero.

Incorporação à base de dados de informações sobre entrada no PDE (se

participa, ano e mês de entrada, o que corresponde à fase de capacitação

da equipe escolar).

Padronização de respostas digitadas em caracteres maiúsculos e

minúsculos com o mesmo significado.

Resgate do resultado final de alguns alunos através da avaliação das

imagens e da checagem das notas. Os resultados finais apresentavam

erros de digitação que foram padronizados e/ou campos em branco. Ficha

Aluno (1999, 2000 e 2001)

Tratamento das respostas compostas em questões que apresentavam

opções fechadas e únicas através da listagem das combinações que

apresentavam freqüência relevante.

Checagem nas imagens e questões com opções que não constavam entre

as possíveis respostas.

Para a 8ª série e a REP7 – 2003, foi criado, desde o processo inicial de

entrada de dados, mecanismos controladores, para reduzir o número de

ocorrências de erros. Assim, todo o processo de digitação foi acompanhado

pelo CEDEPLAR, contudo pela própria dimensão do banco de dados, foi ainda

necessário fazer novas limpezas, porém em proporção e escalas bem menores

que nos anos anteriores.

Para a variável sexo, por exemplo, foram detectados e corrigidos em torno de

700 alunos que responderam esta questão equivocadamente. Isto foi detectado

em função da comparação do nome do aluno presente no seu cadastro com

suas respostas aos questionários ao longo da pesquisa.

No caso da ficha escolar do aluno, até 2001, foram preenchidos alguns campos

em branco para as variáveis turno e turma, de acordo com as respostas que

haviam sido dadas nas provas dos anos correspondentes.

21

Conforme dito anteriormente, apesar de todo o empenho do CEDEPLAR no

processo de limpeza e consistência dos dados, ainda foram identificados erros,

em especial, com a variável identificadora do aluno, levando este banco de

dados a ser utilizado com determinada cautela.

Recomenda-se que, posteriormente, este banco de dados passe por um

processo de identificação e correção de erros em variáveis chaves como a de

identificação do aluno e da escola.

22

CONSTRUÇÃO DO DICIONÁRIO DE DADOS DA BASE DE DADOS “AVALIAÇÃO DE DESEMPENHO: FATORES

ASSOCIADOS”

APRESENTAÇÃO

O dicionário de dados da banco de dados da pesquisa “Avaliação de

Desempenho: Fatores Associados” tem por objetivo permitir ao usuário da base

de dados encontrar uma descrição de todas as variáveis contidas na base, que

tiveram seus nomes modificados em relação à base original em formato MS

Access 2000.

Os procedimentos adotados para elaboração do Dicionário de Dados seguiram

um determinado padrão, capaz de atender as principais estratégias de análise.

As convenções assumidas para construção do citado padrão foram

apresentadas nos relatórios anteriores e que são reproduzidas abaixo.

O Dicionário de Dados, parte integrante deste relatório, está disponível em

meio eletrônico (CD) juntamente com as versões da base de dados da

pesquisa.

23

TABELAS DE CONVENÇÕES

Tabela 1 – Nomes das Variáveis 1º dígito = Letras A(Aluno),P(Professor),D(Diretor) ou E(Escola) 2ºdígito = informação da rodada da pesquisa

Abril de 1999 8 Novembro de 1999 9 Novembro de 2000 0 Novembro de 2001 1 Novembro de 2002 2 Novembro de 2003 3

Dígitos restantes (3 a 8)= identificação da variável Matemática m Português p Resultado final res Situação final sit Respostas das questões das provas r

Tabela 2A– Padrões de Re-codificação dos Dados Branco e W 8888 *, Questão anulada 9999

24

Tabela 2B– Padrões de Re-codificação dos Dados Sim/Não NÃO = 0 SIM = 1 Sexo Masculino = 0 Feminino = 1 Quantidade Nenhum/um/dois ou + 0-1-2 Alfabeto Alfabeto (ABCDE...) 0-1-2-3-4-5.....

MATEMATICA 0 Matérias PORTUGUÊS 1 Integral 0 Manhã 1 Turno Tarde 2 Aprovado 1 Reprovado 0 Evadido 2 Transferido 3 Aluno inexistente 4 Classe de aceleração 5 Mudança de turma 6 Progressão parcial 7 Ver OBS 8

Resultado e Situação Final

Desistente 9 Ruim 0 Razoável 1 Boa 2

Nota da escola

Ótima 3 Branca 0 Mulato 1 Negro 2 Amarelo 3

Raças

Indígena 4 Solteiro 0 Casado 1 Viúvo 2 Separado 3

Estado Civil

Outro 4 Nunca 0 Às vezes 1

Resposta com conotação gradativa (1) Com freqüência 2

A 0 B 1 C 2

Questões das provas de prof. e alunos de port. e mat. para todas as séries D 3

(1) Trata-se de apenas um exemplo de respostas com conotação gradativa. Questões semelhantes são tratadas admitindo o mesmo padrão: da menor para a maior

freqüência.

25

Tabela 2C– Padrões de Re-codificação dos Dados Média (Ficha do aluno) 0 a 10 Nota da prova aplicada (score) 0 a 100 Correções das respostas das questões das provas Certo Errado

1 0

DESCRIÇÃO DO DICIONÁRIO DE DADOS

No documento Livro de Códigos, cada variável representa uma linha, contendo

as seguintes informações:

Primeira coluna (Identificação da questão no instrumento): localização da

variável no respectivo questionário (ex: questão 1, questão 2, etc.) Sendo

que cada questionário representa uma seção na tabela;

Segunda coluna (Nome da variável): nome atribuído à variável que segue o

princípio das convenções adotadas;

Terceira coluna (Descrição da variável): descrição e significado da variável;

Quarta coluna (Alternativas de respostas dos instrumentos): indica as

opções possíveis de resposta na base de dados original para cada variável

(ex: A,B,C, etc).

Quinta coluna (Recodificação das respostas): recodificação das opções de

resposta, baseada na Tabela de Convenções para facilitar o processamento

dos dados.

26

1.2 – CONCLUSÂO DA DOCUMENTAÇÃO E DA BASE DE DADOS DEFINITIVA E COMPLETA DA PESQUISA LONGITUDINAL

APRESENTAÇÃO

O objetivo do presente documento é apresentar a estruturação dos diversos

arquivos que compõem os microdados da pesquisa “Avaliação de

Desempenho: Fatores Associados” – 1999/2003.

Para tal estruturação foi adotado um modelo relacional (entidades e

relacionamentos) em que cada entidade seja ALUNO, ESCOLA ou

PROFESSOR, seria dividida em diversos arquivos sendo um arquivo para cada

ano. Esse procedimento é justificado pelo interesse natural dos pesquisadores

que utilizarão as bases de dados em estudarem separadamente cada ano.

Aqueles que quiserem realizar um estudo ao longo dos anos poderão fazê-lo

unindo os arquivos que compõem a entidade a partir do campo chave primária.

Além de abordar os aspectos que envolvem a utilização das bases de dados da

pesquisa “Avaliação de Desempenho: Fatores Associados”, serão

apresentados os programas utilizados para a entrada de dados das fichas

escolares dos alunos em 2002 (7ª série) e em 2003 (8ª série). Também foram

coletadas as fichas dos alunos que estavam na 7ª série em 2003, e que foi

chamado de REP7. Estes alunos receberam uma atenção especial e seus

dados foram separados em bases distintas, constituindo microdados distintos

para os dados dos alunos e dos professores. Também será apresentado o

programa utilizado para a entrada de dados da Ficha Histórico Escolar, ficha

que registra a trajetória escolar dos alunos que faziam parte da fase inicial da

pesquisa – 4ª série/1999. Estes dados foram um banco de dados distinto do

banco de dados longitudinal.

27

Outro tópico que será abordado, trata-se da base de dados do SEBE da

Prefeitura Municipal do Recife/PE. Procurou-se identificar alunos que

pertencessem às bases de dados tanto da pesquisa “Avaliação de

Desempenho: Fatores Associados” quanto do SEBE.

28

DESCRIÇÃO DAS ENTIDADES

ENTIDADE ESCOLA:

Arquivos:

• esco1999

• esco2000

• esco2001

• esco2002

• esco2003

Chave primária em cada um dos arquivos: IdEscola

Relacionamento UM-PARA-MUITOS com a entidade ALUNO

Relacionamento UM-PARA-MUITOS com a entidade PROFESSOR

Para unir os diversos arquivos formando apenas um arquivo escola basta

utilizar o campo IdEscola comum a todos arquivos.

Exemplo de programa SAS para fazer a união desses arquivos. É importante

destacar que os arquivo devem ser ordenados previamente pela variável

idescola.

proc sort data=esco1999; by idescola; run; proc sort data=esco2000; by idescola; run; proc sort data=esco2001; by idescola; run; proc sort data=esco2002; by idescola; run; proc sort data=esco2003; by idescola;

29

run; data escola; merge esco1999 esco2000 esco2001 esco2002 esco2003; by idescola; run;

Exemplo de programa SPSS para fazer a união desses arquivos. É importante

destacar que os arquivo devem ser ordenados previamente pela variável

idescola.

GET FILE="esco1999.sav". SORT CASES BY idescola. SAVE OUTPUT="esco1999.sav". GET FILE="esco2000.sav". SORT CASES BY idescola. SAVE OUTPUT="esco2000.sav". GET FILE="esco2001.sav". SORT CASES BY idescola. SAVE OUTPUT="esco2001.sav". GET FILE="esco2002.sav". SORT CASES BY idescola. SAVE OUTPUT="esco2002.sav". GET FILE="esco2003.sav". SORT CASES BY idescola. SAVE OUTPUT="esco2003.sav". MATCH FILES FILE="esco1999.sav" /FILE="esco2000.sav" /FILE="esco2001.sav" /FILE="esco2002.sav" /FILE="esco2003.sav" /BY idescola. SAVE OUTPUT="escola.sav". Exemplo de programa STATA para fazer a união desses arquivos. É importante

destacar que os arquivo devem ser ordenados previamente pela variável

idescola. A sintaxe do programa STATA apresenta o inconveniente de limitar a

união de apenas dois arquivos por instrução, portanto arquivos temporários

precisando ser gerados.

30

clear use "esco1999.dta" su sort idescola save temp1 clear use "esco2000.dta" su sort idescola merge idescola using temp1 save temp2 clear use "esco2001.dta" su sort idescola merge idescola using temp2 save temp3 clear use "esco2002.dta" su sort idescola merge idescola using temp3 save temp4 clear use "esco2003.dta" su sort idescola merge idescola using temp4 save escola

31

ENTIDADE PROFESSOR:

Arquivos:

• prof1999

• prof2000

• prof2001

• prof2002

• prof2003

Chave primária em cada um dos arquivos: IdProfes

Chave estrangeira em cada um dos arquivos: IdEscola

Para unir os diversos arquivos formando apenas um arquivo professor basta

utilizar o campo IdProfes comum a todos arquivos.

Exemplo de programa SAS para fazer a união desses arquivos. É importante

destacar que os arquivo devem ser ordenados previamente pela variável

IdProfes.

proc sort data=prof1999; by idprofes; run; proc sort data=prof2000; by idprofes; run; proc sort data=prof2001; by idprofes; run; proc sort data=prof2002; by idprofes; run; proc sort data=prof2003; by idprofes; run; data prof; merge prof1999 prof2000 prof2001 prof2002 prof2003; by idprofes; run;

32

Exemplo de programa SPSS para fazer a união desses arquivos. É importante

destacar que os arquivo devem ser ordenados previamente pela variável

idprofes.

GET FILE="prof1999.sav". SORT CASES BY idprofes. SAVE OUTPUT="prof1999.sav". GET FILE="prof2000.sav". SORT CASES BY idprofes. SAVE OUTPUT="prof2000.sav". GET FILE="prof2001.sav". SORT CASES BY idprofes. SAVE OUTPUT="prof2001.sav". GET FILE="prof2002.sav". SORT CASES BY idprofes. SAVE OUTPUT="prof2002.sav". GET FILE="prof2003.sav". SORT CASES BY idprofes. SAVE OUTPUT="prof2003.sav". MATCH FILES FILE="prof1999.sav" /FILE="prof2000.sav" /FILE="prof2001.sav" /FILE="prof2002.sav" /FILE="prof2003.sav" /BY idprofes. SAVE OUTPUT="prof.sav".

Exemplo de programa STATA para fazer a união desses arquivos. É importante

destacar que os arquivo devem ser ordenados previamente pela variável

idprofes. A sintaxe do programa STATA apresenta o inconveniente de limitar a

união de apenas dois arquivos por instrução, portanto arquivos temporários

precisando ser gerados.

clear use "prof1999.dta" su sort idprofes

33

save temp1 clear use "prof2000.dta" su sort idprofes merge idprofes using temp1 save temp2 clear use "prof2001.dta" su sort idprofes merge idprofes using temp2 save temp3 clear use "prof2002.dta" su sort idprofes merge idprofes using temp3 save temp4 clear use "prof2003.dta" su sort idprofes merge idprofes using temp4 save prof

Agora, é apresentado um exemplo de programa SAS para fazer a união do

arquivo de professores e de escolas. Para tanto, o diagrama a seguir

demonstra o relacionamento entre as entidades. Trata-se de um

relacionamento UM-PARA-MUITOS, ou seja, uma escola pode ter muitos

professores. É importante destacar que os arquivo devem ser ordenados

previamente pela variável IdEscola. Nos arquivos dos professores, as variáveis

correspondentes a IdEscola são p9idesc, p0idesc, p1idesc e p2idesc para os

anos de 1999 a 2002 respectivamente. Tal procedimento é justificado pela

possibilidade do professor estar em escolas diferentes em cada ano. Portanto,

se a variável idescola tivesse o mesmo nome em todos os arquivos de

professores, quando fizessemos a união de todos os anos, o valor dessa

variável se perderia pois seria guardado apenas o valor da variável idescola

referente ao último ano.

34

Variáveis foram criadas para indicar a existência do registro na base de dados

original. Por exemplo, as variáveis qupr1999, qupr2000, qupr2001 e qupr2002

e qupr2003 indicam a existência do registro do questionário do professor em

cada ano. Tais variáveis podem ser usadas como filtros após a união das

bases de dados.

proc sort data=esco1999; by idescola; run; data prof1999; set prof1999; rename idescola = p9idesc; run; proc sort data=prof1999; by idescola; run; /* uniao de professores com escolas para 1999 */ data pfes1999; /* base professores e escolas em 1999 */ merge prof1999 esco1999; by idescola; if qupr1999=1; /* condição opcional para filtrar apenas aqueles que responderam ao questionário do professor */ run; proc sort data=esco2000; by idescola; run; data prof2000; set prof2000; rename idescola = p0idesc; run; proc sort data=prof2000; by idescola; run; /* uniao de professores com escolas para 2000 */ data pfes2000; /* base professores e escolas em 2000 */ merge prof2000 esco2000; by idescola; if qupr2000=1; /* condição opcional para filtrar apenas aqueles que responderam ao questionário do professor */

Escola: IdEscola

Professor: IdProfes IdEscola

35

run; proc sort data=esco2001; by idescola; run; data prof2001; set prof2001; rename idescola = p1idesc; run; proc sort data=prof2001; by idescola; run; /* uniao de professores com escolas para 2001 */ data pfes2001; /* base professores e escolas em 2001 */ merge prof2001 esco2001; by idescola; if qupr2001=1; /* condição opcional para filtrar apenas aqueles que responderam ao questionário do professor */ run; proc sort data=esco2002; by idescola; run; data prof2002; set prof2002; rename idescola = p2idesc; run; proc sort data=prof2002; by idescola; run; /* uniao de professores com escolas para 2002 */ data pfes2002; /* base professores e escolas em 2002 */ merge prof2002 esco2002; by idescola; if qupr2002=1; /* condição opcional para filtrar apenas aqueles que responderam ao questionário do professor */ run; proc sort data=esco2003; by idescola; run; data prof2003; set prof2003; rename idescola = p3idesc;

36

run; proc sort data=prof2003; by idescola; run; /* uniao de professores com escolas para 2003 */ data pfes2003; /* base professores e escolas em 2003 */ merge prof2003 esco2003; by idescola; if qupr2003=1; /* condição opcional para filtrar apenas aqueles que responderam ao questionário do professor */ run;

Segue a sintaxe para o mesmo procedimento em SQL:

create table pfes1999 as select * from prof1999, esco1999 where prof1999.p9idesc = esco1999.idescola and qupr1999=1; create table pfes2000 as select * from prof2000, esco2000 where prof2000.p0idesc = esco2000.idescola and qupr2000=1; create table pfes2001 as select * from prof2001, esco2001 where prof2001.p1idesc = esco2001.idescola and qupr2001=1; create table pfes2002 as select * from prof2002, esco2002 where prof2002.p2idesc = esco2002.idescola and qupr2002=1; create table pfes2003 as select * from prof2003, esco2003 where prof2003.p3idesc = esco2003.idescola and qupr2003=1;

37

ENTIDADE ALUNO:

Arquivos:

• alun1999

• alun2000

• alun2001

• alun2002

• alun2003

Chave primária em cada um dos arquivos: IdAluno

Chave estrangeira em cada um dos arquivos: IdEscola, turno, turma, serie

(através da concatenação de tais variáveis foi criada a variável “chave”).

Para unir os diversos arquivos formando apenas um arquivo aluno basta utilizar

o campo idaluno comum a todos arquivos. Entretanto, vale ressaltar que

existem duplicações de identificações de alunos, ou seja, existem alunos com

mais de um número de identificação. Estes casos são justificados quando

alunos mudam de escola e recebem uma nova identificação na escola destino.

Esta escola destino também faz parte da pesquisa “Avaliação de Desempenho:

Fatores Associados”.

Exemplo de programa SAS para fazer a união desses arquivos. É importante

destacar que os arquivo devem ser ordenados previamente pela variável

idaluno.

proc sort data=alun1999; by idaluno; run; proc sort data=alun2000; by idaluno; run; proc sort data=alun2001; by idaluno; run; proc sort data=alun2002;

38

by idaluno; run; proc sort data=alun2003; by idaluno; run; data aluno; merge alun1999 alun2000 alun2001 alun2002 alun2003; by idaluno; run;

Exemplo de programa SPSS para fazer a união desses arquivos. É importante

destacar que os arquivo devem ser ordenados previamente pela variável

idaluno.

GET FILE="alun1999.sav". SORT CASES BY idaluno. SAVE OUTPUT="alun1999.sav". GET FILE="alun2000.sav". SORT CASES BY idaluno. SAVE OUTPUT="alun2000.sav". GET FILE="alun2001.sav". SORT CASES BY idaluno. SAVE OUTPUT="alun2001.sav". GET FILE="alun2002.sav". SORT CASES BY idaluno. SAVE OUTPUT="alun2002.sav". GET FILE="alun2003.sav". SORT CASES BY idaluno. SAVE OUTPUT="alun2003.sav". MATCH FILES FILE="alun1999.sav" /FILE="alun2000.sav" /FILE="alun2001.sav" /FILE="alun2002.sav" /FILE="alun2003.sav" /BY idaluno. SAVE OUTPUT="aluno.sav".

39

Exemplo de programa STATA para fazer a união desses arquivos. É importante

destacar que os arquivo devem ser ordenados previamente pela variável

idaluno. A sintaxe do programa STATA apresenta o inconveniente de limitar a

união de apenas dois arquivos por instrução, portanto arquivos temporários

precisando ser gerados.

clear use "alun1999.dta" su sort idaluno save temp1 clear use "alun2000.dta" su sort idaluno merge idaluno using temp1 save temp2 clear use "alun2001.dta" su sort idaluno merge idaluno using temp2 save temp3 clear use "alun2002.dta" su sort idaluno merge idaluno using temp3 save temp4 clear use "alun2003.dta" su sort idaluno merge idaluno using temp4 save aluno

Agora, é apresentado um exemplo de programa SAS para fazer a união do

arquivo de alunos e de escolas. Para tanto, o diagrama a seguir demonstra o

relacionamento entre as entidades. Trata-se de um relacionamento UM-PARA-

40

MUITOS, ou seja, uma escola pode ter muitos alunos. É importante destacar

que os arquivos devem ser ordenados previamente pela variável IdEscola. No

caso das bases de dados dos alunos, ao contrário do que ocorre nas bases de

dados dos professores, já existe a variável IdEscola originalmente presente na

tabela MS Access Cadastro Geral do Aluno. Existem também as variáveis

a9idesc, a0idesc, a1idesc, a2idesc e a3idesc, mas são cópias da IdEscola.

Portanto, não é necessário renomear as variáveis para fazer a união com a

base de dados escola. Podemos concluir que o aluno sempre pertencerá a

uma mesma escola durante o período da pesquisa.

proc sort data=esco1999; by idescola; run; proc sort data=alun1999; by idescola; run; /* uniao de alunos com escolas para 1999 */ data ales1999; /* base alunos e escolas em 1999 */ merge alun1999 esco1999; by idescola; run; proc sort data=esco2000; by idescola; run; proc sort data=alun2000; by idescola; run; /* uniao de alunos com escolas para 2000 */ data ales2000; /* base alunos e escolas em 2000 */ merge alun2000 esco2000; by idescola; run;

Escola: IdEscola

Aluno: IdAluno IdEscola

41

proc sort data=esco2001; by idescola; run; proc sort data=aluno2001; by idescola; run; /* uniao de alunos com escolas para 2001 */ data ales2001; /* base alunos e escolas em 2001 */ merge alun2001 esco2001; by idescola; run; proc sort data=esco2002; by idescola; run; proc sort data=alun2002; by idescola; run; /* uniao de alunos com escolas para 2002 */ data ales2002; /* base alunos e escolas em 2002 */ merge alun2002 esco2002; by idescola; run; proc sort data=esco2003; by idescola; run; proc sort data=alun2003; by idescola; run; /* uniao de alunos com escolas para 2003 */ data ales2003; /* base alunos e escolas em 2003 */ merge alun2003 esco2003; by idescola; run;

42

Segue a sintaxe para o mesmo procedimento em SQL:

create table ales1999 as select * from aluno1999, esco1999 where aluno1999.idescola = esco1999.idescola; create table ales2000 as select * from aluno2000, esco2000 where aluno2000.idescola = esco2000.idescola; create table ales2001 as select * from aluno2001, esco2001 where aluno2001.idescola = esco2001.idescola; create table ales2002 as select * from aluno2002, esco2002 where aluno2002.idescola = esco2002.idescola; create table ales2002 as select * from aluno2003, esco2003 where aluno2003.idescola = esco2003.idescola;

De forma semelhante ao que foi feito nos arquivos de professores, existem

variáveis nas bases de dados dos alunos que indicam a existência do registro

na base original (a variável apresenta valor 1):

• cagealun: cadastro geral do aluno.

• qalu1999: questionário do aluno em 1999.

• qalu2000: questionário do aluno em 2000.

• qalu2001: questionário do aluno em 2001.

• qalu2002: questionário do aluno em 2002.

• qalu2003: questionário do aluno em 2003.

• pama0499: prova de matemática do aluno realizada em abril de 1999.

• pama1199: prova de matemática do aluno realizada em novembro de 1999.

• pama2000: prova de matemática do aluno realizada em 2000.

• pama2001: prova de matemática do aluno realizada em 2001.

• pama2002: prova de matemática do aluno realizada em 2002.

• pama2003: prova de matemática do aluno realizada em 2003.

• papo0499: prova de português do aluno realizada em abril de 1999.

43

• papo1199: prova de português do aluno realizada em novembro de 1999.

• papo2000: prova de português do aluno realizada em 2000.

• papo2001: prova de português do aluno realizada em 2001.

• papo2002: prova de português do aluno realizada em 2002.

• papo2003: prova de português do aluno realizada em 2003.

• falu1999: ficha do aluno em 1999.

• falu2000: ficha do aluno em 2000.

• falu2001: ficha do aluno em 2001.

• qpai2001: questionário com o pai do aluno em 2001.

• falu2002: ficha do aluno em 2002.

• falu2003: ficha do aluno em 2003.

Tais variáveis podem ser usadas como filtros após a união das bases de

dados.

44

RELACIONAMENTO PROFESSOR-DOCENTE

Tais arquivos estabelecem o relacionamento entre a entidade Professor e a

entidade Aluno, ou seja, indicam quais professores lecionaram para quais

alunos. Isso é possível a partir da indicação da identificação do professor e do

conjunto escola, turno, turma e série para o qual leciona. Esse relacionamento é um relacionamento MUITOS-PARA-MUITOS. Portanto são necessárias

tabelas que estabeleçam tal relacionamento.

Arquivos:

• pdma0499: registros dos professores docentes da disciplina de matemática

em abril de 1999.

• pdpo0499: registros dos professores docentes da disciplina de português em

abril de 1999.

• pdma1199: registros dos professores docentes da disciplina de matemática

em novembro de 1999.

• pdpo1199: registros dos professores docentes da disciplina de português em

novembro de 1999.

• pdma2000: registros dos professores docentes da disciplina de matemática

em 2000.

• pdpo2000: registros dos professores docentes da disciplina de português em

2000.

• pdma2001: registros dos professores docentes da disciplina de matemática

em 2001.

• pdpo2001: registros dos professores docentes da disciplina de português em

2001.

• pdma2002: registros dos professores docentes da disciplina de matemática

em 2002.

• pdpo2002: registros dos professores docentes da disciplina de português em

2002.

45

• pdma2003: registros dos professores docentes da disciplina de matemática

em 2003.

• pdpo2003: registros dos professores docentes da disciplina de português em

2003.

Chave primária: IdProfes, IdEscola, turno, turma, serie (através da

concatenação das variáveis IdEscola, turno, turma, serie foi criada a variável

“chave” como alternativa para o usuário).

Para unir as bases Professor e Aluno, é necessário utilizar a tabela de

relacionamento Professor-Docente. Primeiro, a base de dados Aluno deve ser

combinada a base de dados Professor-Docente através das variáveis IdEscola,

turno, turma, serie (ou pela variável “chave”). Segundo, a base de dados

resultante da primeira etapa deve ser unida a base Professor através da

variável IdProfes.

A seguir, é apresentado um exemplo de programa que faz a união das bases

de dados professores e alunos utilizando a base professor-docente.

Professor Docente: IdProfes Escola Turno Turma Série (ou Chave)

Aluno: IdAluno Escola Turno Turma Série (ou Chave)

Professor: IdProfes

46

data alun2000; set alun2000; rename turno = a0turno turma = a0turma serie = a0serie; /* chave = a0chave */ run; data pdma2000; set pdma2000; rename turno = pturno turma = pturma serie = pserie; /* chave = pchave */ run; /* uniao da base aluno com professor-docente da disciplina de matemática em 2000 */ data temp; merge alun2000 pdma2000; by idescola turno turma serie; /* by chave */ if pdma2000=1; run; /* uniao com a base professor, resultando na base final de professores com respectivos alunos da disciplina de matemática em 2000 */ data pama2000; merge temp prof2000; by idprofes; run; data pdpo2000; set pdpo2000; rename turno = pturno turma = pturma serie = pserie; /* chave = pchave */ run; /* uniao da base aluno com professor-docente da disciplina de português em 2000 */ data temp; merge alun2000 pdpo2000; by idescola turno turma serie;

47

/* by chave */ if pdpo2000=1; run; /* uniao com a base professor, resultando na base final de professores com respectivos alunos da disciplina de português em 2000 */ data papo2000; /* base professor aluno (português 2000) */ merge temp prof2000; by idprofes; run;

Existem também variáveis nas bases de dados dos alunos que indicam a

existência do registro na base original MS Access (a variável apresenta valor

1):

• pdma0499: professor-docente da disciplina de matemática em abril de 1999.

• ppma0499: prova do professor-docente da disciplina de matemática em abril

de 1999.

• pdma1199: professor-docente da disciplina de matemática em novembro de

1999.

• ppma1199: prova do professor-docente da disciplina de matemática em

novembro de 1999.

• pdma2000: professor-docente da disciplina de matemática em 2000.

• ppma2000: prova do professor-docente da disciplina de matemática em

2000.

• pdma2001: professor-docente da disciplina de matemática em 2001.

• pdma2002: professor-docente da disciplina de matemática em 2002.

• pdma2003: professor-docente da disciplina de matemática em 2003.

• pdpo0499: professor-docente da disciplina de português em abril de 1999.

• pppo0499: prova do professor-docente da disciplina de português em abril

de 1999.

• pdpo1199: professor-docente da disciplina de português em novembro de

1999.

48

• pppo1199: prova do professor-docente da disciplina de português em

novembro de 1999.

• pdpo2000: professor-docente da disciplina de português em 2000.

• pppo2000: prova do professor-docente da disciplina de português em 2000.

• pdpo2001: professor-docente da disciplina de português em 2001.

• pdpo2002: professor-docente da disciplina de português em 2002.

• pdpo2003: professor-docente da disciplina de português em 2003.

Tais variáveis podem ser usadas como filtros após a união das bases de

dados.

49

FORMATAÇÃO DAS VARIÁVEIS

Anexas as bases de dados, seguem programas com o código SAS e SPSS

para formatação dos labels das variáveis. A seguir, é exemplificado o

procedimento em SAS. O programa com a formatação dos labels em SAS deve

ser executado todas as vezes em que se for trabalhar com as bases de dados

pois tais labels não ficam associados ao arquivo de dados. Tal procedimento

não é necessário no SPSS cujas bases de dados já mantêm agregados os

respectivos labels.

proc format; /* formatação das variáveis referentes ao arquivo escola1999 */ value f1088fmt /* iduf */ 11 = "Rondônia" 15 = "Pará" 26 = "Pernambuco" 28 = "Sergipe" 50 = "Mato Grosso do Sul" 52 = "Goiás"; value f1089fmt /* CAD_ESCO */ 1 = "Presente"; value f1090fmt /* pde */ 1 = "Sim" 0 = "Não"; /* continua aqui os demais “formats” da base de dados */ run; data esco1999; set esco1999; format iduf f1088fmt. CAD_ESCO f1089fmt. pde f1090fmt.; run; /* de forma alternativa, a formatação das variáveis pode ser feita no momento de solicitar as tabulações */ proc freq data=esco1999; tables iduf CAD_ESCO pde; format iduf f1088fmt. CAD_ESCO f1089fmt. pde f1090fmt.; run;

50

De forma análoga, segue o procedimento em sintaxe SPSS equivalente para a

base de dados esco1999.

value labels iduf 11 'Rondônia' 15 'Pará' 26 'Pernambuco' 28 'Sergipe' 50 'Mato Grosso do Sul' 52 'Goiás'/ CAD_ESCO 1 'Presente'/ pde 1 'Sim' 0 'Não'. freq var = iduf CAD_ESCO pde.

51

RÓTULOS DAS VARIÁVEIS

Além dos programas SAS e SPSS para formatação dos valores da variáveis,

foram disponibilizados também os programas SAS e SPSS com a sintaxe para

a atribuição dos rótulos das variáveis. Tais rótulos seriam as descrições das

variáveis de forma bem mais compreensível do que os nomes curtos usados

nos nomes das mesmas.

Parte do programa SAS para atribuição dos rótulos das variáveis da base de

dados esco1999:

data esco1999; set esco1999; /* atribuição dos rótulos das variáveis */ label iduf = "Identificação da U.F." idescola = "Número de identificação da escola" nescola = "Nome da escola" CAD_ESCO = "Presença da escola na seção da pesquisa referente ao Roteiro Escola e Questionário do Diretor de 1999" pde = "Indicação de participação no ou não no programa PDE" /* continua aqui o programa */ /* a instrução label deve ser encerrada com o símbolo de ; */ run;

Parte do programa equivalente ao apresentado anteriormente escrito em SPSS

para atribuição dos rótulos das variáveis da base de dados esco1999:

variable labels iduf 'Identificação da U.F.' idescola 'Número de identificação da escola' nescola 'Nome da escola' CAD_ESCO 'Presença da escola na seção da pesquisa referente ao Roteiro Escola e Questionário do Diretor de 1999' pde 'Indicação de participação no ou não no programa PDE'. É importante destacar que as bases de dados em formato SAS já foram

fornecidas com os rótulos das variáveis atribuídos.

52

MÁSCARAS PARA ENTRADAS DE DADOS DAS FICHAS DOS ALUNOS 2002 E 2003

Para a digitação dos dados coletados na pesquisa de campo sobre as fichas

escolares dos alunos em 2002 e 2003, foram desenvolvidos programas na

plataforma MS Access que permitissem evitar inconsistências.

Foram criados formulários para entrada de dados das fichas dos alunos da 7ª

série em 2002, dos alunos da 8ª série em 2003 e dos alunos da 7ª série em

2003 – REP7.

Foram criados também formulários para entrada de dados da ficha dos

professores da 7ª série em 2002, dos professores da 8ª série em 2003 e dos

professores da 7ª série em 2003 – REP7.

Segue a tela para a digitação dos dados da ficha do aluno da 7ª série em 2002:

53

Segue a tela para a digitação dos dados da ficha do aluno da 8ª série em 2003:

54

Segue a tela para a digitação dos dados da ficha do professor da 7ª série em

2002:

55

Segue a tela para a digitação dos dados da ficha do professor da 8ª série em

2003:

Também foi realizada em campo uma pesquisa procurando reconstituir o

histórico escolar dos alunos que estavam na pesquisa “Avaliação de

Desempenho: Fatores Associados” em 1999. Para facilitar a entrada dos dados

desses alunos, também foi criado um formulário procurando evitar as

inconsistências durante o processo de digitação. Destaque para o registro do

tempo total de permanência na escola e para o número total de repetências do

aluno.

56

57

BASE DE MICRODADOS DOS ALUNOS DA 7ª SÉRIE/2003 – REP7

De forma semelhante aos microdados a pesquisa “Avaliação de Desempenho:

Fatores Associados” para os anos 1999/2003, foram criadas entidades

baseado no modelo relacional para representar ESCOLA, PROFESSOR e

ALUNO.

A entidade ESCOLA é representada pela tabela esco2003, a mesma que

compõem os microdados da pesquisa “Avaliação de Desempenho: Fatores

Associados".

Chave primária: IdEscola

Relacionamento UM-PARA-MUITOS com a entidade ALUNO

Relacionamento UM-PARA-MUITOS com a entidade PROFESSOR

Para unir os diversos arquivos formando apenas um arquivo escola basta

utilizar o campo IdEscola comum a todos arquivos de escolas.

A entidade PROFESSOR é representada pela tabela prof2003r. A criação de

uma tabela separada para os professores dos alunos da 7 série repetente em

2003 é justificada pois estes professores não necessariamente correspondem

aos professores presentes na tabela prof2003 que lecionaram para a 8 série

em 2003:

Chave primária em cada um dos arquivos: IdProfes

Chave estrangeira em cada um dos arquivos: IdEscola

Infelizmente não é possível unir este arquivo de professores aos demais

arquivos de professores dos outros anos da pesquisa “Avaliação de

Desempenho: Fatores Associados” pois a identificação do professor (IdProfes)

não é único.

58

A entidade ALUNO é representada pela tabela alun2003r. Esta tabela tem os

dados dos alunos da 7ª série repetente:

Chave primária em cada um dos arquivos: IdAluno

Chave estrangeira em cada um dos arquivos: IdEscola, turno, turma, serie

(através da concatenação de tais variáveis foi criada a variável “chave”).

Para unir os diversos arquivos formando apenas um arquivo aluno basta utilizar

o campo idaluno comum a todos arquivos de alunos. Entretanto, vale ressaltar

que existem duplicações de identificações de alunos, ou seja, existem alunos

com mais de um número de identificação. Estes casos são justificados quando

alunos mudam de escola e recebem uma nova identificação na escola destino.

Esta escola destino também faz parte da pesquisa “Avaliação de Desempenho:

Fatores Associados”. Ou ainda, alunos que não mudaram de escola, foram

reprovados na 7 série, mas, nessa pesquisa, receberam um novo número de

identificação na 7 série repetente.

Agora, é apresentado um exemplo de programa SAS para fazer a união do

arquivo de alunos e de escolas:

proc sort data=esco2003; by idescola; run; proc sort data=alun2003r; by idescola; run; /* uniao de alunos da 7 repetente com escolas para 2003 */ data ales2003r; /* base alunos e escolas em 2003 */ merge alun2003r esco2003; by idescola; run;

59

SEBE

O objetivo do trabalho com a base de dados do SEBE da Prefeitura Municipal

do Recife/PE foi identificar alunos que recebessem o bolsa escola e tentar

verificar algum tipo de evolução na formação desse aluno na pesquisa

“Avaliação de Desempenho: Fatores Associados”.

A base de dados fornecida pela prefeitura de Recife corresponde àqueles que

fizeram o cadastro solicitando o Bolsa Escola. O formato disponibilizado foi em

Interbase 6 ou Firebird 1.5. Ambos totalmente compatíveis, sendo o primeiro

pertencente a empresa Borland Corporation e o segundo mantido pela

comunidade de software livre. A base de dados dos pagamentos do bolsa

escola não nos foi fornecida.

A seguir, são apresentadas algumas telas, listando as tabelas do sistema.

Destaque para a tabela TBREQUERENTE que mantém os dados dos pais e

responsáveis que solicitaram o bolsa escola para seus filhos e dependentes.

60

Na estrutura da tabela TBREQUERENTE, mostrada a seguir, existe a

identificação com código, nome, endereço, etc. Destaque ainda para os

campos crequetipo e cstatucodi. O campo crequetipo indica o tipo de

requerimento cujos valores seriam M para Bolsa Escola Municipal e F para

Bolsa Escola Federal. O campo cstatucodi indica um código do status do

requerimento.

A combinação dos valores desses campos indica se os dependentes desse

requerente recebem ou não algum tipo de ajuda. Esta foi a maneira encontrada

para conseguirmos algum tipo de informação sobre pagamento apenas tendo

recebido dados sobre cadastro. Todos aqueles que são do tipo de

requerimento “Bolsa Escola Municipal”, ou seja, crequetipo=M, recebem o

bolsa escola municipal. Aqueles que foram classificados para o “Bolsa Escola

Federal” (crequetipo=F) e que estão com o status valor “15” (cstatucodi=15)

recebem o bolsa escola federal.

Segue a tela com a identificação de alguns campos da tabela

TBREQUERENTE:

61

Outra tabela importante é a TBDEPENDENTE que armazena os dados dos

dependentes. Para tais dependentes, seus respectivos pais e responsáveis

solicitaram o bolsa escola, se recebem ou não, podemos determinar pelas

variáveis da tabela de requerentes apresentadas anteriormente.

Os principais campos dessa tabela TBDEPENDENTE são:

as variáveis de identificação do requerente (pai ou responsável)

CREQUECODI;

as variáveis de identificação do próprio dependente como código, nome,

sexo, data de nascimento, etc;

as variáveis de identificação da escola em que estuda.

Os campos nome do aluno e data de nascimento foram trabalhadas com na

pesquisa “Avaliação de Desempenho: Fatores Associados”, procurando

identificar alunos que estivessem presentes nas duas bases de dados. Foram

utilizadas técnicas básicas de “record matching”. Entretanto, técnicas mais

avançadas podem ser abordadas associando probabilidades no casamento de

padrões de nomes, sexo e data de nascimento, considerando ou não a

ocorrência de missing nesses valores.

62

Segue a tela com algumas variáveis da tabela TBDEPENDENTE:

63

Durante a produção desse trabalho de tentar localizar os mesmos alunos nas

duas bases de dados, foi constatada a existência de grande quantidade de

dados de alunos duplicados na base de dados da pesquisa “Avaliação de

Desempenho: Fatores Associados”, ou seja, alunos com mais de um cadastro

possuindo mais de um número de identificação e portanto representando

históricos diferentes na evolução da pesquisa.

Trata-se de alunos que saíram de uma escola e que foram para outra. Esta

outra escola também fazia parte da pesquisa “Avaliação de Desempenho:

Fatores Associados”. O aluno deveria ter recebido o mesmo número de

identificação que tinha na escola anterior, mas não foi o caso. Para o

pesquisador, tratariam de dois alunos distintos, mas, de fato, não foi o caso.

O banco de dados da pesquisa “Avaliação de Desempenho: Fatores

Associados” será apresentado na versão SAS e SPSS, e acompanha este

banco de dados o Dicionário de Dados da base de dados.

Os arquivos com toda a documentação – base de dados em versão SAS e

SPSS –, format e os labels, apresentados em mídia CD, é parte integrante

deste relatório.

64

1.3 – DISSEMINAÇÃO DA BASE DE DADOS DA PESQUISA LONGITUDINAL PARA A COMUNIDADE

CIENTÍFICA E EDUCACIONAL

APRESENTAÇÃO

De início, vale ressaltar que o banco de dados longitudinal (1999 a 2003), da

pesquisa “Avaliação de Desempenho: Fatores Associados” realizada por meio

de uma parceria entre o INEP (Instituto de Pesquisas Educacionais Anísio

Teixeira) e o CEDEPLAR (Centro de Desenvolvimento e Planejamento

Regional e Urbano) foi alvo de seminários internos do CEDEPLAR, para

detectar possíveis distorções e apresentar idéias para aprimorar as análises,

por meio deste banco, já realizadas.

Para a sociedade, em especial, o INEP e a sociedade acadêmica, estes dados

foram primeiramente apresentados no Seminário Nacional “Qualidade na

Educação: garantia de equidade e aprendizagem na escola”, realizado em

Brasília-DF, nos dias 4 e 5 de novembro de 2004, promovido pelo INEP/MEC.

Este seminário agregou públicos diversos como, educadores, sociólogos,

economistas, estatísticos e demógrafos, dentre outros.

Assim, pode-se dizer que informações da pesquisa, desde seu início, foram

mostradas neste seminário. Informações sobre o plano amostral, a coleta de

dados, a verificação da consistência dos mesmos foram contempladas por um

público acadêmico bastante diverso, mas envolvido com a procura por uma

maior qualidade na educação.

Análises preliminares, tanto as descritivas quanto as mais complexas -

processos de calibração de itens, equalização das habilidades e estimação de

modelos de valor adicionado - também foram apresentadas. Foi realizada uma

comparação entre a estimação das habilidades dos alunos por meio da Teoria

Clássica e da Teoria da Resposta ao Item (TRI), utilizando-se de estatísticas

65

descritivas e dos resultados dos modelos estimados, mostrando a vantagem

em se adotar os escores equalizados por meio da TRI, quando se pretende

determinar os fatores associados à qualidade da educação.

A apresentação foi realizada em 4 de novembro pelo prof. Eduardo Luiz

Gonçalves Rios-Neto. Ela estava incluída no Módulo II do seminário, intitulado

“Informações Educacionais: inclusão social e a qualidade na educação”, tendo

como coordenadora da mesa Oroslinda Taranto Goulart, diretora de tratamento

e disseminação de informações educacionais do INEP/MEC.

Análises com a utilização do banco de dados longitudinal “Avaliação de

desempenho e fatores associados” foram ainda apresentadas em dois outros

seminários. Um deles, “II Workshop Demografia e Economia da Educação”,

aconteceu em Belo Horizonte nos dias 29 e 30 de novembro de 2004.

Neste seminário estavam presentes, em especial, os professores,

pesquisadores e estagiários do CEDEPLAR, envolvidos com projetos na área

de Educação, e alguns membros da equipe do INEP e técnicos da Secretaria

Estadual de Educação do Estado de Minas Gerais. O seminário em Belo

Horizonte teve caráter de seminário interno, como objetivo de detectar

possíveis distorções e apresentar idéias para aprimorar as análises já

realizadas. Os resultados mostrados neste seminário contemplam informações

que vão desde a coleta dos dados. Assim, foram novamente citados os

arquivos contidos nesta base, assim como as variáveis que neles podem ser

encontradas. As informações sobre a coleta de dados foram apresentadas por

Agesilau Neiva Almada e as demais informações sobre o banco de dados,

assim como as análises estatísticas por Danielle Ramos de Miranda Pereira,

doutoranda em Demografia pelo CEDEPLAR.

A parte introdutória foi seguida pelas análises descritivas para a disciplina de

matemática, comparando-se resultados obtidos por meio de escores clássicos

e equalizados. O intuito desta comparação era o de mostrar a vantagem em se

utilizar os escores equalizados, uma vez que estes se encontram numa mesma

escala, sendo, portanto, diretamente comparáveis.

Assim sendo, os escores clássicos e equalizados foram comparados,

inicialmente, com a utilização de estatísticas descritivas e por meio de gráficos

66

das médias por períodos, dos alunos que participaram de todas as rodadas da

pesquisa (trajetória completa) e daqueles que não completaram a trajetória.

Além disto, para a comparação entre os resultados obtidos com a adoção

desses dois escores foram estimados modelos de valor agregado,

confirmando, mais uma vez, a vantagem em se utilizar escores equalizados,

em vez de simplesmente calcular o escore, somando-se os itens respondidos

corretamente, como é o caso do escore clássico.

Numa outra forma de abordagem, foram apresentados resultados preliminares

da estimação de modelos hierárquicos longitudinais com a utilização da

amostra total, incluindo alunos com trajetória completa, ou não. Estes modelos,

apesar de preliminares e de não apresentarem variáveis preditoras no nível da

escola, já conseguiam mostrar a importância de variáveis como a repetência no

rendimento do aluno na disciplina de matemática.

No ano de 2005, análises com a utilização desses dados longitudinais foram

apresentadas em 28 de março em Brasília, no seminário “Seminário

Demografia e Economia da Educação”, sob a apresentação intitulada “Fatores

associados e o aprendizado em matemática e em português: uma perspectiva

longitudinal”. Vale ressaltar que, neste último seminário, foram apresentados

também resultados para a disciplina de português.

Esta apresentação começa com uma introdução sobre as variáveis

encontradas no banco de dados. Ainda, na parte introdutória, são apresentados

esquemas longitudinais, tanto para a disciplina de matemática quanto para a de

português, que mostram o número de alunos em cada uma das rodadas,

considerando o momento da entrada e da saída do aluno na pesquisa.

Gráficos das médias dos escores equalizados para os alunos com trajetória

completa e incompleta foram analisados para as disciplinas de matemática e

de português. O gráfico de matemática, independente do aluno ter completado

ou não a trajetória, mostrou estruturas de curvas mais próximas à estrutura de

uma curva de aprendizagem padrão, caracterizada por ganhos decrescentes e

tendendo à estabilidade do rendimento no final do processo.

Como foi detectado que o banco de dados ainda apresenta erros na variável

identificadora do aluno, optou-se por estimar modelos hierárquicos

67

longitudinais, considerando os alunos de trajetória completa, ou seja, aqueles

que estiveram presentes em todas as seis rodadas da pesquisa, de abril do

ano de 1999 a novembro do ano de 2003.

Então, com o principal objetivo de verificar os fatores associados ao rendimento

escolar em português e matemática foram estimados modelos hierárquicos

para estas duas disciplinas separadamente. Em especial, variáveis como sexo,

fazer lição, não repetir de ano, escolaridade da mãe, tamanho da turma e

laboratório de informática, mostraram-se associadas ao rendimento do aluno

em matemática ou português.

Foram ainda mostrados outros cálculos, como o de rendimento médio por sexo.

Para calcular o rendimento médio por sexo foi simulada uma situação em que o

(a) aluno(a) fazia lição e não repetia de ano, para a disciplina de matemática.

No caso de português, considerou-se ainda que a mãe apresentava pelo

menos o ensino fundamental completo. Para o terceiro nível, no caso de

matemática, a suposição era a de que o (a) aluno (a) estudava em uma escola

em que o tamanho médio das turmas era de 35. Enquanto para português,

supunha-se que os alunos estudavam em escola com laboratório de

informática. Assim sendo, os rendimentos por série (ou período) foram

calculados e “plotados” para matemática e português, por sexo. Por meio

desses gráficos, foi possível constatar o diferencial de rendimento médio em

matemática e em português entre homens e mulheres. Para maiores detalhes

sobre esta apresentação, veja nos relatórios da Ação 1.3, o relatório sobre a

estimação de modelos hierárquicos para matemática e português.

68

AÇÃO 1.2 – IMPLEMENTAÇÃO DA PESQUISA DE CAMPO

APRESENTAÇÃO

Esta ação compreende os trabalhos desenvolvidos para a implementação da

pesquisa no campo e o processo de geração do banco de dados da 7ª

série/2002 – fichas escolares, 8ª série/2003 – provas, questionários e fichas

escolares, o banco de dados da REP7/2003, e também o banco de dados da

Ficha Histórico Escolar.

Com o intuito de resgatar parte dos alunos que se perderam durante a

pesquisa, optou-se, em 2003, por aplicar provas e questionários para uma série

adicional – 7ª série – aqui chamada de REP7. Este banco de dados está

separado do banco de dados longitudinal e os alunos que, em algum momento,

passaram pela pesquisa “Avaliação de Desempenho: Fatores Associados”

estão devidamente identificados neste banco de dados.

Aproveitando a estrutura montada para coletar as fichas escolares da 7ª, 8ª e

REP7, optamos por criar um instrumento que permitiu levantar a trajetória

escolar dos alunos que compunham a amostra inicial, ou seja, que em 1999

estavam cursando a 4ª série e que responderam às provas e questionários.

Esta ficha foi por nós chamada de Ficha Histórico Escolar e permitiu assim

coletar informações dos alunos, como por exemplo ano de entrada e sua

trajetória dentro da escola, com os seus respectivos resultados finais. Esta

ficha permitiu criar um banco de dados independente do banco de dados

longitudinal e vai permitir também, futuramente, através do cruzamento com o

69

banco de dados da pesquisa “Avaliação de Desempenho: Fatores Associados”,

análises outras sobre o desempenho escolar destes alunos.

Para que os trabalhos de campo e formação do banco de dados pudessem

seguir o mesmo padrão dos anos anteriores e também para que pudéssemos

cumprir os prazos estabelecidos, foram mantidas as empresas que já vinham

trabalhando com a pesquisa “Avaliação de Desempenho: Fatores Associados”

nos anteriores, uma vez que elas já tinham toda uma estrutura de campo e

geração de dados formada.

Assim sendo, além do CEDEPLAR, as empresas envolvidas neste processo

foram:

SOLUÇÃO – APOIO A DECISÕES CONSULTORIA LTDA.:

Elaboração da ficha escolar aluno e professor referente 7ª série, 8ª série

e REP7.

Coordenação e execução do campo para coleta da ficha escolar da 7ª

série, 8ª série, REP7 e Ficha Histórico Escolar.

INTERCONECT DO BRASIL LTDA.:

Processamento dos dados de provas e questionários para a 8ª série e

REP7.

CAFÉ SOFTWARE S/C LTDA.:

Gerenciamento do banco de dados da 7ª série e 8ª série – provas,

questionários e fichas escolares.

Gerenciamento do banco de dados da REP7 – fichas escolares.

70

CEDEPLAR/FACE/UFMG

Revisão das fichas escolares.

Acompanhamento e supervisão dos trabalhos realizados no campo.

Elaboração da Ficha Histórico Escolar.

Processamento dos dados das fichas escolares para a 7ª série/2002, 8ª

série/2003, REP7/2003 e Ficha Histórico Escolar.

Gerenciamento do banco de dados da Ficha Histórico Escolar.

Coordenação dos trabalhos de gerenciamento do banco de dados da 7ª

série/2002, 8ª série/2003 e REP7/2003.

A ação 1.2. – Implementação da Pesquisa de campo está dividida em 05

produtos:

1.1. – Elaboração da ficha escolar do aluno referente a 2002;

1.2. – Aplicação da ficha escolar do aluno referente a 2002;

1.3. – Elaboração da ficha escolar do aluno referente a 2003;

1.4. – Aplicação da ficha escolar do aluno referente a 2003;

1.5. – Processamento e geração do Banco de Dados 8ª série (2003) e 7ª

série (2003).

71

1.1 – ELABORAÇÃO DA FICHA ESCOLAR DO ALUNO E DO PROFESSOR REFERENTE A 2002.

APRESENTAÇÃO

Para o ano de 2002, que abrange os alunos que cursaram a 7ª série, foram

elaborados 04 instrumentos para que pudessem ser coletadas as informações

necessárias à formação do banco de dados longitudinal da pesquisa “Avaliação

de Desempenho: Fatores Associados”.

A fim de assegurar a comparabilidade entre as informações coletadas a cada

ano para a mesma amostra de escolas, houve ligeiras modificações nos

instrumentos, mais especificamente no lay-out que já vinha sendo aplicado, e

que são os seguintes1:

Ficha Escolar – Dados do aluno: resultado final, média e faltas em

Português e Matemática;

Ficha em Branco - Aluno: para acrescentar alunos que ainda não

constam da base de dados da pesquisa (missing) ou seja, alunos que

não fizeram a prova, mas, que pertencem a 7ª série e tiveram resultado

final;

Ficha do Professor: nome e faltas dos professores de Português e

Matemática e suas respectivas turmas;

Boletim de Ocorrência: formulário para registro de eventos significativos

na coleta.

1 Vide cópia dos instrumentos em anexo.

72

CRONOGRAMA DE ATIVIDADES

DATA ATIVIDADES mar/04 abr/04

Estudos de lay-out e alterações nas Fichas Escolares 01 a 31 Elaboração de máscara para impressão dos instrumentos 29 a 31 1 a 12 Impressão das Fichas Escolares 05 a 08 Envio das Fichas Escolares aos coordenadores de campo 26

73

ANEXOS

74

Código da escola: 28018605 Nome da escola: E.P.G. Alencar Cardoso Série: 7 Identific Nome do aluno Data Turno Turma Média Final Result Faltas Obs nasc Port Mat Final Port Mat 7261 ADEMILSON VIEIRA DA 07/04/1985 T A 202419 ANDREZA FERNANDA DA 14/06/1987 T A 331721 ANTONIO CESAR S DO 09/12/1986 T A 202421 DADIANE FONSECA DA 18/02/1988 T A 331731 DANIEL GOES DE JESUS 18/12/1983 T A 58644 EDJAN DA SILVA OLIVEIRA 25/10/1990 T A 202423 EDUARDO MIRANDA DE 03/02/1986 T A 501365 EDVALDA DOS SANTOS 09/04/1984 T A 331733 GRACIELE DOS SANTOS 15/07/1983 T A 331735 JAQUELINE DOS SANTOS AL 13/08/1986 T A 7245 JOEDNA DA SILVA OLIVEIRA 10/12/1988 T A 7271 JOSE MESSIAS CORNELIO AS 04/05/1987 T A 7246 KARINA DOS SANTOS LIMA 25/03/1987 T A 331736 MARIA RITA DOS SANTOS 22/05/1984 T A 331737 PRISCILA DOS SANTOS PER 08/05/1984 T A 202428 RAFAELA NASCIMENTO 02/05/1988 T A 202430 ROSEELAN SANTOS CARDO 03/01/1987 T A 202432 SILVANI SILVA GOES 23/09/1984 T A 7254 SIMONE DOS SANTOS 16/07/1988 T A 331738 SIMONE SANTOS COSTA 12/05/1985 T A 202433 SUELI DE JESUS SANTOS 12/07/1984 T A 331739 TIAGO DE JESUS RODRIGU 22/01/1988 T A 58650 VANESSA MENEZES DA 26/07/1989 T A 58660 WALLAS SANTOS 12/08/1984 T A 7259 WEVERTON DOS SANTOS 31/03/1989 T A

75

Cód. 11002522 E.P.S.G. Prof. Eduardo Lima e SilvaNasc. OBS

dd/mm/aa Port Mat Port Mat1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

Aplicador_______________________________________

FICHA 7ª SÉRIE - 2002

Nome da Escola:

No. Nome do Aluno (letra de forma legível) Turno TurmaMédia Final Result.

FinalFaltas

76

a escola: 28018699 Nome da escola: E.P.G. Jornalista Orlando Dantas Série: 7 Identific Nome do professor Sexo Turno Turma Disciplina Faltas Prof desta Observação turma Desde Até 1793 GIOVALDO FERREIRA Masculino T A Matemática 1945 VALDIVIA DALLA DEZ Feminino t a Português

77

Código da Escola: 11000473Nome da Escola: E.P.G. Antônio Ferreira da Silva

Gerais_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

Professor_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

Alunos_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

Nome do Aplicador _________________________________

Boletim de Ocorrências - 7ª Série - 2002

78

1.2 – APLICAÇÃO DA FICHA ESCOLAR DO ALUNO E FICHA DO PROFESSOR REFERENTE A 2002

APRESENTAÇÃO

Dando continuidade à pesquisa “Avaliação de Desempenho: Fatores

Associados”, foram aplicadas as Fichas Escolares em todas as escolas da

amostra.

A aplicação da Ficha Escolar tem por objetivo acompanhar o desempenho

escolar do aluno, ano a ano, a fim de agregar essa informação à base de

dados de avaliação, construída a partir das respostas aos instrumentos da

pesquisa.

Entretanto, não houve coleta desses dados para a turma de 7ª série, que

respondeu às provas e questionários em 2002. Somente no início de 2004 é

que foi possível registrar as notas escolares dos alunos dessa etapa da

pesquisa.

Este relatório trata do trabalho de campo realizado para colher as informações

escolares dos alunos que estavam matriculados na 7ª série, em 2002, nas

escolas da amostra, tendo feito ou não as provas e respondido aos

questionários.

A análise do desempenho escolar dos alunos que não fizeram as provas da

pesquisa pode confirmar ou afastar a hipótese de algum viés dos resultados da

pesquisa. Se as médias finais escolares desses alunos faltosos apresentarem

uma discrepância significativa em relação às médias finais dos alunos que

fizeram as provas, pode-se supor um viés, uma indicação de que as médias

obtidas nas provas da pesquisa seriam consideravelmente diferentes, se esses

alunos tivessem comparecido à escola no dia da aplicação. Inversamente, se

as médias escolares dos alunos faltosos não apresentarem uma discrepância

79

significativa em relação às médias escolares dos alunos que fizeram as provas,

pode-se afastar essa hipótese.

EQUIPE RESPONSÁVEL

UF COORDENAÇÃO ESTADUAL SUPERVISÃO ESTADUALRO Lúcia Miranda Sulamita Belarmino dos SantosPA Cândida Tavares Marília Dirce GomesPE Maria Epifânia Valença Maria Veralúcia dos Anjos LopesSE Ana Galvão Luciana Galvão MenezesMS Nelice Pereira Sales Risoleide Maria CavalcanteGO Wânia de M. Bernardes Icléia Maria Pereira Neto

NAC. Lia Rosenberg

A mesma equipe que cuidou da supervisão do campo na aplicação dos testes

objetivos foi responsável por esta coleta. Praticamente a mesma equipe

coordenou todos os levantamentos da pesquisa longitudinal, o que contribuiu

para a padronização dos procedimentos e uma constante evolução na

identificação e revisão de estratégias.

INSTRUMENTOS UTILIZADOS

Para coletar as informações dos alunos que realizaram a 7ª série no ano de

2002, foram utilizados os seguintes instrumentos: Ficha Escolar – Dados do

Aluno, Ficha em Branco – Aluno, Ficha do Professor e o Boletim de Ocorrência.

PROCEDIMENTOS

Como nos anos anteriores, o trabalho de campo dividiu-se em 3 etapas

principais: treinamento das supervisoras, treinamento dos aplicadores e

aplicação dos instrumentos.

80

1. Treinamento das supervisoras

A reunião de treinamento foi conduzida pela coordenadora da pesquisa, que

passou aos presentes as novas informações sobre a abrangência, metodologia

e ainda os materiais necessários ao trabalho de campo.

Uma vez que todas participam da pesquisa há alguns anos – muitas delas,

desde seu início – a ênfase recaiu sobre o novo instrumento, aquele que

acompanha a trajetória escolar dos alunos da base de dados longitudinal –

Ficha Histórico Escolar.

2. Treinamento dos Aplicadores

Coube a essas supervisoras repassar as orientações recebidas em São Paulo

aos aplicadores do estado sob sua responsabilidade, o que é feito com o apoio

da coordenadora estadual, uma técnica ligada à Secretaria da Educação, com

acesso aos diretores das escolas e aos dirigentes dos órgãos centrais.

Como nos anos anteriores, esses treinamentos ocorreram simultaneamente,

nas capitais dos 6 Estados participantes da pesquisa – Goiás, Mato Grosso do

Sul, Pará, Pernambuco, Rondônia e Sergipe.

Em cada um desses encontros, foi realizada uma leitura comentada do Manual

da Aplicação2, seguida da análise detalhada das fichas a serem preenchidas

nas escolas, com destaque para a Ficha Histórico Escolar. Algumas

simulações do preenchimento dessas fichas permitiram antecipar possíveis

problemas e encaminhar as respectivas soluções. Houve mais um momento

para questionamentos e esclarecimentos de dúvidas. Finalmente, os materiais

foram entregues a cada dupla de aplicadores, que ficou responsável por um

determinado conjunto de escolas.

Foi solicitado o maior empenho possível na localização de todos os dados.

Todos os possíveis caminhos para encontrar as informações foram

detalhadamente descritos, bem como os entraves que poderiam vir a surgir.

O treinamento transcorreu sem problemas, com a participação de todos os

aplicadores, muitos dos quais já haviam trabalhado em anos anteriores, o que

facilitou muito o trabalho. 2 ver em anexo o manual utilizado

81

3. Aplicação dos Instrumentos

Uma semana antes do início do campo, todas as escolas foram devidamente

avisadas pela Secretaria de Educação do trabalho que seria realizado e quais

os documentos necessários para preenchimento das Fichas.

Todas as escolas receberam bem os aplicadores e cooperaram no que foi

possível. Mas há muitas diferenças entre elas: desde escolas que, mesmo sem

ter todas as informações, apresentam organização na forma de registro até

aquelas que são carentes de tudo. Muitas escolas já estão com o serviço de

secretaria escolar informatizados e isso facilitou muito o trabalho dos

pesquisadores. Em algumas poucas, não foi possível completar os

instrumentos.

Houve um grande esforço para garantir a identificação e a localização dos

alunos que compõem a base de dados. Os pesquisadores encontraram muitos

obstáculos, pois as escolas, em sua imensa maioria, não dispõem de uma boa

organização de registros históricos.

Algumas dúvidas surgiram, sobretudo na coleta da Ficha Histórico Escolar.

Porém, a presença da Supervisora e da Coordenadora, que em nenhum

momento perderam contato com as duplas de aplicadores, foi suficiente para

sanar as dúvidas existentes.

82

PRINCIPAIS OCORRÊNCIAS

Um trabalho dessa envergadura, que leva os pesquisadores à intimidade

administrativa de cerca de 170 escolas, é marcado por uma ampla gama de

eventos e situações envolvendo os participantes. Em benefício do rigor da

pesquisa, todos esses acontecimentos são registrados pelo aplicador em seu

Boletim de Ocorrência. A título de ilustração, seguem-se as mais

freqüentemente citadas pelas supervisoras em seus relatórios da aplicação.

Quase sempre as escolas demonstram uma certa resistência para

informar a freqüência do professor e não permitem a consulta nos livros

de freqüência dos mesmos. As informações sobre faltas foram

conseguidas através do diretor, do administrador, do serviço técnico ou

da secretaria, em alguns casos de forma verbal. Outros dados sobre

movimentação e substituição foram facilmente obtidos.

Os documentos consultados para o preenchimento dos instrumentos da

pesquisa foram o diário de classe, a ficha individual do aluno, o relatório

final e o mapa de matrícula.

Como sempre, a maioria dos diretores foi receptiva, encaminhando os

pesquisadores às equipes das secretarias. Entretanto, tornou-se muito

difícil a coleta em muitas escolas, no que se refere à Ficha Histórico

Escolar. Alguns arquivos são verdadeiros depósitos das fichas

individuais dos alunos, não só desorganizados, mas também, em

péssimas condições de higiene. Foi necessária a compra de máscaras

para os pesquisadores, a fim de protegê-los contra o mofo existente nos

documentos e ambientes.

83

RESUMO QUANTITATIVO

UF ESCOLAS TURMAS ALUNOS PROFsRO 13 44 1220 103PA 34 93 2958 193PE 38 104 3373 222SE 15 35 1052 71MS 35 75 2315 158GO 35 102 3075 218

TOTAL 170 453 13993 965

7ª SÉRIE/2002

CRONOGRAMA DE ATIVIDADES

abr/04 mai/04Treinamento das supervisoras 29Treinamento dos Aplicadores 3 a 5Início Aplicação 5Final da Aplicação 28

ATIVIDADES DATA

84

ANEXO

85

Aplicação da Ficha Escolar

Materiais do Aplicador 1. Ficha Escolar − Aluno 2. Ficha em Branco

3. Ficha Escolar − Professor 4. Boletim de Ocorrências 5. Lápis, Borracha e Régua

Ficha Escolar − Aluno Esta ficha traz os nomes dos alunos que fizeram prova em Outubro e Novembro de 2002. Você deve anotar as informações de todos eles, mesmo que estejam em outro turno ou turma da escola.

Ficha em Branco Você vai encontrar alguns alunos matriculados nestas escolas e que não constam da Ficha Escolar − Aluno. Provavelmente, eles faltaram no dia da prova. Precisamos dos dados desses alunos também. Você vai copiá-los na Ficha em Branco. Use letra de forma para podermos inserir o nome do aluno no Banco de Dados. Não basta escrever: é preciso que outra pessoa consiga ler o que você escreveu.

Complete as informações sobre a Escola − Nome e Código − com letra clara e legível.

Informações que serão coletadas Nome do Aluno: quando estiver impresso, verifique se está corretamente grafado. Se não, anote a correção na coluna de Observações. Na Ficha em Branco, escreva cuidadosamente, em letra de forma. Data de Nascimento: no caso dos alunos que constam do nosso Banco de Dados, você só vai conferir se a data está correta. Se não estiver, deixe esta coluna como está e anote a data certa na coluna de Observações (última à direita). Na Ficha em Branco, você vai marcar a data. Média em Língua Portuguesa e Média de Matemática.: anote a média final de cada aluno. Se a escola utilizar uma medida diferente da escala de 0 a 10, registre no seu BOLETIM DE OCORRÊNCIAS a correspondência entre essa medida e a escala de 0 a 10. Exemplo: conceitos A a E, na escala de 0 a 10, A corresponde a 1 e 2, B a 3 e 4 etc. Caso a escola não empregue nenhum sistema de quantificação do resultado do aluno, escreva o que estiver anotado na escola e faça uma observação no BOLETIM DE OCORRÊNCIAS. Resultado Final: Aprovado, Reprovado, Transferido, Evadido. Faltas em Língua Portuguesa e Matemática.: anote o total de faltas do aluno em 2001. Preste redobrada atenção a este registro, pois este dado é muito importante para a pesquisa!

86

OBS: escreva tudo que se refere a este aluno, como correção da grafia do nome, mudança de turma ou turno, erro na data de nascimento, falta de informações nos documentos consultados. Lembre-se que as observações gerais sobre a turma (número de professores durante o ano, suspensão de aulas por problemas diversos etc.) ou sobre a escola devem ser registradas no BOLETIM DE OCORRÊNCIAS. Aqui, coloque apenas observações sobre um determinado aluno.

Ficha Escolar − Professor A ficha traz impressos o nome e código da escola, bem como os nomes dos professores que constam do nosso cadastro. Agora, queremos identificar todas as turmas (e turnos) de cada um. Procure o nome do professor na lista da escola, confira a disciplina que leciona, o turno e as turmas deste turno. Veja o modelo abaixo:

Nome do Professor Disciplina Turno Turmas Renata Alves Português M A;B;C

Renata Alves Português T D

Antônio Araújo Matemática M A;B;C

Wanda Lopes Matemática T D

Se possível, anote quantas aulas este professor perdeu em cada uma de suas turmas. Caso você encontre apenas uma informação geral do total de faltas, registre na coluna OBS. Não deixe de registrar esta informação, ela é preciosa! Precisamos saber também durante quantos meses os alunos destas turmas foram expostos à influência deste professor. Se for possível obter apenas uma data aproximada do início e término da regência dele em cada turma, anote assim mesmo. Não é preciso ser exata, mas procure fornecer alguma idéia de tempo.

Boletim de Ocorrências Código da Escola : Preencha com bastante atenção! Gerais: Anote aqui ocorrências relevantes para a pesquisa, mas que não se referem a um aluno ou professor em particular. Qualquer eventualidade ou sugestão para facilitar o trabalho nas próximas vezes, deve ser registrada neste lugar. Professor: Anote as ocorrências sobre determinado(s) professor(es). Alunos: Anote apenas ocorrências que não constam da Ficha do Aluno. Nome do Aplicador: Não deixe de colocar seu nome em letra legível!

Procedimentos Recomenda-se trabalhar em duplas, um(a) consulta os documentos da escola e dita para a outro(a), que faz o registro nas Fichas correspondentes. É

87

importante escolher a melhor letra para essa atividade. Letras ruins dificultam muito o trabalho dos pesquisadores!

Apresentem-se ao diretor, peçam autorização para consultar os diários de classe ou documento semelhante, relativos às 7as. séries de 2002, em que constem data de nascimento, notas, faltas e resultado final dos alunos. Procurem saber onde vocês podem encontrar o nome completo dos professores de cada uma dessas turmas.

Solicitem na secretaria da escola as atas ou diários de classe das turmas de 7a. série, períodos diurnos, de 2002.

Preencham a FICHA DO ALUNO com letra legível; lembrem de conferir os dados antes de passar para o próximo nome.

Utilize uma régua ou tira de papel colorido para auxiliar na leitura e no registro dos dados, evitando confusões entre as linhas.

Completem a FICHA EM BRANCO. Siga os mesmos procedimentos para preencher a FICHA DO

PROFESSOR.

Anote qualquer eventualidade no BOLETIM DE OCORRÊNCIAS.

Passo a Passo reúna os documentos de uma das turmas, por exemplo, a 7ª série A da

manhã. localize os alunos que constam da FICHA DO ALUNO e copie os dados

de cada um nas respectivas colunas. verifique quais os alunos dessa FICHA cujos dados não foram localizados

na 7ª série A da manhã. Procure localizá-los nas outras 7as. séries. complete as informações com os alunos que não constam da FICHA,

utilizando a FICHA EM BRANCO. complete as informações constantes da FICHA DO PROFESSOR. coloque seu nome em todos os instrumentos e entregue-os à Supervisão.

88

1.3 – ELABORAÇÃO DA FICHA ESCOLAR DO ALUNO E DO PROFESSOR REFERENTE A 2003

APRESENTAÇÃO

Para o ano de 2003, que abrange os alunos que cursaram a 8ª série, foram

elaborados 04 instrumentos para que pudessem ser coletadas as informações

necessárias à formação do banco de dados longitudinal da pesquisa “Avaliação

de Desempenho: Fatores Associados”.

Com o intuito de resgatar informações de parte dos alunos que foram

excluídos, em algum momento da amostra, e que deixaram de ser

acompanhados na pesquisa por algum motivo - repetência, abandono/evasão

ou transferência - ainda para neste ano, foram coletadas também informações

sobre os alunos que estavam na 7ª série, seguindo assim o mesmo critério

adotado na aplicação das provas e questionários em novembro de 2003, ou

seja, conseguir levantar informações dos alunos que, em algum momento

repetiram de ano e se perderam dentro da pesquisa.

Afim de assegurar a comparabilidade entre as informações coletadas a cada

ano para a mesma amostra de escolas, houve ligeiras modificações nos

instrumentos, mais especificamente no lay-out, tanto para a 8ª série, quanto

para a REP7, que já vinham sendo aplicados, e que são os seguintes3:

Ficha Escolar – Dados do Aluno: resultado final, média e faltas em

Português e Matemática;

Ficha em Branco - Aluno: para acrescentar alunos que ainda não

constam da base de dados da pesquisa (missing) ou seja, alunos que

3 Vide cópia dos instrumentos em anexo.

89

não fizeram a prova, mas que pertencem à 7ª série e tiveram resultado

final;

Ficha do Professor: nome e faltas dos professores de português e

matemática e suas respectivas turmas;

Boletim de Ocorrência: formulário para registro de eventos significativos

na coleta.

Além desses instrumentos, foi criada também uma ficha para registrar o

percurso escolar de cada um dos alunos da amostra inicial – e somente

desses, ou seja, a trajetória escolar de todos os alunos que em 1999 – 4ª

série, estavam na pesquisa:

Ficha Histórico Escolar - Aluno: ano de entrada na escola, série

correspondente, resultado final, origem e destino das transferências

de alunos.

Para preenchê-lo, os aplicadores tiveram que buscar, em cada escola, os

alunos listados no instrumento, coletar sua situação/resultado final e registrar,

no caso dos transferidos e dos recebidos por transferência, a origem, a série e

o ano em que se deu a mudança de escola.

CRONOGRAMA DE ATIVIDADES

DATA ATIVIDADES mar/04 abr/04

Estudos de lay-out e alterações nas Fichas Escolares e Histórico Escolar 01 a 31 Elaboração de máscara para impressão dos instrumentos 29 a 31 1 a 12 Recebimento da Base de Dados - 8ª série e REP7/2003 19 Impressão das Fichas Escolares e Ficha Histórico Escolar 19 a 26 Envio das Fichas Escolares aos coordenadores de campo 26

90

ANEXOS

91

Código da escola: 28018605 Nome da escola: E.P.G. Alencar Cardoso Série: 8 Identific Nome do aluno Data Turno Turma Média Final Result Faltas Obs nasc Port Mat Final Port Mat 7261 ADEMILSON VIEIRA DA 07/04/1985 T A 202419 ANDREZA FERNANDA DA 14/06/1987 T A 331721 ANTONIO CESAR S DO 09/12/1986 T A 202421 DADIANE FONSECA DA 18/02/1988 T A 331731 DANIEL GOES DE JESUS 18/12/1983 T A 58644 EDJAN DA SILVA OLIVEIRA 25/10/1990 T A 202423 EDUARDO MIRANDA DE 03/02/1986 T A 501365 EDVALDA DOS SANTOS 09/04/1984 T A 501366 GEANE DOS SANTOS 03/10/1988 T A 331733 GRACIELE DOS SANTOS 15/07/1983 T A 501367 IRAN GOMES DO BOMFIM 16/11/1988 T A 7245 JOEDNA DA SILVA OLIVEIRA 10/12/1988 T A 7246 KARINA DOS SANTOS LIMA 25/03/1987 T A 331736 MARIA RITA DOS SANTOS 22/05/1984 T A 202428 RAFAELA NASCIMENTO 02/05/1988 T A 202430 ROSECLAN SANTOS 03/01/1987 T A 501368 SHEYLA STEFANIA SANTOS 06/09/1976 T A 202432 SILVANI SILVA GOES 23/09/1984 T A 7254 SIMONE DOS SANTOS 16/07/1988 T A 331738 SIMONE SANTOS COSTA 12/05/1985 T A 202433 SUELI DE JESUS SANTOS 12/07/1984 T A 58650 VANESSA MENEZES DA 26/07/1989 T A 58660 WALLAS SANTOS 12/08/1984 T A 7259 WEVERTON DOS SANTOS 31/03/1989 T A

92

Código da escola: 28018605 Nome da escola: E.P.G. Alencar Cardoso Série: Rep 7 Identific Nome do aluno Data Turno Turma Média Final Result Faltas Obs nasc Port Mat Final Port Mat 70010928 ADRIANO SANTOS DE JESU 05/12/1988 T A 70010929 AMANDA MIRIAM RODRIGU 15/01/1990 T A 70010930 ERONIDES FERREIRA MACE 02/11/1983 T A 70010931 FELIPE AMANCIO DOS SAN 09/02/1988 T A 70010932 GRASILENE SANTOS SILVA 18/04/1989 T A 70010933 GRAZIELLA SANTOS SILVA 28/09/1987 T A 70010934 IRIS GOMES DOS SANTOS 19/07/1987 T A 70010966 ISRAEL SANTOS FABIANO 17/09/1989 T A 70010967 JUVINO PERREIRA DA SILV 27/10/1988 T A 70010935 LEILA THIARA ALVES SANT 03/02/1989 T A 70010936 LEONCIO DOS SANTOS 01/04/1987 T A 70010937 MARTA DOS SANTOS 08/01/1989 T A 70010938 NADJA BOMFIM SATANA 02/10/1984 T A 70010939 PRISCILA REGINA GOIS SA 10/05/1989 T A 70010940 TIAGO DE JESUS RODRIGU 22/01/1988

93

Cód. 11002522 E.P.S.G. Prof. Eduardo Lima e SilvaNasc. OBS

dd/mm/aa Port Mat Port Mat1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

Aplicador_______________________________________

FICHA 8ª SÉRIE - 2003

Nome da Escola:

No. Nome do Aluno (letra de forma legível) Turno TurmaMédia Final Result.

FinalFaltas

94

Cód. 11002522 E.P.S.G. Prof. Eduardo Lima e SilvaNasc. OBS

dd/mm/aa Port Mat Port Mat1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

Aplicador_______________________________________

FICHA REP7 - 2003

Nome da Escola:

No. Nome do Aluno (letra de forma legível) Turno TurmaMédia Final Result.

FinalFaltas

95

Código da escola: 28018699 Nome da escola: E.P.G. Jornalista Orlando Dantas Série: 8 Identific Nome do professor Sexo Turno Turma Disciplina Faltas Prof desta Observação turma Desde Até P0318 GLERVIANI ARAUJO DE SOUS Feminino T A Português

96

Código da escola: 28018699 Nome da escola: E.P.G. Jornalista Orlando Dantas Série: REP7 Identific Nome do professor Sexo Turno Turma Disciplina Faltas Prof desta Observação turma Desde Até P0459 GIOVALDO FERREIRA Masculino T A Matemática

97

Código da Escola: 11000473Nome da Escola: E.P.G. Antônio Ferreira da Silva

Gerais_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

Professor_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

Alunos_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

Nome do Aplicador _________________________________

Boletim de Ocorrências - 8ª Série - 2003

98

Código da Escola: 11000473Nome da Escola: E.P.G. Antônio Ferreira da Silva

Gerais_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

Professor_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

Alunos_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

_______________________________________________________________________________

Nome do Aplicador _________________________________

Boletim de Ocorrências - REP7 - 2003

99

ID E NOME DA ESCOLAID E NOME DO ALUNOTURMA E TURNO

Entrou nesta escola ANO 1 ANO 2 ANO 3 ANO 4 ANO 5 ANO 6 ANO 7 ANO 8 ANO 9 ANO 10 ANO 11 ANO 12

AnoSérieRESULTADO FINALA = AprovadoR = ReprovadoE = EvadidoT = Transferido (preencher o campo "para qual escola?")AT = Aprovado e Transferido (preencher o campo "para qual escola?")

RT = Reprovado e Transferido (preencher o campo "para qual escola?")

ET = Evadiu (abandonou) e depois pediu transferência (preencher o campo "para qual escola?")

- Para qual escola?

- Retornou de qual escola? (caso o aluno tenha retornado a esta escola, registrar o ano de retorno e nome da escola de onde veio)

OBSERVAÇÕES:

FICHA HISTÓRICO ESCOLAR - ALUNO - PRODUTO BCOORTE 4ª SÉRIE/NOV-1999

100

1.4 – APLICAÇÃO DA FICHA ESCOLAR DO ALUNO E FICHA DO PROFESSOR REFERENTE A 2003

APRESENTAÇÃO

Dando continuidade à pesquisa “Avaliação de Desempenho: Fatores

Associados”, foram aplicadas as Fichas Escolares em todas as escolas da

amostra.

A aplicação da Ficha Escolar tem por objetivo acompanhar o desempenho

escolar do aluno, ano a ano, a fim de agregar essa informação à base de

dados de avaliação, construída a partir das respostas aos instrumentos da

pesquisa.

A análise do desempenho escolar dos alunos que não fizeram as provas da

pesquisa pode confirmar ou afastar a hipótese de algum viés dos resultados da

pesquisa. Se as médias finais escolares desses alunos faltosos apresentarem

uma discrepância significativa em relação às médias finais dos alunos que

fizeram as provas, pode-se supor um viés, uma indicação de que as médias

obtidas nas provas da pesquisa seriam consideravelmente diferentes, se esses

alunos tivessem comparecido à escola no dia da aplicação. Inversamente, se

as médias escolares dos alunos faltosos não apresentarem uma discrepância

significativa em relação às médias escolares dos alunos que fizeram as provas,

pode-se afastar essa hipótese.

Neste ano, a pedido do INEP, além da coleta das informações sobre os alunos

das 8ªs. séries, como definia o desenho inicial da pesquisa, foram levantadas

também informações sobre os alunos na 7ª série, onde se poderiam encontrar

muitos dos alunos que haviam respondido à pesquisa em séries anteriores

(desde a 4ª, em 1999) e depois deixado de responder por haver repetido uma

das séries seguintes.

101

Se um aluno que estivesse na 4ª.série, em 1999, respondesse à pesquisa, e

repetisse de ano, nunca mais apareceria no banco de dados. Com esta coleta

adicional, havia uma possibilidade de reencontrar alguns repetentes, de

qualquer série, desde que tivessem tido somente uma repetência.

Este relatório trata do trabalho de campo realizado para colher as informações

escolares dos alunos que estavam matriculados na 7ª e na 8ª séries em 2003,

nas escolas da amostra, e que tivessem ou não feito as provas e respondido

aos questionários da pesquisa.

Para evitar confusão com os alunos que estavam na 7ª série em 2002, as

fichas dos alunos matriculados na 7ª série em 2003 foram marcadas com o

código REP7.

EQUIPE RESPONSÁVEL

UF COORDENAÇÃO ESTADUAL SUPERVISÃO ESTADUALRO Lúcia Miranda Sulamita Belarmino dos SantosPA Cândida Tavares Marília Dirce GomesPE Maria Epifânia Valença Maria Veralúcia dos Anjos LopesSE Ana Galvão Luciana Galvão MenezesMS Nelice Pereira Sales Risoleide Maria CavalcanteGO Wânia de M. Bernardes Icléia Maria Pereira Neto

NAC. Lia Rosenberg

A mesma equipe que cuidou da supervisão do campo na aplicação dos testes

objetivos foi responsável por esta coleta. Praticamente a mesma equipe

coordenou todos os levantamentos da pesquisa longitudinal, o que contribuiu

para a padronização dos procedimentos e uma constante evolução na

identificação e revisão de estratégias.

102

INSTRUMENTOS UTILIZADOS

Para coletar as informações dos alunos que realizaram a 8ª série no ano de

2003 e também dos alunos que estavam na 7ª série em 2003, que chamamos

de REP7, foram utilizados os seguintes instrumentos: Ficha Escolar – Dados

do Aluno, Ficha em Branco – Aluno, Ficha do Professor e o Boletim de

Ocorrência.

Além das fichas escolares para a 8ª série e a REP7 em 2003, foram coletadas

as fichas Histórico Escolar para todos os alunos que em 1999 estavam

cursando a 4ª série – ano inicial da pesquisa.

PROCEDIMENTOS

Como nos anos anteriores, o trabalho de campo dividiu-se em 3 etapas

principais: treinamento das supervisoras, treinamento dos aplicadores e

aplicação dos instrumentos.

1. Treinamento das Supervisoras

A reunião de treinamento foi conduzida pela coordenadora da pesquisa, que

passou aos presentes as novas informações sobre a abrangência, metodologia

e ainda os materiais necessários ao trabalho de campo.

Uma vez que todas participam da pesquisa há alguns anos – muitas delas,

desde seu início – a ênfase recaiu sobre o novo instrumento, aquele que

acompanha a trajetória escolar dos alunos da base de dados longitudinal.

2. Treinamento dos Aplicadores

Coube a essas supervisoras repassar as orientações recebidas em São Paulo

aos aplicadores do estado sob sua responsabilidade, o que é feito com o apoio

103

da coordenadora estadual, uma técnica ligada à Secretaria da Educação, com

acesso aos diretores das escolas e aos dirigentes dos órgãos centrais.

Como nos anos anteriores, esses treinamentos ocorreram simultaneamente

nas capitais dos 6 estados participantes da pesquisa – Goiás, Mato Grosso do

Sul, Pará, Pernambuco, Rondônia e Sergipe.

Em cada um desses encontros, foi realizada uma leitura comentada do Manual

da Aplicação4, seguida da análise detalhada das fichas a serem preenchidas

nas escolas, com destaque para a Ficha Histórico Escolar. Algumas

simulações do preenchimento dessas fichas permitiram antecipar possíveis

problemas e encaminhar as respectivas soluções. Houve mais um momento

para questionamentos e esclarecimentos de dúvidas. Finalmente, os materiais

foram entregues a cada dupla de aplicadores, que ficou responsável por um

determinado conjunto de escolas.

Foi solicitado o maior empenho possível na localização de todos os dados.

Todos os possíveis caminhos para encontrar as informações foram

detalhadamente descritos, bem como os entraves que poderiam vir a surgir.

O treinamento transcorreu sem problemas, com a participação de todos os

aplicadores, muitos dos quais já haviam trabalhado em anos anteriores, o que

facilitou muito o trabalho.

3. Aplicação dos Instrumentos

Uma semana antes do início do campo, todas as escolas foram devidamente

avisadas pela Secretaria de Educação do trabalho que seria realizado e quais

os documentos necessários para preenchimento das Fichas.

Todas as escolas receberam bem os aplicadores e cooperaram no que foi

possível. Mas há muitas diferenças entre elas: desde escolas que, mesmo sem

ter todas as informações, apresentam organização na forma de registro até

aquelas que são carentes de tudo. Muitas escolas já estão com o serviço de

Secretaria escolar informatizados e isso facilitou muito o trabalho dos

4 ver em anexo o manual utilizado

104

pesquisadores. Em algumas poucas, não foi possível completar os

instrumentos.

Houve um grande esforço para garantir a identificação e a localização dos

alunos que compõem a base de dados. Os pesquisadores encontraram muitos

obstáculos, pois as escolas, em sua imensa maioria, não dispõem de uma boa

organização de registros históricos.

Algumas dúvidas surgiram, sobretudo na coleta da Trajetória Escolar. Porém, a

presença da Supervisora e da Coordenadora, que em nenhum momento

perderam contato com as duplas de aplicadores, foi suficiente para sanar as

dúvidas existentes.

PRINCIPAIS OCORRÊNCIAS

Um trabalho dessa envergadura, que leva os pesquisadores à intimidade

administrativa de cerca de 170 escolas, é marcado por uma ampla gama de

eventos e situações envolvendo os participantes. Em benefício do rigor da

pesquisa, todos esses acontecimentos são registrados pelo aplicador em seu

Boletim de Ocorrência. As mais freqüentes dizem respeito à receptividade e

organização das escolas, dois fatores fundamentais para o desenvolvimento da

pesquisa e que apresentam grande variabilidade.

105

RESUMO QUANTITATIVO

UF ESCOLAS TURMAS ALUNOS PROFsRO 13 37 989 76PA 34 78 2506 176PE 38 91 2799 188SE 14 31 988 38MS 35 74 2023 136GO 33 81 2648 163

TOTAL 167 392 11953 777

8ª SÉRIE/2003

UF ESCOLAS TURMAS ALUNOS PROFsRO 13 44 1108 91PA 34 100 3021 210PE 38 94 3088 188SE 14 32 925 48MS 35 84 2389 163GO 34 104 3197 204

TOTAL 168 458 13728 904

REP7/2003

UF ESCOLAS TURMAS ALUNOSRO 14 47 1111PA 31 88 2444PE 34 95 2446SE 16 43 984MS 35 80 2023GO 32 75 1912

TOTAL 162 428 10920

FICHA HISTÓRICO ESCOLAR

106

CRONOGRAMA DE ATIVIDADES

abr/04 mai/04Treinamento das supervisoras 29Treinamento dos Aplicadores 3 a 5Início Aplicação 5Final da Aplicação 28

ATIVIDADES DATA

107

ANEXO

108

Aplicação da Ficha Escolar – 7ª e 8ª Série

Materiais do Aplicador 6. Ficha Escolar − Aluno 7. Ficha em Branco

8. Ficha Escolar − Professor 9. Boletim de Ocorrências 10. Lápis, Borracha e Régua

Ficha Escolar − Aluno Esta ficha traz os nomes dos alunos que fizeram prova em Novembro de 2003. Você deve anotar as informações (média final em Língua Portuguesa e Matemática, quantidade de faltas etc.) de todos eles, mesmo que estejam em outro turno ou turma da escola.

Ficha em Branco Você vai encontrar alguns alunos matriculados nestas escolas e que não constam da Ficha Escolar − Aluno. Provavelmente, eles faltaram no dia da prova. Precisamos dos dados desses alunos também. Você vai copiá-los na Ficha em Branco. Use letra de forma para podermos inserir o nome do aluno no Banco de Dados. Não basta escrever: é preciso que outra pessoa consiga ler o que você escreveu para o processamento dos dados.

Preencha as informações sobre a Escola − Nome e Código − com letra clara e legível.

Informações que serão coletadas Nome do Aluno: quando estiver impresso, verifique se está corretamente grafado. Se não, anote a correção na coluna de Observações. Na Ficha em Branco, escreva cuidadosamente, em letra de forma. Data de Nascimento: no caso dos alunos que constam em nosso Banco de Dados, você só vai conferir se a data está correta. Se não estiver, deixe esta coluna como está e anote a data certa na coluna de Observações (última à direita). Na Ficha em Branco, você vai marcar a data, usando dois dígitos para cada registro: dia, mês, ano (ex: 07/03/1984). Média em Língua Portuguesa e Média de Matemática.: anote a média final de cada aluno. Se a escola utilizar uma medida diferente da escala de 0 a 10, registre no seu BOLETIM DE OCORRÊNCIAS a correspondência entre essa medida e a escala de 0 a 10. Exemplo: conceitos A a E, na escala de 0 a 10, A corresponde a 1 e 2, B a 3 e 4 etc. Caso a escola não empregue nenhum sistema de quantificação do resultado do aluno, escreva o que estiver anotado na escola e faça uma observação no BOLETIM DE OCORRÊNCIAS.

109

Resultado Final: Aprovado, Reprovado, Transferido, Evadido. Faltas em Língua Portuguesa e Matemática.: anote o total de faltas do aluno em 2001. Preste redobrada atenção a este registro, pois este dado é muito importante para a pesquisa! OBS: escreva tudo que se refere a este aluno, como correção da grafia do nome, mudança de turma ou turno, erro na data de nascimento, falta de informações nos documentos consultados. Lembre-se que as observações gerais sobre a turma (número de professores durante o ano, suspensão de aulas por problemas diversos etc.) ou sobre a escola devem ser registradas no BOLETIM DE OCORRÊNCIAS. Aqui, coloque apenas observações sobre um determinado aluno.

Ficha Escolar − Professor A ficha traz impressos o nome e código da escola, bem como os nomes dos professores que constam do nosso cadastro. Agora, queremos identificar todas as turmas (e turnos) de cada um. Procure o nome do professor na lista da escola, confira a disciplina que leciona, o turno e as turmas deste turno. Veja o modelo abaixo:

Nome do Professor Disciplina Turno Turmas Renata Alves Português M A;B;C

Renata Alves Português T D

Antônio Araújo Matemática M A;B;C

Wanda Lopes Matemática T D

Se possível, anote quantas aulas este professor perdeu em cada uma de suas turmas. Caso você encontre apenas uma informação geral do total de faltas, registre na coluna OBS. Não deixe de registrar esta informação, ela é preciosa! Precisamos saber também durante quantos meses os alunos destas turmas foram expostos à influência deste professor. Se for possível obter apenas uma data aproximada do início e término da regência dele em cada turma, anote assim mesmo. Não é preciso ser exata, mas procure fornecer alguma idéia de tempo.

Boletim de Ocorrências Código da Escola : Preencha com bastante atenção! Gerais: Anote aqui ocorrências relevantes para a pesquisa, mas que não se referem a um aluno ou professor em particular. Qualquer eventualidade ou sugestão para facilitar o trabalho nas próximas vezes, deve ser registrada neste lugar. Professor: Anote as ocorrências sobre determinado(s) professor(es). Alunos: Anote apenas ocorrências que não constam da Ficha do Aluno. Nome do Aplicador: Não deixe de colocar seu nome em letra legível!

110

Procedimentos Recomenda-se trabalhar em duplas, um(a) consulta os documentos da escola e dita para a outro(a), que faz o registro nas Fichas correspondentes. É importante escolher a melhor letra para essa atividade. Letras ruins dificultam muito o trabalho dos pesquisadores!

Apresentem-se ao diretor, peçam autorização para consultar os diários de classe ou documento semelhante, relativos às 7as. séries de 2002, em que constem data de nascimento, notas, faltas e resultado final dos alunos. Procurem saber onde vocês podem encontrar o nome completo dos professores de cada uma dessas turmas.

Solicitem na secretaria da escola as atas ou diários de classe das turmas de 7a. série, períodos diurnos, de 2002.

Preencham a FICHA DO ALUNO com letra legível; lembrem de conferir os dados antes de passar para o próximo nome.

Utilize uma régua ou tira de papel colorido para auxiliar na leitura e no registro dos dados, evitando confusões entre as linhas.

Completem a FICHA EM BRANCO. Siga os mesmos procedimentos para preencher a FICHA DO

PROFESSOR.

Anote qualquer eventualidade no BOLETIM DE OCORRÊNCIAS.

Passo a Passo reúna os documentos de uma das turmas, por exemplo, a 7ª série A da manhã. localize os alunos que constam da FICHA DO ALUNO e copie os dados de

cada um nas respectivas colunas. verifique quais os alunos dessa FICHA cujos dados não foram localizados na 7ª

série A da manhã. Procure localizá-los nas outras 7as. séries. complete as informações com os alunos que não constam da FICHA, utilizando

a FICHA EM BRANCO. complete as informações constantes da FICHA DO PROFESSOR. coloque seu nome em todos os instrumentos e entregue-os à Supervisão.

111

1.5 – PROCESSAMENTO E GERAÇÃO DO BANCO DE DADOS 8ª SÉRIE (2003) E 7ª SÉRIE (2003)

APRESENTAÇÃO

O banco de dados, em 2004, foi alimentado em dois momentos:

1) Provas e questionários dos alunos que em 2003 estavam na 8ª série e na 7ª

série – esta última nomeada como REP7 para diferenciar da 7ª série da base

longitudinal referente ao ano de 2002, e questionários de professores e

diretores e roteiro escola para as duas séries.

2) Fichas escolares dos alunos da 7ª série/2002, 8ª série/2003 e REP7/2003 e

ficha professor para as três séries.

No primeiro momento, os trabalhos de entrada de dados e digitalização dos

instrumentos de coleta – provas e questionários – foram realizados pela

empresa INTERCONECT DO BRASIL LTDA.

Com relação à entrada de dados das fichas escolares, o trabalho foi realizado

pelo CEDEPLAR/FACE/UFMG.

O processo de gerenciamento – análises de consistências e integração dos

dados – do banco de dados, referente aos dois momentos foi feito pela

empresa CAFÉ SOFTWARE S/C LTDA.

Com o intuito de resgatar informações dos alunos que se perderam durante a

pesquisa, ou seja, dos alunos que foram excluídos da pesquisa por algum

motivo, como, por exemplo, repetência, abandono/evasão, mudança para outra

escola que não pertencia à amostra ou por outro motivo qualquer, foi criada a

Ficha Histórico Escolar que permitiu assim recuperar a trajetória escolar dos

alunos que em 1999 estavam na 4ª série, e que fizeram parte da amostra inicial

da pesquisa, e a sua situação escolar até 2003. Essas informações formaram

um banco de dados à parte e que possibilitará, com o cruzamento do banco de

dados longitudinal, analisar a trajetória escolar desses alunos e analisar

também o seu desempenho escolar.

112

PROCESSAMENTO DE DADOS DOS INSTRUMENTOS PROVAS E QUESTIONÁRIOS DA 8ª SÉRIE/2003

E DA 7ª SÉRIE/2003

APRESENTAÇÃO

Para o processamento das informações contidas nos instrumentos de coleta –

provas e questionários – as atividades foram realizadas em seis processos:

1) Processo de recepção e conferência do material;

2) Desenvolvimento de programa para entrada dos dados;

3) Processo de digitação do material;

4) Processo de digitalização do material;

5) Processo de análise dos dados digitados contra os dados digitalizados;

6) Processo de correção.

O processo de recepção e conferência do material consistiu em receber a

totalidade do material que chegou da crítica visual, efetuando a checagem das

informações contidas nas caixas com o seu conteúdo. Na incompatibilidade de

informações, o material com problema era encaminhado para uma solução

imediata.

O desenvolvimento do programa para a entrada dos dados consistiu na

elaboração de um programa específico para este processo, onde foram

respeitados todos os parâmetros estabelecidos, e sempre com a missão de

traduzir para a base de dados, com fidelidade, as informações colocadas no

papel. O programa desenvolvido possibilitou a dupla digitação dos dados,

aumentando assim o grau de confiabilidade destes.

113

O processo de digitação do material consistiu na distribuição dos originais aos

digitadores que, utilizando o programa desenvolvido, fizeram a extração dos

dados. Com o controle do programa, era vedado ao digitador efetuar as duas

digitações de um mesmo instrumento, garantindo que se um digitador tivesse

uma interpretação errada de um dado, o erro não se repetia com um segundo

digitador.

O processo de digitalização do material consistiu no processamento dos

instrumentos em papel para um meio digital. Este processo ocorreu em

paralelo com a digitação, sendo feito ao término da mesma. Para este processo

foram utilizados equipamentos de última geração com capacidade de

digitalização dos documentos em ambos os lados da folha com uma única

passagem, garantindo a organização do material.

O processo de análise dos dados digitados com os dados digitalizados

consistiu na confrontação da base de dados obtidos da digitação, com os

dados obtidos da digitalização, localizando qualquer inconsistência, e gerando

relatórios para que se efetuassem as correções necessárias.

O processo de correção consistiu no retorno aos originais para sanar qualquer

dúvida ou inconsistência localizada no processo anterior, para ao final poder

gerar uma base de dados, a que chamamos de base de dados final, e

enviarmos para a empresa Café Software – responsável pelo gerenciamento

do banco de dados – para assim, efetuar o trabalho de processamento dos

resultados.

114

PROCESSAMENTO DE DADOS DAS FICHAS ESCOLARES DA 7ª SÉRIE/2002, 8ª SÉRIE/2003 E A 7ª

SÉRIE/2003 – REP7

APRESENTAÇÃO

O processamento das informações contidas nas fichas escolares da 7ª

série/2002, 8ª série/2003 e 7ª série/2003 – REP7 compreendeu as seguintes

etapas:

Elaboração de máscara para entrada de dados;

Teste da máscara para entrada de dados;

Acertos na máscara para procedimento de entrada de dados;

Recebimento e conferência do material – fichas escolares – enviadas

pelo campo;

Separação de todo o material por instrumentos Fichas Escolares

/Série/Estado/Escola;

Digitação dos dados coletados;

Checagem dos serviços de digitação;

Conclusão e formação do banco de dados das Fichas Escolares.

A partir do banco de dados da 7ª série e do banco de dados da 8ª série,

enviados pela INTERCONECT DO BRASIL LTDA., efetuamos uma máscara

para definir as informações que seriam processadas.

Após definirmos o desenho final da máscara, iniciamos os testes necessários

para comprovação da eficiência da máscara no processamento das

informações. Os erros apresentados foram acertados e o desenho final da

máscara foi definido. Afim de minimizar os erros na digitação e facilitar todo o

115

processo de digitação, o desenho da máscara foi definido como sendo o mais

próximo possível dos instrumentos de coletas

À medida que as fichas escolares foram retornando do campo, todo o material

era conferido e separado por ano/série, por estado e, finalmente, por escola.

Os problemas verificados nesta conferência visual eram reportados ao campo

para a sua imediata solução.

Após todo recebimento do material e sua respectiva conferência e separação,

iniciaram os trabalhos de entrada de dados.

Após a entrada de dados, foi feita uma checagem dos dados no intuito de

solucionar os possíveis erros.

Checagem efetuada e problemas sanados, o banco assim constituído foi

enviado para a CAFÉ SOFTWARE S/C LTDA., para que fosse feito o trabalho

de análise de consistência e a sua integração ao banco de dados longitudinal.

CRONOGRAMA DE ATIVIDADES

mai/04 jun/04 jul/04 ago/04 set/04 out/04Elaboração de máscara para entrada de dados

05 a 16Teste da máscara para entrada de dados

19 a 30Acertos nas máscaras para procedimento de entrada de dados 02 a 13Recebimento e conferência do material – fichas escolares – enviadas pelo campo 02 a 13Separação de todo o material por instrumentos Fichas Escolares /Série/Estado/Escola 16 a 30Digitação dos dados coletados 01 a 31 01 a 29Checagem e acertos dos serviços de digitação 11 a 29 15 a 30Conclusão e formação do banco de dados das Fichas Escolares 3Remessa do banco de dados para análise de consistência 6

ATIVIDADESDATA

116

GERENCIAMENTO DO BANCO DE DADOS DA

8ª SÉRIE – 2003

APRESENTAÇÃO

A Café Software foi responsável pelo gerenciamento do banco de dados da 8a

série. Este trabalho foi realizado de março a novembro de 2004 e consistiu na

preparação de dados para a utilização geral e também para o objetivo

específico de análise estatística de microdados no projeto pesquisa Avaliação

de Desempenho: Fatores Associados. O gerenciamento do banco de dados é

composto por carga, consistência, adequação, filtragem, integração e

tratamento dos dados “brutos”, provenientes da digitação dos instrumentos

coletados, respeitando a integridade referencial da base já existente. O

resultado do trabalho é a base de dados (formato Microsoft Access) com os

dados de todos os anos integrados, consistentes e documentados.

GERAÇÃO DO BANCO DE DADOS DA 8ª SÉRIE

A Geração do Banco de dados da 8a série consistiu na preparação de dados

através de procedimentos técnicos executados por Queries SQL. Nestes

procedimentos, os dados recebidos, provenientes da digitação e digitalização

dos instrumentos aplicados no campo, foram inseridos criteriosamente no

modelo E-R (Entidade Relacionamento) adotado para a pesquisa e

posteriormente integrados à base de dados dos anos anteriores. Assim, após

todo o check de consistências e integração, a base de dados estava pronta

para a utilização geral e também para o objetivo específico de análise

estatística de microdados no projeto pesquisa e demais análises.

117

Escopo das Tarefas

• Cadastro de alunos(CAD_ALUNO)

o Origem: Prova e Questionário do Aluno

o Procedimentos

Seleção e formatação da data de nascimento

Verificação da informação do sexo

Check alunos duplicados/homônimos

Consistências com as tabelas relacionadas*

Geração de relatório de inconsistência (caso necessário)

Carga de Dados no modelo ER

* Mais informações no item “Consistências”

• Cadastro de Professores (CAD_PROFESSOR)

o Origem: Questionário e Cadastro Professor

o Procedimentos:

Adequação à estrutura da base de dados

Check professores duplicados/homônimos

Geração de relatório de inconsistências (caso necessário)

Consistência com as tabelas relacionadas*

Carga dos dados de escola, turno, turma, disciplina e série

• Questionário do Professor(QUEST_PROFESSOR)

o Origem: Questionários dos professores

o Procedimentos:

Verificação das respostas de questões relacionadas,

conforme instrumentos de avaliação

Geração de relatório de inconsistências

118

“Limpeza” conforme orientação do CEDEPLAR

Verificação de duplicidade

Consistência com as tabelas relacionadas*

• Prova do Alunos (PROVA_ALUNO)

o Origem: Provas dos Alunos

o Procedimentos:

Estabelecimento a integridade referencial entre cadastro

de aluno, provas de Português e Matemática, questionário

e ficha do aluno

Geração de escores (acertos, erros, nulos e brancos),

segundo o gabarito da 8a série e obedecendo a estrutura

existente

Check de duplicidade

Check de turmas pequenas

Consistência entre alunos e professores, observando que o

aluno será confrontado com o professor, ou seja, existindo

alunos(turmas), seus professores devem existir

Geração de relatório de inconsistências

Carga de Dados

• Questionário do Aluno(QUEST_ALUNO)

o Origem: Questionários dos Alunos

o Procedimentos:

Verificação das respostas de questões relacionadas,

conforme instrumentos de avaliação

Geração de relatório de inconsistências

“Limpeza” conforme orientação do CEDEPLAR

Verificação de duplicidade

Consistência com as tabelas relacionadas*

119

• Questionário do Diretor(QUEST_DIRETOR)

o Origem: Questionários dos Diretores

o Procedimentos:

Verificação das respostas de questões relacionadas,

conforme instrumentos de avaliação

Geração de relatório de inconsistências

“Limpeza” conforme orientação do CEDEPLAR

Verificação de duplicidade

Consistência com as tabelas relacionadas*

• Questionário do Roteiro Escola (QUEST_ROTEIRO_ESCOLA)

o Origem: Questionários das Escolas

o Procedimentos:

Verificação das respostas de questões relacionadas,

conforme instrumentos de avaliação

Geração de relatório de inconsistências

“Limpeza” conforme orientação do CEDEPLAR

Verificação de duplicidade

Consistência com as tabelas relacionadas*

• Professor Função Docente(PROF_FUNCAO_DOC)

o Origem: PROVA_ALUNO e CAD_PROFESSOR

o Procedimentos:

Estabelecimento da integridade referencial entre as

entidades

Consistência entre alunos e professores, observando que o

aluno será confrontado com o professor, ou seja, existindo

alunos (turmas) seus professores devem existir

Geração de relatório de inconsistências (caso necessário)

120

Carga de Dados, seguindo os procedimentos acima,

através da Prova_Aluno

• Aluno Professor Função Docente (PROF_FUNC_DOC_ALU)

o Origem: PROVA_ALUNO e PROF_FUNCAO_DOC

o Gerar entidade relacional entre PROVA_ALUNO e

PROF_FUNCAO_DOC, respeitando as regras de integridade

referencial

Não pode haver inconsistências

o Carga de dados

• Integração

o Integração do Banco de Dados da 8a série com o banco de dados

dos anos anteriores, respeitando todas as regras de integridade

referencial existentes e o modelo E-R.

• Documentação

o Documentação completa do banco de dados resultante,

juntamente com a notificação de todas as alterações realizadas.

Criação do dicionário de dados, contendo descrições de todos os

campos de cada uma das tabelas integrantes, domínios de

validade, especificação de relacionamentos e diagramas.

CONSISTÊNCIAS

A fim de possibilitar melhor entendimento sobre as consistências,

descreveremos abaixo as principais consistências realizadas e ao que elas

dizem respeito (a qual pergunta devem responder).

121

CAD_ESCOLA CAD_GERAL_ALUNO

Pergunta: Existe escola sem aluno?

CAD_ESCOLA PROF_FUNCAO_DOC

Pergunta: Existe escola sem professor?

QUEST_DIRETOR CAD_ESCOLA

Pergunta: Existe Questionário Diretor sem escola?

CAD_ESCOLA QUEST_DIRETOR

Pergunta: Existem escolas sem Questionário Diretor?

QUEST_ROTEIRO_ESCOLA CAD_ESCOLA

Pergunta: Existe Questionário Roteiro Escola sem escola?

CAD_ESCOLA QUEST_ROTEIRO_ESCOLA

Pergunta: Existem escolas sem Questionário Roteiro Escola?

PROF_FUNCAO_DOC CAD_ESCOLA

Pergunta: Existem professores sem escola?

QUEST_PROFESSOR CAD_GERAL_PROFESSOR

Pergunta: Existe Questionário Professor sem professor?

122

CAD_GERAL_PROFESSOR QUEST_PROFESSOR

Pergunta: Existem professores com mais de um Questionário Professor na mesma data e mesma escola?

PROVA_PROFESSOR CAD_GERAL_PROFESSOR

Pergunta: Existe Prova Professor sem professor?

CAD_GERAL_PROFESSOR PROVA_PROFESSOR

Pergunta: Existem professores com mais de uma Prova Professor na mesma disciplina e mesma data?

QUEST_ALUNO CAD_GERAL_ALUNO

Pergunta: Existe Questionário Aluno sem aluno?

CAD_GERAL_ALUNO QUEST_ALUNO

Pergunta: Existe aluno com mais de um questionário na mesma data?

CAD_GERAL_ALUNO CAD_ESCOLA

Pergunta: Existem alunos sem escola?

PROVA_ALUNO CAD_GERAL_ALUNO

Pergunta: Existe prova aluno sem aluno?

CAD_GERAL_ALUNO PROVA_ALUNO

Pergunta: Existe aluno com mais de uma prova na mesma disciplina e mesma data?

123

PROF_FUNCAO_DOC PROVA_ALUNO

Pergunta: Existe professor sem aluno?

CAD_ESCOLA QUEST_ALUNO

Pergunta: Existem escolas sem Questionário Aluno?

CAD_ESCOLA QUEST_PROFESSOR

Pergunta: Existem escolas sem Questionário Professor?

Estas consistências são essenciais para o produto final, sendo feitas durante

todo o processo. Quando algum dado estava incorreto ou ausente, a Cafe

Software recorreu ao responsável (CEDEPLAR) para a coleta ou confirmação

das informações. Exemplos de problemas encontrados através das

consistências:

Turmas sem professores

Professores sem turma

Provas e questionários sem aluno (sem dono)

Aluno sem escola

Escola sem aluno

Alunos duplicados

Provas duplicadas

124

GERENCIAMENTO DO BANCO DE DADOS DA

7ª SÉRIE – 2003 – REP7

APRESENTAÇÃO

A Café Software foi responsável pelo gerenciamento do banco de dados da 7a

série/2003 – REP7. Este trabalho foi realizado de abril a novembro de 2004 e

consistiu na preparação de dados para a utilização geral e também para o

objetivo específico de análise estatística de microdados no projeto pesquisa

Avaliação de Desempenho: Fatores Associados. O gerenciamento do banco de

dados é composto por carga, consistência, adequação, filtragem, integração e

tratamento dos dados “brutos”, provenientes da digitação dos instrumentos

coletados, respeitando a integridade referencial da base já existente. O

resultado do trabalho é a base de dados (formato Microsoft Access) com os

dados de todos os anos integrados, consistentes e documentados.

GERAÇÃO DO BANCO DE DADOS DA 7ª SÉRIE (REPETENTES)

A Geração do Banco de dados da 7a série/2003 – REP7 consistiu na

preparação de dados através de procedimentos técnicos executados por

Queries SQL. Nestes procedimentos, os dados recebidos, provenientes da

digitação e digitalização dos instrumentos aplicados no campo, foram inseridos

criteriosamente no modelo E-R (Entidade Relacionamento) adotado para a

Pesquisa e posteriormente integrados à base de dados dos anos anteriores.

Assim, após todo o check de consistências, a base de dados estava pronta

para a utilização geral e também para o objetivo específico de análise

estatística de microdados no projeto pesquisa e demais análises.

125

Escopo das Tarefas

• Cadastro de alunos(CAD_ALUNO)

o Origem: Prova e Questionário do Aluno

o Procedimentos

Seleção e formatação da data de nascimento

Verificação da informação do sexo

Check alunos duplicados/homônimos

Consistências com as tabelas relacionadas*

Geração de relatório de inconsistência (caso necessário)

Carga de Dados no modelo ER

* Mais informações no item “Consistências”

• Cadastro de Professores (CAD_PROFESSOR)

o Origem: Questionário e Cadastro Professor

o Procedimentos:

Adequação a estrutura da base de dados

Check professores duplicados/homônimos

Geração de relatório de inconsistências (caso necessário)

Consistência com as tabelas relacionadas*

Carga dos dados de escola, turno, turma, disciplina e série

• Questionário do Professor(QUEST_PROFESSOR)

o Origem: Questionários dos professores

o Procedimentos:

Verificação das respostas de questões relacionadas,

conforme instrumentos de avaliação

Geração de relatório de inconsistências

126

“Limpeza” conforme orientação do CEDEPLAR

Verificação de duplicidade

Consistência com as tabelas relacionadas*

• Prova do Alunos (PROVA_ALUNO)

o Origem: Provas dos Alunos

o Procedimentos:

Estabelecimento a integridade referencial entre cadastro

de aluno, provas de Português e Matemática, questionário

e ficha do aluno

Geração de escores (acertos, erros, nulos e brancos),

segundo o gabarito da 7a série e obedecendo a estrutura

existente

Check de duplicidade

Check de turmas pequenas

Consistência entre alunos e professores, observando que o

aluno será confrontado com o professor, ou seja, existindo

alunos(turmas) seus professores devem existir

Geração de relatório de inconsistências

Carga de Dados

• Questionário do Aluno(QUEST_ALUNO)

o Origem: Questionários dos Alunos

o Procedimentos:

Verificação das respostas de questões relacionadas,

conforme instrumentos de avaliação

Geração de relatório de inconsistências

“Limpeza” conforme orientação do CEDEPLAR

Verificação de duplicidade

Consistência com as tabelas relacionadas*

127

• Questionário do Diretor(QUEST_DIRETOR)

o Origem: Questionários dos Diretores

o Procedimentos:

Verificação das respostas de questões relacionadas,

conforme instrumentos de avaliação

Geração de relatório de inconsistências

“Limpeza” conforme orientação do CEDEPLAR

Verificação de duplicidade

Consistência com as tabelas relacionadas*

• Questionário do Roteiro Escola (QUEST_ROTEIRO_ESCOLA)

o Origem: Questionários das Escolas

o Procedimentos:

Verificação das respostas de questões relacionadas,

conforme instrumentos de avaliação

Geração de relatório de inconsistências

“Limpeza” conforme orientação do CEDEPLAR

Verificação de duplicidade

Consistência com as tabelas relacionadas*

• Professor Função Docente(PROF_FUNCAO_DOC)

o Origem: PROVA_ALUNO e CAD_PROFESSOR

o Procedimentos:

Estabelecimento da integridade referencial entre as

entidades

Consistência entre alunos e professores, observando que o

aluno será confrontado com o professor, ou seja, existindo

alunos (turmas) seus professores devem existir

128

Geração de relatório de inconsistências (caso necessário)

Carga de Dados, seguindo os procedimentos acima,

através da Prova_Aluno

• Aluno Professor Função Docente (PROF_FUNC_DOC_ALU)

o Origem: PROVA_ALUNO e PROF_FUNCAO_DOC

o Gerar entidade relacional entre PROVA_ALUNO e

PROF_FUNCAO_DOC, respeitando as regras de integridade

referencial

Não pode haver inconsistências

o Carga de dados

• Documentação

o Documentação completa do banco de dados resultante. Criação

do dicionário de dados, contendo descrições de todos os campos

de cada uma das tabelas integrantes, domínios de validade,

especificação de relacionamentos e diagramas.

CONSISTÊNCIAS

A fim de possibilitar melhor entendimento sobre as consistências,

descreveremos abaixo as principais consistências realizadas e ao que elas

dizem respeito (a qual pergunta devem responder).

CAD_ESCOLA CAD_GERAL_ALUNO

Pergunta: Existe escola sem aluno?

CAD_ESCOLA PROF_FUNCAO_DOC

Pergunta: Existe escola sem professor?

129

QUEST_DIRETOR CAD_ESCOLA

Pergunta: Existe Questionário Diretor sem escola?

CAD_ESCOLA QUEST_DIRETOR

Pergunta: Existem escolas sem Questionário Diretor?

QUEST_ROTEIRO_ESCOLA CAD_ESCOLA

Pergunta: Existe Questionário Roteiro Escola sem escola?

CAD_ESCOLA QUEST_ROTEIRO_ESCOLA

Pergunta: Existem escolas sem Questionário Roteiro Escola?

PROF_FUNCAO_DOC CAD_ESCOLA

Pergunta: Existem professores sem escola?

QUEST_PROFESSOR CAD_GERAL_PROFESSOR

Pergunta: Existe Questionário Professor sem professor?

CAD_GERAL_PROFESSOR QUEST_PROFESSOR

Pergunta: Existem professores com mais de um Questionário Professor na mesma data e mesma escola?

PROVA_PROFESSOR CAD_GERAL_PROFESSOR

Pergunta: Existe Prova Professor sem professor?

130

CAD_GERAL_PROFESSOR PROVA_PROFESSOR

Pergunta: Existem professores com mais de uma Prova Professor na mesma disciplina e mesma data?

QUEST_ALUNO CAD_GERAL_ALUNO

Pergunta: Existe Questionário Aluno sem aluno?

CAD_GERAL_ALUNO QUEST_ALUNO

Pergunta: Existe aluno com mais de um questionário na mesma data?

CAD_GERAL_ALUNO CAD_ESCOLA

Pergunta: Existem alunos sem escola?

PROVA_ALUNO CAD_GERAL_ALUNO

Pergunta: Existe prova aluno sem aluno?

CAD_GERAL_ALUNO PROVA_ALUNO

Pergunta: Existe aluno com mais de uma prova na mesma disciplina e mesma data?

PROF_FUNCAO_DOC PROVA_ALUNO

Pergunta: Existe professor sem aluno?

CAD_ESCOLA QUEST_ALUNO

Pergunta: Existem escolas sem Questionário Aluno?

131

CAD_ESCOLA QUEST_PROFESSOR

Pergunta: Existem escolas sem Questionário Professor?

Estas consistências são essenciais para o produto final, sendo feitas durante

todo o processo. Quando algum dado está incorreto ou ausente, a Cafe

Software recorreu ao responsável (CEDEPLAR) para a coleta ou confirmação

das informações. Exemplos de problemas encontrado através das

consistências:

Turmas sem professores

Professores sem turma

Provas e questionários sem aluno

Aluno sem escola

Escola sem aluno

Alunos duplicados

Provas duplicadas

132

PROCESSAMENTO DE DADOS DAS FICHAS HISTÓRICO ESCOLAR – ALUNOS 1999

APRESENTAÇÃO

Aproveitando a realização do campo para coleta das fichas escolares, decidiu-se

criar a Ficha Histórico Escolar com o objetivo de levantar a trajetória escolar dos

alunos que iniciaram a amostra da pesquisa “Avaliação de Desempenho: Fatores

Associados”.

Assim sendo, foi criada uma ficha que continha campos que era possíveis de serem

preenchidos com todos os dados que traduzissem a vida escolar do aluno dentro da

escola – ano de entrada, série e a situação do aluno em cada ano e série.

O processo de digitação dos dados da Ficha Histórico Escolar ocorreu

paralelamente à entrada de dados das fichas escolares da 7ª série, 8ª série e REP7.

A digitação destes dados foi precedida de uma conferência e separação de todo o

material por estado e escola.

Passada a etapa de digitação, foi feita uma checagem por amostragem dos dados

processados e também foi feita uma limpeza de todo o banco para que ele pudesse

ficar no formato desejado para as análises.

O banco de dados da Ficha Histórico é um banco independente e poderá ser

utilizado também, através do cruzamento de dados, com o banco de dados

longitudinal para análises futuras.

133

CRONOGRAMA DE ATIVIDADES

mai/04 jun/04 jul/04 ago/04 set/04 out/04Elaboração de máscara para entrada de dados

05 a 16Teste da máscara para entrada de dados

19 a 30Acertos nas máscaras para procedimento de entrada de dados 02 a 13Recebimento e conferência do material – fichas escolares – enviadas pelo campo 02 a 13Separação de todo o material por instrumentos Fichas Escolares /Série/Estado/Escola 16 a 30Digitação dos dados coletados 01 a 31 01 a 29Checagem e acertos dos serviços de digitação 11 a 29 15 a 30Conclusão e formação do banco de dados das Fichas Escolares 3

ATIVIDADESDATA

134

AÇÃO 1.3. – ESTIMATIVAS DE FATORES DETERMINANTES DO RENDIMENTO ESCOLAR NO

ENSINO FUNDAMENTAL

APRESENTAÇÃO

Esta seção está dividida em três principais tópicos. Para o primeiro tópico,

Análise descritiva da base de dados longitudinal (quarta a oitava séries), são

apresentados três relatórios: 1) Análises estatísticas descritivas dos escores

clássicos para as disciplinas de matemática e de português; 2) Análises

estatísticas descritivas dos escores equalizados para as disciplinas de

matemática e português e 3) Análise de trajetórias, segundo os escores

clássicos e equalizados em matemática e português.

Nos dois primeiros relatórios podem ser encontradas análises descritivas dos

escores clássicos e equalizados por estado e por turno, separadamente para

cada disciplina. O principal objetivo desses relatórios é mostrar a diferença nos

resultados descritivos quando se utilizam escores clássicos e escores

equalizados. Esta diferença foi também evidenciada no relatório de Análises de

Trajetórias, que mostra curvas com estrutura bem mais próxima à do padrão de

uma curva de aprendizagem, quando se utilizam os escores equalizados, ou

seja, aqueles estimados e equalizados de acordo com a Teoria da Resposta ao

Item (TRI).

No segundo tópico, “Análise final dos determinantes do rendimento escolar,

com base nos dados longitudinais (quarta a oitava séries)”, constam dois

relatórios: 1) Qualidade dos itens e processos de equalização para as provas

135

de português e matemática, de acordo com a Teoria da Resposta ao Item e 2)

Estimação de modelos hierárquicos longitudinais nas disciplinas de matemática

e de português.

No relatório sobre estimação (calibração) e equalização de acordo com a

Teoria da Resposta ao Item, inicialmente, apresenta-se uma introdução sobre

a TRI, incluindo além da especificação teórica do modelo, critérios, em geral,

utilizados para a determinação da qualidade dos itens. Complementando esta

introdução, é mostrado um resumo teórico sobre processos de equalização de

acordo com a TRI. A seguir, são interpretados os resultados da estimação e da

qualidade dos itens para as disciplinas de matemática e português, assim como

foram também descritos os processos de equalização para as provas das

referidas disciplinas.

De posse da variável dependente escore equalizado, estimada de acordo com

a TRI, passou-se então ao processo de estimação de modelos hierárquicos

longitudinais para as disciplinas de português e matemática, separadamente.

Para a estimação desses modelos, optou-se por trabalhar com os alunos de

trajetória completa, ou seja, alunos que estiveram presentes ao longo de todas

as seis rodadas realizadas pela pesquisa.

Esta opção foi escolhida em virtude da grande quantidade de valores em

branco (missings) presentes nas variáveis preditoras, mas, principalmente, pelo

fato do banco de dados, ainda, apresentar erros na variável identificadora do

aluno. Desta forma, tentou-se minimizar problemas de identificadores

diferentes para o mesmo aluno ao longo da pesquisa, uma vez que todos os

alunos considerados participaram de todas as rodadas e, portanto,

apresentavam o mesmo identificador ao longo da pesquisa. Contudo, este

relatório apresenta um apêndice, contendo resultados de modelos estimados

com alunos que participaram de pelo menos duas rodadas da pesquisa.

No terceiro tópico, “Avaliação do impacto da bolsa escola e renda mínima

sobre o rendimento escolar”, é encontrado um relatório com análises

descritivas, sugerindo qual o tipo de relação entre o impacto do programa bolsa

escola e o rendimento escolar.

136

Para este tópico foi utilizado o banco de dados CADASTRO do bolsa escola

municipal fornecido pela Prefeitura Municipal do Recife/PE, conforme acordo

efetuado em 2003. Porém, com a mudança do governo municipal que

aconteceu neste ano, os arquivos complementares que seriam enviados pela

Prefeitura Municipal do Recife/PE não o foram, acabando por restringir um

pouco o aprofundamento das análises.

Faz parte também desta Ação 1.3 o anexo contendo a dissertação “Fatores

Associados ao Rendimento Escolar de Alunos da 5ª série (2000) – uma

abordagem do valor adicionado e da heterogeneidade”, de autoria de Gláucia

Alves Macedo, defendida no Programa de Pós-Graduação em Demografia do

CEDEPLAR/FACE/UFM em março/2004. Este anexo pode ser encontrado no

final do relatório. Uma versão pré-defesa já havia sido enviada ao INEP

juntamente com o relatório de atividades apresentado em fevereiro/2004. A

versão definitiva desta dissertação agora apresentada, em anexo, é a primeira

publicação efetuada, utilizando o banco de dados da pesquisa “Avaliação de

Desempenho: Fatores Associados”.

137

1.1. – ANÁLISE DESCRITIVA DA BASE DE DADOS LONGITUDINAL (4ª a 8ª SÉRIE)

APRESENTAÇÃO

Este tópico engloba as análises descritivas dos escores clássicos e

equalizados por estado e por turno, separadamente para cada disciplina.

Por meio dos dois primeiros relatórios desta ação – Análises descritivas dos

escores clássicos para as disciplinas de matemática e de português e Análises

descritivas dos escores equalizados para as disciplinas de matemática e

português – é possível verificar a diferença nos resultados descritivos, quando

se utiliza escores clássicos e escores equalizados.

Esta diferença foi também evidenciada no relatório seguinte – Análises de

Trajetórias, que mostra curvas com estrutura bem mais próxima à do padrão de

uma curva de aprendizagem, quando se utilizam os escores equalizados, ou

seja, aqueles estimados numa mesma escala, de acordo com a Teoria da

Resposta ao Item (TRI).

138

ANÁLISES DESCRITIVAS DOS ESCORES CLÁSSICOS PARA AS DISCIPLINAS DE MATEMÁTICA E DE

PORTUGUÊS

APRESENTAÇÃO

Este relatório apresenta uma análise descritiva do rendimento ou escore

clássico (EC) do aluno para as disciplinas de matemática e português, segundo

o estado da federação - Rondônia, Pará, Pernambuco, Sergipe, Goiás e Mato

Grosso do Sul - e o turno em que o aluno estuda – manhã, intermediário e

tarde. O escore clássico é calculado por meio da soma do número de questões

que o aluno respondeu corretamente. Os dados utilizados referem-se ao

período de abril de 1999 a novembro de 2003, ressaltando que, no ano de

1999, a pesquisa teve duas rodadas realizadas, uma em abril e outra em

novembro deste ano. A partir de 2000, as provas foram sempre aplicadas no

mês de novembro até o término da pesquisa em novembro de 2003.

Depois de calculado, o escore clássico passou pela seguinte transformação:

50)10( +×= nEC

em que n é o número de questões que o aluno respondeu corretamente.

Como a prova de abril de 1999 contém apenas 36 itens, seu escore não

poderia ser diretamente comparável aos outros dos outros anos, de forma que

foi necessário que os escores clássicos passassem pela seguinte

transformação:

139

50104036

+⎭⎬⎫

⎩⎨⎧

×⎥⎦

⎤⎢⎣

⎡×⎟⎠⎞

⎜⎝⎛=

nEC

Considerando que as provas de novembro de 1999 a novembro de 2003

contêm 40 questões, o valor máximo obtido pelo aluno pode variar de um valor

mínimo de 50, para um aluno que não acertou nenhuma questão, até um valor

máximo de 450, relativo a um aluno que respondeu corretamente toda a prova.

Para a prova de abril de 1999, os valores mínimo e máximo correspondem a 50

e 410, respectivamente. Será adotado neste relatório, para efeito comparativo,

o valor de 250 como média, pois corresponde à média entre o valor mínimo e

máximo nos períodos de novembro de1999 a novembro de 2003.

A seguir são mostrados as tabelas e os gráficos com os resultados obtidos,

primeiramente, para as provas de matemática e, posteriormente, para as

provas de português:

Tabela 1- Média e desvio padrão do escore clássico em matemática por estado e data de

realização da prova Ano

Estados Abr/1999 Nov/1999 2000 2001 2002 2003 RO 254,39 254,46 265,66 244,22 243,64 241,40

(69,94) (72,47) (64,69) (52,07) (59,81) (51,31)

PA 266,22 259,77 261,06 242,14 240,58 247,03 (67,28) (67,46) (65,33) (50,62) (55,99) (51,13)

PE 250,17 239,75 253,81 232,18 229,94 239,71 (72,72) (73,11) (66,31) (52,29) (58,82) (56,02)

SE 269,54 262,90 273,30 249,48 245,08 251,63 (70,18) (72,60) (67,02) (51,99) (58,48) (54,16)

MS 289,35 280,88 288,15 264,15 270,46 276,00 (76,72) (76,10) (68,24) (57,83) (64,30) (54,99)

GO 293,19 295,78 294,94 260,77 265,37 265,75 (71,06) (71,17) (66,80) (53,05) (62,28) (53,95) Fonte: Cedeplar/ Inep (2005).

140

Gráfico 1: Média dos escores clássicos das provas de matemática

abr-99

nov-99

nov-00

nov-01nov-02

nov-03

abr-99nov-99 nov-00

nov-01

nov-02 nov-03

220

230

240

250

260

270

280

290

300

Período

Esco

re M

édio

RO PA PE SE MS GO

Fonte: Cedeplar/ Inep (2005).

A tabela 1 mostra o escore clássico médio e o desvio padrão por estado e o

gráfico 1 facilita o acompanhamento da evolução destes escores clássicos em

matemática entre abril de 1999 a novembro de 2003. Observando esses dados,

nota-se uma pequena tendência de decrescimento do escore médio na prova

de matemática a partir de 2000 para todos os estados. As menores médias

foram observadas no estado de Pernambuco, enquanto os estados de Goiás e

Mato Grosso do Sul apresentaram os maiores escores médios, sendo que o

estado do Mato Grosso do Sul chega a ultrapassar a melhor posição de Goiás

a partir de novembro de 2001.

141

Tabela 2 Escore clássico médio e desvio padrão em matemática por turno

Ano Turno Abr/1999 Nov/1999 2000 2001 2002 2003 Manhã 267,83 260,22 268,28 249,02 256,90 261,95

(72,53) (74,49) (66,63) (54,03) (63,30) (55,17)

Intermediário 262,21 254,58 259,54 238,46 239,30 253,82 (71,44) (67,31) (66,01) (47,30) (53,45) (48,42)

Tarde 276,20 273,47 275,02 247,82 244,57 248,17 (74,25) (74,87) (69,28) (54,88) (61,05) (55,31) Fonte: Cedeplar/ Inep (2005)

Gráfico 2: Média dos escores clássicos da provas de matemática por turno

abr-99

nov-99

nov-00

nov-01

nov-02

nov-03abr-99

nov-99

nov-00

nov-01 nov-02

nov-03

abr-99

nov-99nov-00

nov-01

nov-02

nov-03

235

240

245

250

255

260

265

270

275

280

Período

Esco

re M

édio

Manhã Intermediário Tarde Fonte: Cedeplar/ Inep (2005)

Pela análise da tabela 2 e do gráfico 2, nota-se que existe um decrescimento

do rendimento médio de matemática em todos os turnos a partir de 2000 com

pequeno acréscimo em 2003. O escore clássico médio do turno tarde foi o

maior entre abril de 1999 e novembro de 2000, mas em novembro de 2001 há

uma inversão de tendência e o turno da manhã alcança e ultrapassa o turno

da tarde.

142

O turno intermediário permanece abaixo dos outros dois turnos entre 1999 e

2002, sendo que em novembro de 2003 ele chega a ultrapassar o turno da

tarde. Assim, é possível notar que nos dados da Tabela 2 e no gráfico 2 em

Abril de 1999, a ordem quanto aos escores clássicos médios era turno da

tarde, manhã e intermediário e em novembro de 2003 houve uma inversão de

posição entre os três turnos, configurando uma nova ordem para os turnos

quanto ao seu escore clássico médio: destaca-se o turno da manhã, seguindo

pelos turnos intermediário e tarde.

As tabelas 3 e 4 e os gráficos 3 e 4 mostram, respectivamente, o percentual de

alunos, por estado e turno, que obtiveram um escore médio superior a 250.

Tabela 3

Percentual de alunos com rendimento em matemática igual ou superior a 250 por estado Ano

Estados Abr/1999 Nov/1999 2000 2001 2002 2003 RO 733 554 1042 735 498 397 % 54,38 51,20 59,58 47,09 44,62 45,79

PA 1725 1365 2025 1556 1108 1075 % 62,21 57,28 60,12 46,19 44,46 50,83

PE 1309 1074 1954 1402 1028 1020 % 49,16 44,75 52,84 39,02 36,40 44,85

SE 813 540 910 603 432 423 % 63,81 57,88 65,23 52,43 47,68 52,88

MS 1583 1329 1688 1478 1309 1195 % 71,02 65,82 72,45 60,75 62,66 70,75

GO 1795 1413 2266 1938 1682 1534 % 76,25 75,60 76,71 61,06 60,85 65,11

Fonte: Cedeplar/ Inep (2005).

143

Gráfico 3: Percentual de alunos com rendimento em matemática igual ou superior a 250 por estado

abr-99

nov-99

nov-00

nov-01nov-02

nov-03

abr-99 nov-99 nov-00

nov-01 nov-02

nov-03

30

40

50

60

70

80

90

100

Período

Perc

entu

al

RO PA PE SE MS GO

Fonte: Cedeplar/ Inep (2005).

Pela tabela e gráfico 3 pode-se notar que o estado de Pernambuco encontra-

se em pior situação em quase todos os anos, apresentando o menor percentual

de alunos com rendimento superior a 250. Por outro lado, os estados de Goiás

e Mato Grosso do Sul apresentam os melhores resultados para todos os anos.

Sergipe, Pará e Rondônia permanecem em uma situação intermediária, sendo

que em 2003 Rondônia tem um percentual de alunos com rendimento superior

a 250, situação próxima à de Pernambuco.

Tabela 4

Percentual de alunos com rendimento em matemática igual ou superior a 250 por turno Ano

Turno Abr/1999 Nov/1999 2000 2001 2002 2003 Manhã 3980 3204 3727 3158 2723 2759

% 61,28 56,27 62,13 51,29 54,29 61,18

Intermediário 471 337 535 260 180 156 % 58,88 53,58 57,78 43,48 45,11 58,43

Tarde 3507 2734 5623 4294 3154 2729 % 65,60 62,66 65,62 50,37 46,55 51,26

Fonte: Cedeplar/ Inep (2005).

144

Gráfico 4: Percentual de alunos com rendimento em matemática igual ou superior a 250 por turno

abr-99

nov-99

nov-00

nov-01nov-02

nov-03abr-99

nov-99

nov-00

nov-01nov-02

nov-03

abr-99nov-99

nov-00

nov-01

nov-02

nov-03

30

40

50

60

70

80

90

100

Período

Perc

entu

al

Manhã Intermediário Tarde

Fonte: Cedeplar/ Inep (2005).

A tabela e gráfico 4 apresentam o percentual de alunos com escore clássico

superior a 250 por turno para a disciplina de matemática. Entre 1999 e 2000, o

percentual de alunos variou pouco em todos os turnos, sendo que o turno da

tarde apresenta os melhores resultados, seguido do turno da manhã e do

intermediário. Em 2001, o percentual dos três turnos sofre uma queda, mas em

2002 e 2003 se recuperam em parte. Em 2003, configura-se uma nova posição

para os turnos com maior porcentagem de alunos com escore clássico superior

a 250, com o turno da manhã superando o escore clássico médio dos turnos

intermediário e tarde.

Com o intuito de facilitar a análise do comportamento do rendimento médio dos

alunos em matemática, foram construídos, ainda, os seguintes gráficos em

formato boxplot.

145

Gráfico 5: Rendimento em matemática por estado em abril de 1999

Estado

GOMSSEPEPARO

Esco

re C

láss

ico

500

400

300

200

100

0

Fonte: Cedeplar/ Inep (2005)

Analisando-se o gráfico 5, que se refere aos rendimentos dos alunos na prova

de matemática em abril de 1999, e tendo em vista que o rendimento

considerado razoável, para efeito de comparação, estaria em torno de 250,

percebe-se que as medianas dos rendimentos da maioria dos estados

encontram-se acima desse valor, exceto para o estado de Pernambuco, cujo

rendimento apresenta-se abaixo, porém próximo desse valor (239). O estado

com melhores resultados é Goiás. Isto se justifica uma vez que este estado

apresenta a maior mediana (306) dentre os demais estados.

A grosso modo, pode-se afirmar que cerca de 75% dos alunos deste estado

apresentaram nota superior a 250. Estados como, Pará, Sergipe e Rondônia

apresentam um resultado intermediário, estando os três com mediana igual ou

superior a 250, mas próximos desta média. O estado do Mato Grosso do Sul é

o que mais se aproxima dos resultados apresentados por Goiás, com uma

mediana próxima de 300 (294), bem acima de 250.

146

Gráfico 6: Rendimento em matemática por estado em novembro de 1999

Estado

GOMSSEPEPARO

Esco

re C

láss

ico

500

400

300

200

100

0

Fonte: Cedeplar/ Inep (2005)

Pela análise do gráfico 6, observam-se as medianas dos rendimentos em

matemática, por estado, em novembro de 1999. Os rendimentos mais baixos

ainda se encontram em Pernambuco, no qual cerca de 50% dos alunos

possuem rendimento em matemática inferior a 230, e mais de 25% deles estão

situados num rendimento inferior a 180, o que não ocorre nos outros estados

analisados. As medianas relativas aos estados de Rondônia, Pará, Sergipe,

apresentam-se próximas, com valores os seguintes 250, 260 e 270 ,

respectivamente. De abril a novembro de 1999, nota-se uma queda nas

medianas de quase todos os estados, exceto para Rondônia, que manteve a

mesma mediana. O estado de Pernambuco configura ter a menor mediana

relativa à prova de matemática. Já o estado onde se verifica a melhor situação

em termos de rendimentos é Goiás, haja vista que apresenta maior mediana,

por volta de 300, o que implica que mais de 50% dos alunos apresentaram

rendimentos superiores a 300. Isto reflete um bom resultado, na medida em

147

que se adotou, como critério comparativo, uma média para o rendimento de

250, indicando um resultado próximo ao que pode se considerado razoável.

Outra constatação, no que se refere ao melhor desempenho de Goiás, é um

percentual de 75% de alunos com rendimentos superiores a 250, assim como

apresentado em abril de 1999.

Gráfico 7: Rendimento em matemática por estado em 2000

Estado

GOMSSEPEPARO

Esco

re C

láss

ico

500

400

300

200

100

0

Fonte: Cedeplar/ Inep (2005)

Pela observação do gráfico 7, verifica-se que os resultados das medianas dos

estados não se modificaram expressivamente, porém pode-se destacar

tendência de mudanças para melhores rendimentos em especial no caso do

Estado do Mato Grosso do Sul.

Nota-se que os piores rendimentos em 2000 continuam em Pernambuco, onde

50% dos alunos possuem rendimentos em matemática abaixo de 250.

Rondônia e Pará, também continuam equivalentes em termos de rendimentos

148

médios, ambos apresentando cerca de 50% dos alunos com rendimentos

inferiores a 260. O estado de Sergipe também está numa situação parecida,

haja vista que apresenta 50% dos alunos com rendimento abaixo de 270. O

estado de Mato Grosso do Sul apresentou uma pequena melhora da sua

mediana entre novembro de 1999 e 2000, aumentando de 280 para 290,

aproximando-se cada vez mais do estado de Goiás. Por sua vez, o estado de

Goiás confirmou, no ano de 2000, o melhor desempenho, antes apresentado

em novembro de 1999, visto que apresentou maior mediana (300), de forma

que 50% dos alunos ficaram com rendimento médio superior a 300. Além

disso, nota-se que Goiás manteve o percentual de 75% dos alunos com

rendimento superior a 250.

Gráfico 8: Rendimento em matemática por estado em 2001

Estado

GOMSSEPEPARO

Esco

re C

láss

ico

500

400

300

200

100

0

Fonte: Cedeplar/ Inep (2005)

149

Pelo gráfico 8, que corresponde aos rendimentos de matemática por estado do

ano de 2001, pode-se notar que os resultados para este ano diferem em

relação aos períodos anteriores. Percebe-se que as medianas dos estados

estão mais próximas. Porém, o resultado para cada estado piorou, visto que

houve uma queda dos rendimentos dos alunos no que se refere às medianas.

Os piores resultados continuam sendo os de Pernambuco, uma vez que sua

mediana ainda é a menor (230). Já os estados de Pará e Rondônia

apresentaram rendimentos bem semelhantes em relação às suas medianas.

No estado de Sergipe também houve queda de rendimento, agora

apresentando mais de 50% dos alunos abaixo de 250. Do mesmo modo, é

visível a mudança de comportamento entre os estados de Goiás e Mato Grosso

do Sul em relação a 2000. Pode-se dizer que estes estados agora se

encontram “empatados” como estados que apresentam os melhores

resultados, sendo que suas medianas reduziram-se significativamente (de 300

e 290, respectivamente, em 2000, chegando a 260 em 2001).

Gráfico 9: Rendimento em matemática por estado em 2002

Estado

GOMSSEPEPARO

Esco

re C

láss

ico

500

400

300

200

100

0

Fonte: Cedeplar/ Inep (2005)

150

No gráfico 9, observa-se os rendimentos de matemática por estado no ano de

2002. Percebe-se uma melhora no quadro de Mato Grosso do Sul em relação

aos outros estados. Isto pode ser comprovado pelo aumento do valor de sua

mediana (270) e de sua nota máxima, ultrapassando Goiás nesses quesitos e

sendo o único estado que obteve melhora de rendimento. Os outros estados

demonstraram comportamento semelhante ao ano de 2001, com pequena

queda para os estados de Sergipe e Pernambuco, sendo que Pernambuco

continua sendo o estado com os piores resultados.

Gráfico 10: Rendimento em matemática por estado em 2003

Estado

GOMSSEPEPARO

Esco

re C

láss

ico

500

400

300

200

100

0

Fonte: Cedeplar/ Inep (2005)

Pela análise do gráfico 10, que mostra os rendimentos de matemática por

estado em 2003, pode-se analisar que o estado de Pernambuco apresenta,

agora mais claramente, uma tendência de melhora com relação aos outros

períodos analisados, chegando a se equiparar ao estado de Rondônia. Isto

pode ser visualizado pelos valores das medianas, 240, para os dois estados.

151

Este resultado pode não ser considerado positivo, uma vez que Rondônia em

abril de 1999 apresentava uma mediana próxima a 250.

Assim, o que teria acontecido seria uma piora nos resultados de Rondônia, de

forma que no fim do processo este estado teve seus resultados ainda mais

próximos aos de Pernambuco. Entretanto, comparando-se os resultados de

abril de 1999 e novembro de 2003, o que houve foi uma queda no rendimento

médio de todos os estados, com exceção de Pernambuco que apresentou

praticamente a mesma mediana. Portanto, pode-se dizer que considerando a

primeira e a última rodada da pesquisa, o estado de Pernambuco manteve os

mesmos resultados, enquanto todos os outros estados apresentaram queda

em seus rendimentos médios.

É importante ressaltar que entre as rodadas a posição dos estados muda com

o tempo. Observa-se, em especial, a partir de 2001, com exceção do ano de

2002, o estado de Mato Grosso do Sul continua a apresentar melhor

desempenho com relação a todos os estados, com exceção de Goiás. O

estado de Mato Grosso do Sul chega a ultrapassar Goiás em 2002, mas em

2003, os dois estados voltam a apresentar resultados semelhantes, com

medianas iguais a 270. Os estados Pará e Sergipe estão em situação

intermediária, apresentando medianas iguais a 250.

Em resumo, pode-se dizer que comparando o início e o final do processo,

todos os estados apresentaram queda em seus rendimentos médios, com

exceção de Pernambuco, que apesar disso, sempre apresentou os piores

rendimentos. Entretanto em 2003, Pernambuco não foi o único responsável

pelos piores rendimentos, pois Rondônia apresentou resultados semelhantes.

Pará e Sergipe continuaram em posição intermediária, enquanto Goiás passa a

dividir os melhores rendimentos com o estado do Mato Grosso do Sul.

152

Gráfico 11: Rendimento em matemática por turno em abril de 1999

Turno

TardeIntermediárioManhã

Esco

re C

láss

ico

500

400

300

200

100

0

Fonte: Cedeplar/ Inep (2005)

Pela análise do gráfico 11, observa-se os rendimentos de matemática por

turno, em abril de 1999. Percebe-se que a variabilidade entre os rendimentos

por turno é bem parecida, embora o melhor turno pareça ser o da tarde, que

apresenta 50% dos alunos com rendimento superior a 280. O turno da manhã

vem logo em seguida, com mediana igual a 270 e o turno intermediário com

260.

153

Gráfico 12: Rendimento em matemática por turno em novembro de 1999

Turno

TardeIntermediárioManhã

Esco

re C

láss

ico

500

400

300

200

100

0

Fonte: Cedeplar/ Inep (2005)

Observando o gráfico de novembro de 1999 acima, relativo aos rendimentos de

matemática, e comparando-o ao de abril de 1999, percebe-se que não ocorreu

mudança expressiva entre os turnos. Todavia, verifica-se que o rendimento

teve uma sensível piora no sentido de que as medianas decresceram em 10

pontos para os três turnos. A posição continuou a mesma, sendo o turno da

tarde o melhor em termos de rendimento, com mais de 50% dos alunos

possuindo rendimento superior a 270, seguido do turno matutino que

apresentou uma mediana igual a 260. Já o turno intermediário apresentou um

comportamento parecido ao demonstrado em abril havendo, entretanto, uma

diminuição de sua mediana de 260 para 250.

154

Gráfico 13: Rendimento em matemática por turno em novembro de 2000

Turno

TardeIntermediárioManhã

Esco

re C

láss

ico

500

400

300

200

100

0

Fonte: Cedeplar/ Inep (2005)

No gráfico 13 acima, que expõe os resultados referentes aos rendimentos de

matemática em novembro de 2000, nota-se que houve uma melhora em todos

os turnos, que voltaram ao patamar de abril de 1999. A ordem continuou a

mesma, sendo que a mediana do turno da tarde, que apresenta os melhores

resultados em termos de rendimento, voltou a ser 280. O turno da manhã

voltou a ter mediana igual a 270 e o turno intermediário voltou a apresentar

mediana igual a 260.

155

Gráfico 14: Rendimento de matemática por turno em novembro de 2001

Turno

TardeIntermediárioManhã

Esco

re C

láss

ico

500

400

300

200

100

0

Fonte: Cedeplar/ Inep (2005)

O gráfico 14 retrata os rendimentos de matemática em novembro de 2001, por

turno. Esse ano, assim como visto na exposição dos rendimentos por estado,

apresenta diferenças de resultados quando comparado aos anos de 1999 e

2000. Além disso, verifica-se que a mediana apresentou uma redução para

todos os turnos. O turno da manhã “empata” com o turno da tarde em termos

de melhores rendimentos e os dois apresentam mediana igual a 250, ou seja,

50% dos alunos, do turno da manhã e da tarde, estão com rendimentos acima

de 250. O turno intermediário continua apresentando as piores médias, tendo

sua mediana em 240. Também é notável, nesse ano, que os rendimentos se

mostraram mais próximos entre os turnos.

156

Gráfico 15: Rendimento de matemática por turno em novembro de 2002

Turno

TardeIntermediárioManhã

Esco

re C

láss

ico

500

400

300

200

100

0

Fonte: Cedeplar/ Inep (2005)

Pela análise do gráfico 15, referente aos rendimentos de matemática por turno

no ano de 2002, verifica-se que o turno intermediário não obteve variação,

apresentando semelhante mediana e, portanto, apresentando rendimento

próximo ao ano anterior. Um ponto a ser ressaltado é que, no turno da tarde, a

mediana diminuiu de 250 para 240, igualando-se ao turno intermediário.

O turno da manhã manteve a mediana de 250, e por esse motivo é o turno que

apresenta os melhores resultados em termos de rendimento. A nova ordem é o

turno da manhã com os melhores rendimentos médios, seguido dos turnos da

tarde e intermediário, que se encontram praticamente na mesma posição.

157

Gráfico 16: Rendimento de matemática por turno em novembro de 2003

Turno

TardeIntermediárioManhã

Esco

re C

láss

ico

500

400

300

200

100

0

Fonte: Cedeplar/ Inep (2005)

O gráfico 16 retrata os rendimentos da prova de matemática, por turno, em

novembro de 2003. Pela análise das medianas, pode-se dizer que o

rendimento subiu em relação ao ano anterior, uma vez que para os turnos da

manhã e da tarde a mediana aumentou em 10 pontos e para o turno

intermediário, em 20 pontos. Apesar desse aumento ocorrido no turno da tarde,

ele apresentou os piores resultados em relação aos outros turnos, de forma

que um percentual de 50% dos alunos da tarde têm rendimento inferior a 250.

Já os turnos da manhã e intermediário estão “empatados” com relação aos

melhores resultados, apresentando mediana igual a 260.

Comparando-se a situação entre o primeiro (abril de 1999) e o último período

da pesquisa (novembro de 2003) , observa-se, além de uma queda nos níveis

de rendimentos médios nos turnos da manhã e da tarde, respectivamente 10 e

30 pontos, houve uma inversão de posição. Em abril de 1999, o turno da tarde

apresentava os melhores rendimentos, seguido pelos turnos da manhã e

158

intermediário, enquanto que em novembro de 2003, esta ordem foi alterada, de

forma que os turnos da manhã e intermediário passaram para a primeira

posição, deixando o turno da tarde em segundo lugar.

As tabelas e os gráficos a seguir, referem-se aos resultados obtidos para as

provas de português:

Tabela 5 Escore clássico médio e desvio padrão em português por estado

Ano Estados Abr/1999 Nov/1999 2000 2001 2002 2003

RO 278,69 249,40 277,71 287,43 268,83 263,79 (74,33) (75,75) (73,19) (79,09) (75,01) (87,69)

PA 294,20 255,26 275,19 298,04 265,70 274,36 (70,14) (72,20) (74,04) (74,88) (70,65) (77,72)

PE 269,31 236,30 262,77 276,44 249,37 261,55 (76,86) (75,78) (75,46) (80,54) (72,93) (83,65)

SE 285,97 259,20 288,28 297,27 268,07 276,76 (75,86) (76,73) (73,79) (79,77) (75,50) (83,41)

MS 292,77 270,42 294,92 306,99 303,81 324,97 (73,53) (78,24) (76,05) (80,07) (73,32) (74,63)

GO 311,57 276,35 297,07 309,98 289,60 299,60 (69,60) (77,52) (73,63) (76,39) (71,74) (79,37) Fonte: Cedeplar/ Inep (2005)

159

Gráfico 17: Média dos escores clássicos das provas de português

abr-99

nov-99

nov-00

nov-01

nov-02

nov-03

abr-99

nov-99

nov-00

nov-01

nov-02

nov-03

230

240

250

260

270

280

290

300

310

320

330

Período

Esco

re M

édio

RO PA PE SE MS GO

Fonte: Cedeplar/ Inep (2005)

Por meio da tabela 5 e do gráfico 17, que mostram a média dos escores

clássicos por estado, pode-se observar que todos os estados apresentam

tendência crescente até 2001, com exceção de novembro de 1999. Em 2002,

há uma queda e, em 2003, uma pequena recuperação, com exceção de

Rondônia, quanto à recuperação em 2003. Os estado do Mato Grosso do Sul

e de Goiás apresentam os melhores resultados e Pernambuco, os piores para

todos os anos. Os estados de Rondônia, Pará e Sergipe se mantêm em uma

posição intermediária.

160

Tabela 6 Escore clássico médio e desvio padrão em português por turno

Ano Turno Abr/1999 Nov/1999 2000 2001 2002 2003 Manhã 285,69 254,90 277,48 299,83 282,33 296,14

(75,60) (77,25) (75,41) (76,84) (73,56) (81,13)

Intermediário 286,11 250,62 266,75 291,83 265,83 299,28 (70,71) (71,18) (76,33) (75,22) (68,29) (73,96)

Tarde 294,47 261,42 284,68 293,13 268,94 275,15 (73,30) (77,69) (75,40) (80,94) (76,13) (84,48) Fonte: Cedeplar/ Inep (2005)

Gráfico 18: Média dos escores clássicos da provas de matemática por turno

abr-99

nov-99

nov-00

nov-01

nov-02

nov-03

abr-99

nov-99

nov-00

nov-01

nov-02

nov-03

abr-99

nov-99

nov-00

nov-01

nov-02

nov-03

240

250

260

270

280

290

300

310

Período

Esco

re M

édio

Manhã Intermediário Tarde

Fonte: Cedeplar/ Inep (2005)

A tabela 6 e o gráfico 18 mostram os resultados dos escores clássicos médios

por turno. Por meio desta tabela e deste gráfico, observa-se uma tendência

crescente até o ano de 2001, com exceção de novembro de 1999. Em 2002, há

uma queda e, em 2003, uma recuperação para todos os turnos, assim como

ocorreu para os estados.

161

Em abril de 1999, o turno da tarde estava em melhor posição, seguido pelos

turnos da manhã e intermediário. Porém, em 2003, há uma inversão dessas

posições, ficando o turno intermediário com a melhor média, seguido do turno

da manhã e da tarde.

As tabelas 7 e 8 e os gráficos 19 e 20 mostram, respectivamente, o percentual

de alunos, por estado e turno, que obtiveram um escore médio na disciplina de

português superior a 250.

Observando a tabela 7 e o gráfico 19, vê-se que Pernambuco apresenta o pior

percentual para todos os anos, enquanto Mato Grosso do Sul e Goiás têm os

melhores percentuais. Entre novembro de 1999 e 2001, todos os estados

apresentam tendência de crescimento, mas, em 2002, há uma queda

considerável com pequena recuperação em 2003, exceto para Rondônia.

Tabela 7 Percentual de alunos com rendimento em português igual ou superior a 250 por estado

Ano Estados Abr/1999 Nov/1999 2000 2001 2002 2003

RO 889 514 1164 1058 642 511 % 66,10 48,22 66,55 68,39 58,90 58,67

PA 2092 1301 2210 2533 1446 1336 % 75,58 54,64 65,60 74,90 58,42 63,32

PE 1610 1017 2142 2238 1357 1249 % 60,34 42,71 58,14 63,01 48,09 55,00

SE 901 499 999 842 535 507 % 70,83 55,69 72,29 73,54 59,31 63,69

MS 1624 1192 1723 1825 1580 1411 % 72,86 59,66 73,85 75,29 75,74 83,84

GO 1914 1184 2226 2508 1972 1751 % 81,73 63,66 75,56 79,09 71,17 74,38

Fonte: Cedeplar/ Inep (2005)

162

Gráfico 19: Percentual de alunos com rendimento em português igual ou superior a 250 por estado

abr-99

nov-99

nov-00

nov-01

nov-02

nov-03

abr-99

nov-99

nov-00

nov-01

nov-02nov-03

30

40

50

60

70

80

90

100

Período

Perc

entu

al

RO PA PE SE MS GO

Fonte: Cedeplar/ Inep (2005)

Na tabela 8 e no gráfico 20, tem-se o percentual de alunos com escore clássico

superior a 250 por turno. Pode-se dizer que todos os turnos apresentam

tendência crescente entre novembro de 1999 e 2001, uma queda em 2002 e,

uma leve recuperação em 2003.

O turno da manhã manteve-se em posição intermediária, exceto para 2001 e

2002. Entretanto, os turnos da tarde e intermediário apresentaram uma

inversão em suas posições entre 1999 e 2003, começando o turno da tarde em

posição superior e terminando em posição inferior ao turno intermediário.

163

Tabela 8 Percentual de alunos com rendimento em português igual ou superior a 250 por turno

Ano Turno Abr/1999 Nov/1999 2000 2001 2002 2003 Manhã 4534 2988 3921 4587 3352 3239

% 69,80 53,03 65,73 74,91 66,95 72,44

Intermediário 568 339 571 432 236 197 % 71,72 53,98 61,66 72,36 59,30 74,34

Tarde 3928 2380 5972 5985 3944 3329 % 73,61 55,11 69,67 70,40 58,51 62,24

Fonte: Cedeplar/ Inep (2005)

Gráfico 20: Percentual de alunos com rendimento em português igual ou superior a 250 por turno

abr-99

nov-99

nov-00

nov-01

nov-02

nov-03abr-99

nov-99

nov-00

nov-01

nov-02

nov-03abr-99

nov-99

nov-00 nov-01

nov-02

nov-03

30

40

50

60

70

80

90

100

Período

Perc

entu

al

Manhã Intermediário Tarde

Fonte: Cedeplar/ Inep (2005)

Com o intuito de facilitar a análise do comportamento do rendimento médio dos

alunos em português, foram construídos, ainda, os gráficos 21 a 32 em formato

boxplot.

164

Gráfico 21: Rendimento em português por estado em abril de 1999

Estado

GOMSSEPEPARO

Esco

re C

láss

ico

500

400

300

200

100

0

Fonte: Cedeplar/ Inep 1999-2003

O gráfico 21, que se refere aos rendimentos dos alunos na prova de português

em abril de 1999, mostra que em todos os estados, um percentual de 50% dos

alunos apresentaram rendimentos superiores a 250. Pernambuco é o estado

que apresenta o pior resultado, com uma mediana de 260. Em seguida, vem o

estado de Rondônia com mediana igual a 280. Os estados de Sergipe e Mato

Grosso do Sul estão em situação intermediária, apresentando medianas iguais

a 290.

Pará e Goiás apresentam os melhores resultados em termos de rendimentos,

com medianas iguais a 300 e 310, respectivamente, contando, ainda, com um

percentual de 75% de seus alunos, apresentando rendimentos superiores a

250.

165

Gráfico 22: Rendimento em português por estado em novembro de 1999

Estado

GOMSSEPEPARO

Esco

re C

láss

ico

500

400

300

200

100

0

Fonte: Cedeplar/ Inep (2005)

Por meio do gráfico 22, observa-se as medianas dos rendimentos em

português, por estado, em novembro de 1999. Esse gráfico apresenta

resultados interessantes, se comparado aos resultados de abril de 1999, pois

nota-se uma queda considerável em todas as medianas. Pernambuco continua

apresentado os piores rendimentos (mediana 230). Em seguida, estão os

estados de Rondônia (240), Pará (250), Sergipe (260), Mato Grosso do Sul

(270) e Goiás (280). Somente Rondônia e Pernambuco ficaram abaixo da

média considerada razoável, 250.

O estado do Pará que estava próximo a Goiás, sede lugar para Mato Grosso

do Sul e passa a ter uma mediana de 250, ficando em situação intermediária à

posição dos estados de Rondônia e Sergipe

166

Gráfico 23: Rendimento em português por estado em novembro de 2000

Estado

GOMSSEPEPARO

Esco

re C

láss

ico

500

400

300

200

100

0

Fonte: Cedeplar/ Inep (2005)

Através da observação do gráfico 23, verifica-se que os resultados das

medianas dos estados se modificaram positivamente. Todos os estados

melhoraram de 30 a 40 pontos na mediana entre 1999 e 2000. Os piores

rendimentos em 2000 continuam em Pernambuco, com uma mediana de 260, e

que apesar de ser a mais baixa, volta ao patamar de abril de 1999. Rondônia e

Pará apresentam resultados equivalentes em termos de rendimentos médios,

280, assim como Mato Grosso e Sergipe, 300. O estado com melhor

desempenho continua sendo Goiás, recuperando a mediana apresentada em

abril de 1999 (310).

167

Gráfico 24: Rendimento em português por estado em novembro de 2001

Estado

GOMSSEPEPARO

Esco

re C

láss

ico

500

400

300

200

100

0

Fonte: Cedeplar/ Inep (2005)

No gráfico 24, que corresponde aos rendimentos de português por estado do

ano de 2001, pode-se notar que os resultados para o ano de 2001 seguem a

mesma tendência positiva dos períodos anteriores, apesar das medianas terem

crescido menos que em 2000, aumentando de 10 a 20 pontos. Os piores

resultados continuam sendo os de Pernambuco, porém sua mediana aumentou

em 20 pontos, passando de 260, em 2000, para 280, em 2001.

Os estados de Mato Grosso do Sul e Goiás apresentam os melhores

resultados, com mediana de 320 e um percentual de 75% dos alunos com

rendimento superior a 250. No ano anterior, somente o estado de Goiás havia

apresentado tal resultado. Pode-se dizer que os estados de Rondônia, Pará e

Sergipe, também, apresentam bons resultados em 2001, com medianas de

290, 300 e 310, respectivamente.

168

Gráfico 25: Rendimento em português por estado em novembro de 2002

Estado

GOMSSEPEPARO

Esco

re C

láss

ico

500

400

300

200

100

0

Fonte: Cedeplar/ Inep (2005)

No gráfico 25, observa-se os rendimentos de português por estado no ano de

2002. De 2001 para 2002 todos os estados pioraram sua situação, todas as

medianas apresentaram quedas. Pará e Pernambuco tiveram os piores

resultados, tendo uma diminuição de 40 pontos na mediana. O pior estado

continua sendo Pernambuco que apresenta uma mediana de 240 pontos. Mato

Grosso do Sul ultrapassou os resultados apresentados por Goiás e passa a ser

o estado que apresenta os melhores resultados, inclusive com 75% dos seus

alunos apresentando escore clássico acima de 250. Pará, Sergipe e Rondônia

tiveram uma queda em suas medianas, mas permanecem com resultados

acima de 250.

169

Gráfico 26: Rendimento em português por estado em novembro de 2003

Estado

GOMSSEPEPARO

Esco

re C

láss

ico

500

400

300

200

100

0

Fonte: Cedeplar/ Inep (2005)

Pela análise do gráfico 26, que mostra os rendimentos de português para cada

estado em 2003, nota-se que todos os estados apresentam uma melhora com

relação ao ano de 2002. O estado que mais se destacou foi o de Mato Grosso

de Sul que teve o melhor resultado em comparação aos outros anos e aos

demais estados, atingindo uma mediana de 340 e com 75% dos alunos com

rendimento igual ou superior a 280. Pernambuco continua com o pior resultado

em relação aos demais estados nos anos anteriores, mas sua mediana

aumentou em 20, quando comparada a do ano anterior.

Os estados de Rondônia, Pará e Sergipe obtiveram uma melhora com relação

a 2002, entretanto esses resultados não superam aqueles encontrados em

2001.

170

Comparando os gráficos referentes à primeira e à última rodada da pesquisa,

para a disciplina de português, observa-se que Pernambuco manteve-se com

os piores resultados, quando comparado aos dos demais estados, entretanto

permaneceu com a mesma mediana (260). É interessante ressaltar os

resultados do estado do Pará, que passou do segundo melhor rendimento em

abril de 1999 (300), para o terceiro pior desempenho, ultrapassando apenas

Pernambuco e Rondônia em 2003. Por outro lado, é importante notar a

melhora observada em relação aos resultados do Mato Grosso do Sul, que

passou da terceira posição em abril de 1999 (com mediana de 290) para o

melhor desempenho em 2003 (com mediana de 340), chegando, no ano de

2003, a se distanciar de forma considerável até mesmo do estado de Goiás.

Os gráficos 27 a 32 mostram os rendimentos das provas de português por

turno.

Gráfico 27: Rendimento em português por turno em abril de 1999

Turno

TardeIntermediárioManhã

Esco

re C

láss

ico

500

400

300

200

100

0

Fonte: Cedeplar/ Inep (2005)

171

No gráfico 27, observa-se os rendimentos de português por turno para abril de

1999. Pode-se dizer que não há variação significativa entre os rendimentos dos

alunos por turno neste período, uma vez que as medianas são iguais para os

três turnos (290), que também apresentam variabilidades próximas.

Gráfico 28: Rendimento em português por turno em novembro de 1999

Turno

TardeIntermediárioManhã

Esco

re C

láss

ico

500

400

300

200

100

0

Fonte: Cedeplar/ Inep (2005)

Observando o gráfico 28, que mostra os resultados, para novembro de 1999,

relativos aos rendimentos de português, percebe-se que houve uma queda na

mediana dos três turnos quando comparado aos resultados de abril de 1999. O

turno da tarde apresenta o melhor resultado com mediana igual a 260 e os

turnos intermediário e manhã obtiveram medianas iguais a 250.

172

Gráfico 29: Rendimento em português por turno em novembro de 2000

Turno

TardeIntermediárioManhã

Esco

re C

láss

ico

500

400

300

200

100

0

Fonte: Cedeplar/ Inep (2005)

O gráfico 29 destaca os resultados referentes aos rendimentos de português

em novembro de 2000. Nota-se que houve um aumento nas medianas dos

três turnos, quando comparadas às do período anterior. O turno da tarde teve o

melhor resultado com uma mediana de 290, seguido pelo turno da manhã (280)

e pelo turno intermediário (270). Entretanto, esses resultados não configuram

uma plena recuperação, se comparados aos resultados de abril de 1999,

quando todos os turnos apresentavam mediana igual a 290.

173

Gráfico 30: Rendimento em português por turno em novembro de 2001

Turno

TardeIntermediárioManhã

Esco

re C

láss

ico

500

400

300

200

100

0

Fonte: Cedeplar/ Inep (2005)

O gráfico 30 retrata os rendimentos de português, em novembro de 2001, por

turno. Assim como em 2000, houve melhora das medianas para todos os

turnos. Manhã e intermediário foram os turnos que mais cresceram, 30 pontos,

enquanto o turno da tarde cresceu somente 10 pontos. O turno da manhã

ultrapassou o turno da tarde e apresenta os melhores resultados, enquanto os

turnos da tarde e intermediário estão “empatados”, com uma mediana de 300.

174

Gráfico 31: Rendimento em português por turno em novembro de 2002

Turno

TardeIntermediárioManhã

Esco

re C

láss

ico

500

400

300

200

100

0

Fonte: Cedeplar/ Inep (2005)

Analisando o gráfico 31, que se refere aos rendimentos de português, por turno

em 2002, verifica-se que houve uma queda do rendimento para todos os

turnos. O turno da manhã continuou apresentando os melhores resultados

assim como em 2001 e os turnos da tarde e intermediário continuaram em

posições semelhantes.

175

Gráfico 32: Rendimento em português por turno em novembro de 2003

Turno

TardeIntermediárioManhã

Esco

re C

láss

ico

500

400

300

200

100

0

Fonte: Cedeplar/ Inep (2005)

O gráfico 32 mostra os rendimentos da prova de português, por turno, em

novembro de 2003. O que houve neste ano é que o turno da tarde, que nos

anos anteriores, chegou, em geral, a apresentar os melhores resultados,

aparece com os piores resultados. O turno intermediário ultrapassou o turno da

manhã, apresentando os melhores resultados. Nesse ano, todos os turnos

apresentaram melhora mas em menor escala do que em 2001.

Em resumo, os resultados por turno são os mesmos no início do processo. No

meio da pesquisa, o turno da tarde, em geral, apresenta os melhores

rendimentos. Entretanto, no final do processo o turno da tarde passa a

apresentar um rendimento inferior até mesmo ao turno intermediário.

176

ANÁLISES DESCRITIVAS DOS ESCORES EQUALIZADOS PARA AS DISCIPLINAS DE

MATEMÁTICA E DE PORTUGUÊS

APRESENTAÇÃO

No relatório anterior, foram apresentadas análises descritivas dos escores

clássicos de matemática e português por estado e turno. Entretanto, a

comparação entre os escores clássicos, não deve ser feita diretamente, uma

vez que os resultados não se encontram em uma mesma escala. Sendo assim,

o principal objetivo destas análises foi o de verificar a diferença entre os

resultados obtidos com os escores clássicos e aqueles obtidos com os escores

equalizados, aqueles que se encontram em uma mesma escala, podendo ser

diretamente comparados.

Neste relatório será analisado o escore equalizado de matemática e de

português, respectivamente, em uma abordagem comparativa por estado e

turno. Após a equalização dos dados, necessária para que os rendimentos dos

alunos pudessem ser diretamente comparados, foi feita uma modificação nos

resultados de acordo com a seguinte fórmula:

Escore padronizado= (escore equalizado x 10) + 50

Dessa forma, os escores equalizados, até então normalmente distribuídos com

média zero e desvio padrão um, passaram a apresentar uma distribuição

normal, com média 50 e desvio-padrão 10. Tal transformação foi feita com o

objetivo de facilitar a apresentação dos resultados, não sendo motivada por

177

qualquer critério teórico precedente. O mesmo ocorre com o valor de referência

50, adotado arbitrariamente com o objetivo unicamente comparativo.

Os resultados apresentados dizem respeito aos escores obtidos pelos alunos

de 4a a 8a série, nas provas aplicadas no trabalho de campo entre 1999 e 2003,

sendo que no ano de 1999 foram realizadas duas rodadas, uma em abril e

outra em novembro.

De início, são apresentados os resultados para a disciplina de matemática. Na

tabela e no gráfico 1, tem-se a média dos escores equalizados e o desvio

padrão. É possível notar que o estado de Pernambuco apresenta o pior

rendimento médio em matemática, considerando todo o período da pesquisa,

além de contar com a maior variabilidade dos escores em praticamente todos

os anos. Ao contrário, os estado do Mato Grosso do Sul e Goiás se alternaram

na posição de melhor escore médio. Para todos os estados, verifica-se uma

tendência crescente do escore médio, assim como da variabilidade das notas.

Por estar em uma escala comparável, o escore equalizado médio deve crescer

ao longo do tempo, de forma a refletir os ganhos de aprendizagem do aluno

com o passar dos anos. Com exceção da queda de desempenho notada em

Rondônia, Pernambuco, Pará e Sergipe no ano de 2003, esse crescimento

pode ser verificado em todos os momentos da pesquisa, em todos os estados

participantes. Contudo, isto não chega a constituir uma preocupação, uma vez

que considerando a estrutura padrão de uma curva de aprendizagem, pode-se

esperar uma tendência à estabilidade no final do processo.

178

Tabela 1 Escore equalizado médio e desvio padrão em matemática por estado e período Ano

Estados Abr/1999 Nov/1999 2000 2001 2002 2003 RO 48,53 50,82 55,61 60,07 61,08 59,21

(8,77) (8,39) (7,57) (7,72) (9,08) (10,35)

PA 49,64 51,73 54,98 60,03 60,95 59,88 (8,07) (7,73) (7,80) (7,34) (8,61) (10,47)

PE 47,53 49,16 54,23 58,37 59,04 58,69 (8,84) (8,70) (8,04) (7,82) (9,30) (11,25)

SE 50,56 51,67 56,39 60,50 61,52 60,93 (8,88) (8,64) (8,01) (7,97) (9,09) (11,07)

MS 51,46 53,79 58,11 62,89 65,09 66,66 (9,10) (8,82) (8,06) (8,07) (9,00) (10,52)

GO 53,24 55,48 59,03 62,73 64,50 64,23 (8,85) (8,16) (7,84) (7,44) (8,94) (10,76)

Fonte: Cedeplar/ Inep (2005).

Grafico1: Média dos escores equalizados das provas de matemática por período e estado

abr/99

nov/99

nov/00

nov/01nov/02 nov/03

40

45

50

55

60

65

70

Período

Esco

re m

édio

Rondônia Pará Pernambuco Sergipe Mato Grosso do Sul Góias

Fonte: Cedeplar/ Inep (2005).

179

A mesma tendência crescente pode ser vista na análise por turno. Nas

primeiras rodadas da pesquisa, o turno da tarde se destaca como o de maior

rendimento, apresentando também a maior variabilidade dos escores.

Entretanto, a partir do ano 2001 esta colocação é tomada pelo turno da manhã,

que apresenta a maior taxa de crescimento de 2001 para 2002 e a mesma taxa

que o turno intermediário de 2002 para 2003. Todos os turnos apresentaram

taxas crescentes de crescimento dos escores até 2001, sendo que a partir de

então há uma queda desta taxa para todos.

Somente para o turno da tarde nota-se um decréscimo no escore de 2002 para

2003. O turno intermediário também ultrapassa o turno da tarde a partir do ano

2002. É importante ressaltar que, apesar de não se esperar que haja

diminuição dos escores ao longo do tempo, a estrutura padrão da curva de

aprendizagem se traduz em retornos marginais decrescentes de rendimento,

tendendo à estabilidade no final do processo. Assim, os escores deveriam

crescer continuamente, mas a taxas decrescentes, tendendo a se estabilizarem

no final do processo.

Tabela 2

Escore equalizado médio e desvio padrão em matemática por turno e período Ano

Turno Abr/1999 Nov/1999 2000 2001 2002 2003 Manhã 49,78 51,49 55,95 60,98 63,12 63,41

(8,86) (8,66) (7,95) (7,78) (9,30) (11,00)

Intermediário 49,06 51,10 54,69 59,77 61,10 61,39 (8,47) (7,72) (7,93) (6,81) (8,17) (9,89)

Tarde 50,78 53,04 56,61 60,55 61,36 60,43 (9,07) (8,70) (8,21) (8,00) (9,26) (11,19) Fonte: Cedeplar/ Inep (2005).

180

Gráfico 2: Média dos escores equalizados de matematica por período e turno

abr/99

nov/99

nov/00

nov/01nov/02 nov/03

40

50

60

70

Período

Esco

re m

édio

Manhã Intermediário Tarde

Fonte: Cedeplar/ Inep (2005).

A melhora no desempenho dos alunos pode ser vista também através da

tabela 3, que mostra o percentual de alunos cujo escore é igual ou superior a

50, critério explicado anteriormente. É possível notar a mesma troca de

posições verificada através da média por estado, em que Goiás e Mato Grosso

do Sul se alternavam na posição de melhor desempenho. Ao final da pesquisa,

ambos os estados possuíam mais de 90% dos alunos com escore acima da

média. No estado do Pará, ocorre uma acentuada queda na proporção dos

alunos com desempenho igual ou superior a 50 entre 2001 e 2003. Essa queda

é acompanhada por Rondônia e Pernambuco, entretanto, se dá a uma taxa

maior nesse último estado.

181

Tabela 3 Percentual de alunos com escore em matemática igual ou superior a 50 por estado e

período Ano

Estados Abr/1999 Nov/1999 2000 2001 2002 2003 RO 595 595 1363 1409 974 694 % 55,00 54,00 77,00 90,00 87,00 80,00

PA 1463 1463 2585 3077 2193 1719 % 61,00 61,00 76,00 91,00 88,00 81,00

PE 1129 1129 2629 3085 2271 1716 % 47,00 47,00 71,00 85,00 80,00 75,00

SE 555 555 1115 1029 789 662 % 59,00 59,00 79,00 89,00 87,00 82,00

MS 1367 1367 1978 2305 1956 1583 % 67,00 67,00 84,00 94,00 93,00 93,00

GO 1437 1437 2611 3015 2550 2124 % 77,00 76,00 88,00 94,00 92,00 90,00

Fonte: Cedeplar/ Inep (2005).

Gráfico 3: Percentual dos alunos com escore igual ou superior a 50 na prova de matemática por período e estado

abr/99 nov/99

nov/00

nov/01

nov/02

nov/03

30%

40%

50%

60%

70%

80%

90%

100%

Período

Perc

entu

al

Rondônia Pará Pernambuco Sergipe Mato Grosso do Sul Góias

Fonte: Cedeplar/ Inep (2005).

182

A análise por turno, apresentada na tabela e no gráfico 4, mostra um

comportamento dos escores semelhante ao percebido na abordagem por

estados. Há uma queda no período inicial e um posterior crescimento da

proporção dos alunos com escore igual ou superior a 50, seguido de nova

queda neste percentual a partir do ano 2001. Inicialmente, o melhor

desempenho é encontrado entre os alunos do turno da tarde, cerca de 65%

dos alunos que freqüentam a escola no turno da tarde obtiveram desempenho

satisfatório. A partir de 2001, esta posição de destaque passa para o turno da

manhã. Além disso, entre 2000 e 2001, a taxa de crescimento dos escores

observada no turno da manhã é consideravelmente maior que a do turno da

tarde.

Tabela 4 Percentual de alunos com rendimento em matemática igual ou superior a 250 por turno

Ano Turno Abr/1999 Nov/1999 2000 2001 2002 2003 Manhã 3335 3335 4738 5682 4490 3964

% 58,00 58,00 78,00 92,00 89,00 87,00

Intermediário 358 358 680 544 357 233 % 56,00 56,00 73,00 90,00 89,00 87,00

Tarde 2853 2853 6863 7694 5886 4301 % 65,00 65,00 80,00 90,00 86,00 80,00

Fonte: Cedeplar/ Inep (2005).

183

Gráfico 4: Percentual de alunos com escore equalizado igual ou superior a 50 na prova de matemática por período e turno

abr/99 nov/99

nov/00

nov/01 nov/02nov/03

30%

40%

50%

60%

70%

80%

90%

100%

Período

Perc

entu

al

Manhã Intermediário Tarde

Fonte: Cedeplar/ Inep (2005).

Com o objetivo de verificar o comportamento ao longo do tempo dos escores

obtidos pelos alunos, e o desempenho em conjunto dos mesmos, a análise

segue com a utilização de gráficos no formato boxplot.

Como é possível observar no gráfico 5, o estado com pior desempenho é

novamente Pernambuco, com mediana igual a 46, resultado abaixo da média

adotada como referência. É interessante observar que, nesta rodada inicial, os

estados não se distinguem muito entre si, com exceção do caso de

Pernambuco e Goiás (com mediana de aproximadamente 54 pontos). Desta

forma, as medianas estão próximas a 50 e os escores apresentam

variabilidades parecidas.

184

Gráfico 5: Rendimento em matemática por estado em abril de 1999

Estado

GOMSSEPEPARO

Esc

ore

equa

lizad

o

80

70

60

50

40

30

20

Fonte: Cedeplar/ Inep (2005).

Em novembro de 1999, ocorre um aumento geral nos escores dos alunos, de

forma que somente o estado de Pernambuco permanece com a mediana

abaixo de 50 (48,43). Mato Grosso do Sul e Goiás se destacam, sendo que um

quarto dos alunos e Goiás passam a apresentar escore superior a 60 (62,78).

Os estados permanecem parecidos quanto à variabilidade dos escores, com

exceção do Mato Grosso do Sul, que aumenta significativamente a

heterogeneidade quanto ao desempenho dos alunos.

185

Gráfico 6: Rendimento em matemática por estado em novembro de 1999

Estado

GOMSSEPEPARO

Esc

ore

equa

lizad

o

80

70

60

50

40

30

20

Fonte: Cedeplar/ Inep (2005).

O crescimento dos escores em 2000 é ainda maior que o ocorrido no período

anterior. Nos estados que vinham apresentando desempenho inferior, essa

melhora fez com que eles se aproximassem dos resultados obtidos pelos

demais. Rondônia e Pernambuco apresentaram uma melhora considerável,

com o aumento de suas medianas para aproximadamente 54 pontos (54,65 e

54,20). Esta mudança os aproxima do quadro visto no Pará (54,52) e Sergipe

(55,58), até então superiores a eles.

No estado de Goiás, a mediana ultrapassa 60 (60,72). Seguindo a mesma

tendência de Goiás, o estado do Mato Grosso do Sul teve um aumento de

aproximadamente 4 pontos (57,92), mas ainda se mantém com o segundo

melhor resultado. Ademais, este estado apresentou uma diminuição na

heterogeneidade de desempenho em relação ao período anterior.

186

Gráfico 7: Rendimento em matemática por estado em novembro de 2000

Estado

GOMSSEPEPARO

Esc

ore

equa

lizad

o

90

80

70

60

50

40

30

20

Fonte: Cedeplar/ Inep (2005).

Em 2001, os escores voltam a aumentar, crescendo, em geral, a uma taxa

superior às anteriores. Uma porcentagem inferior a 10% dos alunos, possui

rendimento menor que 50 no estado de Goiás, onde também é possível notar

uma pequena variabilidade dos escores, o que indica que os alunos deste

estado são mais homogêneos quanto a um bom desempenho. Mato Grosso do

Sul, apesar de também possuir rendimentos altos, é recorrentemente o estado

de maior variabilidade, sendo que seus alunos apresentam grande amplitude

em termos de rendimento. Assim, pode-se dizer que alguns desses alunos não

compartilham da maior eficiência notada no estado.

187

Gráfico 8: Rendimento em matemática por estado em novembro de 2001

Estado

GOMSSEPEPARO

Esc

ore

equa

lizad

o

90

80

70

60

50

40

30

Fonte: Cedeplar/ Inep (2005).

As medianas dos escores mantiveram-se relativamente estáveis, sofrendo

acréscimo muito pequeno entre 2001 e 2002. Esta foi a primeira rodada em

que os escores não apresentaram uma tendência positiva clara. A única

mudança mais expressiva foi o aumento verificado nos estados de maior

desempenho, Mato Grosso do Sul (65,20) e Goiás (64,50). A situação de

Pernambuco torna-se novamente mais distinta daquela encontrada nos outros

estados, porque os escores de seus alunos permaneceram praticamente

estagnados (59,76), enquanto os rendimentos nos demais estados

aumentaram, ainda que pouco, aprofundando o hiato que já existia, mas que se

mostrava menor no ano anterior.

188

Gráfico 9: Rendimento em matemática por estado em novembro de 2002

Estado

GOMSSEPEPARO

Esc

ore

equa

lizad

o

100

90

80

70

60

50

40

30

Fonte: Cedeplar/ Inep (2005).

No ano de 2003, cessa a tendência positiva de crescimento dos escores e os

rendimentos sofrem uma forte queda, exceto no Mato Grosso do Sul (67,30). O

valor das medianas decresce, assim como a proporção de alunos com escore

acima de 50.

Nesta rodada da pesquisa, vale ressaltar o diferencial ocorrido entre os estados

de melhor desempenho, Mato Grosso do Sul (67,30) e Goiás (64,57). Apesar

de o estado goiano vir apresentando escores superiores, a diferença em

relação ao segundo colocado era pequena, e por vezes quase inexistente,

como foi o caso do ano anterior. Entretanto, em 2003, o desempenho dos

alunos do estado do Mato Grosso do Sul foi o único a melhorar, enquanto os

rendimentos dos alunos goianos decresceram, ainda que a uma taxa mais

suave que a percebida nos demais estados.

189

Gráfico 10: Rendimento em matemática por estado em novembro de 2003

Estado

GOMSSEPEPARO

Esc

ore

equa

lizad

o

100

90

80

70

60

50

40

30

Fonte: Cedeplar/ Inep (2005).

Na análise por turno, no período de abril de 1999, a única mediana com valor

inferior a 50 é a do turno intermediário (49,05). Nesta etapa, os turnos

apresentam-se pouco diferenciados entre si e os escores possuem

variabilidade semelhante. Ainda assim, o turno da tarde apresenta o melhor

desempenho (52,36), enquanto o turno da manhã possui cerca de 50%

(50,66%) dos alunos com escore abaixo de 50.

É possível perceber ainda que nos turnos da tarde e da manhã há uma maior

variabilidade dos escores dos alunos cuja pontuação é inferior a mediana de,

respectivamente, 50,6 e 52,3. Isso permite concluir que o desempenho dos

alunos com escore inferior a 50 é mais heterogêneo, podendo conter

rendimentos significativamente baixos, a despeito do melhor posicionamento

destes dois turnos. O intermediário, ao contrario, apesar de ser o pior entre os

três turnos, é o mais homogêneo deles.

190

Gráfico 11: Rendimento em matemática por turno em abril de 1999

Turno

TardeIntermediarioManhã

Esc

ore

equa

lizad

o

80

70

60

50

40

30

20

Fonte: Cedeplar/ Inep (2005).

Assim, como na análise por estado, ao controlar os escores por turno, verifica-

se a mesma tendência de crescimento. Isso pode ser percebido pelo aumento

do valor das medianas – manhã (53,42), intermediário (52,41) e tarde (54,17),

no período de novembro de 1999. Nesta etapa, os turnos da manhã e da tarde

apresentam resultados muito semelhantes, sendo a maior variabilidade dos

escores do turno da tarde a principal diferença entre eles.

Entretanto, no turno da manhã, é notável a diferença de variabilidade entre os

escores dos alunos que se encontram abaixo e acima da mediana (53,42). No

primeiro caso, os escores apresentam grande heterogeneidade, enquanto os

alunos de desempenho superior são mais homogêneos quanto ao rendimento.

O mesmo ocorre no turno intermediário, que apresenta grande diferença de

variabilidade nos escores dos alunos localizados abaixo e acima da mediana

(52,41).

191

Gráfico 12: Rendimento em matemática por turno em novembro de 1999

Turno

TardeIntermediárioManhã

Esc

ore

equa

lizad

o

80

70

60

50

40

30

20

Fonte: Cedeplar/ Inep (2005).

Conforme é possível notar no gráfico 13, o desempenho entre os turnos torna-

se mais equiparado no ano 2000. Há crescimento dos escores em todos os

turnos, mas este se dá a uma taxa mais acentuada no turno intermediário,

reduzindo o hiato existente entre este horário e os demais. Ao contrário do que

foi dito na análise do período anterior, aqui a variabilidade dos escores se

inverte, sendo visivelmente maior entre os alunos cujo rendimento é superior à

mediana, principalmente no turno da manhã.

192

Gráfico 13: Rendimento em matemática por turno em novembro de 2000

Turno

TardeIntermediárioManhã

Esc

ore

equa

lizad

o

90

80

70

60

50

40

30

20

Fonte: Cedeplar/ Inep (2005).

Em 2001, ocorre um grande aumento nos escores de todos os turnos, o maior

até aqui. Este aumento ocorre a uma taxa maior para os turnos intermediário e

matutino do que para o turno vespertino, de forma que o desempenho entre

eles torna-se mais próximo – manhã (61,76), intermediário (61,11) e tarde

(61,39).

É relevante ressaltar que, nesta rodada da pesquisa, o desempenho dos

alunos do turno da manhã supera o dos alunos do turno da tarde, até aqui em

melhor posição. Entretanto, como em todos os turnos a mediana possui valores

pouco acima de 60, isto parece indicar não haver diferença significativa entre

os turnos, neste período. Por fim, a variabilidade volta a ser maior entre os

alunos com rendimentos abaixo da mediana nos três turnos.

193

Gráfico 14: Rendimento em matemática por turno em novembro de 2001

Turno

TardeIntermediárioManhã

Esc

ore

equa

lizad

o

90

80

70

60

50

40

30

Fonte: Cedeplar/ Inep (2005).

Em 2002, os escores dos alunos do turno da manhã apresentam um maior

aumento (passando de 61,76 para 63,33), enquanto os rendimentos dos alunos

dos turnos vespertino e intermediário têm aumentos provavelmente não

significativos. Isso faz com que o hiato entre o turno vespertino e matutino se

aprofunde, seguindo o processo iniciado no ano anterior.

194

Gráfico 15: Rendimento em matemática por turno em novembro de 2002

Turno

TardeIntermediárioManhã

Esc

ore

equa

lizad

o

100

90

80

70

60

50

40

30

Fonte: Cedeplar/ Inep (2005).

A última rodada da pesquisa não apresenta uma tendência clara para o

comportamento dos escores, sendo que cada turno segue uma trajetória

distinta. Em especial, o turno matutino, apresenta uma pequena elevação em

sua mediana (63,53). Estes movimentos, no entanto, são marginais e parecem

não representar mudanças significativas, sendo possível considerar constante

o desempenho dos alunos do turno matutino entre 2002 e 2003. O mesmo

pode-se dizer com relação aos rendimentos do turno intermediário.

Dessa forma, para estes dois turnos é possível notar uma estabilidade no final

da pesquisa, o que é coerente com a hipótese de retornos decrescentes de

rendimento ao longo do tempo, tendendo à estabilidade no final do processo.

Entretanto, isso não ocorre no turno da tarde. Entre 2002 e 2003, ocorre uma

queda nos rendimentos dos alunos do turno vespertino, de forma que este

passa a figurar em uma colocação inferior até mesmo à do turno intermediário.

195

Gráfico 16: Rendimento em matemática por turno em novembro de 2003

Turno

TardeIntermediárioManhã

Esc

ore

equa

lizad

o

100

90

80

70

60

50

40

30

Fonte: Cedeplar/ Inep (2005).

Os resultados apresentados a seguir referem-se aos escores equalizados

obtidos pelos alunos de 4º a 8º série, nas provas de português aplicadas entre

abril de 1999 a novembro de 2003.

196

Tabela 5 Escore equalizado médio e desvio padrão em português por estado

Ano Estados Abr-99 Nov-99 2000 2001 2002 2003

RO 48,99 48,27 54,43 55,83 56,30 58,28

(8,92) (9,79) (8,83) (9,07) (10,24) (11,05)

PA 50,78 48,90 54,00 57,07 55,99 59,57

(8,44) (9,46) (9,17) (8,53) (9,67) (10,00)

PE 47,69 46,16 52,54 54,67 53,70 57,84

(9,28) (10,01) (9,30) (9,17) (10,14) (10,83)

SE 49,99 49,38 55,46 56,78 56,10 59,59

(9,06) (9,81) (9,06) (9,16) (10,39) (10,89)

MS 50,54 50,93 56,36 58,12 61,04 65,82

(8,94) (10,22) (9,34) (9,10) (9,81) (9,26)

GO 52,71 51,61 56,59 58,27 58,97 62,55

(8,46) (10,20) (9,01) (8,64) (9,84) (9,94)

Fonte: Cedeplar/ Inep (2005)

Gráfico 17: Escores equalizados médios das provas de português

Abr-99

nov/99

nov/00

nov/01nov/02

nov/03

45

50

55

60

65

Período

Esco

re M

édio

RO PA PE SE MS GO

Fonte: Cedeplar/ Inep (2005)

197

Conforme a tabela 5 e o gráfico 17, é possível notar que o estado de

Pernambuco apresenta o pior desempenho médio em todo histórico da

pesquisa, além de contar com a maior variabilidade dos escores em

praticamente todos os anos. Ao contrário, os estado do Mato Grosso do Sul e

Goiás se alternaram na posição de melhor escore médio.

Em praticamente todos os estados, não se verifica uma tendência sempre

crescente do escore médio, uma vez que em alguns períodos, em geral, entre

abril e novembro de 1999 e entre 2001 e 2002, ocorre uma queda desses

escores. Por estar em uma escala comparável, espera-se que o escore

equalizado médio cresça ao longo do tempo, de forma a refletir os ganhos de

aprendizagem do aluno com o passar dos anos, o que não acontece, conforme

dito anteriormente, entre todos os períodos analisados por estado.

Tabela 6 Escore equalizado médio e desvio padrão em português por turno

Ano Turno Abr-99 Nov-99 2000 2001 2002 2003 Manhã 49,7 48,7 54,3 57,2 58,2 62,2

(9,1) (10,1) (9,2) (8,7) (9,9) (10,2)

Intermediário 49,9 48,3 52,8 56,5 56,3 62,7 (8,5) (9,2) (9,6) (8,5) (9,2) (8,9)

Tarde 50,7 49,7 55,1 56,5 56,3 59,6 (8,9) (10,2) (9,2) (9,3) (10,5) (10,8)

Fonte: Cedeplar/ Inep (2005)

198

Gráfico 18: Escores equalizados médios das provas de português

Abr-99

nov/99

nov/00

nov/01 nov/02

nov/03

47

49

51

53

55

57

59

61

63

Período

Esco

re M

édio

Manhã Intermediário Tarde Fonte: Cedeplar/ Inep (2005)

A mesma tendência sempre crescente não pode ser vista na análise por turno.

Nas primeiras rodadas da pesquisa, o turno vespertino se destaca como o de

maior desempenho, apresentando também a maior variabilidade dos escores.

Entretanto, a partir do ano 2001, esta colocação é tomada pelo turno da

manhã, que desde então apresenta a maior taxa de crescimento dos escores

até novembro de 2002, sendo ultrapassada pela taxa de crescimento do turno

intermediário entre 2002 e 2003. Contudo, o turno da manhã é o único a não

apresentar queda, tendendo sempre a um crescimento ao longo do tempo,

após novembro de 1999.

199

Tabela 7 Percentual de alunos com rendimento em português igual ou superior a 50 por estado

Ano Estado Abr/1999 Nov-99 2000 2001 2002 2003

RO 638,0 461 1260,0 1165,0 782,0 668,0 % 47,4 43,2 72,0 75,3 71,7 76,7

PA 1584,0 1104 2397,0 2758,0 1788,0 1715,0 % 57,2 46,4 71,1 81,5 72,2 81,4

PE 1091,0 864 2338,0 2514,0 1760,0 1665,0 % 40,9 36,3 63,5 70,8 62,4 73,6

SE 666,0 438 1060,0 897,0 650,0 623,0 % 52,4 48,9 76,7 78,3 72,1 78,3

MS 1226,0 1066 1816,0 1994,0 1782,0 1579,0 % 55,0 53,4 77,8 82,3 85,4 93,9

GO 1523,0 1078 2329,0 2683,0 2249,0 2065,0 % 65,0 58,0 79,1 84,6 81,2 87,7

Fonte: Cedeplar/ Inep (2005)

A trajetória do desempenho dos alunos pode ser vista também através da

tabela 7, que mostra o percentual de alunos cujo escore é igual ou superior a

50. É possível notar a mesma troca de posições verificada através da média

por estado, em que Goiás e Mato Grosso do Sul se alternavam na posição de

melhor desempenho. Ao final da pesquisa, ambos os estados possuíam mais

de 87% dos alunos com escore acima da média. No estado do Pará, ocorreu

uma das maiores quedas na proporção dos alunos com desempenho

satisfatório entre os anos 2001 e 2002. Aliás, essa tendência de queda no

rendimento só não ocorreu no estado do Mato Grosso do Sul.

200

Gráfico 19: Percentual de alunos com rendimento em português igual ou superior a 50 por estado

Abr-99

nov/99

nov/00

nov/01

nov/02

nov/03

30

40

50

60

70

80

90

Período

Perc

entu

al

RO PA PE SE MS GO

Fonte: Cedeplar/ Inep (2005)

Tabela 8 Percentual de alunos com rendimento em português igual ou superior a 50 por turno

Ano Turno Abr-99 Nov-99 2000 2001 2002 2003 Manhã 3358,0 2616,0 4234,0 4979,0 3929,0 3845,0

% 51,7 46,4 71,0 81,3 78,5 86,1

Intermediário 409,0 284,0 612,0 479,0 292,0 237,0 % 51,6 45,2 66,1 80,2 73,4 89,4

Tarde 2961,0 2111,0 6354,0 6553,0 4790,0 4233,0 % 55,5 48,9 74,1 77,1 71,1 79,2

Fonte: Cedeplar/ Inep (2005)

201

Gráfico 20: Percentual de alunos com rendimento em português igual ou superior a 50 por turno

Abr-99

nov/99

nov/00nov/01

nov/02

nov/03

40

50

60

70

80

90

Período

Perc

entu

al

Manhã Intermediário Tarde

Fonte: Cedeplar/ Inep (2005)

A análise por turno, apresentada na tabela 8 e gráfico 20, mostra um

comportamento dos escores semelhante ao percebido na abordagem por

estados. Há uma queda no período inicial e um posterior crescimento da

proporção dos alunos com escore igual ou superior a 50, seguido de nova

queda nesta proporção a partir do ano 2000 para o turno da tarde e a partir de

2001 para os demais. Inicialmente, o melhor desempenho é encontrado entre

os alunos do turno da tarde, cerca de 55% dos alunos que freqüentam a escola

no turno vespertino obtiveram desempenho igual ou superior a 50. A partir de

2001, esta posição de destaque passa para o turno da manhã, uma vez que a

queda de desempenho neste turno se dá a uma taxa mais lenta que os demais

até 2002. Entre 2002 e 2003, a maior taxa de crescimento é observada no

turno intermediário, que chega a ultrapassar até mesmo o rendimento do turno

matutino em novembro de 2003.

Com o objetivo de verificar o comportamento ao longo do tempo dos escores

obtidos pelos alunos, e o desempenho em conjunto dos mesmos, a análise

segue com a utilização de gráficos no formato de boxplot.

202

Gráfico 21: Rendimento em português por estado em abril de 1999

Estado

GOMSSEPEPARO

Esc

ore

equa

lizad

o

80

70

60

50

40

30

20

Fonte: Cedeplar/ Inep (2005)

Como é possível observar no gráfico 21, o estado com pior desempenho é

novamente Pernambuco, com mediana de aproximadamente 47 (46,96),

resultado abaixo do critério arbitrário utilizado, para efeito comparativo, como

média satisfatória (50). É interessante observar que nesta rodada inicial as

medianas variam de 46,96, em Pernambuco a 54 pontos no estado de Goiás.

Nas posições intermediárias encontram-se Rondônia (48,99), Sergipe (51,29),

Mato Grosso do Sul (52,07) e Pará (52,33). Pode-se dizer que a variação entre

os rendimentos dos estados é parecida, exceto para os estados de

Pernambuco e Goiás, que apresentam as maiores variabilidades.

203

Gráfico 22: Rendimento em português por estado em novembro de 1999

Estado

GOMSSEPEPARO

Esc

ore

equa

lizad

o

90

80

70

60

50

40

30

20

Fonte: Cedeplar/ Inep (2005)

Em novembro de 1999, ocorre uma queda geral nos escores dos alunos, de

forma que somente os estados de Goiás e Mato Grosso do Sul permanecem

com a mediana acima de 50, respectivamente, 53,36 e 51,86. Os estados

permanecem parecidos com o período anterior, quanto à variabilidade dos

escores, de forma que os estados de Goiás e Pernambuco continuam a

apresentar uma maior variabilidade nos rendimentos de seus alunos.

204

Gráfico 23: Rendimento em português por estado em novembro de 2000

Estado

GOMSSEPEPARO

Esc

ore

equa

lizad

o

90

80

70

60

50

40

30

20

Fonte: Cedeplar/ Inep (2005)

Em 2000, os escores começam a crescer. Nos estados que vinham

apresentando desempenho inferior, este crescimento fez com que estes

estados- Pernambuco (com mediana igual a 54,02), Rondônia (54,49) e Pará

(54,49) - apresentassem resultados mais próximos e superiores a 50. Assim,

pode-se dizer que os estados de Rondônia e Pernambuco apresentaram uma

melhora considerável, que permitiu uma aproximação dos resultados desses

dois estados ao quadro visto no Pará e Sergipe (55,30), até então superiores a

eles.

No estado de Goiás, a mediana ultrapassa 56 (56,69), sendo que pouco mais

de 20% dos alunos obtiveram escores inferiores a 50. Mato Grosso do Sul,

apresenta posição muito semelhante à do estado de Goiás, pois além do

aumento da mediana para 56,11, o estado consegue manter cerca de 78% dos

alunos acima do rendimento satisfatório e diminuir a heterogeneidade de

desempenho em relação ao período anterior.

205

Gráfico 24: Rendimento em português por estado em novembro de 2001

Estado

GOMSSEPEPARO

Esc

ore

equa

lizad

o

90

80

70

60

50

40

30

20

Fonte: Cedeplar/ Inep (2005)

Em 2001, os escores, continuam crescendo, mas, em geral, a taxas

decrescentes, com exceção do estado de Rondônia (54,49). O estado de Goiás

apresenta mediana de torno de 60 (59,47) e também uma pequena

variabilidade dos escores, indicando que os alunos deste estado são mais

homogêneos quanto a ter um bom desempenho. Em situação muito

semelhante, encontra-se Mato Grosso do Sul, que também possui rendimentos

altos, caracterizado por uma mediana de 59,11. Pode-se dizer ainda que este

estado mantém uma variabilidade muito próxima à do estado de Goiás,

situação semelhante à observada no período anterior.

206

Gráfico 25: Rendimento em português por estado em novembro de 2002

Estado

GOMSSEPEPARO

Esc

ore

equa

lizad

o

90

80

70

60

50

40

30

20

Fonte: Cedeplar/ Inep (2005)

No ano de 2002, grande parte das medianas dos escores apresentaram leve

queda, como aquelas observadas nos estados do Pará (55,68), Pernambuco

(53,51) e Sergipe (56,12). Por outro lado, o maior aumento no desempenho foi

observado em Mato Grosso do Sul (62,61), que chega a ultrapassar o

rendimento de português em Goiás (60,22). Outra mudança percebida foi a

diminuição da variabilidade dos escores médios, em especial, nos estados de

Pará e Sergipe e, seu aumento no estado de Mato Grosso do Sul.

Apesar do decréscimo apresentado nas medianas de PA, PE e SE ter sido

pequeno, esta foi a segunda rodada em que os escores, em geral, não

apresentaram uma tendência positiva clara. O rendimento de Pernambuco

(53,51) torna-se novamente mais distante daqueles observados em outros

estados.

207

Gráfico 26: Rendimento em português por estado em novembro de 2003

Estado

GOMSSEPEPARO

Esc

ore

equa

lizad

o

90

80

70

60

50

40

30

Fonte: Cedeplar/ Inep (2005)

No ano de 2003, os rendimentos aumentam consideravelmente. O valor das

medianas cresce em todos os estados atingindo em Rondônia

aproximadamente 61 pontos (60,50), nos estados do Pará e de Sergipe

ultrapassa o marco de 62 (62,04 e 62,55, respectivamente), em Pernambuco

fica em torno de 60 (59,75) e nos estados de Goiás e do Mato Grosso do Sul

ultrapassa 63 (63,31 e 66,37 pontos, respectivamente).

Nesta rodada da pesquisa, observa-se ainda um maior diferencial entre os

estados de melhor desempenho, Mato Grosso do Sul (66,37) e Goiás (63,31).

Apesar de o estado goiano vir apresentando escores superiores, a diferença

em relação ao segundo colocado, não chegou a ultrapassar 2,5 pontos entre

2001 e 2002. Entretanto, entre 2002 e 2003, a diferença de desempenho entre

os estados do Mato Grosso do Sul e de Goiás chega a ultrapassar 3 pontos.

208

Gráfico 27: Rendimento em português por turno em abril de 1999

Turno

TardeIntermediárioManhã

Esc

ore

equa

lizad

o

80

70

60

50

40

30

20

Fonte: Cedeplar/ Inep (2005)

Na análise por turno, não há uma única mediana com valor inferior a 50 em

abril de 1999. Nesta etapa, os turnos apresentam-se pouco diferenciados entre

si e os escores possuem variabilidade semelhante. Ainda assim, o turno da

tarde apresenta o melhor desempenho (52,15). É possível perceber ainda que

nos turnos da tarde e da manhã há uma maior variabilidade dos escores dos

alunos cuja pontuação é inferior a mediana, indicando que o desempenho dos

alunos com escore menor que a média é mais heterogêneo nestes turnos, que

podem conter rendimentos mais baixos, a despeito do melhor posicionamento

destes dois turnos. O intermediário, ao contrário, apesar de ser o pior entre os

três turnos, é o mais homogêneo deles.

209

Gráfico 28: Rendimento em português por turno em novembro de 1999

Turno

TardeIntermediárioManhã

Esc

ore

equa

lizad

o90

80

70

60

50

40

30

20

Fonte: Cedeplar/ Inep (2005)

Como na análise por estado, ao controlar os escores por turno verifica-se a

mesma tendência de decrescimento. Isso pode ser percebido pela queda do

valor das medianas, todas próximas, porém com valores inferiores a 50. Assim,

em novembro de 1999, todos os turnos apresentam medianas inferiores à

média e variabilidade mais homogênea que a observada no período anterior. É

mantida a posição superior do turno da tarde, seguido pela da manhã e pelo

intermediário, respectivamente.

210

Gráfico 29: Rendimento em português por turno em novembro de 2000

Turno

TardeIntermediárioManhã

Esc

ore

equa

lizad

o90

80

70

60

50

40

30

20

Fonte: Cedeplar/ Inep (2005)

Conforme é possível notar no gráfico 29, o desempenho entre os turnos torna-

se bem próximo no ano de 2000, de forma que todos atingem por volta de 54,5

pontos na mediana – manhã (54,54), intermediário (54,22) e tarde (54,92). Há

crescimento dos escores em todos os turnos. A respeito da variabilidade, ela é

maior entre os alunos cujo rendimento é superior, em especial, no turno da

tarde.

211

Gráfico 30: Rendimento em matemática por turno em novembro de 2001

Turno

TardeIntermediárioManhã

Esc

ore

equa

lizad

o90

80

70

60

50

40

30

20

Fonte: Cedeplar/ Inep (2005)

Em 2001, verifica-se um aumento nos escores dos turnos, menor que o

observado no período anterior. Entre os turnos, este aumento foi menor para o

turno vespertino. É relevante ressaltar que nesta rodada da pesquisa, o

desempenho dos alunos do turno da manhã (56,93) supera o dos alunos do

turno da tarde (55,57), até então em melhor posição. O turno intermediário

mantém o pior rendimento (55,08). Por fim, a variabilidade é claramente maior

entre os alunos com rendimentos superiores à mediana para os três turnos.

212

Gráfico 31: Rendimento em matemática por turno em novembro de 2002

Turno

TardeIntermediárioManhã

Esc

ore

equa

lizad

o90

80

70

60

50

40

30

20

Fonte: Cedeplar/ Inep (2005)

Em 2002, os escores dos alunos não apresentam aumento, porém o turno da

manhã é o único a apresentar crescimento atingindo uma mediana de 58,89.

Isso faz com que o hiato entre o turno da manhã e os demais se aprofunde.

Entretanto os turnos intermediário e da tarde praticamente apresentam a

mesma posição, com, respectivamente, as seguintes medianas, 55,95 e 55,93.

213

Gráfico 32: Rendimento em matemática por turno em novembro de 2003

Turno

TardeIntermediárioManhã

Esc

ore

equa

lizad

o

90

80

70

60

50

40

30

Fonte: Cedeplar/ Inep (2005)

Na última rodada da pesquisa, em 2003, há um crescimento no rendimento de

todos os três turnos. O turno da manhã atinge uma mediana de

aproximadamente 63 pontos (63,28), enquanto o turno intermediário apresenta

uma mediana de 63,4, valor levemente superior ao do turno matutino. O turno

da tarde permanece na última posição com rendimento mediando de 62,19.

Assim, o turno intermediário passa a apresentar o maior valor da mediana,

seguido pela manhã e tarde. Dessa forma, é possível notar uma instabilidade

nas posições dos turnos. A tarde que liderou até 2000, em 2003 inverteu sua

posição com o turno intermediário, que tinha os piores escores no início do

processo. Contudo, essas diferenças parecem não representar mudanças

significativas.

Em resumo, considerando todo o período analisado, o que se pode afirmar é

que o nível dos rendimentos por turno em todos os estados cresceu

consideravelmente, passando de valores medianos próximos a 50 para valores

superiores a 60.

214

ANÁLISE DE TRAJETÓRIAS SEGUNDO OS ESCORES CLÁSSICOS E EQUALIZADOS

APRESENTAÇÃO

Será apresentada a seguir a trajetória dos escores médios dos alunos, por ano

e disciplina. Será chamado de trajetória completa o percurso daqueles que

participaram de todas as rodadas da pesquisa, e trajetória incompleta o

percurso daqueles que não estiveram presentes em todos os períodos.

ANÁLISE DO ESCORE CLÁSSICO

Ao analisar o comportamento dos escores médios dos alunos ao longo do

tempo, espera-se verificar que os retornos marginais da escolaridade sejam

positivos e decrescentes, ou seja, o escore do aluno cresce a cada ano de

estudo, mas a taxas declinantes. Assim, seria esperado ainda que as curvas

representativas das trajetórias dos alunos, quanto a seus escores médios entre

abril de 1999 e novembro de 2003, fossem mais inclinadas no inicio, tendendo

à estabilidade no final. Entretanto, conforme é possível notar no gráfico 1, isso

não ocorreu. As curvas que representam as trajetórias completa e incompleta,

grafadas a partir das médias dos escores clássicos, são instáveis, chegando a

apresentar retornos negativos em alguns pontos. É possível que isso tenha

ocorrido devido à utilização do escore em sua forma clássica ou “bruta”. Os

escores clássicos não estão numa mesma escala e, por isso, não deveriam ser

comparados diretamente. Ao contrário, os escores equalizados, que estão

215

numa mesma escala, apresentam trajetórias mais bem comportadas,

reiterando a importância do processo de equalização na análise dos resultados.

As trajetórias traçadas a partir dos escores clássicos de matemática mostram

que o maior retorno ocorre entre abril e novembro de 1999. Depois disso, o

ganho médio propiciado pelo próximo ano de escolaridade é pequeno, sendo

quase nulo para os alunos de trajetória completa. A partir de 2001, as

trajetórias assumem uma tendência descendente, como se o ano adicional de

estudo tivesse efeito negativo sobre os escores dos alunos. Esse

comportamento é semelhante para os alunos que completaram ou não a

trajetória da pesquisa, uma vez que as duas curvas são bem parecidas. A

diferença fundamental entre elas se dá no nível do escore, mais elevado para

os alunos de trajetória completa.

Tabela 1: Estatísticas descritivas dos escores clássicos de matemática dos alunos que não completaram a trajetória de abril/1999 a novembro/2003

Fonte: Cedeplar/ Inep (2005).

Tabela 2: Estatísticas descritivas dos escores clássicos de matemática dos alunos que completaram a trajetória de abril/1999 a novembro/2003

Fonte: Cedeplar/ Inep (2005).

Nº de casos Média Desvio Padrão Mínimo MáximoAbril/1999 10654 236,421 64,301 50 380Nov/1999 8699 260,827 74,226 50 450

2000 13507 269,243 67,946 50 4502001 13293 246,670 54,004 50 4302002 10204 247,974 61,731 50 4502003 8114 234,066 54,480 50 400

Nº de casos Média Desvio Padrão Mínimo MáximoAbril/1999 1987 255,586 61,441 80 380Nov/1999 1987 284,872 72,858 50 450

2000 1987 286,734 68,055 50 4402001 1987 256,417 55,474 50 4202002 1987 257,162 63,231 100 4502003 1987 239,225 54,844 80 400

216

Gráfico 1: Média dos escores clássicos de matemática por trajetória

Abril/1999

Nov/1999

2003

20022001

2000

200,000

230,000

260,000

290,000

320,000

Período

Esco

re m

édio

Completa Incompleta Fonte: Cedeplar/ Inep (2005).

Os escores clássicos de português também não se comportaram conforme o

esperado. Entre as duas rodadas do ano de 1999 ocorre uma queda no valor

dos escores médios dos alunos que completaram ou não a trajetória da

pesquisa. A partir de novembro de 1999 até 2001, as trajetórias apresentam

tendência positiva e o escore médio aumenta a taxas decrescentes. Na

segunda metade da pesquisa, entretanto, entre 2001 e 2002, os escores

voltam a diminuir, e só retomam a tendência anterior no ano seguinte.

Tabela 3: Estatísticas descritivas dos escores clássicos de português dos alunos que não completaram a trajetória de abril/1999 a novembro/2003

Fonte: Cedeplar/ Inep (2005).

Nº de casos Média Desvio Padrão Mínimo MáximoAbril/1999 10649 286,261 74,571 50 450Nov/1999 8607 252,799 76,579 50 450

2000 13488 278,217 75,495 50 4502001 13246 294,185 79,175 50 4502002 10171 272,948 74,746 60 4502003 8110 283,822 82,885 50 450

217

Tabela 4: Estatísticas descritivas dos escores clássicos de português dos alunos que completaram a trajetória de abril/1999 a novembro/2003

Fonte: Cedeplar/ Inep (2005).

Gráfico 2: Média dos escores clássicos de português por trajetória

Abril/1999

Nov/1999

2003

2002

20012000

200,000

230,000

260,000

290,000

320,000

Período

Esco

re M

édio

Completa Incompleta

Fonte: Cedeplar/ Inep (2005).

Nº de casos Média Desvio Padrão Mínimo MáximoAbril/1999 1975 306,512 71,465 50 450Nov/1999 1975 276,952 76,626 50 450

2000 1975 298,684 74,048 50 4502001 1975 306,446 78,250 70 4502002 1975 281,635 76,677 100 4502003 1975 290,289 85,367 50 450

218

ANÁLISE DOS ESCORES EQUALIZADOS

Conforme o que foi dito anteriormente, os escores equalizados possibilitam

uma comparação mais confiável dos escores recebidos em provas e momentos

diferenciados. Isso pode ser confirmado através da análise dos escores médios

equalizados de português e matemática.

As tabelas 5 e 6 e o gráfico 3 apresentam as trajetórias completa e incompleta

de matemática.

Tabela 5: Estatísticas descritivas dos escores equalizados de matemática dos alunos que não completaram a trajetória de abril/1999 a novembro/2003

Fonte: Cedeplar/ Inep (2005).

Tabela 6: Estatísticas descritivas dos escores equalizados de matemática dos alunos que completaram a trajetória de abril/1999 a novembro/2003

Fonte: Cedeplar/ Inep (2005).

Nº de casos Média Desvio Padrão Mínimo MáximoAbril/1999 10654 49,738 8,954 24,750 74,565Nov/1999 8699 51,572 8,654 27,988 76,575

2000 13507 55,978 8,093 31,096 79,3822001 13293 60,502 7,850 34,600 85,0012002 10204 61,874 9,268 37,348 88,9162003 8114 61,592 11,125 35,351 89,611

Nº de casos Média Desvio Padrão Mínimo MáximoAbril/1999 1987 52,415 8,516 25,957 74,565Nov/1999 1987 54,409 8,290 27,988 76,575

2000 1987 58,024 7,986 31,096 79,3822001 1987 61,988 7,924 34,600 83,0192002 1987 63,108 9,313 38,126 88,9162003 1987 62,576 11,305 36,048 89,611

219

Gráfico 3: Média dos escores equalizados de matemática por trajetória

Nov/1999

2003 20022001

2000

Abr/1999

40,000

45,000

50,000

55,000

60,000

65,000

Período

Esco

re m

édio

Completa Incompleta Fonte: Cedeplar/ Inep (2005).

Como pode ser observado, as curvas apresentam comportamento mais

próximo ao esperado. Os escores apresentam tendência crescente com o

passar dos anos, explicitando os ganhos de aprendizado possibilitados pela

permanência na escola por mais um ano, exceto pelo período entre 2002 e

2003. Além disso, o crescimento dos escores médios se dá a uma taxa

decrescente em quase todo o trajeto, conforme o que seria esperado.

As tabelas 7 e 8 e o gráfico 4 apresentam as trajetórias completa e incompleta

de português.

Tabela 7: Estatísticas descritivas dos escores equalizados de português dos alunos que não completaram a trajetória de abril/1999 a novembro/2003

Fonte: Cedeplar/ Inep (2005).

Nº de casos Média Desvio Padrão Mínimo MáximoAbril/1999 10649 49,774 8,994 24,809 73,739Nov/1999 8607 48,524 10,060 25,350 76,865

2000 13488 54,358 9,277 28,621 78,5552001 13246 56,601 9,024 30,675 78,0182002 10171 56,846 10,222 30,986 82,9722003 8098 60,653 10,551 33,514 83,392

220

Tabela 8: Estatísticas descritivas dos escores equalizados de português dos alunos que completaram a trajetória de abril/1999 a novembro/2003

N º de casos M édia D esvio Padrão M ínim o M áxim oA bril/1999 1975 52,310 8,617 24,810 73,739N ov/1999 1975 51,720 9,925 25,350 76,865

2000 1975 56,880 8,986 28,620 78,5552001 1975 57,980 8,776 31,470 78,0182002 1975 58,040 10,456 32,410 82,9722003 1975 61,460 10,782 33,510 83,392

Trajetória C om pleta

Fonte: Cedeplar/ Inep (2005).

Gráfico 4: Média dos escores equalizados de português por trajetória

Nov/1999

2003

200220012000

Abr/1999

40,00

45,00

50,00

55,00

60,00

65,00

Período

Esco

re m

édio

Completa Incompleta Fonte: Cedeplar/ Inep (2005).

As trajetórias de português apresentam decréscimo no valor dos escores

médios somente entre abril e novembro de 1999, nos demais períodos o

percurso segue com tendência positiva. A taxa de crescimento dos escores

médios é decrescente de novembro de 1999 a 2002, sendo que é praticamente

nula entre 2001 e 2002. Entre 2002 e 2003, entretanto, a taxa de crescimento

dos escores é significativamente superior a dos períodos anteriores, ao

contrário da relativa estabilidade que era esperada.

221

COMPARAÇÃO DAS TRAJETÓRIAS A PARTIR DOS ESCORES BRUTOS E DOS ESCORES EQUALIZADOS

Os escores médios apresentaram trajetória mais condizente com o esperado

em sua forma equalizada que na forma bruta, como pode ser visto nos gráficos

referentes a ambas as trajetórias apresentadas até aqui. Em português, o

escore em sua forma bruta dá origem a trajetórias inconstantes, o que só pode

ser percebido com a observação dos resultados equalizados. As trajetórias

brutas apresentam dois pontos de decréscimo dos escores médios, os

períodos entre abril e novembro de 1999 e 2001 e 2002, enquanto na forma

equalizada nota-se apenas uma pequena diminuição no primeiro período,

sendo que esta é quase nula para os alunos de trajetória completa. Além disso,

ao contrário do resultado clássico, o escore médio equalizado permanece

constante entre 2001 e 2002.

Em matemática, a diferença provocada pela equalização dos dados nas

trajetórias fica ainda mais evidente. Os escores médios clássicos apresentam

crescimento mais abrupto que os equalizados, o que fica claro principalmente

com a observação de abril e novembro de 1999 nos gráficos correspondentes.

Além disso, as trajetórias clássicas apresentam dois pontos de decréscimo,

2000 e 2001 e 2002 e 2003. Já nas trajetórias equalizadas só ocorre

diminuição do escore médio entre 2002 e 2003, mas esta se dá de forma suave

(ao contrário do que ocorre com os valores brutos) sendo quase nula para os

alunos de trajetória incompleta.

222

1.2. – ANÁLISE FINAL DOS DETERMINANTES DO RENDIMENTO ESCOLAR, COM BASE NOS DADOS

LONGITUDINAIS (4ª A 8ª SÉRIES)

APRESENTAÇÃO

Esta seção é composta de dois relatórios, Qualidade dos itens e processos de

equalização para as provas de português e matemática, de acordo com a

Teoria de Resposta ao Item - TRI, e do relatório de Estimação de modelos

hierárquicos longitudinais nas disciplinas de matemática e de português.

Vale ressaltar que os gráficos e as tabelas referentes ao relatório “Qualidade

dos itens e processos de equalização para as provas de português e

matemática de acordo com a Teoria de Resposta ao Item (TRI)” podem ser

encontrados no anexo da Ação 1.3. Estes gráficos e tabelas estão em anexo

em função da grande quantidade de gráficos e das dificuldades relacionadas à

formatação que impossibilitaram a inserção destes gráficos e tabelas no corpo

do relatório.

223

QUALIDADE DOS ITENS E PROCESSOS DE EQUALIZAÇÃO PARA AS PROVAS DE PORTUGUÊS E

MATEMÁTICA DE ACORDO COM A TEORIA DA RESPOSTA AO ITEM (TRI)

APRESENTAÇÃO

Esta seção do relatório pretende, de início, avaliar a qualidade dos itens

aplicados pela pesquisa “Avaliação de Desempenho: Fatores Associados” a

alunos que cursavam a quarta série em 1999, acompanhando-os até 2003,

quando estes deveriam estar cursando a oitava série. Entretanto, durante este

período, algumas informações se perderam, por exemplo, por transferência,

evasão ou reprovação. Por outro lado, novos alunos passaram a participar da

amostra, quando transferidos para as escolas selecionadas pela pesquisa.

Antes, porém, é necessário introduzir a teoria por meio da qual será avaliada a

qualidade dos itens e, posteriormente, colocar todos os rendimentos numa

mesma escala através da equalização. Isto será feito através da Teoria da

Resposta ao Item.

224

INTRODUÇÃO À TEORIA DA RESPOSTA AO ITEM (TRI)

Uma das principais características da Teoria da Resposta ao Item (TRI) é

considerar como elementos centrais os itens, e não a prova como um todo,

conforme considerava a Teoria Clássica do Teste. Vale lembrar que o escore

clássico é simplesmente a soma dos itens que o aluno acertou, enquanto o

escore da Teoria da Resposta ao Item leva em conta além do número de itens

respondidos corretamente pelo aluno, as características dos itens que ele

acertou. Isto garante uma medida mais apurada da habilidade ou proficiência

do aluno.

No mesmo sentido, ANDRADE; TAVARES &VALLES (2000, p.3) afirmam qual

a principal vantagem da TRI :

“Uma das grandes vantagens da TRI sobre a Teoria Clássica é

que ela permite a comparação entre populações, desde que

submetidas a provas que tenham alguns itens comuns, ou

ainda, a comparação entre indivíduos da mesma população

que tenham sido submetidos a provas totalmente diferentes.

Isto porque uma das principais características da TRI é que ela

tem como elementos centrais os itens, e não a prova como um

todo”

Esses mesmos autores definiram a Teoria da Resposta ao Item “... como um

conjunto de modelos matemáticos que procuram representar a probabilidade

de um indivíduo dar uma certa resposta a um item como função dos

parâmetros do item e da habilidade do respondente” (ANDRADE; TAVARES

&VALLES, 2000, p.7).

225

O modelo, geralmente, mais adotado é o logístico de três parâmetros, dado

pela seguinte equação:

)(1

1)1()(iji bDaiij

eccP

−−+−+= θθ

com i=1,2,...,n e j=1, 2,...,m, em que:

• θj representa a habilidade do j-ésimo aluno;

• P(θj) é a probabilidade de um aluno j com habilidade θj responder

corretamente o item i, denominada Função de Resposta ao Item (FRI)

ou Curva Característica do Item (CCI);

• D é um valor de escala igual a 1,7, quando se deseja que a função

logística forneça resultados semelhantes aos da função de ogiva normal;

• bi é o parâmetro de dificuldade do item i, medido na mesma escala da

habilidade e correspondendo ao ponto onde a inclinação da CCI é

máxima. Representa a habilidade necessária para que a probabilidade

de acerto ao item i seja igual a (1+ci)/2. Como a habilidade está

normalmente distribuída, o valor da dificuldade, em geral, varia entre -2

e +2 (HAMBLETON, 1993). Valores altos indicam itens difíceis;

• ai é o parâmetro de discriminação do item i, com valor proporcional à

inclinação da CCI no ponto bi. Quanto maior a inclinação, maior o valor

da discriminação do item. Conforme HAMBLETON (1993), os valores do

parâmetro a, em geral, variam entre 0 e 2. Valores baixos de

discriminação indicam que o item não consegue separar os alunos em

grupos de habilidades distintos. Por outro lado, valores altos implicam na

ocorrência de dois grupos: os que possuem habilidade abaixo do

parâmetro b e os que possuem acima. É importante ressaltar que

226

valores de a muito elevados também não conseguem separar os

indivíduos em grupos ou intervalos de habilidades;

• ci é probabilidade de alunos com baixa habilidade responderem

corretamente o item i, ou seja, é a probabilidade de acerto do item i ao

acaso, quando o aluno não sabe a resposta deste item.

Como exemplo, veja a curva característica do item 291 da prova de

matemática em abril de 1999.

Gráfico 1: Curva característica do item 29 da prova

de matemática em abril de 1999

De acordo com os critérios estabelecidos na seção de interpretação dos

resultados da qualidade dos itens, o item acima pôde ser bem classificado, 1 Este gráfico da Curva Característica do Item, assim como o de sua curva de informação, também se encontra em anexo, junto aos gráficos referentes a todos os itens de matemática e de português em todos os períodos de aplicação das provas. A numeração dos gráficos, em anexo, leva em conta os itens comuns e os itens que foram retirados no processo de estimação e equalização.

0

0.2

0.4

0.6

0.8

1.0

-3 -2 -1 0 1 2 3

c

b

Habilidade

Prob

abili

dade

a = 1.041 b = 0.315 c = 0.076

Fonte: Cedeplar/ Inep (2005)

227

porque ele apresentou o parâmetro de discriminação superior a 0,75

(ANDRADE, TAVARES & VALLES, 2000), o parâmetro de dificuldade no

intervalo [-2;2] e o parâmetro de acerto casual próximo a zero.

Uma outra função que tem um importante papel na avaliação de itens, a função

de informação do item, mostra a contribuição de cada item na estimação da

habilidade, em qualquer ponto de sua escala. Para o modelo logístico de três

parâmetros a função de informação do item é dada por (HAMBLETON, 1993):

2)(7,1)(7,1

2

]1][[)1(89,2)(

iiii babai

iii eec

caI −−− ++−

= θθθ (i=1, 2, ...., n)

A função de informação do item 29 da prova matemática realizada em abril de

1999 pode ser vista na figura abaixo:

Gráfico 2: Curva de Informação do Item 29 da prova de matemática realizada em abril de 1999

-3 -2 -1 0 1 2 30

0.5

1.0

1.5

2.0

2.5

Habilidade

Info

rmaç

ão

Fonte: Cedeplar/ Inep (2005)

228

Este item apresenta uma distribuição aproximadamente normal em relação à

sua curva de informação, dando uma maior contribuição à estimação das

habilidades dos alunos por volta do escore 0,3. Dito de outra forma, este item

apresenta a informação máxima, quando o escore é igual a 0,3,

correspondendo ao valor do parâmetro de dificuldade (b).

Assim, o item 29 da prova de matemática realizada em abril de 1999, dá uma

maior contribuição à estimação das habilidades dos alunos com escore 0,3,

contudo a informação pode ser considerada relevante entre [-1, 1], o que pode

ser confirmado pela inclinação da curva característica do item, conforme

Gráfico 1. Esta confirmação pode ser verificada, porque, neste intervalo, a

curva característica do item apresenta a maior inclinação e, portanto, os

maiores valores para o parâmetro de discriminação (a).

Vale ressaltar que, em anexo, podem ser vistas as tabelas, contendo os

valores dos parâmetros de discriminação, de dificuldade e de acerto casual,

assim como os seus erros padrões correspondentes, por ano e disciplina. Em

anexo, também, são apresentados os gráficos das curvas características e de

informação de todos os itens para as disciplinas de matemática e de português.

A numeração dos itens e dos gráficos, em anexo, leva em conta os itens

comuns - questões que se repetem em provas distintas com o objetivo de

viabilizar a comparação do desempenho dos alunos - assim como aqueles

itens que foram retirados durante o processo de estimação e equalização.

229

PROCESSOS DE EQUALIZAÇÃO

De início, é importante definir o termo equalizar que significa equiparar ou

tornar comparável. No caso da TRI, equalizar significa estimar, na mesma

métrica, parâmetros de itens pertencentes a provas diferentes ou habilidades

de alunos de grupos distintos. Em outras palavras, equalizar é estimar

parâmetros de itens e habilidades numa escala comum, tornado os itens e as

habilidades comparáveis (KOLEN & BRENNAN, 1995; ANDRADE, TAVARES

& VALLES, 2000).

Quando diferentes testes são estimados separadamente, não se pode garantir

que os parâmetros dos itens destes testes estejam na mesma escala, porque a

posição da escala depende do grupo de respondentes considerado. Em outras

palavras, no processo de estimação, a escala de dificuldade do item tem um

centro arbitrário, em geral, sendo a média estimada da habilidade ou a média

da dificuldade do item, fazendo com que a posição da escala dependa do

grupo de estudantes considerado. Assim, isto é especialmente importante em

estudos longitudinais em que se espera que alunos de séries mais adiantadas

tenham um nível mais elevado de habilidade, justificando a importância em se

equalizar as proficiências estimadas.

Existem dois tipos de equalização: a equalização via população, também

conhecida por equalização horizontal, e a equalização via itens comuns, a

denominada equalização vertical (ANDRADE, TAVARES & VALLES, 2000).

A equalização via população, ou equalização horizontal, envolve equalizar

escores obtidos em testes com aproximadamente o mesmo nível de

dificuldade, por exemplo, quando mais de uma versão do teste é aplicada a

alunos de um mesmo nível, ou seja, de uma mesma série. Neste tipo de

equalização, quando um único grupo de estudantes é submetido a provas

distintas, para se garantir que os parâmetros de itens estão na mesma escala,

basta estimar conjuntamente estes itens.

Por outro lado, a equalização via itens comuns, ou a equalização vertical,

permite que se coloque em uma mesma escala escores de testes de diferentes

níveis de dificuldade, por exemplo, escores obtidos por alunos de diferentes

230

níveis educacionais, respondendo a testes diferentes, mas com a presença de

itens comuns. Neste tipo de equalização, os itens comuns servem de ligação

entre as populações envolvidas, garantindo que seus parâmetros estejam

numa mesma escala.

Para o estudo longitudinal do desenvolvimento cognitivo dos alunos da quarta

série em 1999 até a oitava série em 2003, que contou com a presença de item

comum, foi realizada a equalização vertical, estando os resultados de

desempenho em cada avaliação referenciados a uma mesma escala, a de abril

de 1999. Assim, tanto para a disciplina de matemática quanto para a de

português, o período de referência escolhido para a realização da equalização

foi abril de 1999, considerado o baseline da pesquisa.

Considerando a TRI, para o caso da pesquisa longitudinal “Avaliação de

Desempenho: Fatores Associados”, poder-se-ia utilizar dois tipos de

equalização vertical, a posteriori e a priori.

A equalização a posteriori, como o próprio nome sugere, é realizada após a

estimação, separadamente, de dois conjuntos de itens que foram submetidos a

duas populações de interesse. Tendo estimativas em duas diferentes escalas

para os itens comuns, pode-se estabelecer algum tipo de relação que permita

colocar os parâmetros de um dos conjuntos de itens na escala do outro. Vários

são os métodos, que se baseiam em relações lineares entre os parâmetros de

um mesmo item medidos em escalas diferentes, por meio dos quais se pode

realizar a equalização a posteriori, como por exemplo, os conhecidos métodos

Média-Desvio e Média-média (veja KOLEN & BRENNAN, 1995; ANDRADE,

TAVARES & VALLES, 2000).

As equalizações a priori são realizadas durante o processo de estimação ou

calibração dos itens e segundo ANDRADE, TAVARES & VALLES (2000) são

mais eficazes do que as equalizações a posteriori, uma vez que permitem

estimações com menores erros. Além disto, elas exigem um menor número de

itens comuns do que as equalizações a posteriori. Em geral, os autores têm

sugerido pelo menos 6 itens comuns entre 2 provas de 30 itens, quando a

equalização é feita durante a calibração.

231

Diante do exposto, em especial, das vantagens da realização da equalização a

priori, adotou-se este método para a equalização dos dados da pesquisa.

Assim, os parâmetros de itens puderam ser estimados conjuntamente por meio

do software Bilog-mg2 e, portanto, as habilidades puderam ser estimadas em

uma mesma escala de referência (abril de 1999), para que se pudesse

prosseguir às análises descritivas e à estimação de modelos hierárquicos

longitudinais na determinação de fatores associados ao rendimento escolar dos

alunos durante o período pesquisado.

2 Este software permite a estimação conjunta dos itens de todos os períodos, de modo a colocar a habilidade de todas as séries numa mesma escala, tornado, assim, todos os escores dos alunos comparáveis, por meio do processo de equalização vertical.

232

PROCEDIMENTOS E INTERPRETAÇÃO DOS RESULTADOS DA CALIBRAÇÃO, DA QUALIDADE DOS ITENS E DA EQUALIZAÇÃO

Os procedimentos utilizados para a calibração dos itens de matemática e

português estão descritos nas Tabelas 1 e 3, respectivamente, assim como os

motivos pelos quais alguns itens foram retirados até a obtenção da calibração

final. O processo de calibração dos itens foi realizado em vários passos,

estratégia utilizada para manter o maior número possível de itens nas provas. A

qualidade dos itens foi avaliada considerando-se, principalmente, os valores

referentes às estimativas dos parâmetros de discriminação e de dificuldade e,

ainda, os erros padrões (EP) destas estimativas.

Em resumo, os critérios considerados para a retirada dos itens foram: a)

correlação bisserial3 negativa; b) item com 100% de acerto; c) parâmetro de

discriminação menor do que 0,4; d) erros padrões referentes aos parâmetros

de discriminação ou de dificuldade maiores que 0,3 (BAKER, 2001).

Depois do primeiro passo, ou seja, após a primeira calibração sem a retirada

de itens, os parâmetros dos itens foram sendo novamente re-estimados por

meio do software Bilog-mg, que estima conjuntamente os itens de todos os

períodos e coloca a habilidade de todas as séries numa mesma escala,

fazendo com que todos os escores dos alunos sejam comparáveis, por meio do

processo de equalização.

Os primeiros resultados apresentados abaixo são da disciplina de matemática.

Antes, porém, vale ressaltar que as provas de abril 1999, nas duas disciplinas,

foram consideradas como escala de referência para os processos de

calibração e equalização.

3 Indicada para medir a associação entre um item e o teste.

233

Tabela 1: Procedimentos para a calibração e retirada de itens, referentes às provas de matemática nos períodos de abril de 1999 a novembro de 2003

Passo Item retirado Motivo 1 nenhum O processo de estimação não convergiu

113 Correlação bisserial negativa

429 100% de acerto

617 Correlação bisserial negativa 631 100% de acerto

2

637 Correlação bisserial negativa

305 306 320 333 417 601

3

620

Todos com parâmetro de discriminação menor do que 0.400

107 413 EP > 0.300 para os parâmetros a ou b 4

206 EP ≈ 0.25 para o parâmetro a EP > 0.15 para o parâmetro b

211 415

5

606

Todos com parâmetro de discriminação menor do que 0.400

6 426 a < 0.400 Fonte: Cedeplar/ Inep (2005)

Vale destacar, ainda que, somente um item comum (305) foi eliminado da

calibração final, conforme pode ser visto na tabela 1. Este item aparece nas

aplicações de 2000 e 2001, conforme mostra a tabela 2, que apresenta um

esquema longitudinal com a numeração dos itens comuns das provas de

matemática de abril de 1999 a novembro de 2003.

Na tabela 2, as questões estão numeradas por ordem e ano, sendo que o

primeiro dígito diz respeito ao ano e os dois últimos, à posição do item na

prova. Os itens comuns se mantêm com o mesmo número que recebem na

primeira prova em que aparecem, mesmo quando se repetem em provas

seguintes. Voltando ao item 305, ele aparece pela primeira vez na posição 5 da

prova de novembro de 2000. Em seguida, este item se repete na posição de

número 2 da prova de novembro de 2001 (no lugar do item 402).

234

Tabela 2: Esquema longitudinal dos itens comuns das provas de matemática de abril/1999 a novembro/2003

Itens Abr/99 Nov/99 2000 2001 2002 2003 1 101 201 109 401 501 601 2 102 109 302 305 502 602 3 103 203 303 403 503 603 4 104 204 204 213 504 511 5 105 110 305 309 422 501 6 106 206 306 406 506 606 7 107 207 218 119 507 607 8 108 208 308 408 508 608 9 109 209 309 409 432 432 10 110 210 219 303 406 534 11 111 211 311 324 511 515 12 112 212 312 312 303 537 13 113 213 223 413 513 613 14 114 214 119 210 514 532 15 115 215 315 415 515 303 16 116 216 316 334 420 616 17 117 134 317 417 517 617 18 118 218 318 418 518 618 19 119 219 230 419 519 619 20 120 220 320 420 434 620 21 121 221 321 219 521 621 22 122 222 128 422 522 622 23 123 223 323 423 523 623 24 124 119 324 424 312 526 25 125 225 114 425 403 527 26 126 226 326 426 526 626 27 127 227 327 427 527 627 28 128 228 124 428 528 628 29 129 229 329 429 423 629 30 130 230 330 430 530 630 31 131 128 331 431 531 631 32 132 104 332 432 532 632 33 133 233 333 433 309 633 34 134 234 334 434 534 634 35 135 122 335 435 535 635 36 136 236 336 436 536 636 37 114 337 437 537 637 38 124 338 438 538 638 39 126 339 439 539 639 40 240 340 440 540 640

Fonte: Cedeplar/ Inep (2005)

235

Para português, os mesmos procedimentos foram utilizados, tanto que o

processo de calibração foi realizado passo a passo, buscando manter o maior

número de itens possível para a calibração final, conforme mostra a Tabela 3.

Tabela 3: Procedimentos para a calibração e retirada de itens, referentes às

provas de português nos períodos de abril de 1999 a novembro de 2003 Passo Item retirado Motivo

1 nenhum O processo de estimação não convergiu 101 106 107 209 215

2

617

Todos com parâmetro de discriminação menor do que 0.400

203 3 213 EP > 0.300 para o parâmetro a

4 508 100% de acerto Fonte: Cedeplar/ Inep (2005)

É importante lembrar que seria possível tratar de formas diferentes itens

comuns que foram aplicados em mais do que duas avaliações, diante da

possibilidade do aluno memorizar a resposta correta. Por exemplo, o item

comum 307, conforme mostra a tabela 4, fez parte das provas de português a

partir de 2000, totalizando quatro participações nas provas do período abril de

1999 a novembro de 2003.

Uma das possíveis formas de se tratar o item 307 seria considerá-lo somente

nas avaliações de 2000 e 2001, eliminando-o das avaliações de 2002 e 2003.

Entretanto, a opção escolhida foi a de manter o item 307 no processo de

estimação, porque não se espera que o resultado sofresse muitas mudanças

caso este item fosse retirado da aplicação de 2002 e/ou 2003.

236

Tabela 4: Esquema longitudinal dos itens comuns das provas de português de abril/1999 a novembro/2003

Itens Abr/99 Nov/99 2000 2001 2002 2003 1 101 201 124 401 501 601 2 102 124 302 402 502 323 3 103 203 126 403 330 603 4 104 204 304 315 418 604 5 105 132 222 405 505 526 6 106 206 306 406 506 606 7 107 207 307 407 507 607 8 108 208 224 240 508 429 9 109 209 228 409 509 609 10 110 210 310 410 510 409 11 111 211 131 411 511 411 12 112 212 312 119 401 612 13 113 213 313 413 513 613 14 114 214 314 414 514 614 15 115 215 315 415 515 615 16 116 109 123 307 516 616 17 117 126 317 417 409 617 18 118 119 122 418 518 618 19 119 219 319 419 519 619 20 120 220 320 317 307 620 21 121 221 240 421 521 621 22 122 222 119 422 522 622 23 123 223 323 423 523 623 24 124 224 324 122 524 624 25 125 225 325 425 525 625 26 126 226 326 426 526 626 27 127 123 327 427 527 529 28 128 228 328 337 429 331 29 129 229 329 429 529 629 30 130 230 330 430 530 523 31 131 231 331 431 531 631 32 132 232 332 304 532 307 33 133 110 333 433 533 633 34 134 234 334 434 331 634 35 135 235 335 323 335 317 36 136 118 336 436 411 636 37 237 337 437 317 637 38 122 338 438 538 638 39 125 339 439 539 639 40 240 340 330 540 640

Fonte: Cedeplar/ Inep (2005)

237

Conforme dito anteriormente, a qualidade dos itens pode ser avaliada pelos

valores das estimativas dos parâmetros e de seus erros padrões (EP), que

podem ser vistos nas tabelas, em anexo, contendo os valores dos parâmetros

e de seus erros padrões, para a discriminação, a dificuldade e o acerto casual

por ano e disciplina. Em anexo, também são apresentados gráficos das curvas

características e de informação de todos os itens, permitindo que a inspeção

visual auxilie no processo de avaliação dos itens.

Por sua vez, a avaliação das provas, considerando todos os períodos, foi feita

por meio da distribuição dos valores dos parâmetros dos itens, em especial, o

da discriminação, além da interpretação da curva de informação do teste, tanto

para a disciplina de português quanto para a de matemática. Vale relembrar

que as provas de português e de matemática são compostas por quarenta itens

nas rodadas de novembro de 1999 a novembro de 2003. Em abril de 1999, as

provas continham apenas trinta e seis itens. Entretanto, após a equalização, os

itens comuns passaram a ser considerados uma única vez, enquanto outros

tiveram que ser retirados das provas por apresentarem, em especial, baixo

valor para o parâmetro de discriminação. Dessa forma, a prova de matemática

contém, ao todo, cento e sessenta e sete itens válidos, e a de português, cento

e setenta e sete.

A tabela 5 mostra a distribuição dos valores dos parâmetros de discriminação

nas provas de matemática e de português.

Tabela 5: Distribuição dos valores do parâmetro de discriminação nas provas de matemática e de português

Discriminação Matemática Português 0.4 ≤ a < 0.5 14 9

8,38% 5,08% 0.5 ≤ a < 0.75 37 46

22,16% 25,99% ≥ 0.75 116 122

69,46% 68,93% Total 167 177

100% 100% Fonte: Cedeplar/Inep (2005)

238

Os resultados da distribuição, referentes ao total de itens diferentes aplicados

nas provas de matemática, podem ser analisados por meio da tabela 5. Esta

tabela mostra que um percentual de aproximadamente 8% (8,38%) dos itens

aplicados nas provas de matemática apresentou discriminação entre 0,4 e 0,5.

Para trinta e sete itens, o valor do parâmetro de discriminação ficou entre 0,5 e

0,75, o que corresponde a aproximadamente 22% (22,16%) do total de itens

aplicados. Um percentual em torno de 70% (69,46%) dos itens apresentou

parâmetro igual ou superior a 0,75.

Quanto aos resultados de português, a tabela 5 mostra que as provas contêm,

ao todo, cento e setenta e sete itens diferentes. Destes, cerca de 5% (5,08%)

apresentaram parâmetro de discriminação com valores entre 0,4 e 0,5. Para

aproximadamente um quarto (25,99%) dos itens de português, os valores dos

parâmetros de discriminação foram estimados entre 0,5 e 0,75. A grande

maioria dos itens, cerca de 70% (68,93%) obteve parâmetros de discriminação

com valor igual ou superior a 0,75.

Tabela 6: Distribuição dos valores do parâmetro de dificuldade nas provas de matemática e português

Fonte: Cedeplar/Inep (2005)

Dificuldade Matemática Português b ≤-2 1 1

0,59% 0,56% -2 < b ≤ -1 2 4

1,19% 2,25% -1< b ≤ 0 22 23

13,17% 12,99% 0 < b < 1 42 76

25,14% 42,93% 1≤ b < 2 43 61

25,74% 34,46% b ≥ 2 57 12

34,13% 6,78% Total 167 177

100% 100%

239

Quanto à distribuição dos valores dos parâmetros de dificuldade dos itens por

disciplina, nas provas de matemática, de acordo com a tabela 6, em torno de

um quarto (25,14%) apresentou dificuldade entre 0 e 1, quarenta e três itens

(25,74%), entre 1 e 2 e cinqüenta e sete (34,13%), maiores que 2. Os outros

itens obtiveram parâmetros com menor dificuldade, sendo que vinte e dois

(13,17%) apresentaram dificuldade entre -1 e 0, dois itens (1,19%), entre -2 e -

1 e,apenas, um item (0,59%), valor inferior a -2.

Dos cento e setenta e sete parâmetros de dificuldade estimados para os itens

de português, setenta e seis (42,93% do total de itens) têm valor entre 0 e 1,

sessenta e um (34,46%), entre 1 e 2 e doze (6,77%) são maiores ou iguais a 2.

Considerando os itens restantes, aqueles com menor dificuldade, vinte e três

(13% do total de itens) obtiveram parâmetros estimados com valor entre -1 e 0,

quatro (2,25%), entre -2 e -1. Apenas um item obteve parâmetro de dificuldade

abaixo de -2, o que corresponde a, apenas, um percentual de 0,56% do total de

itens aplicados.

Diante do exposto, de uma forma geral, pode-se dizer que a maioria dos itens

apresenta discriminação desejada (>=0.75), tanto em matemática quanto em

português (cerca de 70% nas duas disciplinas). No caso da probabilidade de

acerto casual, a maioria dos itens também apresentou valores adequados (por

volta de 0,25). Quanto à dificuldade, os itens contemplam parte considerável

da escala de habilidade, o que pode ser visto por meio das distribuições

apresentadas acima e por meio das curvas de informação dos testes (Gráficos

3 e 4). Isto está de acordo com o que, em geral, é esperado de uma prova:

praticamente toda a escala de habilidade deve ser considerada. Entretanto, as

curvas de informação das duas disciplinas como um todo indicam que os itens

são mais informativos na estimação de escores de alunos que apresentam uma

maior habilidade.

240

Gráfico 3: Curva Total de Informação do Teste de Matemática de Abril/1999 a Novembro/2003

Fonte: Cedeplar/ Inep (2005)

241

Gráfico 4: Curva Total de Informação do Teste de Português de Abril/1999 a Novembro/2003

Fonte: Cedeplar/ Inep (2005)

Fonte: Cedeplar/ Inep (2005)

242

ESTIMAÇÃO DE MODELOS HIERÁRQUICOS LONGITUDINAIS PARA AS DISCIPLINAS DE

MATEMÁTICA E DE PORTUGUÊS

APRESENTAÇÃO

De início, vale ressaltar que a utilização de dados longitudinais têm muito a

contribuir com as avaliações da qualidade do ensino, uma vez que permite a

análise da trajetória da proficiência dos alunos no tempo e, portanto, a

estimação adequada, em especial, do efeito-escola, com a utilização da

abordagem clássica de modelos hierárquicos longitudinais.

De uma forma geral, a literatura da proficiência educacional, incluindo

especialmente áreas como Economia e Educação, estabelece, em geral, três

níveis de fatores aos quais a proficiência está associada: nível do aluno, nível

da turma e nível da escola (HANUSHEK, 2002; WILLMS & SOMERS, 1999;

SOARES, CÉSAR & MAMBRINI, 2001). Isto se deve ao fato de, os dados

educacionais apresentarem uma estrutura hierárquica, estando os alunos

aninhados em turmas e estas aninhadas em escolas.

Entretanto, essa literatura não é consensual, nem quanto aos fatores

associados à proficiência, nem quanto às definições do efeito-escola e nem

quanto às suas formas de operacionalização (WILLMS, 2000; TOOD &

WOLPIN, 2003; FERRÃO & FERNANDES, 2003).

O termo efeito-escola foi definido, por FERRÃO & FERNANDES (2003), como

a proporção da variância total que está associada à variância entre as escolas,

ou seja, o quanto da variação do rendimento escolar entre os alunos é

explicado por diferenças existentes entre as escolas que eles freqüentam. Nos

modelos estimados a seguir, o efeito-escola pode estar associado ao status

inicial de desempenho, à taxa linear média de crescimento no desempenho do

243

aluno de um período para o seguinte ou à taxa não linear média de

crescimento.

Considerando a necessidade de se conhecer melhor os fatores associados à

proficiência escolar, visando contribuir de alguma forma para a melhoria do

sistema educacional brasileiro, este relatório pretende investigar quais são os

fatores associados à proficiência educacional da quarta à oitava série do

ensino fundamental no norte, no nordeste e no centro-oeste brasileiros que,

conforme SAEB (2004), são as regiões do Brasil com os piores resultados em

termos de desempenho.

244

INFORMAÇÕES SOBRE O BANCO DE DADOS E AS VARIÁVEIS UTILIZADAS NO PROCESSO DE ESTIMAÇÃO DOS FATORES ASSOCIADOS AO DESEMPENHO ESCOLAR NA DISCIPLINA DE MATEMÁTICA.

A base de dados utilizada nos modelos possui informações de escolas, alunos,

professores e diretores de seis Unidades da Federação: Pará (PA), Rondônia

(RO), Pernambuco, Sergipe (SE), Goiás (GO) e Mato Grosso do Sul (MS). Esta

base tem um desenho longitudinal para o acompanhamento de uma coorte de

alunos ao longo do tempo, com a principal finalidade de estimar os fatores

determinantes do desempenho escolar.

Esses dados correspondem a cinco anos de pesquisa em seis períodos

diferentes. A primeira e a segunda rodadas foram realizadas com alunos que

cursavam a 4ª série do ensino fundamental no ano de 1999, sendo a primeira

realizada em primeiro de Abril e a segunda, em primeiro de Novembro de1999.

A partir de 2000, as rodadas foram sempre realizadas em primeiro de

novembro do referente período. Assim, na terceira rodada em primeiro de

novembro de 2000 foram pesquisados os alunos da quinta série e assim,

sucessivamente até a sexta rodada em 2003 para os alunos da 8ª série.

Para estimar os modelos, optou-se por trabalhar com os alunos de trajetória

completa, ou seja, alunos que estiveram presentes ao longo de todas as seis

rodadas realizadas pela pesquisa. A Tabela 1 mostra algumas estatísticas

descritivas – o total de alunos, a média, o desvio padrão, o máximo e o mínimo

- para os alunos que completaram, ou não, a trajetória na disciplina de

matemática.

245

Tabela 1: Estatísticas descritivas dos alunos que completaram, ou não, a trajetória entre abril/1999 e novembro/2003 - Matemática.

Trajetória Completa Nº de alunos Média Desvio Padrão Mínimo Máximo

abril/99 1987 52,4 8,5 26,0 74,6 nov/99 1987 54,4 8,3 28,0 76,6 2000 1987 58,0 8,0 31,1 79,4 2001 1987 62,0 7,9 34,6 83,0 2002 1987 63,1 9,3 38,1 88,9 2003 1987 62,6 11,3 36,0 89,6

Trajetória Incompleta abril/99 10654 49,7 9,0 24,7 74,6 nov/99 8699 51,6 8,7 28,0 76,6 2000 13507 56,0 8,1 31,1 79,4 2001 13293 60,5 7,8 34,6 85,0 2002 10204 61,9 9,3 37,3 88,9 2003 8114 61,6 11,1 35,4 89,6

Fonte: Cedeplar/ Inep (2005)

Como se pode notar, por meio da Tabela 1, o número de alunos que

completaram a trajetória é bem menor, quando comparado ao número dos que

não estiveram presentes em alguma rodada da pesquisa.

Conforme já era esperado, o gráfico 1 mostra que o desempenho dos alunos

que participaram das seis rodadas é superior ao dos demais, uma vez que os

alunos que completaram a trajetória podem ter repetido no máximo até a 4ª

série. Entretanto, vale salientar que a estrutura das duas curvas é muito similar,

estando relativamente próximas ao que se espera de uma curva de

aprendizagem, ou seja, ganhos decrescentes ao longo do período com

tendência à estabilidade no final do processo.

246

Gráfico 1: Médias dos Escores Equalizados de Matemática segundo o tipo de trajetória

Abr-99

Nov-99

Nov-00

Nov-01

Nov-02 Nov-03

45

50

55

60

65

Períodos

Méd

ias

Trajetória incompleta Trajetória completa

Fonte: Cedeplar/ Inep (2005)

O software utilizado para estimar os modelos foi o HLM. Como este software

não aceita valores em branco (missings) nos arquivos de nível 2 e 3, houve

uma perda4 de 201 alunos e 30 escolas. Assim, o banco passou a contar com

1786 e 146 escolas. Como o software HLM somente identifica uma escola para

cada aluno, optou-se por retirar do banco alunos que mudaram de escola

durante a pesquisa. Assim, foram retirados também 35 alunos e 1 escola, de

forma que o banco final para a estimação dos fatores associados ao

desempenho em matemática totaliza 1751 alunos em 145 escolas.

A Tabela 2 mostra algumas estatísticas descritivas para as variáveis

quantitativas que foram consideradas na estimação dos modelos. A variável

sco, como era de se esperar, uma vez que tem uma distribuição normal com

média 50 e desvio padrão 10, apresentou, respectivamente, um mínimo de 25

e um máximo de 90 pontos. O número de horas-aula por dia variou entre 3,6 e 4 Para minimizar esta perda, foram “imputados” no questionário de alunos da oitava série os valores em branco. Assim, foram utilizados os questionários da sétima (2002) e sexta (2001) séries, sucessivamente, para tentar completar os valores em branco presentes no questionário da oitava série (2003).

247

7,4. Por sua vez, o menor tamanho médio de turma por escola foi de 21,56

alunos, enquanto o maior valor chegou a 51,38 alunos. No caso de percentual

de professores com curso superior a amplitude foi de 100%, indicando portanto

que em relação a este quesito, existe escola que não tem professor com curso

superior, em contraste com escola em que todos os professores apresentam

pelo menos curso superior.

Tabela 2: Estatísticas Descritivas das Variáveis Quantitativas Utilizadas na Estimação dos Modelos de Matemática

Variável Nº de Casos Média Desvio Padrão Mínimo MáximoEscore 10506 58,62 9,9 25,96 89,52

Horas-Aula 145 4,35 0,47 3,6 7,4 Tamanho da Turma 145 35,1 5,61 21,56 51,38

Docentes com Curso Superior 145 62,22 28,63 0 100 Fonte: Cedeplar/ Inep (2005)

O quadro 1 mostra a descrição das variáveis e suas categorias

correspondentes, utilizadas no processo de estimação dos modelos. Essas

variáveis estão divididas por níveis correspondentes aos modelos hierárquicos

longitudinais.

Assim sendo, o nível 1 contempla as habilidades dos alunos estimadas

(calibradas) e equalizadas, de acordo com a teoria da resposta ao item.

Posteriormente, esta variável resposta teve sua distribuição transformada numa

normal com média 50 e desvio-padrão 10. Além da variável resposta, no nível 1

também se encontram variáveis relacionadas ao tempo. Neste trabalho, essas

variáveis correspondem à série cursada e a uma transformação dessa variável,

série ao quadrado, para tentar captar a não linearidade do ganho no

desempenho relativo ao processo de aprendizagem.

No nível 2, encontram-se variáveis relacionadas a características familiares e

individuais, que se espera não sofrerem variações significativas com o tempo.

E por fim, o nível 3 compreende variáveis qualitativas e quantitativas

relacionadas às escolas. Vale ressaltar que as variáveis do terceiro nível foram

retiradas do censo escolar de 2001, com exceção da quadra que faz parte do

censo escolar do ano de 2000.

248

QUADRO 1 Variáveis consideradas na estimação dos modelos hierárquicos longitudinais

Nível 1 Variáveis Significado Categorias

sco Escore modificado = (escore equalizado x 10) + 50

serie Série

serie2 Série elevada ao quadrado

Nível 2 sexo Você é do sexo: 0 – Masculino 1 – Feminino

raca Você se considera: 0 – Não-branco 1 – Branco

livros Quantos livros há em sua casa? 0 – 20 ou menos 1 – Mais de 20

licão Você faz lição de casa? 0 – Não 1 – Sim

repetiu Já repetiu de ano alguma vez? 0 – Sim 1 – Não

mãe_ler Sua mãe sabe ler? 0 – Não 1 – Sim

pai_ler Seu pai sabe ler? 0 – Não 1 – Sim

abandonou Já abandonou a escola por pelo menos um ano?

0 – Sim 1 – Não

esc_pai Até que ano seu pai estudou?

0 - Não completou o ensino fundamental. 1 - Pelo menos o ensino fundamental completo

esc_mae Até que ano sua mãe estudou?

0 - Não completou o ensino fundamental. 1 - Pelo menos o ensino fundamental completo

Nível 3 horas-aula Número Médio de Horas-Aula Diária no Ensino Fundamental

tam_turma Número Médio de Alunos por Turma Total no Ensino Fundamental

doc_superior Percentual de Docentes com Curso Superior no Ensino Fundamental

bibliote Se a escola tem biblioteca. 0 – Não 1 – Sim

labcien Se a escola tem laboratório de ciências.

0 – Não 1 – Sim

labinfo Se a escola tem laboratório de informática.

0 – Não 1 – Sim

quadra Se a escola tem quadra. 0 – Não 1 – Sim

Fonte: Cedeplar/ Inep (2005)

249

Tabela 3: Freqüência absoluta e relativa do desempenho em matemática e dos possíveis fatores associados a ele.

Variável Categoria Freqüência Absoluta

Freqüência Relativa

masculino 768 43,90% sexo

feminino 983 56,10% não branco 1193 68,10%

raça branco 558 31,90%

até 20 livros 965 55,10% livros

mais de 20 livros 786 44,90% Não fazem 269 15,40%

lição Fazem 1482 84,60% Repetiu 531 30,30%

repetiu Não repetiu 1220 69,70%

Não completou o ensino fundamental. 271 15,50% escolaridade da mãe Pelo menos o ensino fundamental completo 1480 84,50%

Não completou o ensino fundamental. 352 20,10% escolaridade do pai Pelo menos o ensino fundamental completo 1399 79,90%

Sim 96 5,50% abandono

Não 1655 94,50% Não 103 5,90% mãe sabe ler Sim 1648 94,10% Não 90 5,10% pai sabe ler Sim 1661 94,90%

Menos de 50 1968 18,70% escore 50 ou mais 8538 81,30%

Não 62 42,80% quadra Sim 83 57,20% Não 110 75,90% laboratório de

informática Sim 35 24,10% Não 46 31,70% biblioteca Sim 99 68,30% Não 135 93,10% laboratório de ciências Sim 10 6,90%

4hs ou menos 34 23,40% Entre 4 e 5hs 107 73,80% Entre 5 e 6hs 2 1,40%

horas-aula

Mais que 6hs 2 1,40% Menor que 15 alunos 0 0,00% Entre 15 e 30 alunos 26 17,90% Entre 30 e 45 alunos 112 77,30%

tamanho da turma

Mais que 45 alunos 7 4,80% Menos de 25% 22 15,20%

Entre 25% e 50% 18 12,40% Entre 50% e 75% 47 32,40%

docentes com curso superior

Mais de 75% 58 40,00% Fonte: Cedeplar/ Inep (2005)

250

Conforme Tabela 3, variáveis que apresentaram acima de 90% de freqüência

para uma mesma categoria - conforme acontece com as variáveis mãe e pai

sabem ler, já abandonou a escola e presença de laboratório de ciências – não

foram utilizadas no modelo. Essa variabilidade baixa fez com que essas

variáveis, previamente testadas no modelo, fossem não significativas ou

apresentassem um sentido não esperado para seu coeficiente, como foi o

caso da variável laboratório de ciências.

Para a definição do calendário letivo, considerou-se que o ano letivo contém 10

meses, levando-se em conta as férias. Como a pesquisa tem sua primeira

rodada em primeiro de abril de 1999, esta será tomada como base (baseline).

A segunda rodada foi realizada em primeiro de novembro de 1999, oito meses

após a primeira. E todas as rodadas seguintes foram realizadas com um

intervalo de um ano. Para identificar cada período de acordo com os intervalos

entre as rodadas e usando como base abril de 1999 e o calendário com 10

meses, as rodadas foram classificadas da seguinte forma:

• Abr/ 1999 = 0 – base;

• Nov/1999 = 0,8 – referente aos 08 meses entre as rodadas;

• Nov/ 2000 = 1,8 – referente aos 10 meses letivos entre as

rodadas;

• Nov/ 2001 = 2,8 – referente aos 10 meses letivos entre as

rodadas;

• Nov/ 2002 = 3,8 – referente aos 10 meses letivos entre as

rodadas;

• Nov/ 2003 = 4,8 – referente aos 10 meses letivos entre as

rodadas.

251

ESPECIFICAÇÃO TEÓRICA E RESULTADOS PARA O MODELO INCONDICIONAL

O primeiro modelo estimado foi o modelo incondicional, nomenclatura adotada

pelo livro HLM para informar que este modelo não apresenta nenhuma variável

preditora no nível 2 ou no nível 3, somente incluindo no nível 1, as variáveis

relacionadas ao tempo, série e série ao quadrado. Este modelo permite o

cálculo de estatísticas, por meio das quais é possível determinar o percentual

da variabilidade de π0 (status inicial médio de um aluno) , π1(taxa linear média

do crescimento do desempenho de um aluno), π2(taxa não-linear média de

crescimento de um aluno), que são devidos à variabilidade entre as escolas.

Na seção 2.1 abaixo, é apresentada a especificação teórica do modelo

incondicional, uma adaptação da especificação contida no livro de

RAUDENBUSH & BRYK (2002). Sendo assim, segue-se a mesma

nomenclatura para um modelo sem variáveis independente, exceto pelas

variáveis relativas ao tempo (série e série ao quadrado), presentes no nível 1.

A especificação teórica apresentada, a seguir ,contém a equação do modelo

completo e uma equação para cada um dos três níveis especificados

separadamente.

ESPECIFICAÇÃO TEÓRICA DO MODELO INCONDICIONAL

Modelo completo

Y=γ000+γ100(serie)+γ200(serie2)+[e+u00+r0+u10(serie)+r1(serie)+u20(serie)+r2(serie

2)]

Nível 1

Y= π0+π1(serie)+π2(serie2)+e

252

Nível 2

π0=β00+r0

π1=β10+r1

π2=β20+r2

Nível 3

β00=γ000+u00

β10=γ100+u10

β20=γ200+u20

em que:

Y é o desempenho de um aluno em sua escola num determinado período; γ000

representa o status inicial médio das escolas (Abril de 1999); β00 é o status

inicial médio de uma determinada escola:

β00=γ000+u00

π0 significa o status inicial médio de um determinado aluno:

π0=β00+r0

γ100 é a taxa linear média de crescimento anual das escolas; β10 é a taxa

linear média anual de crescimento de uma determinada escola; π1 representa

a taxa linear média de crescimento anual de determinado aluno:

π1=β10+r1

γ200 é a taxa não-linear média de crescimento anual das escolas; β20 significa a

taxa não-linear média anual de crescimento de uma determinada escola e π2 é

a taxa não-linear média de crescimento anual de determinado aluno:

π2=β20+r2

Os erros aleatórios e, rs e us são, respectivamente, termos aleatórios dos níveis

1,2 e 3.

253

Este tipo de modelo pressupõe independência entre os erros de nível 1, que

são normalmente distribuídos com média zero e variância constante σ2,

(RAUDENBUSH & BRYK, 2002). Contudo, para os erros dos níveis 2 e 3, o

pressuposto é de que eles sejam, respectivamente, dependentes. Vale, ainda,

ressaltar que, para esses mesmos autores, modelos deste tipo podem assumir

várias formas complexas de estrutura de erro.

RESULTADOS PARA O MODELO INCONDICIONAL

Modelo Completo

Y=51,35+4,78 (série) -0,50(serie2)+[e+u00+r0 + ((u10+ r1)(serie))+((u20+

r2)(serie2))]

Nível 1

Y= 51,35+u00+r0+(4,78+u10+r1(serie))+(-0,50+u20+r2(serie2))+e

Nível 2

π0=51,35+u00+r0

π1=4,78+u10+ r1

π2=-0,50+u20+r2

Nível 3

β00=51,35+u00

β10=4,78+u10

β20= -0,50+u20

A tabela 4 mostra os resultados da estimação do modelo incondicional e a

tabela 5, o cálculo do ganho médio anual do rendimento de um aluno de uma

série para outra.

254

Tabela 4: Resultados do Modelo Incondicional

Efeitos Fixos Coeficiente Erro padrão Estat. t Graus de

liberdade Valor p

Status inicial médio do aluno, π0 Status inicial médio da escola, β00 Status inicial médio das escolas, γ000 51,35 0,36 140,77 144 0,000 Taxa média de crescimento do aluno, π1 Taxa média de crescimento da escola, β10 Taxa média de crescimento das escolas, γ100 4,78 0,15 32,78 144 0,000 Taxa não linear média de crescimento do aluno, π2 Taxa não linear média de crescimento da escola, β20 Taxa não linear média de crescimento das escolas, γ200 -0,50 0,03 -15,12 144 0,000

Efeitos Aleatórios Comp. da variância

Desvio padrão

Estat. 2χ

Graus de liberdade Valor p

Nível 1 - e 24,21 4,92 - - -

Nível 2 (alunos dentro das escolas) Status inicial individual, r0 39,43 6,28 3937,21 1606 0,000

Taxa de aprendizagem anual individual, r1 2,58 1,61 1974,23 1606 0,000 Taxa não linear de aprendizagem anual individual, r2 0,18 0,43 2131,29 1606 0,000

Nível 3 (entre as escolas) Status médio das escolas, u00 12,90 3,59 538,69 144 0,000

Taxa de crescimento médio das escolas, u10 1,00 1,00 233,53 144 0,000 Taxa não linear de crescimento médio das escolas, u20 0,06 0,25 255,80 144 0,000

Fonte: Cedeplar/ Inep (2005)

255

De acordo com a Tabela 4, que mostra os resultados para o modelo

incondicional, a habilidade ou status inicial médio apresentado pelo aluno em

abril de 1999 foi de 51,35 pontos, numa escala de scores correspondente à

distribuição normal com média 50 e desvio padrão 10. Por sua vez, a taxa

linear média de crescimento no rendimento do aluno de uma série para outra

foi de 4,78 pontos, enquanto sua taxa não linear média de crescimento

apresenta um valor negativo de 0,50. Assim, pode-se dizer que, em média, um

aluno ganha 4,28 pontos no seu escore de uma série (ou período) para a

seguinte.

No final da Tabela 4 são apresentados os resultados referentes aos efeitos

aleatórios no modelo incondicional. Estes resultados sugerem que existe

variação aleatória significativa no status inicial médio, na taxas, linear e não

linear, médias de crescimento em ambos os níveis 2 e 3. Em outras palavras,

os efeitos aleatórios dos níveis 2 e 3 são significativamente diferentes de zero,

sendo, portanto, importantes na explicação do percentual da variabilidade do

status inicial, da taxa linear e da taxa não linear que pode ser explicado pela

variabilidade entre as escolas.

Assim, por meio do modelo incondicional, é possível calcular a porcentagem da

variação do status inicial que é explicada pela variabilidade entre as escolas,

conforme a equação (1)

(1) %65,2410043,3990,12

90,12100)()(

)(

000

00 ≅×+

=×+ rVaruVaruVar

em que, Var(u00) é a variância do status inicial médio entre as escolas; Var(r0) é

a variância do status inicial médio dentro das escolas.

Então, pode-se dizer que 24,65% da variação total do status inicial é explicada

pela variabilidade entre as escolas.

256

Por meio do modelo incondicional, também, é possível calcular a porcentagem

da variação da taxa linear de crescimento que é explicada pela variabilidade

entre as escolas. Essa porcentagem é dada conforme equação (2):

(2) %93,2710058,200,1

00,1100)()(

)(

110

10 ≅×+

=×+ rVaruVaruVar

em que, Var(u10) é a variância da taxa linear média de crescimento entre as

escolas; Var(r1) é a variância da taxa linear média de crescimento dentro das

escolas.

Assim, pode-se concluir que 27,93% da variação total da taxa linear média de

aprendizagem do aluno de uma série para a seguinte é explicada pela

variabilidade entre as escolas.

Através do modelo incondicional é possível, ainda, calcular a porcentagem da

variação da taxa não linear de crescimento que é explicada pela variabilidade

entre as escolas. Essa porcentagem é dada segundo a equação (3):

)3( %2510018,006,0

06,0100)()(

)(

220

20 ≅×+

=×+ rVaruVaruVar

em que, Var(u20) é a variância da taxa não linear média de crescimento entre

as escolas; Var(r2) é a variância da taxa não linear média de crescimento

dentro das escolas.

Então, um quarto (ou 25%) da variação total da taxa não linear média de

aprendizagem do aluno de uma série para a seguinte é explicada pela

variabilidade entre as escolas.

Portanto, essas três estatísticas são mais um meio para se confirmar a

importância da presença do nível 3 no modelo, ou seja, a importância da

variabilidade entre as escolas na explicação da variabilidade de cada um dos

três coeficientes presentes no nível 1- status inicial médio, taxa linear média de

crescimento e taxa não linear média de crescimento.

257

A Tabela 5 e o Gráfico 2 mostram os rendimentos médios acrescidos ao score

do aluno por período, ou seja, de uma série para a seguinte. Na coluna do

ganho marginal anual constante na Tabela 5, observa-se uma diminuição na

taxa de crescimento ao longo do tempo, o que vai ao encontro com o formato

esperado de uma curva de aprendizagem – taxas de crescimento cada vez

menores, tendendo à estabilidade no final do processo.

O gráfico 2 permite uma melhor visualização deste comentário, mostrando,

mais uma vez, que a curva estimada dos ganhos anuais apresenta estrutura

similar ao padrão de uma curva de aprendizagem típica. Assim, um aluno,

concluindo a quarta série, que possui um rendimento médio de 54,82 pontos

em novembro de 1999, alcança um rendimento médio de 60,78 pontos, ao

concluir a sexta série em novembro de 2001.

A partir deste período, o crescimento se torna bem menor, de forma que

concluindo a oitava série seu rendimento médio aumenta em aproximadamente

2 pontos em relação ao rendimento atingido na conclusão da sexta série,

enquanto o crescimento médio alcançado entre a quarta e a sexta séries é de

aproximadamente 6 pontos.

Tabela 5: Modelo Incondicional - Cálculo do ganho médio de rendimento de um aluno de uma série para outra

Modelo γ100 série γ200 série2 γ100 (série)+[γ200(série2)] Ganho anual

Ganho marginal por ano

γ000+Ganho anual (1) Rendimento médio

Abr/Nov99 4,78 0,80 -0,50 0,64 3,50 3,50 54,82 Nov99/00 4,78 1,80 -0,50 3,24 6,98 3,48 58,30 Nov00/01 4,78 2,80 -0,50 7,84 9,46 2,48 60,78 Nov01/02 4,78 3,80 -0,50 14,44 10,94 1,48 62,26 Nov02/03 4,78 4,80 -0,50 23,04 11,42 0,48 62,74

Fonte: Cedeplar/ Inep (2005) Nota: (1) Para o primeiro período, o ganho não é anual, ma sim entre os meses de abril e novembro do ano de 1999.

258

Gráfico 2: Escores médios de matemática dos alunos de trajetória completa com os valores estimados de acordo com o modelo

incondicional

nov/99

nov/00

nov/01

nov/02 nov/03

abr-9950

55

60

65

70

Período

Esco

res

Escore modelado

O gráfico 3 apresenta uma comparação entre as médias dos escores dos

alunos de trajetória completa, mostradas na tabela 1, e os escores obtidos para

os alunos por meio da estimação do modelo incondicional, apesar das perdas

de alunos e/ou escolas, em função da organização do banco de dados para a

estimação dos modelos. Os resultados obtidos através da estimação dos

modelos estão mais próximos daqueles esperados de uma curva de

aprendizagem – ganhos positivos, mas a taxas decrescentes tendendo à

estabilidade no final do processo - quando comparados aos resultados da

análise descritiva.

Fonte: Cedeplar/ Inep (2005)

259

Gráfico 3: Comparação entre as médias dos escores de matemática dos alunos de trajetória completa e os valores estimados de acordo

com o modelo incondicional

nov/99

nov/00

nov/01

nov/02 nov/03

abr-9950

55

60

65

70

Período

Esco

res

Escore modelado Escore descritivo

Fonte: Cedeplar/ Inep (2005)

260

PROCEDIMENTO ADOTADO PARA A ESTIMAÇÃO DO MODELO FINAL, SUAS ESPECIFICAÇÕES E RESULTADOS

PROCEDIMENTO ADOTADO PARA A ESTIMAÇÃO DO MODELO FINAL

O procedimento adotado para a estimação do modelo final foi esquematizado

da seguinte forma. No primeiro passo, foram acrescentadas variáveis do nível

3, uma a uma, no modelo incondicional. No segundo passo, foi estimado um

modelo, contendo as variáveis que se apresentaram significativas no primeiro

passo. No terceiro passo, um procedimento análogo ao do nível 3 foi utilizado

para se estimar o nível 2 do modelo, de forma que as variáveis referentes a

esse nível foram consideradas, uma a uma. No caso da primeira variável se

mostrar significativa, entraria uma segunda variável juntamente com a primeira

e, assim, sucessivamente, até que o modelo final fosse estimado.

ESPECIFICAÇÃO TEÓRICA DO MODELO FINAL

Modelo Completo

Y=γ000+γ001(tam_turma)+γ010(sexo)+γ020(lição)+γ030(repetiu)+[γ100(serie)+γ110(se

xo)(serie)]+[γ200(serie2)+γ210(sexo)(serie2)+γ220(lição)(serie2)+γ230(repetiu)(seri

e2)]+[e+u00+r0+u10(serie)+r1(serie)+u20(serie2)+r2(serie2)]

Nível 1

Y=π0+π1(serie)+π2(serie2)+e

261

Nível 2

π0=β00+β01(sexo)+β02(lição)+β03(repetiu)+r0

π1=β10+β11(sexo)+r1

π2=β20+β21(sexo)+β22(lição)+β23(repetiu)+r2

Nível 3

β00=γ000+γ001(tam_turma)+u00

β01=γ010

β02=γ020

β03=γ030

β10=γ100+u10

β11=γ110

β20=γ200+u20

β21=γ210

β22=γ220

β23=γ230

RESULTADOS DO MODELO FINAL

Modelo Completo

Y=55,26 –0,18(tam_turma) –1,05(sexo)+1,47(lição)+2,57(repetiu) +[5,11(serie)-

0,57(sexo)(serie)]+[0,66(serie2)+0,09(sexo)(serie2)+0,06(lição)(serie2)+0,09(re

petiu)(serie2)]+[e+u00+r0+u10(serie)+r1(serie)+u20(serie2)+r2(serie2)]

262

Nível 2

π0=55,26–0,18(tam_turma)+u00 -1,05(sexo)+1,47(lição)+2,57(repetiu)+r0

π1=5,11+u10 –0,57(sexo)+r1

π2=-0,66+u20+0,09(sexo)+0,06(lição) +0,09(repetiu)+r2

Nível 3

β00=55,26 –0,18(tam_turma)+u00

β01=-1,05

β02=1,47

β03=2,57

β10=5,11+u10

β11=-0,57

β20=-0,66+u20

β21=0,09

β22=0,06

β23=0,09

A tabela 6 apresenta os resultados da estimação do modelo final. No modelo

final, a variável sexo se mostrou significativa na explicação do status inicial

médio do aluno, da taxa linear média de crescimento e da taxa não linear

média de crescimento.

Conforme a Tabela 6, pode-se dizer que se o aluno for homem, não fizer lição

e tiver repetido de ano, ele apresentará, em média, uma habilidade ou status

incial de 55,26-0,18(tam_turma). Considerando que o tamanho médio da turma

em sua escola seja de 35 alunos, seu status inicial médio seria de 48,96. Sua

taxa linear média de crescimento de aprendizagem entre as séries (ou

períodos) seria de 5,11 pontos. E, este aluno apresentaria, ainda, uma taxa

não linear média de crescimento de -0,66, totalizando, em média, um

crescimento de 4,45 (5,11-0,66) pontos no seu rendimento de um período para

o seguinte.

263

Comparando o mesmo caso para as mulheres, o sexo feminino apresentará um

status inicial médio inferior ao do sexo masculino em 1,05 pontos (47,91). A

taxa linear média de crescimento para as mulheres foi de 4,54 (5,11-0,57),

portanto, também, inferior àquela apresentada pelo sexo masculino. Contudo, o

sexo feminino apresenta uma taxa não linear de crescimento de –0,57 (-

0,66+0,09), sendo assim, menos negativa que a do sexo masculino. Entretanto

os resultados para esta taxa não são suficientes para que as mulheres

apresentem um desempenho superior ao dos homens.

Fazer lição aumenta o status médio do aluno em 1,47 pontos, assim como sua

taxa não linear de crescimento em 0,06 pontos. Resultado análogos foram

encontrado para a variável repetiu, indicando que não repetir de ano está

associado positivamente ao status médio do aluno, aumentando-o em 2,57

pontos. Por sua vez, a taxa não linear média de crescimento aumenta em 0,09,

caso o aluno não tenha repetido de ano. Conforme estes últimos resultados,

pode-se dizer que fazer lição de casa e não repetir de ano é importante para

que o aluno apresente um melhor rendimento escolar.

Assim, como não repetir de ano está associado positivamente a um melhor

desempenho escolar, este resultado está sugerindo que a repetência pode não

ser tão eficaz, quanto se pensava que ela fosse. Para exemplificar, considere

dois alunos na quarta série em 1999, um repetente e o outro não repetente. Se

existe diferença significativa entre seus escores, conforme resultados do

modelo, isto pode indicar que a repetência não foi tão eficaz, a ponto de fazer

com que essa diferença não fosse significativa. Portanto, a repetência não

deve ser considerada a principal alternativa, mas sim uma das possíveis

alternativas na busca pela melhoria do desempenho.

Os resultados para o nível 3, conforme Tabela 6, mostram que o tamanho

médio das turmas nas escolas está associado negativamente com o status

inicial médio de sua escola. Assim, quanto maior o tamanho médio da turma

em sua escola, menor será o desempenho deste aluno. Considerando um

aluno, em que o tamanho médio de alunos por turma em sua escola seja 35,

conforme a média encontrada nas estatísticas descritivas, mostradas na Tabela

2, referentes às variáveis quantitativas consideradas na estimação dos

modelos, este aluno perderá 6,3 (-0,18*35) pontos em seu status inicial.

264

As tabelas 7 e 8 apresentam, respectivamente, um exemplo do cálculo do

ganho médio do rendimento para os sexos feminino e masculino entre os

períodos, na situação em que ambos os sexos fizeram lição, não repetiram de

ano e estudavam em escola com tamanho médio de turma de 35 alunos.

Assim, maiores detalhes sobre a comparação entre os rendimentos femininos e

masculinos podem ser vistos nestas tabelas e em seus gráficos

correspondentes.

A Tabela 7 mostra, um passo a passo, para o cálculo do rendimento médio

feminino de um período (ou série) para o seguinte. Na última parte desta

tabela, estão, respectivamente, calculados o ganho anual, o ganho marginal

por ano e o rendimento médio. Dessa forma, uma aluna - que faz lição, nunca

repetiu de ano e estuda em escola com tamanho médio de turma de 35 alunos

– apresenta um ganho entre abril e novembro de 1999, concluindo a quarta

série, de 3,36 pontos no escore, atingindo um ganho acumulado de 9,42 pontos

no final da sexta série, em novembro de 2001. A partir desse período, os

ganhos são bem menores, conforme pode ser constatado na coluna de ganho

marginal. Entre novembro de 2001 e novembro de 2003, quando os alunos

estavam concluindo a oitava série, o acréscimo no escore foi de apenas 2,70

num período de dois anos letivos. Assim, enquanto as alunas obtiveram um

ganho de 6,06 pontos no escore entre a quarta e sexta série, o ganho obtido no

escore entre a sexta e a oitava série foi de apenas 2,70 pontos.

Analogamente, a mesma interpretação pode ser feita para a Tabela 8 que

mostra o cálculo do ganho anual, do ganho marginal e do rendimento médio

masculino. Entretanto, vale salientar que apesar do sexo masculino ter um

rendimento muito próximo ao feminino durante a quarta série, respectivamente,

3,36 e 3,76, ao longo do tempo, conforme mostram a Tabela 8 e o Gráfico 4, os

homens tendem a apresentar um rendimento médio cada vez maior ao longo

do tempo.

O Gráfico 4 mostra, ainda, que a maior diferença entre os escores de homens

e mulheres concentra-se entre 2000 e 2002, quando o sexo masculino

praticamente mantém uma diferença de aproximadamente 2 pontos no escore

em relação ao do sexo feminino. Contudo, a estrutura das curvas é bastante

semelhante.

265

Tabela 6: Resultados do Modelo Final Efeitos Fixos Coeficiente Erro padrão Estat. t Graus de liberdade Valor p status inicial médio do aluno, π0 status inicial médio da escola, β00 Status inicial médio das escolas, γ000 55,26 1,94 28,50 143 0,000 Tamanho médio da turma no ensino fundamental, γ001 -0,18 0,05 -3,31 143 0,001 sexo, β01 Associação entre sexo e status inicial médio do aluno, γ010 -1,05 0,42 -2,52 1747 0,012 lição, β02 Associação entre lição e status inicial médio do aluno, γ020 1,47 0,51 2,87 1747 0,005 repetiu, β03 Associação entre repetiu e status inicial médio do aluno, γ030 2,57 0,36 7,16 1747 0,000 taxa média de crescimento do aluno, π1 taxa média de crescimento da escola, β10 Taxa média de crescimento das escolas, γ100 5,11 0,19 27,28 144 0,000 sexo, β11 Associação entre sexo e taxa de crescimento do aluno, γ110 -0,57 0,23 -2,52 1749 0,012 taxa não linear média de crescimento do aluno, π2 taxa não linear média de crescimento da escola, β20 Taxa não linear média de crescimento das escolas, γ200 -0,66 0,05 -13,29 144 0,000 sexo, β21 Associação entre sexo e taxa não linear média de crescimento do aluno, γ210

0,09 0,04 1,96 1747 0,049

lição, β22 Associação entre lição e taxa não linear média de crescimento do aluno, γ220

0,06 0,03 2,21 1747 0,027

repetiu, β23 Associação entre repetiu e taxa não linear média de crescimento do aluno, γ230

0,09 0,02 4,12 1747 0,00

Fonte: Cedeplar/ Inep (2005)

266

Tabela 6: Resultados do Modelo Final (continuação) Efeitos Aleatórios Comp. da

variância Desvio padrão Estat.

2χ Graus de liberdade Valor p Nível 1 – e 24,21 4,92 - - - Nível 2 (alunos dentro das escolas)

Status inicial individual, r0 37,55 6,13 3962,71 1603 0,000 Taxa de aprendizagem anual individual, r1 2,49 1,58 1966,51 1605 0,000

Taxa não linear de aprendizagem anual individual, r2 0,17 0,42 2113,84 1603 0,000 Nível 3 (entre as escolas)

Status médio das escolas, u00 11,13 3,34 499,72 143 0,000 Taxa de crescimento médio das escolas, u10 1,03 1,01 225,27 144 0,000

Taxa não linear de crescimento médio das escolas, u20 0,06 0,25 256,57 144 0,000 Fonte: Cedeplar/ Inep (2005)

267

Tabela 7: Modelo Final - Cálculo do rendimento médio feminino de uma série para outra - Matemática Modelo

Final γ100 γ110 Sexo feminino série [γ100+ γ110 (sexo)]*(série)

P1*(série) Abr/Nov99 5,11 -0,57 1,00 0,80 3,63 Nov99/00 5,11 -0,57 1,00 1,80 8,17 Nov00/01 5,11 -0,57 1,00 2,80 12,71 Nov01/02 5,11 -0,57 1,00 3,80 17,25 Nov02/03 5,11 -0,57 1,00 4,80 21,79 Modelo

Final γ200 γ210 Sexo

feminino γ220 Fez

lição γ230 Não

repetiu série2[γ200+γ210*(sexo)+γ220*(lição)+γ230*(nãorepetiu)]*(série2)

P2*(série2) Abr/Nov99 -0,66 0,09 1,00 0,06 1,00 0,09 1,00 0,64 -0,27 Nov99/00 -0,66 0,09 1,00 0,06 1,00 0,09 1,00 3,24 -1,36 Nov00/01 -0,66 0,09 1,00 0,06 1,00 0,09 1,00 7,84 -3,29 Nov01/02 -0,66 0,09 1,00 0,06 1,00 0,09 1,00 14,44 -6,06 Nov02/03 -0,66 0,09 1,00 0,06 1,00 0,09 1,00 23,04 -9,68 Modelo

Final Ganho anual Ganho marginal por ano

π0 +Ganho anual (1) Rendimento médio

Abr/Nov99 3,36 3,36 56.31 Nov99/00 6,81 3,45 59.76 Nov00/01 9,42 2,61 62.37 Nov01/02 11,19 1,77 64.14 Nov02/03 12,12 0,93 65.07

Fonte: Cedeplar/ Inep (2005) Nota: (1)Para o primeiro período, o ganho não é anual, ma sim entre os meses de abril e novembro do ano de 1999.

268

Tabela 8: Modelo Final - Cálculo do rendimento médio masculino de uma série para outra - Matemática Modelo

Final γ100 γ110 Sexo masculino série [γ100+γ110*(sexo)]*(série)

P1*(série) Ab/Nov99 5,11 -0,57 0,00 0,80 4,09 Nov99/00 5,11 -0,57 0,00 1,80 9,20 Nov00/01 5,11 -0,57 0,00 2,80 14,31 Nov01/02 5,11 -0,57 0,00 3,80 19,42 Nov02/03 5,11 -0,57 0,00 4,80 24,53 Modelo

Final γ200 γ210Sexo

masculino γ220Fez

lição γ230Não

repetiu série2[γ200+γ210*(sexo)+γ220*(lição)+γ230*(nãorepetiu)]*(série2)

P2*(série2) Ab/Nov99 -0,66 0,09 0,00 0,06 1,00 0,09 1,00 0,64 -0,33 Nov99/00 -0,66 0,09 0,00 0,06 1,00 0,09 1,00 3,24 -1,65 Nov00/01 -0,66 0,09 0,00 0,06 1,00 0,09 1,00 7,84 -4,00 Nov01/02 -0,66 0,09 0,00 0,06 1,00 0,09 1,00 14,44 -7,36 Nov02/03 -0,66 0,09 0,00 0,06 1,00 0,09 1,00 23,04 -11,75

Modelo Final

Ganho anual Ganho marginal por ano

π0 +Ganho anual (1) Rendimento médio

Ab/Nov99 3,76 3,36 57.76 Nov99/00 7,55 3,78 61.55 Nov00/01 10,31 2,76 64.31 Nov01/02 12,05 1,74 66.05 Nov02/03 12,78 0,72 66.78

Fonte: Cedeplar/ Inep (2005) Nota: (1) Para o primeiro período, o ganho não é anual, ma sim entre os meses de abril e novembro do ano de 1999.

269

Gráfico 4: Comparação dos rendimentos médios em matemática por sexo entre abril de 1999 e novembro de 2003

nov/99

nov/00

nov/01

nov/02nov/03

abr-99

50

55

60

65

70

Período

Esco

res

Ganho Feminino Ganho Masculino

Fonte: Cedeplar/ Inep (2005)

270

INFORMAÇÕES SOBRE O BANCO DE DADOS E AS VARIÁVEIS UTILIZADAS NO PROCESSO DE ESTIMAÇÃO DOS FATORES ASSOCIADOS AO DESEMPENHO ESCOLAR NA DISCIPLINA DE PORTUGUÊS.

A base de dados utilizada nos modelos é a mesma dos modelos de

matemática, possuindo informações de escolas, alunos, professores e diretores

de seis Unidades da Federação: Pará (PA), Rondônia (RO), Pernambuco,

Sergipe (SE), Goiás (GO) e Mato Grosso do Sul (MS). Esta base tem um

desenho longitudinal para o acompanhamento de uma coorte de alunos ao

longo do tempo, com a principal finalidade de estimar os fatores determinantes

do desempenho escolar.

Esses dados correspondem a cinco anos de pesquisa em seis períodos

diferentes. A primeira e a segunda rodadas foram realizadas com alunos que

cursavam a 4ª série do ensino fundamental no ano de 1999, sendo a primeira

realizada em primeiro de Abril e a segunda, em primeiro de Novembro de1999.

A partir de 2000, as rodadas foram sempre realizadas em primeiro de

novembro do referente período. Assim, na terceira rodada em primeiro de

novembro de 2000 foram pesquisados os alunos da quinta série e assim,

sucessivamente até a sexta rodada em 2003 para os alunos da 8ª série.

Para estimar os modelos de português, foi adotada a mesma opção, quando se

estimou os modelos para a disciplina de matemática. Dessa forma foram

selecionados para a estimação dos modelos os alunos de trajetória completa,

ou seja, alunos que estiveram presentes ao longo de todas as seis rodadas

realizadas pela pesquisa. A Tabela 1 mostra algumas estatísticas descritivas –

o total de alunos, a média, o desvio padrão, o máximo e o mínimo - para os

alunos que completaram, ou não, a trajetória na disciplina de português.

271

Tabela 1: Estatísticas descritivas dos alunos que completaram, ou não, a trajetória entre abril/1999 e novembro/2003 – Português

Trajetória Incompleta Nº de alunos Média Desvio Padrão Mínimo Máximo

abril/99 10649 49,77 8,99 24,81 73,74 nov/99 8607 48,52 10,06 25,35 76,86 2000 13488 54,36 9,28 28,62 78,55 2001 13246 56,60 9,02 30,68 78,02 2002 10171 56,85 10,22 30,99 82,97 2003 8098 60,65 10,55 33,51 83,39

Trajetória Completa abril/99 1975 52,31 8,62 24,81 73,74 nov/99 1975 51,72 9,93 25,35 76,86 2000 1975 56,88 8,99 28,62 78,55 2001 1975 57,98 8,78 31,47 78,02 2002 1975 58,04 10,46 32,41 82,97 2003 1975 61,46 10,78 33,51 83,39

Fonte: Cedeplar/ Inep (2005)

Gráfico 4: Média dos escores equalizados de português por trajetória

Nov/1999

2003

200220012000

Abr/1999

40,00

45,00

50,00

55,00

60,00

65,00

Período

Esco

re m

édio

Completa Incompleta

Fonte: Cedeplar/ Inep (2005)

272

Como se pode notar, por meio da Tabela 1, o número de alunos que

completaram a trajetória é bem menor, também como aconteceu em

matemática, quando comparado ao número dos que não estiveram presentes

em alguma rodada da pesquisa. Conforme já era esperado, o gráfico 4 mostra

que o desempenho dos alunos que participaram das seis rodadas é superior ao

dos demais, uma vez que os alunos que completaram a trajetória podem ter

repetido no máximo até a 4ª série. Entretanto, vale salientar que a estrutura

das duas curvas é muito similar, apesar destas curvas estarem menos

próximas ao que se espera de uma curva de aprendizagem - ganhos

decrescentes ao longo do período com tendência à estabilidade no final do

processo – do que às de matemática, em função do comportamento do

primeiro e do último período.

O software utilizado para estimar os modelos foi o HLM. Como este software

não aceita valores em branco (missings) nos arquivos de nível 2 e 3, houve

uma perda de 115 alunos e 31 escolas. Assim, o banco passou a contar com

1860 e 145 escolas. Como o software HLM somente identifica uma escola para

cada aluno, optou-se por retirar do banco alunos que mudaram de escola

durante a pesquisa. Assim, foram retirados também 43 alunos e 2 escolas, de

forma que o banco final para a estimação dos fatores associados ao

desempenho em matemática totaliza 1817 alunos em 143 escolas.

A Tabela 2 mostra algumas estatísticas descritivas para as variáveis

quantitativas que foram consideradas na estimação dos modelos. A variável

sco, como era de se esperar, uma vez que tem uma distribuição normal com

média 50 e desvio padrão 10, apresentou, respectivamente, um mínimo de em

torno de 20 (24,81) e um máximo em torno de 90 (83,39) pontos. O número de

horas-aula por dia variou entre 3,6 e 7,4. Por sua vez, o menor tamanho médio

de turma por escola foi de 21,56 alunos, enquanto o maior valor chegou a

51,38 alunos. No caso de percentual de professores com curso superior a

amplitude foi de 100%, indicando portanto que em relação a este quesito,

existe escola que não tem professor com curso superior, em contraste com

escola em que todos os professores apresentam pelo menos curso superior,

como aconteceu em matemática.

273

Tabela 2: Estatísticas Descritivas das Variáveis Numéricas Utilizadas nos Modelos da disciplina de Português

Variável Nº de Casos Média Desvio

Padrão Mínimo Máximo

Escore 10902 56,35 10,26 24,81 83,39 Horas-Aula 143 4,34 0,47 3,6 7,4

Tamanho da Turma 143 35,16 5,6 21,56 51,38 Docentes com Curso

Superior 143 61,99 28,72 0 100

Fonte: Cedeplar/ Inep (2005)

O quadro 1 mostra a descrição das variáveis e suas categorias

correspondentes, utilizadas no processo de estimação dos modelos de

português. Essas variáveis estão divididas por níveis correspondentes aos

modelos hierárquicos longitudinais.

274

QUADRO 1 Variáveis consideradas na estimação dos modelos hierárquicos longitudinais

Nível 1 Variáveis Significado Categorias

sco Escore modificado = (escore equalizado x 10) + 50

serie Série

serie2 Série elevada ao quadrado

Nível 2 sexo Você é do sexo: 0 – Masculino 1 – Feminino

raca Você se considera: 0 – Não-branco 1 – Branco

livros Quantos livros há em sua casa? 0 – 20 ou menos 1 – Mais de 20

licão Você faz lição de casa? 0 – Não 1 – Sim

repetiu Já repetiu de ano alguma vez? 0 – Sim 1 – Não

mãe_ler Sua mãe sabe ler? 0 – Não 1 – Sim

pai_ler Seu pai sabe ler? 0 – Não 1 – Sim

abandonou Já abandonou a escola por pelo menos um ano?

0 – Sim 1 – Não

esc_pai Até que ano seu pai estudou?

0 - Não completou o ensino fundamental. 1 - Pelo menos o ensino fundamental completo

esc_mae Até que ano sua mãe estudou?

0 - Não completou o ensino fundamental. 1 - Pelo menos o ensino fundamental completo

Nível 3 horas-aula Número Médio de Horas-Aula Diária no Ensino Fundamental

tam_turma Número Médio de Alunos por Turma Total no Ensino Fundamental

doc_superior Percentual de Docentes com Curso Superior no Ensino Fundamental

bibliote Se a escola tem biblioteca. 0 – Não 1 – Sim

labcien Se a escola tem laboratório de ciências.

0 – Não 1 – Sim

labinfo Se a escola tem laboratório de informática.

0 – Não 1 – Sim

quadra Se a escola tem quadra. 0 – Não 1 – Sim

Fonte: Cedeplar/ Inep (2005)

275

Assim sendo, o nível 1 contempla as habilidades dos alunos estimadas

(calibradas) e equalizadas, de acordo com a teoria da resposta ao item.

Posteriormente, esta variável resposta teve sua distribuição transformada numa

normal com média 50 e desvio-padrão 10. Além da variável resposta, no nível 1

também se encontram variáveis relacionadas ao tempo. Neste trabalho, essas

variáveis correspondem à série cursada e a uma transformação dessa variável,

série ao quadrado, para tentar captar a não linearidade do ganho no

desempenho relativo ao processo de aprendizagem.

No nível 2, encontram-se variáveis relacionadas a características familiares e

individuais, que se espera não sofrerem variações significativas com o tempo.

E por fim, o nível 3 compreende variáveis qualitativas e quantitativas

relacionadas às escolas. Vale ressaltar que as variáveis do terceiro nível foram

retiradas do censo escolar de 2001, com exceção da quadra que faz parte do

censo escolar do ano de 2000.

Conforme Tabela 3, variáveis que apresentaram acima de 90% de freqüência

para uma mesma categoria - conforme acontece com as variáveis mãe e pai

sabem ler, já abandonou a escola e presença de laboratório de ciências – não

foram utilizadas na estimação dos modelos de português. Essa variabilidade

baixa fez com que essas variáveis, previamente testadas no modelo, fossem

não significativas.

276

Tabela 3: Freqüência absoluta e relativa do desempenho em português e dos possíveis fatores associados a ele.

Variável Categoria Freqüência Absoluta

Freqüência Relativa

masculino 808 44,50% sexo

feminino 1009 55,50% não branco 1233 67,90%

raça branco 584 32,10%

até 20 livros 1000 55,00% livros

mais de 20 livros 817 45,00% Não fazem 259 14,30%

lição Fazem 1558 85,70% Repetiu 535 29,40%

repetiu Não repetiu 1282 70,60%

Não completou o ensino fundamental. 283 15,60% escolaridade da mãe Pelo menos o ensino fundamental completo 1534 84,40%

Não completou o ensino fundamental. 367 20,20% escolaridade do pai Pelo menos o ensino fundamental completo 1450 79,80%

Sim 81 4,50% abandono

Não 1736 95,50% Não 96 5,30% mãe sabe ler Sim 1721 94,70% Não 108 5,90% pai sabe ler Sim 1709 94,10%

Menos de 50 2880 26,40% escore 50 ou mais 8022 73,60%

Não 61 42,70% quadra Sim 82 57,30% Não 109 76,20% laboratório de

informática Sim 34 23,80% Não 45 31,50% biblioteca Sim 98 68,50% Não 133 93,00% laboratório de

ciências Sim 10 7,00% 4hs ou menos 34 23,80% Entre 4 e 5hs 105 73,40% Entre 5 e 6hs 2 1,40%

horas-aula

Mais que 6hs 2 1,40% Menor que 15 alunos 0 0,00% Entre 15 e 30 alunos 25 17,50% Entre 30 e 45 alunos 111 77,60%

tamanho da turma

Mais que 45 alunos 7 4,90% Menos de 25% 22 15,40%

Entre 25% e 50% 18 12,60% Entre 50% e 75% 46 32,20%

docentes com curso superior

Mais de 75% 57 39,90%

Fonte: Cedeplar/ Inep (2005)

277

Para a definição do calendário letivo, considerou-se que o ano letivo contém 10

meses, levando-se em conta as férias. Como a pesquisa tem sua primeira

rodada em primeiro de abril de 1999, esta será tomada como base (baseline).

A segunda rodada foi realizada em primeiro de novembro de 1999, oito meses

após a primeira. E todas as rodadas seguintes foram realizadas com um

intervalo de um ano. Para identificar cada período de acordo com os intervalos

entre as rodadas e usando como base abril de 1999 e o calendário com 10

meses, as rodadas foram classificadas da seguinte forma:

• Abr/ 1999 = 0 – base;

• Nov/1999 = 0,8 – referente aos 08 meses entre as rodadas;

• Nov/ 2000 = 1,8 – referente aos 10 meses letivos entre as

rodadas;

• Nov/ 2001 = 2,8 – referente aos 10 meses letivos entre as

rodadas;

• Nov/ 2002 = 3,8 – referente aos 10 meses letivos entre as

rodadas;

• Nov/ 2003 = 4,8 – referente aos 10 meses letivos entre as

rodadas.

278

ESPECIFICAÇÃO TEÓRICA E RESULTADOS PARA O MODELO INCONDICIONAL

O primeiro modelo estimado foi o modelo incondicional, nomenclatura adotada

pelo livro HLM para informar que este modelo não apresenta nenhuma variável

preditora no nível 2 ou no nível 3, somente incluindo no nível 1, as variáveis

relacionadas ao tempo, série e série ao quadrado. Este modelo permite o

cálculo de estatísticas, por meio das quais é possível determinar o percentual

da variabilidade de π0 (status inicial médio de um aluno) , π1(taxa linear média

do crescimento do desempenho de um aluno), π2(taxa não-linear média de

crescimento de um aluno), que são devidos à variabilidade entre as escolas.

Na seção 3.1 a seguir, é apresentada a especificação teórica do modelo

incondicional, uma adaptação da especificação contida no livro de

RAUDENBUSH & BRYK (2002). Sendo assim, segue-se a mesma

nomenclatura para um modelo sem variáveis independente, exceto pelas

variáveis relativas ao tempo (série e série ao quadrado), presentes no nível 1.

A especificação teórica apresentada para a disciplina de português, conforme

aquela apresentada em matemática,contém a equação do modelo completo e

uma equação para cada um dos três níveis especificados separadamente.

279

ESPECIFICAÇÃO TEÓRICA DO MODELO INCONDICIONAL

Modelo completo

Y=γ000+γ100(serie)+γ200(serie2)+[e+u00+r0 +u10(serie)+r1(serie)+u20(serie)+

r2(serie2)]

Nível 1

Y=π0+π1(serie)+π2(serie2)+e

Nível 2

π0=β00+r0

π1=β10+r1

π2=β20+r2

Nível 3

β00=γ000+u00

β10=γ100+u10

β20=γ200+u20

em que:

Y é o desempenho de um aluno em sua escola num determinado período; γ000

representa o status inicial médio das escolas (Abril de 1999); β00 é o status

inicial médio de uma determinada escola:

β00=γ000+u00

π0 significa o status inicial médio de um determinado aluno:

π0=β00+r0

280

γ100 é a taxa linear média de crescimento anual das escolas; β10 é a taxa

linear média anual de crescimento de uma determinada escola; π1 representa

a taxa linear média de crescimento anual de determinado aluno:

π1=β10+r1

γ200 é a taxa não-linear média de crescimento anual das escolas; β20 significa a

taxa não-linear média anual de crescimento de uma determinada escola e π2 é

a taxa não-linear média de crescimento anual de determinado aluno:

π2=β20+r2

Os erros aleatórios e, rs e us são, respectivamente, termos aleatórios dos níveis

1,2 e 3.

Este tipo de modelo pressupõe independência entre os erros de nível 1, que

são normalmente distribuídos com média zero e variância constante σ2,

(RAUDENBUSH & BRYK, 2002). Contudo, para os erros dos níveis 2 e 3, o

pressuposto é de que eles sejam, respectivamente, dependentes. Vale, ainda,

ressaltar que, para esses mesmos autores, modelos deste tipo podem assumir

várias formas complexas de estrutura de erro.

RESULTADOS PARA O MODELO INCONDICIONAL

A tabela 4 mostra os resultados da estimação do modelo incondicional que não

convergiu com o número máximo de iterações especificado pelo HLM.

Por sua vez, a Tabela 5 e 6 mostram, respectivamente, os resultados da

estimação do modelo incondicional “sem forçar” a convergência e o cálculo do

ganho médio anual do rendimento de um aluno de uma série para outra.

281

Tabela 4: Resultados do Modelo Incondicional

Efeitos Fixos Coeficiente Erro padrão Estat. t Graus de

liberdade Valor p

Status inicial médio do aluno, π0 Status inicial médio da escola, β00 Status inicial médio das escolas, γ000 51,41 0,33 154,67 142 0,000 Taxa média de crescimento do aluno, π1 Taxa média de crescimento da escola, β10 Taxa média de crescimento das escolas, γ100 2,36 0,17 13,52 142 0,000 Taxa não linear média de crescimento do aluno, π2 Taxa não linear média de crescimento da escola, β20 Taxa não linear média de crescimento das escolas, γ200 -0,08 0,04 -2,31 142 0,021

Efeitos Aleatórios Comp. da variância

Desvio padrão

Estat. 2χ

Graus de liberdade Valor p

Nível 1 -e 31,45 5,61 - - -

Nível 2 (alunos dentro das escolas) Status inicial individual, r0 45,47 6,74 4283,34 1674 0,000

Taxa de aprendizagem anual individual, r1 0,77 0,88 1709,83 1674 0,265 Taxa não linear de aprendizagem anual individual, r2 0,00 0,05 1765,03 1674 0,060

Nível 3 (entre as escolas) Status médio das escolas, u00 8,81 2,97 374,00 142 0,000

Taxa de crescimento médio das escolas, u10 1,90 1,38 271,94 142 0,000 Taxa não linear de crescimento médio das escolas, u20 0,09 0,31 304,50 142 0,000

Fonte: Cedeplar/ Inep (2005)

282

Tabela 5: Resultados do Modelo Incondicional

Efeitos Fixos Coeficiente Erro padrão Estat. t Graus de

liberdade Valor p

Status inicial médio do aluno, π0 Status inicial médio da escola, β00 Status inicial médio das escolas, γ000 51,48 0,33 156,03 142 0,000 Taxa média de crescimento do aluno, π1 Taxa média de crescimento da escola, β10 Taxa média de crescimento das escolas, γ100 2,27 0,17 13,36 10899 0,000 Taxa não linear média de crescimento do aluno, π2 Taxa não linear média de crescimento da escola, β20 Taxa não linear média de crescimento das escolas, γ200 -0,07 0,04 -1,89 10899 0,058

Efeitos Aleatórios Comp. da variância

Desvio padrão

Estat. 2χ

Graus de liberdade Valor p

Nível 1 - e 36,94 6,08 - - -

Nível 2 (alunos dentro das escolas) Status inicial individual, r0 48,07 6,93 7254,42 1674 0,000

Taxa de aprendizagem anual individual, r1 - - - - - Taxa não linear de aprendizagem anual individual, r2 - - - - -

Nível 3 (entre as escolas) Status médio das escolas, u00 9,89 3,14 469,91 142 0,000

Taxa de crescimento médio das escolas, u10 - - - - - Taxa não linear de crescimento médio das escolas, u20 - - - - -

Fonte: Cedeplar/ Inep (2005)

283

Modelo Completo

Y=51,48+2,27(serie) –0,07(serie2)+[e+u00+r0]

Nível 1

Y=51,48+u00+r0+2,27(serie) –0,07(serie2)+e

Nível 2

π0=51,48+u00+r0

π1=2,27

π2=-0,07

Nível 3

β00=51,48+u00

β10=2,27

β20=-0,07

284

Tabela 6: Modelo Incondicional - Cálculo do ganho médio de rendimento de um aluno de uma série para outra

Modelo γ100 série γ200 série2 γ100 (série)+[γ200(série2)]

Ganho anual

Ganho marginal por ano

γ000 + Ganho anual (1)

Rendimento médio

Abr/Nov99 2,27 0,80 -0,07 0,64 1,77 1,77 53,25

Nov99/00 2,27 1,80 -0,07 3,24 3,86 2,09 55,34

Nov00/01 2,27 2,80 -0,07 7,84 5,81 1,95 57,29

Nov01/02 2,27 3,80 -0,07 14,44 7,62 1,81 59,10

Nov02/03 2,27 4,80 -0,07 23,04 9,28 1,67 60,76

Fonte: Cedeplar/ Inep (2005)

Nota: (1) Para o primeiro período, o ganho não é anual, mas sim entre os meses de abril e novembro do ano de 1999.

De acordo com a Tabela 5, que mostra os resultados para o modelo

incondicional, a habilidade ou status inicial médio apresentado pelo aluno em

abril de 1999 foi de 51,48 pontos, numa escala de scores correspondente à

distribuição normal com média 50 e desvio padrão 10. Por sua vez, a taxa

linear média de crescimento no rendimento do aluno de uma série para outra

foi de 2,27 pontos, enquanto sua taxa não linear média de crescimento

apresenta um valor negativo de 0,07. Assim, pode-se dizer que, em média, um

aluno ganha 2,20 pontos no seu escore de uma série (ou período) para a

seguinte.

No final da Tabela 5 são apresentados os resultados referentes aos efeitos

aleatórios no modelo incondicional. Estes resultados sugerem que existe

variação aleatória significativa somente no status inicial médio. Em outras

palavras, os efeitos aleatórios relacionados ao status inicial nos níveis 2 e 3

são significativamente diferentes de zero, não sendo, portanto, importantes na

285

explicação do percentual da variação do status inicial que pode ser explicado

pela variabilidade entre as escolas.

Portanto, essa estatística é mais um meio para se confirmar a importância da

presença do nível 3 no modelo, ou seja, a importância da variabilidade entre as

escolas na explicação da variabilidade do status inicial médio.

A Tabela 6 e o Gráfico 2 mostram os rendimentos médios acrescidos ao score

do aluno por período, ou seja, de uma série para a seguinte. Na coluna do

ganho marginal anual constante na Tabela 6, observa-se, em gera, uma taxa

de crescimento cada vez maior ao longo do tempo, indicando um crescimento

linear e cada vez maior no caso do desempenho em português.

O gráfico 2 permite uma melhor visualização deste comentário, mostrando,

mais uma vez, que a curva estimada dos ganhos anuais apresenta estrutura

linear, não tão próxima ao padrão de uma curva de aprendizagem típica,

mostrando entretanto um formato “ideal” de crescimento linear positivo. Assim,

um aluno, concluindo a quarta série, que possui um rendimento médio de 53,25

pontos em novembro de 1999, alcança um rendimento médio de 57,29 pontos,

ao concluir a sexta série em novembro de 2001.

A partir deste período, o crescimento não se torna menor como em

matemática, de forma que concluindo a oitava série seu rendimento médio

aumenta em aproximadamente 3,5 pontos em relação ao rendimento atingido

na conclusão da sexta série, enquanto o crescimento médio alcançado entre a

quarta e a sexta série atinge aproximadamente 4 pontos.

286

Gráfico 2: médias dos escores de português dos alunos de trajetória completa de acordo com o modelo incondicional

nov/99

nov/00

nov/01

nov/02

nov/03

abr-99

50

55

60

65

70

Período

Esco

re M

édio

Escore Modelado

O gráfico 3 apresenta uma comparação entre as médias dos escores dos

alunos de trajetória completa, mostradas na tabela 1, e os escores obtidos para

os alunos por meio da estimação do modelo incondicional, apesar das perdas

de alunos e/ou escolas, em função da organização do banco de dados para a

estimação dos modelos. Os resultados obtidos através da estimação dos

modelos estão bem mais próximos daqueles esperados de uma curva de

aprendizagem, quando comparados aos resultados da análise descritiva.

Fonte: Cedeplar/ Inep (2005)

287

Gráfico 3: Comparação entre as médias dos escores de português dos alunos de trajetória completa e os valores estimados de acordo

com o modelo incondicional

nov/99

nov/00

nov/01

nov/02

nov/03

nov/99

nov/01 nov/02

abr-99

nov/00

abr-99

50

55

60

65

70

Período

Esco

re M

édio

Escore Modelado Escore Descritivo

Fonte: Cedeplar/ Inep (2005)

288

PROCEDIMENTO ADOTADO PARA A ESTIMAÇÃO DO MODELO FINAL, SUAS ESPECIFICAÇÕES E RESULTADOS

PROCEDIMENTO ADOTADO PARA A ESTIMAÇÃO DO MODELO FINAL

O procedimento adotado para a estimação do modelo final foi esquematizado

da seguinte forma. No primeiro passo, foram acrescentadas variáveis do nível

3, uma a uma, no modelo incondicional. No segundo passo, foi estimado um

modelo, contendo as variáveis que se apresentaram significativas no primeiro

passo. No terceiro passo, um procedimento análogo ao do nível 3 foi utilizado

para se estimar o nível 2 do modelo, de forma que as variáveis referentes a

esse nível foram consideradas, uma a uma. No caso da primeira variável se

mostrar significativa, entraria uma segunda variável juntamente com a primeira

e, assim, sucessivamente, até que o modelo final fosse estimado.

ESPECIFICAÇÃO TEÓRICA DO MODELO FINAL

Modelo Completo

Y=γ000+γ010(sexo)+γ020(lição)+ γ030(repetiu)+γ040(esc_mae)+ [γ100(serie)+

γ110(sexo)(serie)]+[γ200(serie2)+γ201(labinfo)(serie2)+γ210(sexo)(serie2)+

γ220(repetiu)(serie2)]+[e+u00+r0]

Nível 1

Y=π0+π1(serie)+π2(serie2)+e

289

Nível 2

π0=β00+β01(sexo)+β02(lição)+β03(repetiu)+β04(esc_mae)+r0

π1=β10+β11(sexo)

π2=β20+β21(sexo)+β22(repetiu)

Nível 3

β00=γ000+u00

β01=γ010

β02=γ020

β03=γ030

β04=γ040

β10=γ100

β11=γ110

β20=γ200+γ201(labinfo)

β21=γ210

β22=γ220

290

RESULTADOS DO MODELO FINAL

Modelo Completo

Y=45,27+1,55(sexo)+2,89(lição)+2,91(repetiu)+0,93(esc_mae)+

[1,82(serie)+0,81(sexo)(serie)]+[-0,09(serie2)+0,10(labinfo)(serie2)–0,10

(sexo)(serie2)+0,08(repetiu)(serie2)]+[e+u00+r0]

Nível 2

π0=45,27+u00+1,55(sexo)+2,89(lição)+2,91(repetiu)+0,93(esc_mae)+r0

π1=1,82+0,81(sexo)

π2=-0,09+0,10(labinfo)-0,10(sexo)+0,08(repetiu)

Nível 3

β00=45,27+u00

β01=1,55

β02=2,89

β03=2,91

β04=0,93

β10=1,82

β11=0,81

β20=-0,09+0,10(labinfo)

β21=-0,10

β22=0,08

A tabela 7 apresenta os resultados da estimação do modelo final. No modelo

final, a variável sexo se mostrou significativa na explicação do status inicial

291

médio do aluno, da taxa linear média de crescimento e da taxa não linear

média de crescimento. Fazer lição aumenta o status médio do aluno, enquanto

que não repetir aumenta além do status inicial do aluno, sua taxa não linear de

crescimento. Estes resultados encontrados para a variável repetiu, indicam que

não repetir de ano está associado positivamente ao status médio do aluno e à

sua taxa não linear média de crescimento. Conforme estes últimos resultados,

pode-se dizer que fazer lição de casa e não repetir de ano é importante para

que o aluno apresente um melhor rendimento escolar. No modelo final de

português, a variável escolaridade da mãe também foi significativa na

explicação do status inicial médio do aluno

Assim, como não repetir de ano está associado positivamente a um melhor

desempenho escolar, este resultado está sugerindo que a repetência pode não

ser tão eficaz, quanto se pensava que ela fosse. Para exemplificar, considere

dois alunos na quarta série em 1999, um repetente e o outro não repetente. Se

existe diferença significativa entre seus escores, conforme resultados do

modelo, isto pode indicar que a repetência não foi tão eficaz, a ponto de fazer

com que essa diferença fosse não significativa. Portanto, conforme dito

anteriormente, a repetência não deve ser considerada a principal alternativa,

mas sim uma das possíveis alternativas na busca pela melhoria do

desempenho.

Os resultados para o nível 3, conforme Tabela 7, mostram que a presença de

laboratório de informática nas escolas está associada positivamente com a taxa

não linear média de crescimento na aprendizagem de português.

As tabelas 8 e 9 apresentam, respectivamente, um exemplo do cálculo do

ganho médio do rendimento na disciplina de português para os sexos feminino

e masculino entre os períodos, na situação em que ambos os sexos fizeram

lição, não repetiram de ano e estudavam em escola com laboratório de

informática. Assim, maiores detalhes sobre a comparação entre os rendimentos

femininos e masculinos podem ser vistos nestas tabelas e em seus gráficos

correspondentes.

A Tabela 8 mostra, um passo a passo, para o cálculo do rendimento médio

feminino de um período (ou série) para o seguinte. Na última parte desta

tabela, estão, respectivamente, calculados o ganho anual, o ganho marginal

292

por ano e o rendimento médio. Dessa forma, uma aluna - que faz lição, nunca

repetiu de ano e estuda em escola com laboratório de informática – apresenta

um ganho entre abril e novembro de 1999, concluindo a quarta série, de 2,10

pontos no escore, atingindo um ganho acumulado de 7,29 pontos no final da

sexta série, em novembro de 2001. A partir de novembro de 2000, o

crescimento anual permanece aproximadamente constante, o que se traduz

num crescimento positivo linear, fazendo com que o escores do aluno esteja

sempre aumentando ao longo do tempo. Entre novembro de 2001 e novembro

de 2003, quando os alunos estavam concluindo a oitava série, o acréscimo

estimado no escore foi de 5,10, correspondente a um período de dois anos

letivos. Assim, as alunas obtiveram um ganho de 5,19 pontos no escore entre a

quarta e sexta série, ganho próximo ao obtido entre a sexta e a oitava série

(5,10).

Analogamente, a mesma interpretação pode ser feita para a Tabela 9 que

mostra o cálculo do ganho anual, do ganho marginal e do rendimento médio

masculino. Durante a quarta série o sexo masculino apresentou um rendimento

médio de 1,51. Este rendimento se mostrou inferior ao apresentado pelo sexo

feminino (2,10). Além do mais, a partir do período novembro de 1999 a

novembro de 2000 esta diferença entre os rendimentos por sexo tende a se

estabilizar, tornando a distância entre homens e mulheres aproximadamente

constante, entretanto maior que a estimada no início do processo .

293

Tabela 7: Resultados do Modelo Final

Efeitos Fixos Coeficiente Erro padrão

Estat. t Graus de liberdade

Valor p

Status inicial médio do aluno, π0 Status inicial médio da escola, β00 Status inicial médio das escolas, γ000 45,27 0,73 62,09 142 0,000 Sexo, β01 Associação entre sexo e status inicial médio do aluno, γ010 1,55 0,38 4,07 1812 0,000 Lição, β02 Associação entre lição e status inicial médio do aluno, γ020 2,89 0,55 5,29 1812 0,000 Repetiu, β03 Associação entre repetiu e status inicial médio do aluno, γ030 2,91 0,41 7,17 1812 0,000 Esc_mãe, β04 Associação entre escolaridade da mãe e status inicial médio do aluno, γ040 0,93 0,46 2,02 1812 0,043 Taxa média de crescimento do aluno, π1 Taxa média de crescimento da escola, β10 Taxa média de crescimento das escolas, γ100 1,82 0,24 7,56 10891 0,000 Sexo, β11 Associação entre sexo e taxa de crescimento do aluno, γ110 0,81 0,25 3,24 10891 0,002 Taxa não linear média de crescimento do aluno, π2 Taxa não linear média de crescimento da escola, β20 Taxa não linear média de crescimento das escolas, γ200 -0,09 (1) 0,05 -1,65 10891 0,098 Laboratório de informática, γ201 0,10 0,04 2,69 10891 0,008 Sexo, β21 Associação entre sexo e taxa não linear média de crescimento do aluno, γ210 -0,10 0,05 -1,97 10891 0,048 Repetiu, β22 Associação entre repetiu e taxa não linear média de crescimento do aluno, γ220 0,08 0,02 3,31 10891 0,001

Fonte: Cedeplar/ Inep (2005) Nota: (1) Estatisticamente diferente de zero a 10% de significância.

294

Tabela 7: Resultados do Modelo Final (continuação) Efeitos Aleatórios Comp. da

variância Desvio padrão

Estat. 2χ

Graus de liberdade

Valor p

Nível 1 – e 36,58 6,05 - - - Nível 2 (alunos dentro das escolas)

Status inicial individual, r0 43,13 6,57 7576,17 1670 0,000 Taxa de aprendizagem anual individual, r1 - - - - -

Taxa não linear de aprendizagem anual individual, r2 - - - - - Nível 3 (entre as escolas)

Status médio das escolas, u00 7,56 2,75 424,31 142 0,000 Taxa de crescimento médio das escolas, u10 - - - - -

Taxa não linear de crescimento médio das escolas, u20 - - - - - Fonte: Cedeplar/ Inep (2005)

295

Tabela 8: Modelo Final - Cálculo do rendimento médio feminino de uma série para outra - Português Modelo

Final γ100 γ110 Sexo feminino série [γ100+ γ110 (sexo)]*(série)

P1*(série) Ab/Nov99 1,82 0,81 1,00 0,80 2,10 Nov99/00 1,82 0,81 1,00 1,80 4,73 Nov00/01 1,82 0,81 1,00 2,80 7,36 Nov01/02 1,82 0,81 1,00 3,80 9,99 Nov02/03 1,82 0,81 1,00 4,80 12,62

Modelo Final γ200 γ201

Lab. Inf. γ210

Sexo Feminino γ220

Não repetiu série2

[γ200+γ201*(lab.Inf.)+γ210*(sexo)+γ220*(nãorepetiu]*(série2) P2*(série2)

Ab/Nov99 -0,09 0,10 1,00 -0,10 1,00 0,08 1,00 0,64 -0,01 Nov99/00 -0,09 0,10 1,00 -0,10 1,00 0,08 1,00 3,24 -0,03 Nov00/01 -0,09 0,10 1,00 -0,10 1,00 0,08 1,00 7,84 -0,08 Nov01/02 -0,09 0,10 1,00 -0,10 1,00 0,08 1,00 14,44 -0,14 Nov02/03 -0,09 0,10 1,00 -0,10 1,00 0,08 1,00 23,04 -0,23

Modelo Final

Ganho anual Ganho marginal por ano

π0 +Ganho anual (1) Rendimento médio

Ab/Nov99 2,10 3,36 55,66 Nov99/00 4,70 2,60 58,26 Nov00/01 7,29 2,58 60,85 Nov01/02 9,85 2,56 63,41 Nov02/03 12,39 2,54 65,95

Fonte: Cedeplar/ Inep (2005) Nota: (1) Para o primeiro período, o ganho não é anual, ma sim entre os meses de abril e novembro do ano de 1999.

296

Tabela 9: Modelo Final - Cálculo do rendimento médio masculino de uma série para outra - Português Modelo

Final γ100 γ110 Sexo Masculino série [γ100+ γ110 (sexo)]*(série)

P1*(série) Ab/Nov99 1,82 0,81 0,00 0,80 1,46 Nov99/00 1,82 0,81 0,00 1,80 3,28 Nov00/01 1,82 0,81 0,00 2,80 5,10 Nov01/02 1,82 0,81 0,00 3,80 6,92 Nov02/03 1,82 0,81 0,00 4,80 8,74

Modelo Final γ200

γ201

Lab. Inf. γ210

Sexo Masculino γ220

Não repetiu série2

[γ200+γ201*(lab.Inf.)+γ210*(sexo)+γ220*(nãorepetiu)]*(série2) P2*(série2)

Ab/Nov99 -0,09 0,10 1,00 -0,10 0,00 0,08 1,00 0,64 0,06 Nov99/00 -0,09 0,10 1,00 -0,10 0,00 0,08 1,00 3,24 0,29 Nov00/01 -0,09 0,10 1,00 -0,10 0,00 0,08 1,00 7,84 0,71 Nov01/02 -0,09 0,10 1,00 -0,10 0,00 0,08 1,00 14,44 1,30 Nov02/03 -0,09 0,10 1,00 -0,10 0,00 0,08 1,00 23,04 2,07

Modelo Final

Ganho anual Ganho marginal por ano

π0 +Ganho anual (1) Rendimento médio

Ab/Nov99 1,51 3,36 53,52 Nov99/00 3,57 2,05 55,58 Nov00/01 5,80 2,23 57,81 Nov01/02 8,22 2,41 60,23 Nov02/03 10,81 2,59 62,82

Fonte: Cedeplar/ Inep (2005) Nota: (1) Para o primeiro período, o ganho não é anual, ma sim entre os meses de abril e novembro do ano de 1999.

297

O Gráfico 3 mostra, também, uma comparação dos rendimentos médios em

português por sexo entre abril de 1999 e novembro de 2003. Em abril, os

rendimentos entre os sexos estão próximos apesar do sexo feminino

apresentar melhor desempenho. A partir de 1999 o rendimento médio do sexo

feminino se distancia do masculino, alcançando maiores níveis. Esta diferença

parece se manter aproximadamente constante a partir da conclusão da quinta

série em 2000 até o término do ensino fundamental. Entretanto, a estrutura das

curvas é praticamente a mesma.

Gráfico 3: Comparação dos rendimentos médios em português por sexo entre abril de 1999 e novembro de 2003

nov/99

nov/00

nov/01

nov/02

nov/03

abr-9945

50

55

60

65

70

Período

Esco

res

Ganho Feminino Ganho Masculino

Fonte: Cedeplar/ Inep (2005)

298

APÊNDICE DO RELATÓRIO SOBRE ESTIMAÇÃO DE MODELOS HIERÁRQUICOS LONGITUDINAIS PARA AS

DISCIPLINAS DE MATEMÁTICA E PORTUGUÊS

APRESENTAÇÃO

Conforme mencionado na introdução da ação 1.3, este relatório apresenta um

apêndice, contendo resultados de modelos estimados com alunos que

participaram de pelo menos duas rodadas da pesquisa. Mesmo sabendo dos

possíveis viéses desses modelos, em virtude da variável identificadora do

aluno ainda apresentar erros no banco de dados, foram estimados 2 modelos

para as disciplinas de matemática e de português, utilizando os alunos que

participaram de pelo menos duas rodada da pesquisa.

No primeiro modelo, tanto para matemática, quanto para português, foram

utilizadas as mesmas variáveis adotadas na estimação dos modelos para

alunos que completaram a trajetória. No segundo tipo de modelo foi

acrescentada a variável traj-incomp, variável dicotômica em que um significa

ter participado de 2 a 5 rodadas da pesquisa e zero indica os alunos de

trajetória completa.

Assim, a seguir são apresentadas as especificações teóricas dos quatro

modelos e seus respectivos resultados.

299

ESPECIFICAÇÃO TEÓRICA DO MODELO 1 PARA A DISCIPLINA DE MATEMÁTICA

Nível 1

Y=π0+π1(serie)+π2(serie2)+e

Nível 2

π0=β00+β01(sexo)+β02(lição)+β03(repetiu)+r0

π1=β10+β11(sexo)+β12(lição)+β13(repetiu)+β14(esc_pai)+r1

π2=β20+β21(lição)+β22(repetiu)+r2

Nível 3 β00=γ000+γ001(tam_turma)+u00 β01=γ010

β02=γ020

β03=γ030

β10=γ100+u10 β11=γ110

β12=γ120

β13=γ130

β14=γ140

β20=γ200+u20

β21=γ210 β22=γ220

ESPECIFICAÇÃO TEÓRICA DO MODELO 2 PARA A DISCIPLINA DE MATEMÁTICA

Nível 1

Y=π0+π1(serie)+π2(serie2)+e

Nível 2

π0=β00+β01(sexo)+β02(lição)+β03(repetiu)+r0

π1=β10+β11(sexo)+β12(lição)+β13(repetiu)+β14(esc_pai)+β15(traj_incomp)+r1

π2=β20+β21(lição)+β22(repetiu)+β23(traj_incomp)+r2

300

Nível 3 β00=γ000+γ001(tam_turma)+u00 β01=γ010

β02=γ020

β03=γ030

β10=γ100+u10 β11=γ110

β12=γ120

β13=γ130

β14=γ140

β15=γ150 β20=γ200+u20 β21=γ210 β22=γ220

β23=γ230

ESPECIFICAÇÃO TEÓRICA DO MODELO 1 PARA A DISCIPLINA DE PORTUGUÊS

Nível 1

Y=π0+π1(serie)+π2(serie2)+e

Nível 2

π0=β00+β01(sexo)+β02(lição)+β03(repetiu)+r0 π1=β10+β11(sexo)

π2=β20+β21(lição)+β22(repetiu)+r2

Nível 3

β00=γ000+u00 β01=γ010

β02=γ020

β03=γ030

β10=γ100

β11=γ110

301

β20=γ200+γ201(lab_info)+u20 β21=γ210

β22=γ220

ESPECIFICAÇÃO TEÓRICA DO MODELO 2 PARA A DISCIPLINA DE PORTUGUÊS

Nível 1

Y=π0+π1(serie)+π2(serie2)+e

Nível 2

π0=β00+β01(sexo)+β02(lição)+β03(repetiu)+β04(traj_incomp)+r0

π1=β10+β11(sexo)+β12(traj_incomp)

π2=β20+β21(lição)+β22(repetiu)+r2

Nível 3 β00=γ000+u00

β01=γ010

β02=γ020

β03=γ030

β04=γ040

β10=γ100

β11=γ110

β12=γ120

β20=γ200+γ201(lab_info)+u20 β21=γ210

β22=γ220

302

Fonte:Cedeplar/Inep(2005)

Tabela 1: Resultados do Modelo 1 para a disciplina de matemática Efeitos Fixos Coeficiente Erro

padrãoEstat. t Graus de

liberdade Valor p

Status inicial médio do aluno, π0 Status inicial médio da escola, β00 Status inicial médio das escolas, γ000 54,75 1,44 37,96 160 0,000 Tamanho da turma no ensino fundamental, γ001 -0,16 0,04 -4,13 160 0,000 Sexo, β01 Associação entre sexo e status inicial médio do aluno, γ010 -1,77 0,24 -7,22 6437 0,000 Lição, β02 Associação entre lição e status inicial médio do aluno, γ020 1,75 0,39 4,52 6437 0,000 Repetiu, β03 Associação entre repetiu e status inicial médio do aluno, γ030 2,43 0,34 7,15 6437 0,000 Taxa média de crescimento do aluno, π1 Taxa média de crescimento da escola, β10 Taxa média de crescimento das escolas, γ100 6,09 0,28 21,82 161 0,000 Sexo, β11 Associação entre sexo e taxa de crescimento do aluno, γ110 -0,16 0,06 -2,80 6436 0,006 Lição, β12 Associação entre lição e taxa de crescimento do aluno, γ120 -0,68 0,25 -2,76 6436 0,006 Repetiu, β13 Associação entre repetiu e taxa de crescimento do aluno, γ130 -0,65 0,19 -3,37 6436 0,001 Escolaridade do pai, β14 Associação entre escolaridade do pai e taxa de crescimento do aluno, γ140

0,26 0,06 4,69 6436 0,000

Taxa não linear média de crescimento do aluno, π2 Taxa não linear média de crescimento da escola, β20 Taxa não linear média de crescimento das escolas, γ200 -0,90 0,05 -18,01 161 0,000 Lição, β21 Associação entre lição e taxa não linear média de crescimento do aluno, γ210

0,20 0,05 4,38 6438 0,000

Repetiu, β22 Associação entre repetiu e taxa não linear média de crescimento do aluno, γ220

0,20 0,03 5,75 6438 0,000

303

Fonte:Cedeplar/Inep(2005)

Tabela 1: Resultados do Modelo 1 para a disciplina de matemática (continuação) Efeitos Aleatórios Comp. da

variância Desvio padrão

Estat. 2χ

Graus de liberdade

Valor p

Nível 1 – e 26,63 5,16 - - - Nível 2 (alunos dentro das escolas)

Status inicial individual, r0 34,39 5,86 9232,13 5182 0,000 Taxa de aprendizagem anual individual, r1 2,77 1,66 5754,20 5181 0,000

Taxa não linear de aprendizagem anual individual, r2 0,26 0,51 6228,66 5183 0,000 Nível 3 (entre as escolas)

Status médio das escolas, u00 7,90 2,81 615,08 160 0,000 Taxa de crescimento médio das escolas, u10 1,54 1,24 342,96 161 0,000

Taxa não linear de crescimento médio das escolas, u20 0,09 0,30 440,10 161 0,000

304

Fonte:Cedeplar/Inep(2005)

Tabela 2: Resultados do Modelo 2 para a disciplina de Matemática

Efeitos Fixos Coeficiente Erro padrão

Estat. t Graus de liberdade

Valor p

Status inicial médio do aluno, π0 Status inicial médio da escola, β00 Status inicial médio das escolas, γ000 54,75 1,42 38,43 160 0,000 Tamanho da turma no ensino fundamental, γ001 -0,16 0,04 -4,23 160 0,000 Sexo, β01 Associação entre sexo e status inicial médio do aluno, γ010 -1,77 0,25 -7,20 6437 0,000 Lição, β02 Associação entre lição e status inicial médio do aluno, γ020 1,75 0,39 4,52 6437 0,000 Repetiu, β03 Associação entre repetiu e status inicial médio do aluno, γ030 2,44 0,34 7,21 6437 0,000 Taxa média de crescimento do aluno, π1 Taxa média de crescimento da escola, β10 Taxa média de crescimento das escolas, γ100 5,64 0,28 20,17 161 0,000 Sexo, β11 Associação entre sexo e taxa de crescimento do aluno, γ110 -0,16 0,06 -2,79 6435 0,006 Lição, β12 Associação entre lição e taxa de crescimento do aluno, γ120 -0,68 0,25 -2,74 6435 0,006 Repetiu, β13 Associação entre repetiu e taxa de crescimento do aluno, γ130 -0,58 0,19 -2,99 6435 0,003 Escolaridade do pai, β14 Associação entre escolaridade do pai e taxa de crescimento do aluno, γ140

0,26 0,06 4,68 6435 0,000

Trajeto Incompleto (de 2 a 5 rodadas), β15 Associação entre trajeto incompleto e status inicial médio do aluno, γ150

0,71 0,14 5,11 6435 0,000

305

Tabela 2: Resultados do Modelo 2 para a disciplina de Matemática (continuação) Taxa não linear média de crescimento do aluno, π2 Taxa não linear média de crescimento da escola, β20 Taxa não linear média de crescimento das escolas, γ200 -0,79 0,05 -14,94 161 0,000 Lição, β21

Associação entre lição e taxa não linear média de crescimento do aluno, γ210

0,20 0,05 4,36 6437 0,000

Repetiu, β22

Associação entre repetiu e taxa não linear média de crescimento do aluno, γ220

0,19 0,03 5,28 6437 0,000

Trajeto Incompleto, β23 Associação entre trajeto incompleto e status inicial médio do aluno, γ230

-0,16 0,03 -5,27 6437 0,000

Efeitos Aleatórios Comp. da variância

Desvio padrão

Estat. 2χ

Graus de liberdade

Valor p

Nível 1 – e 26,61 5,16 - - - Nível 2 (alunos dentro das escolas)

Status inicial individual, r0 34,44 5,87 9237,73 5182 0,000 Taxa de aprendizagem anual individual, r1 2,66 1,63 5733,06 5180 0,000

Taxa não linear de aprendizagem anual individual, r2 0,25 0,50 6196,82 5182 0,000

Fonte:Cedeplar/Inep(2005)

306

Tabela 3: Resultados do Modelo 1 para a disciplina de Português Efeitos Fixos Coeficiente Erro

padrãoEstat. t Graus de

liberdade Valor p

Status inicial médio do aluno, π0 Status inicial médio da escola, β00 Status inicial médio das escolas, γ000 48,41 0,44 109,39 161 0,000 Sexo, β01 Associação entre sexo e status inicial médio do aluno, γ010 1,62 0,26 6,15 6400 0,000 Lição, β02 Associação entre lição e status inicial médio do aluno, γ020 1,66 0,33 5,04 6400 0,000 Repetiu, β03 Associação entre repetiu e status inicial médio do aluno, γ030 2,18 0,23 9,36 6400 0,000 Taxa média de crescimento do aluno, π1 Taxa média de crescimento da escola, β10 Taxa média de crescimento das escolas, γ100 2,09 0,16 12,92 26207 0,000 Sexo, β11 Associação entre sexo e taxa de crescimento do aluno, γ110 0,25 0,07 3,84 26207 0,000 Taxa não linear média de crescimento do aluno, π2 Taxa não linear média de crescimento da escola, β20 Taxa não linear média de crescimento das escolas, γ200 -0,23 0,04 -6,03 160 0,000 Laboratório de informática, γ201 0,08 0,04 2,03 160 0,042 Lição, β21 Associação entre lição e taxa não linear média de crescimento do aluno, γ210

0,07 0,02 4,40 6401 0,000

Repetiu, β22 Associação entre repetiu e taxa não linear média de crescimento do aluno, γ220

0,08 0,01 5,25 6401 0,000

Fonte:Cedeplar/Inep(2005)

307

Fonte:Cedeplar/Inep(2005)

Tabela 3: Resultados do Modelo 1 para a disciplina de Português (continuação) Efeitos Aleatórios Comp. da

variância Desvio padrão

Estat. 2χ

Graus de liberdade

Valor p

Nível 1 – e 32,34 5,71 - - - Nível 2 (alunos dentro das escolas)

Status inicial individual, r0 37,90 6,16 14240,53 6239 0,000 Taxa de aprendizagem anual individual, r1 - - - - -

Taxa não linear de aprendizagem anual individual, r2 0,04 0,20 7856,70 6240 0,000 Nível 3 (entre as escolas)

Status médio das escolas, u00 6,44 2,54 728,88 161 0,000 Taxa de crescimento médio das escolas, u10 - - - - -

Taxa não linear de crescimento médio das escolas, u20 0,03 0,18 1020,20 160 0,000

308

Tabela 4: Resultados do Modelo 2 para a disciplina de Português Efeitos Fixos Coeficiente Erro

padrãoEstat. t Graus de

liberdade Valor p

Status inicial médio do aluno, π0 Status inicial médio da escola, β00 Status inicial médio das escolas, γ000 47,66 0,50 94,70 161 0,000 Sexo, β01 Associação entre sexo e status inicial médio do aluno, γ010 1,61 0,26 6,12 6399 0,000 Lição, β02 Associação entre lição e status inicial médio do aluno, γ020 1,66 0,33 5,06 6399 0,000 Repetiu, β03 Associação entre repetiu e status inicial médio do aluno, γ030 2,30 0,23 9,95 6399 0,000 Trajeto Incompleto (de 2 a 5 rodadas), β04 Associação entre trajeto incompleto e status inicial médio do aluno, γ040

1,98 0,33 5,95 6399 0,000

Taxa média de crescimento do aluno, π1 Taxa média de crescimento da escola, β10 Taxa média de crescimento das escolas, γ100 2,04 0,16 12,56 26205 0,000 Sexo, β11 Associação entre sexo e taxa de crescimento do aluno, γ110 0,25 0,07 3,80 26205 0,000 Trajeto Incompleto, β12 Associação entre trajeto incompleto e status inicial médio do aluno, γ120

-0,45 0,07 -6,66 26205 0,000

Taxa não linear média de crescimento do aluno, π2 Taxa não linear média de crescimento da escola, β20 Taxa não linear média de crescimento das escolas, γ200 -0,18 0,04 -4,67 160 0,000 Laboratório de informática, γ201 0,08 0,04 2,07 160 0,038 Lição, β21 Associação entre lição e taxa não linear média de crescimento do aluno, γ210

0,07 0,02 4,39 6401 0,000

Repetiu, β22 Associação entre repetiu e taxa não linear média de crescimento do aluno, γ220

0,07 0,01 4,90 6401 0,000

Fonte:Cedeplar/Inep(2005)

309

Tabela 4: Resultados do Modelo 2 para a disciplina de Português (continuação) Efeitos Aleatórios Comp. da

variância Desvio padrão

Estat. 2χ

Graus de liberdade Valor p

Nível 1 – e 32,56 5,71 - - - Nível 2 (alunos dentro das escolas)

Status inicial individual, r0 37,81 6,15 14281,72 6238 0,000 Taxa de aprendizagem anual individual, r1 - - - - -

Taxa não linear de aprendizagem anual individual, r2 0,04 0,20 7847,74 6240 0,000 Nível 3 (entre as escolas)

Status médio das escolas, u00 6,33 2,51 724,73 161 0,000 Taxa de crescimento médio das escolas, u10 - - - - -

Taxa não linear de crescimento médio das escolas, u20 0,03 0,18 1003,12 160 0,000

Fonte:Cedeplar/Inep(2005)

310

1.3. – AVALIAÇÃO DO IMPACTO DA BOLSA-ESCOLA E RENDA MÍNIMA SOBRE O RENDIMENTO ESCOLAR

APRESENTAÇÃO

O cenário delineado, nas últimas décadas, para o sistema educacional

brasileiro revela importantes transformações em diversos aspectos. Destaca-se

a ampliação do acesso à escola no ensino fundamental e uma melhoria nos

níveis médios de escolarização atingidos. Entretanto, muitas lacunas ainda se

fazem notar. A escolaridade média, mensurada em termos de anos médios de

estudo, ainda se encontra abaixo da alcançada por diversos países em

desenvolvimento, enquanto persistem acentuadas desigualdades,

principalmente regionais, em termos de acesso a oportunidades educacionais

(MARTELETO, 2002).

As mudanças demográficas, principalmente a queda nos níveis de

fecundidade, a partir da década de 1970, têm proporcionado uma diminuição

proporção de população em idade de cursar a educação primária, de tal sorte

que a falta de escolas parece não ser o principal problema do sistema brasileiro

de educação e maior atenção deve ser dada a questões como a qualidade da

educação e à repetência (FLETCHER & RIBEIRO, 1987; KLEIN, 1995). Abre-

se um cenário onde assume crucial importância a investigação de aspectos

ligados à qualidade, eficácia e rendimento escolar.

Por outro lado, têm se observado uma preocupação, por parte dos órgãos

governamentais com questões ligadas à educação de crianças provenientes de

famílias de baixa renda, principalmente visando a permanência na escola, por

meio de incentivo financeiro, buscando contribuir para a melhoria das

condições de vida no seio dessas famílias e, conseqüentemente, no país.

Nesse sentido, iniciativas vêm sendo desenvolvidas visando quebrar o círculo

da transmissão intergeracional da pobreza, via educação.

311

Além da ampliação do acesso ao ensino fundamental, o Governo Federal tem

optado pela adoção de medidas de transferência de renda que, além de

incentivar as matrículas, trazem uma preocupação com a permanência na

escola e conseqüente redução nos níveis de evasão escolar. No ano de 2001,

foi criado então o Programa Nacional do Bolsa Escola, com a proposta de

conceder benefício monetário mensal a milhares de famílias brasileiras em

troca da manutenção de suas crianças nas escolas.

O Bolsa Escola era uma política de complementação de renda familiar que

visava manter os alunos carentes na escola, impedindo a evasão causada pelo

trabalho infantil. Os dados utilizados são provenientes da Prefeitura de Recife,

entre os anos 2001 e 2004, e se referem aos que receberam, ou não, o

beneficio do programa municipal ou federal. A Prefeitura de Recife concedia o

benefício a famílias com renda per capita inferior a 1/3 de salário mínimo e que

morassem na cidade a pelo menos cinco anos. Estas recebiam entre R$100.00

e R$200.00 por mês, dependendo do número de filhos inscritos no programa.

Por sua vez, o Bolsa Escola concedido pelo governo federal pagava R$15.00

por mês para cada filho entre 6 e 15 anos, até o limite de três filhos por família.

Com a unificação dos programas sociais no ano de 2004, realizada pelo

Ministério do Desenvolvimento Social, o Bolsa Escola se uniu ao Auxílio Gás,

ao Cartão Alimentação e ao Bolsa Alimentação para constituir o Bolsa Família.

A reunião destes benefícios em um único programa tem como objetivo

melhorar a focalização da população alvo, além de realizar uma

complementação de renda mais consistente, uma vez que os valores pagos

isoladamente eram relativamente baixos.

Pouco tem sido feito no sentido de se analisar o enorme potencial informativo

dos bancos de dados gerados a partir dos cadastros construídos no

desenvolvimento de tais programas e menos ainda tem sido feito no sentido de

tentar investigar o impacto de tais programas nos resultados escolares

alcançados pelos alunos beneficiados.

312

OBJETIVOS

O objetivo principal desse trabalho é avaliar o impacto da bolsa escola e renda

mínima sobre o rendimento escolar de alunos do sistema educacional da

cidade do Recife.

ASPECTOS METODOLÓGICOS

BASE DE DADOS

A base de dados do programa bolsa escola municipal de Recife é constituída

por três bancos de dados:

CADASTRO (SEBE) - este banco de dados possui as informações dos alunos

que foram selecionados para os programas bolsa escola municipal e bolsa

escola federal. As informações contidas compreendem o período de 2001 a

2004. No caso do bolsa escola municipal, quando o aluno é selecionado passa

automaticamente a receber o benefício. Portanto, todos os alunos selecionados

para o bolsa escola municipal são alunos que recebem este benefício. No caso

do programa bolsa escola federal, o aluno é selecionado, mas, a apropriação

(se vai receber ou não o benefício) é feita pelo governo federal.

Este banco de dados, inicialmente, foi criado para atender as demandas do

bolsa escola municipal, passou por várias alterações, tais como a inclusão de

informações sobre o bolsa escola federal, e cadastro único do bolsa escola

federal. Cabe ressaltar que este banco de dados ainda se encontra em fase de

padronização e formatação das informações nele contidas.

PAGAMENTO E FREQUÊNCIA - Estes bancos de dados possuem

informações referentes ao pagamento de benefícios ao aluno, seja ele

municipal ou federal. Atualmente, a Prefeitura de Recife é quem coordena o

pagamento do bolsa escola federal. Estas bases de dados ainda não se

encontram disponíveis para os usuários interessados, portanto, as análises que

dependiam de seu conteúdo deverão ficar para uma etapa posterior.

313

Por outro lado, a base de dados, referente à pesquisa “Avaliação de

Desempenho: Fatores Associados” contemplando o período entre 1999 e 2003,

contém informações sobre o rendimento escolar dos alunos, sobre questões

sócio-econômicas dos alunos, professores e diretores, além de informações

sobre a infra-estrutura das escolas, dentre outras. Os escores foram estimados

e equalizados de acordo com a Teoria da Resposta ao Item, para que estando

em uma mesma escala, esses escores pudessem ser diretamente

comparáveis.

A etapa posterior constou na “linkagem” dos bancos de dados do bolsa escola

e da base de dados longitudinal “Avaliação de Desempenho: Fatores

Associados”.

MÉTODOS UTILIZADOS

Nessa primeira abordagem do problema foram desenvolvidas análises

descritivas e exploratórias dos dados sobre rendimento escolar, considerando o

fato do aluno receber, ou não, o benefício do bolsa família. A variável utilizada

para representar a informação sobre o programa foi categorizada em três

respostas, segundo o tipo de benéfico recebido: federal, municipal ou nenhum

tipo de benefício.

Modelos de análise de variância não foram estimados, porque os valores dos

testes de hipóteses poderiam estar contaminados por violações no modelo,

principalmente quanto à independência das observações, uma vez que alguns

dos alunos investigados pertencem a uma mesma escola. Tal fato levaria à

necessidade de uma investigação com modelos que incorporassem estes

elementos. Uma análise posterior com o uso, por exemplo, de modelos

hierárquicos, agregando um maior número de variáveis preditoras é

recomendada, o que não pode ser feito nesta etapa, em virtude da

indisponibilidade de dados que permitissem tal investigação no espaço de

tempo possível.

314

RESULTADOS DE MATEMÁTICA

ANÁLISE DESCRITIVA E EXPLORATÓRIA DOS DADOS: RESULTADOS GLOBAIS

Esta análise trata de uma abordagem preliminar dos dados, procurando

ressaltar alguns aspectos descritivos dos mesmos, tendo por base a variável

rendimento do aluno, representada pela média aritmética dos escores

estimados e equalizados, no período de 2001 a 2003, segundo a Teoria da

Resposta ao Item,

A Tabela 1 e o Gráfico 1 a seguir apresentam resultados do cruzamento dos

escores de rendimento com a variável tipo de benefício, lembrando que a

primeira foi recodificada em duas categorias de escores, compreendendo

valores baixo e acima de 60. Por outro lado, a variável tipo de benefício foi

categorizada 3 grupos: nenhum benefício; benefício federal e benefício

municipal.

Tabela 1

Número de benefícios recebidos no programa bolsa escola em Recife, por classe de escore de rendimento escolar em matemática,segundo o tipo de

benefício recebido – 2001 a 2004

Tipo debenefício < 60 >60 TotalNenhum Abs. 43 43 86

% 50,0 50,0 100,0Municipal Abs. 19 10 29

% 65,5 34,5 100,0Federal Abs. 67 62 129

% 51,9 48,1 100,0Total Abs. 129 115 244

% 52,9 47,1 100,0

Classes de escore

Fonte: Programa Bolsa Família –Recife (2005); Cedeplar/ Inep (2005).

315

Gráfico 1

Número de benefícios recebidos no programa bolsa escola em Recife, por classe de escore de rendimento escolar em matemática, segundo o tipo

de benefício recebido – 2001 a 2004

0

10

20

30

40

50

60

70

Nenhum Municipal Federal Total

<60>=60

Fonte: Programa Bolsa Família –Recife (2005); Cedeplar/ Inep (2005).

Os resultados exibem uma distribuição por classes dos escores muito

semelhante entre os que recebem benéfico federal e os que não recebem

nenhum tipo de benefício. Entre os que recebem bolsa municipal, os resultados

mostram uma maior concentração nesse grupo na categoria de escores

menores que 60, sugerindo resultados inferiores aos que não recebem nenhum

tipo de benefício.

Em seguida, foi realizada uma análise exploratória da variável escore médio,

por tipo de benefício recebido. Tais resultados são apresentados em forma de

Tabela e Gráfico 2.

316

Tabela 2

Medidas descritivas e exploratórias dos escores médiosde matemática, por tipo de benefício recebido.

Nenhum Municipal FederalMédia 59,02 58,53 59,05Tri-média(5%) 59,08 58,33 59,01Mediana 59,73 57,78 59,84Variancia 59,15 60,17 52,05Desvio padrão 7,69 7,76 7,21Mínimo 39,83 44,77 42,22Máximo 77,54 76,00 76,95Amplitude 37,71 31,23 34,73Amp. interquartil 9,57 8,75 9,66Assimetria -0,16 0,56 0,00Curtose -0,05 -0,18 -0,35

EstatísticasTipo de benefício

Fonte: Programa Bolsa Família –Recife (2005); Cedeplar/ Inep (2005).

317

Gráfico 2

Escores médios de rendimento escolar em matemática,

por tipo de benefício recebido

Fonte: Programa Bolsa Família –Recife (2005); Cedeplar/ Inep (2005).

Tais resultados descritivos e exploratórios, de modo geral, corroboram os

apresentados anteriormente, indicando uma distribuição semelhante, tanto em

termos de medidas de posição central, como de variabilidade, para os grupos

dos que não recebem nenhum tipo de benefício e aqueles que recebem

benefício federal, enquanto os que recebem benefício municipal apresentam

valores centrais ligeiramente inferiores e uma distribuição com menor nível de

variabilidade, ou seja, com valores ligeiramente mais homogêneos.

318

ANÁLISE DESCRITIVA E EXPLORATÓRIA DOS DADOS: RESULTADOS POR SEXO

Em uma tentativa de aprofundar a análise, os dados são investigados nessa

seção detalhados por sexo. Para obter resultados mais robustos, a variável tipo

de benefício foi dicotomizada considerando apenas os casos em que o aluno

recebe, ou não, qualquer tipo de benefício, agregando-se os resultados dos

que recebem bolsa municipal e federal.

A Tabela 3 apresenta resultados dos escores dicotomizados, classificados por

acesso ao benefício (recebe ou não), para cada sexo.

Tabela 3

Escores de matemática, por acesso ao benefício, segundo sexo

Escore<60 >=60 Total

Não Recebe Absoluto 17 19 36% 47,2 52,8 100,0

Recebe Absoluto 31 37 68% 45,6 54,4 100,0

Total Absoluto 48 56 104% 46,2 53,8 100,0

Não Recebe Absoluto 26 24 50% 52,0 48,0 100,0

Recebe Absoluto 54 35 89% 60,7 39,3 100,0

Total Absoluto 80 59 139% 57,6 42,4 100,0

Masculino

Feminino

Tipo

Fonte: Programa Bolsa Família –Recife (2005); Cedeplar/ Inep (2005).

319

Entre os homens, a chance de apresentar um escore superior a 60 não

apresenta grandes diferenciais entre os que recebem e os que não recebem o

benefício, sendo ligeiramente inferior para estes últimos. Foi encontrada uma

razão de chances da ordem de 1,064, ou seja, os que recebem o benefício

apresentam uma chance cerca de 6,5% superior de ter um escore maior que

60 do que os que não recebem.

Já entre as mulheres, os resultados são de certo surpreendentes, uma vez que

a chance de apresentar um escore superior a 60 é maior entre as que não

recebem benefício, correspondendo a uma razão de chances da ordem de 0,7,

ou seja, as que não recebem benefício apresentam uma chance 43% maior de

ter um escore inferior a 60 do que as que não recebem qualquer tipo de

benefício.

Uma abordagem exploratória dos dados, por sexo, é apresentada na Tabela 4,

em que se pode observar, inicialmente resultados ligeiramente inferiores para o

sexo feminino nos escores centrais de matemática. Observa-se ainda que entre

os homens há uma discreta tendência de valores centrais mais elevados entre

os que recebem algum tipo de benefício, ao contrário do grupo das mulheres,

em que se observam valores centrais ligeiramente superiores para os que não

recebem qualquer tipo de benefício, resultado já observado na investigação

anterior com dados mais agregados.

320

Tabela 4

Medidas descritivas e exploratórias dos escores médios de matemática,

por acesso ao benefício e sexo.

Masculino FemininoRecebem Não Recebem Recebem Não Recebem

Média 59,8 59,6 58,4 58,6Tri-média(5%) 59,8 59,8 58,2 58,6Mediana 60,7 60,3 58,1 59,0Variancia 54,4 67,0 52,5 54,3Desvio padrão 7,4 8,2 7,2 7,4Mínimo 42,2 39,8 44,2 42,3Máximo 76,0 77,5 76,9 75,0Amplitude 33,8 37,7 32,7 32,8Amp. interquartil 8,9 10,5 10,0 9,8Assimetria -0,1 -0,2 0,3 -0,2Curtose -0,1 0,0 -0,5 0,0

Estatísticas

Fonte: Programa Bolsa Família –Recife (2005); Cedeplar/ Inep (2005).

321

RESULTADOS DE PORTUGUÊS

ANÁLISE DESCRITIVA E EXPLORATÓRIA DOS DADOS: RESULTADOS GLOBAIS

A Tabela 5 e o Gráfico 3 apresentam resultados do cruzamento dos escores de

rendimento - classificados em duas categorias, correspondendo a escores

abaixo e acima de 60 - e a variável tipo de benefício, a princípio classificada em

3 categorias: nenhum tipo de benefício, benefício municipal e benefício federal.

Tabela 5

Número de benefícios recebidos no programa bolsa escola

em Recife, por classe de escore de rendimento escolar em português,

segundo o tipo de benefício recebido – 2001 a 2004

<60 >=60 TotalNenhum Abs. 23 13 36

% 63,9 36,1 100,0Municipal Abs. 5 3 8

% 62,5 37,5 100,0Federal Abs. 29 17 46

% 63,0 37,0 100,0Total Abs. 57 33 90

% 63,3 36,7 100,0

Classes de escoreTipo de Benefício

Fonte: Programa Bolsa Família –Recife (2005); Cedeplar/ Inep (2005).

322

Gráfico 3

Número de benefícios recebidos no programa bolsa escola em Recife, por classe de escore de rendimento escolar em português, segundo o tipo de

benefício recebido – 2001 a 2004

0,0

10,0

20,0

30,0

40,0

50,0

60,0

70,0

Nenhum Municipal Federal Total

<60>=60

Fonte: Programa Bolsa Família –Recife (2005); Cedeplar/ Inep (2005).

Inicialmente, cabe destacar uma participação mais elevada de escores abaixo

de 60 em português do que a observada nos escores de matemática. No que

tange à distribuição dos escores nas diversas categorias de tipos de benefícios,

nota-se bastante semelhança entre os resultados dos que não recebem

nenhum tipo de benefício e daqueles que recebem benefício, municipal ou

federal.

Em seguida, foi feita uma análise exploratória da variável escore médio, por

tipo de benefício recebido. Tais resultados são apresentados na Tabela 6 e

Gráfico 4.

323

Tabela 6

Medidas descritivas e exploratórias dos escores médios de português,

por tipo de benefício recebido.

Nenhum Municipal FederalMédia 56,6 55,6 57,5Tri-média(5%) 56,6 56,1 57,4Mediana 56,5 58,1 58,4Variancia 76,0 68,0 80,0Desvio padrão 8,7 8,2 8,9Mínimo 39,8 39,5 40,1Máximo 74,2 63,7 76,1Amplitude 34,4 24,2 36,0Amp. interquartil 14,5 12,8 11,6Assimetria 0,0 -1,2 -0,1Curtose -0,7 0,9 -0,2

EstatísticasTipo de benefício

Fonte: Programa Bolsa Família –Recife (2005); Cedeplar/ Inep (2005).

Gráfico 4

Escores médios de rendimento escolar em português, por tipo de benefício recebido

Fonte: Programa Bolsa Família –Recife (2005); Cedeplar/ Inep (2005).

324

A investigação exploratória dos dados indica, de modo geral, valores centrais

ligeiramente mais elevados para os que recebem algum tipo de benefício, seja

municipal ou federal, exibindo estas distribuições ainda certo grau de

assimetria positiva, ou seja, uma tendência de concentração nos escores mais

baixos; já a distribuição dos escores daqueles que não recebem benefícios

apresenta um maior grau de variabilidade, combinado com uma distribuição

ligeiramente mais simétrica.

ANÁLISE DESCRITIVA E EXPLORATÓRIA DOS DADOS: RESULTADOS POR SEXO

Em uma tentativa de aprofundar a análise, os dados são investigados nessa

seção, detalhados por sexo. Para obter resultados mais robustos, a variável

tipo de benefício foi dicotomizada considerando apenas os casos em que o

aluno recebe, ou não, qualquer tipo de benefício, agregando-se os resultados

dos que recebem bolsa municipal e federal.

A Tabela 7 apresenta resultados dos escores acima e abaixo de 60,

classificados por acesso ao benefício (recebe ou não), para cada sexo.

Tabela 7

Escores de português, por acesso ao benefício, segundo sexo

Escore<60 >=60 Total

Não Recebe Absoluto 12 4 16% 75,0 25,0 100,0

Recebe Absoluto 14 2 16% 87,5 12,5 100,0

Total Absoluto 26 6 32% 81,3 18,8 100,0

Não Recebe Absoluto 11 9 20% 55,0 45,0 100,0

Recebe Absoluto 19 18 37% 51,4 48,6 100,0

Total Absoluto 30 27 57% 52,6 47,4 100,0

TipoMasculino

Feminino

Fonte: Programa Bolsa Família –Recife (2005); Cedeplar/ Inep (2005).

325

Inicialmente, cabe destacar uma participação bem mais elevada em escores

inferiores a 60 no grupo dos homens. Nesse grupo foi encontrada uma razão

de chances da ordem de 2,33, indicando que entre os que recebem algum

benefício a chance de ter um escore inferior a 60 é cerca de 2,3 vezes superior

à daqueles que não recebem.

Entre as mulheres, os resultados se invertem, com uma razão de chances da

ordem de 0,864, sugerindo que entre as que recebem benefício, as chances de

apresentarem escores acima de 60 são aproximadamente 16% superiores do

que entre o grupo das que não recebem qualquer tipo de benefício.

Uma abordagem exploratória dos dados, por sexo, é apresentada na Tabela 8,

onde se pode observar, inicialmente resultados inferiores para o sexo

masculino nos escores centrais de português. Observam-se, ainda, que entre

os homens há uma ligeira tendência de valores centrais mais elevados para os

que não recebem qualquer tipo de benefício, ao contrário do que ocorre no

grupo das mulheres em que se observam valores centrais ligeiramente

superiores para as que recebem algum tipo de benéfico, corroborando os

resultados anteriormente observados na investigação com dados mais

agregados.

Tabela 8

Medidas descritivas e exploratórias dos escores médios de português,

por acesso ao benefício e sexo.

Recebem Não Recebem Recebem Não RecebemMédia 53,7 54,4 59,2 58,4Tri-média(5%) 53,8 54,6 59,1 58,4Mediana 55,0 55,7 58,9 57,6Variancia 68,1 60,1 67,5 85,2Desvio padrão 8,3 7,8 8,2 9,2Mínimo 40,1 39,8 41,1 43,5Máximo 66,4 66,2 76,1 74,2Amplitude 26,4 26,3 35,0 30,8Amp. interquartil 12,8 13,3 9,8 15,2Assimetria -0,6 -0,3 0,0 0,0Curtose -0,7 -0,7 -0,2 -1,0

FemininoEstatísticas

Masculino

Fonte: Programa Bolsa Família –Recife (2005); Cedeplar/ Inep (2005).

326

CONSIDERAÇÕES FINAIS

Os resultados encontrados nesta etapa do trabalho têm um caráter puramente

descritivo e exploratório e devem ser examinados à luz das limitações impostas

pela base de dados, que, ainda, não permitiu a incorporação de outros

indicadores da situação sócio-econômica dos alunos investigados. Espera-se,

com a liberação das bases de dados de pagamentos e freqüência, a ser feito

em etapa posterior, uma maior disponibilidade de dados que permitam uma

modelagem mais acurada.

Alguns dos resultados encontrados nessa investigação corroboram os

encontrados em outros estudos, ao passo que outros se revestem de certo

modo surpreendem. Inicialmente cabe destacar, de modo geral, os resultados

em matemática parecem ser melhores que os de português, pois cerca de 53%

dos escores médios foram inferiores a 60 em matemática, enquanto que em

português esse percentual foi da ordem 63,3%. Desagregados por sexo, esses

dados revelam que em matemática os escores tendem a ser melhores entre os

homens, cujo percentual de escores abaixo de 60 foi da ordem de 46,2%,

contra os 57,6% encontrados entre as mulheres. Em português, a situação se

inverte, revelando um desempenho bastante inferior dos homens, cujo

percentual de escores abaixo de 60 foi da ordem de 81,3%, contra os 52,6%

detectado entre as mulheres. No tocante ao impacto do programa bolsa escola

no rendimento escolar dos alunos, os resultados sugerem pouca ou nenhuma

influência.

A distribuição dos escores de matemática foi bastante semelhante entre os que

recebem bolsa federal e os que não recebem nenhum tipo de benefício, sendo

que nesta disciplina os resultados chegam a apresentar valores ligeiramente

inferiores para os que recebem bolsa municipal. Os escores de português

também revelam uma distribuição bastante semelhante entre os que recebem e

os que não recebem qualquer benefício.

Os resultados desagregados por sexo, revelam situações interessantes. O

exame dos resultados de matemática, revelou que entre os homens, a chance

de apresentar um escore superior a 60 foi apenas ligeiramente inferior para os

327

que recebem algum benefício. Entre as mulheres, os resultados são de certo

surpreendem, uma vez que a chance de apresentar escores mais elevados foi

maior entre as que não recebem benefício.

Os resultados de português exibem um padrão diferente. Entre os homens, os

resultados sugerem que o fato de receber algum benefício piora o rendimento,

ao contrário do que acontece no grupo das mulheres.

Esta abordagem exploratória certamente deixa muito mais questões do que

respostas, mas levantou pontos importantes a serem investigados em uma

etapa posterior, uma vez que não foram feitas investigações de natureza

inferencial.

Espera-se que alguma contribuição ao aprofundamento do tema tenha sido

dada e que uma modelagem adequada possa confirmar os resultados

exploratórios aqui encontrados.

328

AÇÃO 1.5 – ESTUDOS SOBRE A PERMANÊNCIA E TRANSIÇÕES DOS ALUNOS NO SISTEMA

EDUCACIONAL BRASILEIRO

APRESENTAÇÃO

Esta ação está subdividida em duas sub-ações. A primeira delas se refere à

análise descritiva sobre a promoção, a permanência e o aproveitamento

escolar dos alunos, de 1999 a 2003. A segunda sub-ação diz respeito à

avaliação do impacto do bolsa escola e renda mínima sobre o desempenho

escolar, no que tange à promoção, permanência escolar e aproveitamento.

Este segundo relatório foi realizado com a utilização do banco de dados

“Cadastro” enviado pela Prefeitura de Recife e com a utilização do banco de

dados “Avaliação de Desempenho: Fatores Associados” do qual foram

retirados os escores equalizados dos alunos para a análise do impacto do

bolsa escola no rendimento escolar.

329

1.1 – ANÁLISE SOBRE PROMOÇÃO, PERMANÊNCIA NA ESCOLA E APROVEITAMENTO ESCOLAR DOS

ALUNOS (4ª A 8ª SÉRIE)

APRESENTAÇÃO

Para fazer a análise proposta nesta seção foi utilizado um programa no

software SPSS para identificar quais provas os alunos fizeram. Desse modo, foi

feita uma discriminação dos alunos por provas realizadas. A classificação é

apresentada nas figuras 1 e 2 a seguir.

As figuras 1 e 2 mostram a distribuição longitudinal dos alunos entre abril de

1999 e novembro de 2003 nas provas de matemática e português. O aluno,

considerando a sua participação nas provas, foi classificado por uma letra A, B,

C, D, E ou F e um número, de 1 a 6.

Desta forma, A1 corresponde aos alunos que fizeram a prova de matemática

em abril de 1999, conforme a figura 1; o grupo A2 corresponde aos alunos A1

que fizeram a prova de novembro de 1999; o conjunto A3 são os alunos A2 que

fizeram a prova de novembro de 2000 e assim, sucessivamente, até A6.

Pode-se relacionar B2 aos alunos que participaram pela primeira vez da

pesquisa em novembro de 1999; B3 representa os alunos de B2 que fizeram a

prova de 2000. O conjunto C3 são os alunos que fizeram a prova de 2000, mas

não realizaram a prova de novembro de 1999, enquanto C4 representa o grupo

C3 que fez a prova de 2001. Por sua vez, os alunos que não fizeram a prova

de 2000, contudo participaram da prova de 2001 são representados por D4. A

analogia realizada até o grupo D4, deve, também, ser aplicada aos grupos

posteriores do esquema longitudinal presentes nas figuras 1 e 2.

330

Figura 1: Distribuição longitudinal dos alunos entre abril de 1999 e novembro de 2003 nas provas de matemática.

A1 12641A2 10026 B2 660A3 6437 B3 326 C3 8731A4 4337 B4 185 C4 4544 D4 6214A5 2963 B5 111 C5 2675 D5 2997 E5 3445A6 1987 B6 64 C6 1676 D6 1640 E6 1473 F6 3261

Fonte: Cedeplar/Inep(2005)

Figura 2: Distribuição longitudinal dos alunos entre abril de 1999 e novembro de 2003 nas provas de português.

A1 12624A2 9929 B2 653A3 6360 B3 328 C3 8775A4 4311 B4 189 C4 4551 D4 6170A5 2941 B5 116 C5 2681 D5 2973 E5 3435A6 1975 B6 72 C6 1674 D6 1625 E6 1452 F6 3275

Fonte: Cedeplar/Inep(2005)

O gráfico 1 mostra uma comparação do número de alunos em cada grupo da

pesquisa por disciplina entre abril de 1999 e novembro de 2003. Observa-se

que em todos os grupos A, D e E foram realizadas mais provas de matemática

do que de português. Já nas etapas B e C houve uma alternância entre as

disciplinas cujas provas foram realizadas por um maior número de alunos.

Somente no conjunto F as provas de português foram realizadas por uma

maior quantidade de alunos do que matemática.

331

Fonte: Cedeplar/Inep(2005)

A tabela 1 e o gráfico 2 mostram os números de alunos que fizeram prova por

ano e por disciplina entre abril de 1999 e novembro de 2003. Nota-se que a

prova de matemática foi realizada com maior freqüência pelos alunos em todos

os anos, quando comparada à freqüência com que os alunos realizaram as

provas de português.

Tabela 1: Número de alunos que fizeram prova por ano e por disciplina entre abril de 1999 e novembro de 2003

Ano Português Matemáticaabr/99 12624 12641nov/99 10582 106862000 15463 154942001 15221 152802002 12146 121912003 10073 10101

Fonte: Cedeplar/Inep(2005)

Gráfico 1: Comparação do número de alunos em cada etapa da pesquisa por disciplina entre abril de 1999 e novembro de 2003

0

2000

4000

6000

8000

10000

12000

14000

A1 A2 A3 A4 A5 A6 B2 B3 B4 B5 B6 C3 C4 C5 C6 D4 D5 D6 E5 E6 F6

Etapa da pesquisa

Núm

ero

de a

luno

s

MatemáticaPortuguês

332

Fonte: Cedeplar/Inep(2005)

As tabelas 2 e 3 mostram o percentual de alunos que realizaram as provas de

acordo com os períodos apresentados nas células destas tabelas para as

disciplinas de matemática e de português, respectivamente.

Pela análise da tabela 2, por exemplo, que contém os resultados referentes à

discilpina de matemática, observa-se que 79,31% dos alunos que realizaram a

prova de abril de 1999 fizeram a prova de novembro do mesmo ano. Do

mesmo modo, aproximadamente 28% dos que fizeram a prova de novembro de

1999 continuaram no processo até 2001. Pode-se notar, também, que apenas

15,72% dos alunos apresentaram uma trajetória completa, ou seja, fizeram

todas as provas, desde abril de 1999 a novembro de 2003.

Para a prova de português, este percentual é próximo ao observado em

matemática, visto que 15,64% dos alunos fizeram todas as provas. Em geral,

vale ressaltar que os demais percentuais são semelhantes nas duas

disciplinas.

Gráfico 2: Comparação do número de alunos por ano e por disciplina entre abril de 1999 e novembro de 2003

Apr-99

Nov-99

Nov-00 Nov-01

Nov-02

Nov-03

0

2000

4000

6000

8000

10000

12000

14000

16000

18000

Ano

Núm

ero

de a

luno

s

PortuguêsMatemática

333

Tabela 2: Percentual de alunos que realizaram as provas de acordo com os períodos mostrados nas células da tabela para a disciplina de

matemática

Período abr/99 nov/99 2000 2001 2002 nov/99 79,31% - - - -

2000 50,92% 49,39% - - -

2001 34,31% 28,03% 52,04% - -

2002 23,44% 16,82% 30,64% 48,23% -

2003 15,72% 9,70% 19,20% 26,39% 42,76%

Fonte: Cedeplar/Inep(2005)

Tabela 3: Percentual de alunos que realizaram as provas de acordo com os períodos mostrados nas células da tabela para a disciplina de

português

Período abr/99 nov/99 2000 2001 2002 nov/99 78,65% - - - -

2000 50,38% 50,23% - - -

2001 34,15% 28,94% 51,86% - -

2002 23,30% 17,76% 30,55% 48,18% -

2003 15,64% 11,03% 19,08% 26,34% 42,27%

Fonte: Cedeplar/Inep(2005)

As tabelas 4 e 5 apresentam o percentual dos alunos que fizeram prova em

dois anos consecutivos, entre abril de 1999 e novembro de 2003, por grupo em

matemática e português, respectivamente.

Por meio da tabela 4, pode-se observar, por exemplo, que 64,20% dos alunos

do grupo A fizeram prova em novembro de 1999 e de 2000. Esta foi o menor

percentual de realização de provas entre anos consecutivos, quando se

considera apenas o grupo A. Da mesma forma, observa-se que no grupo E,

aproximadamente 43% (42,76%) dos alunos que fizeram a prova em 2002

continuaram no processo em 2003.

334

Análise semelhante pode ser feita para a tabela 5, referente às provas de

português, que em geral, apresentam resultados próximos aos observados em

matemática.

Tabela 4: Percentual dos alunos que fizeram prova em dois anos consecutivos, conforme períodos especificados, por grupo em

matemática

período grupo

abr99/nov99 nov99/2000 2000/2001 2001/2002 2002/2003

A 79,31% 64,20% 67,38% 68,32% 67,06%

B - 49,39% 56,75% 60,00% 57,66%

C - - 52,04% 58,87% 62,65%

D - - - 48,23% 54,72%

E - - - - 42,76%

Fonte: Cedeplar/Inep(2005)

Tabela 5: Percentual dos alunos que fizeram prova em dois anos consecutivos, conforme períodos especificados, por grupo em português

período grupo

abr99/nov99 nov99/2000 2000/2001 2001/2002 2002/2003

A 78,65% 64,05% 67,78% 68,22% 67,15% B - 50,23% 57,62% 61,38% 62,07% C - - 51,86% 58,91% 62,44% D - - - 48,18% 54,66% E - - - - 42,27%

Fonte: Cedeplar/Inep(2005)

335

A tabela 6 mostra o número de alunos relacionados à permanência nas escolas

entre abril de 1999 e novembro de 2003 em matemática, e a tabela 7 apresenta

os percentuais correspondentes. Por meio dessas tabelas, pode-se notar três

situações nas quais os alunos podem estar inseridos: 1) aqueles que mudaram

de escola de um ano para o outro; 2) os que nela permaneceram por pelo

menos duas rodadas consecutivas; e 3) os que não fizeram prova em dois

anos consecutivos.

Pela análise desses dados, pode-se observar que o percentual de alunos que

mudaram de escola é baixo em relação aos que realizaram pelo menos duas

provas de matemática. Como pode ser notado o maior percentual de alunos

que mudaram de escola foi de 2,24% entre 2001 e 2002, o que corresponde,

em valor absoluto, a 196 alunos de 8746 que fizeram as provas.

O menor percentual de alunos que mudaram de escola foi entre abril e

novembro de 1999, como é esperado, haja vista que o ano é o mesmo. Assim,

apenas 19 alunos migraram de escola, o que representa 0,19% do total de

alunos que fizeram as duas provas.

Além disso, percebe-se que entre 2002 e 2003, houve uma diminuição do

percentual de alunos que mudaram de escola e, por conseguinte, uma

elevação do percentual de alunos que continuaram numa mesma escola.

Assim, entre 2002 e 2003, aproximadamente 0,4% dos alunos mudaram de

escola enquanto que este percentual atinge 2,24% entre os anos de 2001 e

2002, citados anteriormente. Para os alunos que não fizeram prova em dois

anos consecutivos, somente é apresentado o valor absoluto, observando-se

um número considerável de alunos nesta situação.

Tabela 6: Situação dos alunos com relação à continuidade nas escolas

entre abril de 1999 e novembro de 2003 para matemática Situação Período mudaram de escola permaneceram na escola não fizeram prova em dois

anos consecutivosabr99/nov99 19 10007 3275nov99/2000 110 6653 126542000/2001 90 8976 126422001/2002 196 8550 99792002/2003 24 6816 8612

Fonte: Cedeplar/Inep(2005)

336

Tabela 7: Percentual dos alunos com relação à continuidade nas escolas entre

abril de 1999 e novembro de 2003 para matemática

Situação Período mudaram de escola permaneceram na escola

abr99/nov99 0,19% 99,81%nov99/2000 1,63% 98,37%2000/2001 0,99% 99,01%2001/2002 2,24% 97,76%2002/2003 0,35% 99,65%

Fonte: Cedeplar/Inep(2005)

As tabelas 8 e 9 representam o número e o percentual, respectivamente, de

alunos relacionados à permanência nas escolas entre abril de 1999 e

novembro de 2003 para a disciplina de português. Por meio dessas tabelas,

observa-se que os resultados de português não variam expressivamente, se

comparados aos de matemática.

Para a disciplina de português, entre os períodos de abril de 1999 a novembro

do mesmo ano, apenas 0,11% dos alunos mudaram de escola. Os demais

percentuais são também semelhantes aos seus correspondentes na prova de

matemática, tanto que para a transição referente aos períodos de 2001 e 2002,

o percentual de mudança de alunos é de 2,25%, ocorrendo uma redução nesse

percentual para o período de 2002 e 2003, que foi de 0,35%.

Tabela 8: Situação dos alunos com relação à continuidade nas escolas entre abril de 1999 e novembro de 2003 para português

Situação Período mudaram de escola permaneceram na escola não fizeram prova em dois

anos consecutivosabr99/nov99 11 9918 3348nov99/2000 106 6582 126692000/2001 91 8960 125822001/2002 196 8515 99452002/2003 24 6775 8633

Fonte: Cedeplar/Inep(2005)

337

Tabela 9: Percentual dos alunos com relação à continuidade nas escolas entre

abril de 1999 e novembro de 2003 para português

Situação Período mudaram de escola permaneceram na escola

abr99/nov99 0,11% 99,89%nov99/2000 1,58% 98,42%2000/2001 1,01% 98,99%2001/2002 2,25% 97,75%2002/2003 0,35% 99,65%

Fonte: Cedeplar/Inep(2005)

O gráfico 3 refere-se ao percentual de alunos que mudaram de escola entre

rodadas consecutivas realizadas durante a pesquisa, no período de abril de

1999 a novembro de 2003 por disciplina. Novamente, os valores para as

provas de português e de matemática são semelhantes, podendo ser

ressaltada uma maior diferença no período referente a abril de 1999 e

novembro de 1999.

Gráfico 3: Percentual de alunos que mudaram de escola em anos consecutivos entre abril de 1999 e novembro de 2003 por disciplina

0,00%

0,50%

1,00%

1,50%

2,00%

2,50%

abr99/nov99 nov99/2000 2000/2001 2001/2002 2002/2003

Período

Perc

entu

al

PortuguêsMatemática

Fonte: Cedeplar/Inep(2005)

338

O gráfico 4 mostra uma comparação do percentual de alunos que

permaneceram na escola em anos consecutivos, entre as provas de abril de

1999 e novembro de 2003, por disciplina. Percebe-se uma certa oscilação,

mesmo que pequena, em relação aos percentuais de alunos que

permaneceram em uma mesma escola. Até 2000, português apresenta um

maior percentual de alunos que continuaram numa mesma escola em anos

consecutivos. A partir deste período, o este percentual referente à disciplina de

matemática passa a ser maior.

Gráfico 4: Percentual de alunos que permaneceram na escola em anos consecutivos entre abril de 1999 e novembro de 2003 por disciplina

96,50%

97,00%

97,50%

98,00%

98,50%

99,00%

99,50%

100,00%

100,50%

abr99/nov99 nov99/2000 2000/2001 2001/2002 2002/2003

Período

Perc

entu

al

PortuguêsMatemática

Fonte: Cedeplar/Inep(2005)

339

1.2 – AVALIAÇÃO DO IMPACTO DA BOLSA ESCOLA E RENDA MÍNIMA SOBRE O DESEMPENHO ESCOLAR

(PROMOÇÃO, PERMANÊMCIA ESCOLAR E APROVEITAMENTO)

APRESENTAÇÃO

Conforme dito anteriormente, este relatório foi realizado com a utilização do

banco de dados “Cadastro” enviado pela Prefeitura de Recife e com a

utilização do banco de dados “Avaliação de Desempenho: Fatores Associados”

do qual foram retirados os escores equalizados dos alunos para a análise do

impacto do bolsa escola no rendimento escolar.

De início, conforme a Tabela 1, é apresentada uma comparação entre as

estatísticas descritivas dos escores equalizados referentes aos alunos do

banco de dados “Avaliação de desempenho e fatores associados” (2001-2003)

e do banco de dados cadastro do programa Bolsa Escola do Recife (2001-

2004), após o merge com os escores equalizados advindos da pesquisa

Avaliação de desempenho, para a disciplina de matemática.

Sendo assim, o banco do Bolsa Escola passou a contar com 244 alunos que

participaram das provas de matemática da pesquisa “Avaliação de

desempenho e fatores associados” no período de 2001 a 2003. Por meio da

Tabela 1, pode-se observar que os escores médios desses alunos (58,98) são

menores que os escores médios quando se consideram todos os alunos do

banco de dados “Avaliação de desempenho e fatores associados” durante o

período de 2001 a 2003 (61,44). Contudo, os alunos do bolsa escola

apresentam um valor mínimo (39,83) maior do que o observado para todos

alunos que realizaram as provas de matemática entre 2001 e 2003 na pesquisa

da avaliação de desempenho.

340

Tabela 1

Estatisticas descritivas dos escores equalizados referentes aos alunos do banco de dados "Avaliação de desempenho e fatores associados" e do banco Bolsa Escola do Recife, após junção com escores equalizados

advindos da pesquisa Avaliação de desempenho -Matemática

Fonte: Cedeplar/ Inep (2005); Programa Bolsa Família –Recife (2005)

Comparação análoga à anterior para a disciplina de português pode ser vista

na Tabela 2. Neste caso, a comparação entre as estatísticas descritivas dos

escores equalizados referentes aos alunos do banco de dados “Avaliação de

desempenho e fatores associados” (2001-2003) e do banco de dados cadastro

do programa Bolsa Escola do Recife (2001-2004) mostra que novamente os

escores médios dos alunos constantes no banco de dados bolsa escola são

levemente inferiores (56,97) aos escores equalizados médios apresentados

pelos alunos da pesquisa “Avaliação de Desempenho: Fatores Associados”

(57,95). O mesmo acontece no caso do desvio padrão e dos valores máximos.

Contudo, conforme aconteceu em matemática, os alunos em português

constantes no banco bolsa escola de Recife apresentaram um valor mínimo

superior em aproximadamente 9 pontos ao valor apresentado pelos alunos que

fizeram as provas de português entre 2001 e 2003, aplicadas pela pesquisa

anteriormente citada.

Escore Frequência Média Desvio Padrão Mínimo Máximo

61.44 9.33 34.60 89.61

Bolsa Escola - 01/04 244 58.98 7.42 39.83 77.54

Avaliação de Desempenho - 01/03 37564

341

Tabela 2

Estatisticas descritivas dos escores equalizados referentes aos alunos do banco de dados "Avaliação de desempenho e fatores associados" e do banco Bolsa Escola do Recife, após junção com escores equalizados

advindos da pesquisa Avaliação de desempenho -Português

Fonte: Cedeplar/ Inep (2005); Programa Bolsa Família –Recife (2005)

A seguir são apresentadas as freqüências absolutas e relativas dos escores

equalizados referente aos alunos do banco de dados “Avaliação de

Desempenho: Fatores Associados” e aos alunos do banco Bolsa Escola do Re

cife, respectivamente para as disciplinas de matemática (Tabela 3) e português

(Tabela 4).

Tabela 3

Frequência dos escores equalizados referente aos alunos do banco de dados "Avaliação de desempenho e fatores associados" e aos alunos do

banco Bolsa Escola do Recife, após junção com escores equalizados advindos da pesquisa Avaliação de desempenho -Matemática

Fonte: Cedeplar/ Inep (2005); Programa Bolsa Família –Recife (2005)

No caso da disciplina de matemática, conforme mostra a Tabela 3, dos alunos

referentes ao programa Bolsa Escola, um percentual de 47,13 apresentam

escores médios iguais ou superiores a 60, enquanto que este percentual para

os alunos que realizaram as provas de matemática entre 2001 e 2003 foi de

Escore Frequência Média Desvio Padrão Mínimo Máximo

30.68 83.39

Bolsa Escola - 01/04 90 56.97 8.72 39.51 76.11

Avaliação de Desempenho - 01/03 37440 57.95 10.02

Escores Média Frequência PercentualMenor que 60 15621 41.59

Maior ou igual a 60 21943 58.41Total 37564 100

Menor que 60 129 52.87Maior ou igual a 60 115 47.13

Total 244 100

Avaliação de Desempenho - 01/03

Bolsa Escola - 01/04

342

58,41%. Este percentual é, portanto, superior em aproximadamente 11 pontos

ao percentual que se refere aos alunos constates no banco bolsa escola.

Tabela 4

Frequência dos escores equalizados referente aos alunos do banco de dados "Avaliação de desempenho e fatores associados" e aos alunos do

banco Bolsa Escola do Recife, após junção com escores equalizados advindos da pesquisa Avaliação de desempenho –Português

Fonte: Cedeplar/ Inep (2005); Programa Bolsa Família –Recife (2005)

Quanto à disciplina de português, apesar da diferença de percentual entre os

alunos com escores iguais ou superiores a 60 ser praticamente a mesma

(aproximadamente 11 pontos) , quando se compara os escores médios obtidos

por meio dos dois bancos de dados, há uma diferença de, também,

aproximadamente 11 pontos, quando se compara cada um desses percentuais

com os seus correspondentes em matemática. Então, comparando-se

matemática e português, pode-se dizer que os alunos apresentaram

desempenhos inferiores na disciplina de português, tanto no que se refere ao

banco de dados “Avaliação de Desempenho: Fatores Associados”, quanto no

que se refere aos dados do Bolsa Escola.

Por fim, são apresentadas tabelas cruzadas, para as disciplinas de português e

matemática, a fim de se ter uma indicação do tipo de relação existente entre

receber, ou não, o benefício referente ao Bolsa Escola Municipal ou Federa e

os escores médios dos alunos constantes no banco Bolsa Escola de Recife.

Escores Média Frequência PercentualMenor que 60 19520 52.14

Maior ou igual a 60 17920 47.86Total 37440 100

Menor que 60 57 63.33Maior ou igual a 60 33 36.67

Total 90 100

Avaliação de Desempenho - 01/03

Bolsa Escola - 01/04

343

Tabela 5

Recebe, ou não, benefício versus escore equalizado- Matemática Fonte: Cedeplar/ Inep (2005); Programa Bolsa Família –Recife (2005)

Fonte: Cedeplar/ Inep (2005); Programa Bolsa Família –Recife (2005)

Para a disciplina de matemática, a tabela 5 mostra os valores absolutos e os

percentuais de linha, considerando recebe, ou não, o benefício bolsa escola

versus escores equalizados médios recodificados em menores que 60 e iguais

ou maiores que 60. Dos que não recebem nenhum tipo de benefício, um

percentual de 50% obtiveram escores iguais ou maiores que 60. Entre os que

recebem algum tipo de benefício, seja ele municipal ou federal, este percentual

é inferior a aproximadamente 4,5 pontos (45,57%). Esses resultados sugerem

não haver dependência entre receber benefício e possuir maiores escores.

Tabela 6

Recebe, ou não, benefício versus escore equalizado- Português

Fonte: Cedeplar/ Inep (2005); Programa Bolsa Família –Recife (2005)

<60 >=60 Total43 43 86

50.00% 50.00% 100%86 72 158

54.43% 45.57% 100%129 115 244

52.87% 47.13% 100%

Escore

Não recebe nenhum tipo de beneficioRecebe beneficio

municipal ou federal

Total

Bolsa

<60 >=60 Total23 13 36

63.89% 36.11% 100%34 20 54

62.96% 37.03% 100%57 33 90

63.33% 36.66% 100%

Escore

Total

Bolsa

Não recebe nenhum tipo de beneficioRecebe beneficio

municipal ou federal

344

Para a disciplina de português, conforme mostra a tabela 6, considerando a

diferença no percentual de escores iguais ou superiores a 60 entre aqueles que

recebem benefício (37,03%), ou não recebem (36,11%), pode-se dizer que esta

é ainda menor que no caso de matemática. Portanto, estes resultados mais

uma vez, sugerem a independência entre o recebimento de benefício e

melhores rendimentos escolares.

345

CONSIDERAÇÕES FINAIS

APRESENTAÇÃO

De início vale, ressaltar que embora o banco de dados tenha passado por um

processo de “limpeza” e consistência, ainda existem neste banco erros

consideráveis, além de uma grande quantidade de valores em branco

(missings) presente nas possíveis variáveis preditoras do rendimento escolar.

Assim, erros, como números diferentes para identificar um mesmo aluno ao

longo da pesquisa, fazem ainda com que essa base necessite, até o momento,

de cautela em sua utilização. Recomenda-se, posteriormente, que este banco

de dados passe por um processo de identificação e correção de erros em

variáveis tão importantes como a de identificação do aluno e da escola.

Diante do conhecimento dos erros acima citados e tentando minimizar os

possíveis viéses que estes causariam na estimação dos fatores associados ao

rendimento escolar, foram estimados modelos hierárquicos longitudinais

somente para os alunos que participaram das seis rodadas da pesquisa,

garantindo assim que pelo menos esses alunos não apresentavam problemas

em sua variável identificadora. De qualquer forma, um apêndice contendo

modelos, que consideram alunos participantes de pelo menos duas rodadas da

pesquisa, podem ser visto no final do relatório referente à estimação de

modelos para trajetória completa.

Para a estimação de modelos foi necessária a estimação da variável

dependente habilidade ou escore do aluno, de acordo com a Teoria da

Resposta ao Item. Por meio dos processos de calibração e equalização da TRI,

é possível comparar diretamente todos os escores estimados, uma vez que

eles se encontram em uma mesma escala.

346

Quanto aos modelos de trajetória completa, para os quais existe um relatório

detalhado dos resultados, observa-se, em geral, o que já era esperado quanto

à associação entre rendimento escolar e sexo. Em matemática, os homens

apresentam melhores resultados, enquanto que em português, as mulheres

superam o rendimento masculino.

Tanto para matemática quanto para português, os modelos mostraram a

importância da realização da lição de casa para um melhor rendimento escolar.

No caso da repetência, se existe diferença significativa entre os escores dos

alunos que já repetiram e os que nunca repetiram, conforme mostram os

resultados dos modelos, isto pode indicar que a repetência não foi tão eficaz, a

ponto de fazer com que essa diferença fosse não significativa. Portanto, a

repetência não deve ser considerada a principal alternativa, mas sim uma das

possíveis alternativas na busca pela melhoria do desempenho.

No nível da escola, os modelos mostram que as variáveis do tamanho da

turma, para a disciplina de matemática, e a presença do laboratório de

informática, para a disciplina de português foram estatisticamente significativas

para explicar o desempenho. Contudo, recomenda-se para trabalhos futuros a

utilização de modelos de variáveis latentes para a construção de um fatores

relacionados ao nível da escola, tal como o de infra-estrutura. Ainda neste

sentido, mas com relação ao aluno, recomenda-se a realização de análise

fatorial para a identificação de constructos, como por exemplo o do nível sócio-

econômico.

Para o nível da escola, sem a utilização de constructos ou de qualquer outra

variável preditora, é possível perceber a importância dessa dimensão na

explicação do status inicial do aluno, da taxa linear de crescimento e da taxa

não linear de crescimento. Dessa forma, para dados educacionais, mais uma

vez se confirma a necessidade de utilização de metodologias que levam em

conta a dependência entre as observações, tal como a de modelos lineares

hierárquicos longitudinais, ou não.

347

BIBLIOGRAFIA

ANDRADE, D.F; TAVARES, H.R.; VALLE, R.C. Teoria da resposta ao item: conceitos e aplicações. Caxambu: Associação Brasileira de Estatística, 2000. ALBERNAZ, A.; FERREIRA, F.H.G.; FRANCO, C. Qualidade e equidade no ensino fundamental brasileiro. Pesquisa e planejamento econômico. Rio de Janeiro: Instituto de Pesquisa Econômica Aplicada, V. 32, n. 3, p.453-476, dez.2002. BAKER, F.B. The Basics of Item Response Theory. USA: ERIC Clearinghouse on Assessment and Evaluation, 2001. BARBOSA, M.E.F.; FERNANDES, C. A escola brasileira faz diferença? Uma investigação dos efeitos da escola na proficiência em matemática dos alunos da 4ª série. In: FRANCO, C. (org.) Avaliação, ciclos e promoção na Educação. Porto Alegre: ARTMED, 2001. BUCHMANN, C.; HANNUM, E. Education and stratification in developing countries: a review of theories and research. Annual Review of Sociology, v. 102, p.27-77, 2001.

CARVALHO, J.A .M., WONG, L.R. A window of opportunity: some demographic and socioeconomic implications of the rapid fertility decline in Brazil. Belo Horizonte: FACE/CEDEPLAR, 1995 (Texto para discussão 91). CÉSAR, C.C.; SOARES, J.F. Desigualdades acadêmicas induzidas pelo contexto escolar. Revista Brasileira de Estudos de População. Campinas: Associação Brasileira de Estudos Populacionais, v. 18, n.1/2, p. 97-110, jan./dez. 2001. CERQUEIRA, C.A. Tipologia e características dos estabelecimento escolares brasileiros. Tese (Doutorado em Demografia) – Centro de Desenvolvimento e Planejamento Regional, Universidade Federal de Minas Gerais, Belo Horizonte, 2004 COLEMAN, J.S., CAMPBELL, E.Q., HOBSON, C.J.,McPARTLAND, J., MOOD, A M., WEINFELD, F.D.; YORK, R.L. Equality of educational opportunity. Washington, D.C.:U.S. Government Printing Office, 1966.

348

FERRÃO, M. A.; BELTRÃO, K. I.; FERNANDES, C.; SANTOS, D.; SUÁREZ, M; ANDRADE, A. C. O SAEB- Sistema Nacional de Avaliação da Educação Básica: objetivos, características e contribuições na investigação da escola eficaz. Revista Brasileira de Estudos de População. Campinas: Associação Brasileira de Estudos Populacionais, v. 18, n.1/2, p. 111-130, jan./dez. 2001. FERRÃO, M. A.; FERNANDES, C. O efeito-escola e a mudança- Dá para mudar? Evidências da Investigação Brasileira. Revista Eletrônica Iberoamericana sobre Calidad em Educación, v.1, n. 1, 2003 FLETCHER, P. R., RIBEIRO, S.C. O ensino de primeiro grau no Brasil hoje. INEP. 1987. (6) FRANCO, C.; BONAMINO, A. Iniciativas recentes de avaliação da qualidade da educação no Brasil. In: FRANCO, C. (org.) Avaliação, ciclos e promoção na Educação. Porto Alegre: ARTMED, 2001. FRANCO, C.; MANDARINO, M.; ORTIGÃO, M. I. O projeto pedagógico e os resultados escolares. Pesquisa e planejamento econômico. Rio de Janeiro: Instituto de Pesquisa Econômica Aplicada, V. 32, n. 3, p.477-4493, dez. 2002. GOLDSTEIN, H. Modelos da Realidade: novas abordagens para a compreensão de processos educacionais. In: FRANCO, C. (org.) Avaliação, ciclos e promoção na Educação. Porto Alegre: ARTMED, 2001. HAMBLETON, R.K. Principles and selected applications of item response theory. In: LINN, R. L. Educational Measurement. 3ed. Phoenix: American Council on Education, Oryx Press, p.147-200, 1993. HANUSHEK, E. A.; KAIN, J.F.; MARKMAN, J.M.; RIVKIN, S.G. Does peer ability affect student achievement?, National Bureau of Economic Research , 2001 HANUSHEK, E. A. Publicy provided education. In: AUERBACH , A. J., FELDSTEIN, M. Handbook of Public Economics. Stanford: Elsevier Science B.V., v. 4, p. 2046-2107, 2002. HANUSHEK, E. A. The failure of input-based schooling policies. The Economic Journal, v. 113, p.64-98, Feb.2003. INEP – Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. Avaliação internacional mostra desempenho de alunos de 41 países, 2003. Disponível em http://www.inep.gov.br. Acesso em 15 de jul. 2004. KLEIN, R. Produção e utilização de indicadores educacionais. LNCC/CNPQ. Rio de Janeiro: Fevereiro, p.1-35. 1995

349

KOLEN, M. J., BRENNAN, R.L. Test Equating – Methods and Pratices. New York: Springer, 1995 KRUEGER, A. B. Economic considerations and class size. The Economic Journal, v.113, p.34-63, Feb.2003. LAZEAR, E.P. Educational production. Quartely Journal of Economics, v.116(3), p.777-803, 2001. LEE, V. E.; BRYK, A. S. A multilevel model of the social distribution of high school achievement. Sociology of Education. V.62, p.172-192, 1989. MARTELETO, L. Desigualdade regional e intergeracional de oportunidades: a matrícula e a escolaridade de crianças e jovens no Brasil. In: XIII Encontro da Associação Brasileira de Estudos Populacionais. Ouro Preto-MG: ABEP, 2002. Disponível em CD-ROM. PISA- Programa Internacional de Avaliação de Estudantes. PISA 2000: Relatório Nacional. Brasília, dez.2001. Disponível em http://www.inep.gov.br. Acesso em 15 de jul. 2004. RAUDENBUSH, S.W.& BRYK, A S. Hierarquical Linear Models: Applications and Data Analysis Methods. Second Edition. London: Sage Publications, 2002. ROSENBAUM, J.E. Two revolutions in educational attainment research over the past 30 years: their impact on public understanding and social policy. Institute for Policy Research. Working paper 02-21, 2002. SAEB- Sistema Nacional de Avaliação da Educação Básica. Relatório SAEB99. Disponível em http://www.inep.gov.br. Acesso em 12 de mai. 2004 SAEB- Sistema Nacional de Avaliação da Educação Básica. Relatório SAEB 2001-Matemática. Brasília, 2002. Disponível em http://www.inep.gov.br. Acesso em 12 de mai. 2004 SAEB- Sistema Nacional de Avaliação da Educação Básica. Resultados do SAEB 2003. Brasília, 2004. Disponível em http://www.inep.gov.br. Acesso em 23 de set.. 2004. SOARES, J.F.; CÉSAR, C.C.; MAMBRINI, J. Determinantes de desempenho dos alunos do ensino básico brasileiro: evidências do SAEB de 1997. In: FRANCO, C. (org.) Avaliação, ciclos e promoção na Educação. Porto Alegre: ARTMED, 2001. THOMAS, S.; MORTIMORE, P. Comparison of value-added models for secondary-school effectiveness. Research Papers in Education, v.11, n.1, p.5-33, 1996.

350

THOMAS, S. Value added approaches for school self-evaluation in the United Kingdom. Trabalho apresentado no International Seminar on Education Evaluation. Rio de Janeiro, 1997. TOOD, P. E., WOLPIN, K.I. On the specification and estimation of the production function for cognitive achievement . The Economic Journal, v. 113, p.F3-F33, Feb.2003. WILLMS, J.D. Monitoring school performance: a non-technical guide for educational administrators. Lewes: Falmer press, 1992. WILLMS, J. D.; SOMERS, M-A. Schooling outcomes in Latin America. A report for UNESCO, 1999. WILLMS, J. D. Monitoring school performance for “standards-based reform”. Evaluation and Research in Education, v.14, n. 3 e 4, p. 237-253, 2000. WINSTON, G.C., ZIMMERMAN, D.J. Peer effects in higher education. National Bureau of Economic Research. Working paper 9501. Cambrigde, Feb.2003. Disponível em http://www.nber.org/papers/w9501. Acesso em 6 de abr. 2004. ZIMOWSKI, M. F.. MURAKI, E. MISLEVY, R. J. & BOCK, R. D. BILOG-MG: Multiple-Group IRT Analysis and Test Maintenance for Binary Items. Chicago: Scientific Software, Inc., 1996.