traduÇÃo, adaptaÇÃo, fidedignidade e evidÊncias de...
TRANSCRIPT
-
UNIVERSIDADE PRESBITERIANA MACKENZIE
TATIANA PONTRELLI MECCA
TRADUÇÃO, ADAPTAÇÃO, FIDEDIGNIDADE E EVIDÊNCIAS DE VALIDADE
DA BATERIA DE VISUALIZAÇÃO E RACIOCÍNIO DA
“LEITER INTERNATIONAL PERFORMANCE SCALE-REVISED”
SÃO PAULO
2010
-
TATIANA PONTRELLI MECCA
TRADUÇÃO, ADAPTAÇÃO, FIDEDIGNIDADE E EVIDÊNCIAS DE VALIDADE
DA BATERIA DE VISUALIZAÇÃO E RACIOCÍNIO DA
LEITER INTERNATIONAL PERFORMANCE SCALE-REVISED
Dissertação apresentada ao
Programa de Pós-Graduação em
Distúrbios do Desenvolvimento
da Universidade Presbiteriana
Mackenzie como requisito para
obtenção do título de mestre.
Orientador: Prof. Dr. Elizeu Coutinho de Macedo.
SÃO PAULO
2010
-
M486t Mecca, Tatiana Pontrelli Traduçăo, adaptação, fidedignidade e evidencias de validade da bateria de raciocínio e visualizaçăo da Leiter International Performance Scale Revised / Tatiana Pontrelli Mecca - São Paulo, 2010 161 f. : il. ; 30 cm
Dissertação (Mestrado em Distúrbios do Desenvolvimento) - Universidade Presbiteriana Mackenzie, 2010.
Referências bibliográficas: f. 145-158.
1. Avaliação Psicológica. 2. Inteligência. 3. Leiter-R. I. Título.
CDD 153.9
-
TATIANA PONTRELLI MECCA
TRADUÇÃO, ADAPTAÇÃO, FIDEDIGNIDADE E EVIDÊNCIAS DE VALIDADE
DA BATERIA DE VISUALIZAÇÃO E RACIOCÍNIO DA
LEITER INTERNATIONAL PERFORMANCE SCALE-REVISED
Dissertação apresentada ao
Programa de Pós-Graduação em
Distúrbios do Desenvolvimento
da Universidade Presbiteriana
Mackenzie como requisito para
obtenção do título de mestre.
Aprovada em __________________
BANCA EXAMINADORA
Profº Dr. Elizeu Coutinho de Macedo – Orientador
Universidade Presbiteriana Mackenzie
Profª Dra. Alessandra Gotuzo Seabra
Universidade Presbiteriana Mackenzie
Profº Dr. Ricardo Primi
Universidade São Francisco
-
APOIO:
Este trabalho obteve apoio e financiamento da
Fundação de Amparo à Pesquisa do Estado de
São Paulo e Mackpesquisa.
-
AGRADECIMENTOS
Este trabalho é fruto da dedicação, investimento, colaboração e esforço de muitas
pessoas e aqui vai o meu “muito obrigada” a cada um que me ajudou a torná-lo possível.
Primeiramente agradeço ao meu orientador, professor doutor Elizeu Coutinho de
Macedo. Obrigada por tudo! Pelo que me ensinou enquanto meu professor na graduação,
pelos anos de iniciação científica e por ter aceitado orientar este trabalho. Todas as lições,
todas as conversas, todos os ensinamentos foram muito valiosos, essenciais e
determinantes para o meu caminho profissional e pessoal. Não há palavras que traduzem a
imensa admiração que tenho por você.
À professora doutora Alessandra Gotuzo Seabra que além de trazer ricas
contribuições como parte da banca examinadora, me incentivou e me ajudou com seus
conhecimentos na elaboração do projeto inicial que resultou neste trabalho. Sua
competência e sua gentileza é exemplo para todos que estão a sua volta. Muitíssimo
obrigada Alê!
Ao professor doutor Ricardo Primi que contribuiu não só com suas discussões e
conhecimento compartilhado como parte da banca examinadora, mas também como autor
de muitas das referencias lidas para o corpo teórico deste trabalho. Suas pesquisas têm sido
de fundamental importância para aqueles que estudam avaliação da inteligência. Também
agradeço pela oportunidade de assistir as aulas de TRI!
Agradeço àquelas que me ensinaram a dar os primeiros passos. As colegas de
laboratório que fizeram parte do início da minha trajetória profissional e que me serviram
de exemplo durante esses anos: Katerina Lukasova, Carolina Nikaedo, Luane Natalle,
Carolina Kuriyama e Riviane Borghesi Bravo. Especialmente à Fernanda Tebexreni Orsati,
que nestes seis anos não poupou esforços para me ensinar, me orientar e mesmo longe,
sempre esteve presente. Fe, deixo aqui registrado o quanto você é essencial na minha
formação.
Aos professores e colegas do grupo de Transtornos Globais do Desenvolvimento da
Universidade Presbiteriana Mackenzie com quem dividi boa parte destes anos. Cada um a
sua maneira contribuiu de forma valiosa para o meu crescimento profissional e pessoal:
Salomão, Decio, Elói, Maria Cristina, Cristiane, Roberta, Renata e Alessandra. Sou
imensamente grata por todos os momentos. Aliás, devo ressaltar aqui que minha maior
motivação para este trabalho veio dos 4 anos que dividi com vocês.
-
Darlene, Camila, Bruna, Rivi, Cintia e Natália: mais do que minhas colegas de
mestrado ou de laboratório, minhas amigas queridas! Obrigada pelo carinho, amizade,
companheirismo, apoio, incentivo...enfim...contar com vocês fez toda a diferença!!!!!! Me
sinto honrada de ter amigas como vocês.
Àqueles que de alguma forma me ajudaram na execução deste trabalho, seja na
tradução e adaptação da Leiter-R, bem como na coleta, tabulação e análise dos dados:
professora Ceres Alves de Araújo, Natália Martins Dias, Bruna Tonietti Trevisan, Arthur
Berberian, Alexandre Bizzocchi, Mayra Fernanda Ferreira Seraceni e Gizelly de Lima
Alemida . Agradeço especialmente à Daniela Aguilera Moura Antonio pela super força e
disponibilidade durante a coleta e tabulação dos dados e também por dar continuidade a
este trabalho. Dani, obrigada por ter participado deste trabalho como se ele fosse seu. Sua
ajuda fez toda a diferença! E ainda temos mais dois anos nessa jornada...
Agradeço a todos os professores do Programa de Pós-Graduação em Distúrbios do
Desenvolvimento e aos colegas do Laboratório de Neurociência Cognitiva, por todos os
momentos de aprendizado que me proporcionaram.
Lembro especialmente da Alícia e Karine, secretárias do Programa de Pós-
Graduação em Distúrbios do Desenvolvimento e Denise da Coordenadoria de Pesquisa da
Universidade Presbiteriana Mackenzie, que sempre estiveram dispostas a me ajudar em
todos os momentos que precisei.
À minha família: Aninha, Gordinho, Tico e Le. Vocês tornaram isso possível. Se
cheguei até aqui foi graças ao investimento, apoio e auxílio incondicional que eu tive desde
o início. Agradeço imensamente todo o esforço e dedicação que vocês tiveram ao me
proporcionar todas as condições necessárias para que eu pudesse realizar este trabalho e
me dedicar exclusivamente a ele. Eu amo vocês!
Por fim, agradeço aos professores, coordenação, direção e a todos os funcionários
das escolas que fizeram o possível e o impossível para que eu conseguisse realizar meu
trabalho. Aos pais e alunos que participaram da pesquisa. Vocês formam os maiores
responsáveis por todo este aprendizado.
-
RESUMO
MECCA, TP. Tradução, Adaptação, Fidedignidade e Evidências de Validade da Bateria
de Visualização e Raciocínio da Leiter International Performance Scale Revised.
Dissertação de Mestrado, Programa de Pós-Graduação em Distúrbios do Desenvolvimento.
Universidade Presbiteriana Mackenzie, São Paulo, 2010.
Testes tradicionais que avaliam inteligência exigem habilidades e formas de responder que
são difíceis para sujeitos com condições clínicas específicas como os distúrbios do
desenvolvimento. Assim, é necessário disponibilizar instrumentos que possibilitem essa
avaliação. Um teste utilizado internacionalmente para avaliação de inteligência não-verbal
nos distúrbios do desenvolvimento é a Leiter-R, aplicada dos 2 aos 20 anos. São fornecidas
três medidas de desempenho: Raciocínio Fluido, QI Estimado e QI Total, por meio dos
subtestes da Bateria de Visualização e Raciocínio. O objetivo deste estudo foi realizar a
tradução, adaptação e verificar parâmetros psicométricos da Bateria de Visualização e
Raciocínio da Leiter-R em pré-escolares. A tradução e adaptação foram realizadas de
acordo com pressupostos apresentados nas diretrizes da International Test Commission
seguindo as seguintes etapas: tradução, julgamento, adaptação e revisão da versão final.
Participaram 254 crianças entre 3 e 6 anos, alunos de 1º a 3º Estágio do Ensino Infantil de
duas escolas públicas da cidade de São Paulo. Resultados de análise de variância
mostraram efeito da idade e série no desempenho em todos os subtestes da Leiter-R, exceto
para o subteste de Sequencias. Diferenças no desempenho devido ao tempo de
escolarização foram encontradas no subteste Padrões Repetidos em crianças de 4 anos do
1º Estágio e nos subtestes Figura-Fundo e Formas Completas em crianças de 5 anos no 2º
Estágio. ANOVA revelou diferença de gênero para a idade de 6 anos no subteste Dobra de
Papel com melhor desempenho no grupo feminino. Padrões de convergência foram
verificados através de correlações positivas e significativas entre os escores na Leiter-R
com a Escala de Maturidade Mental Columbia e Matrizes Progressivas Coloridas de
Raven. Correlações entre teste e reteste foram positivas e significativas para a maioria dos
subtestes. Os coeficientes de Spearman-Brown ficaram em torno de 0,84 e Alfa de
Cronbach por idade e série, mostraram valores em torno de 0,77 indicando boa precisão
dos subtestes. Desta forma, os resultados sugerem boa adequação dos parâmetros
psicométricos da Leiter-R, preenchendo requisitos básicos que atestam a qualidade do
instrumento.
Palavras-chave: Avaliação Psicológica, Inteligência, Leiter-R.
-
ABSTRACT
MECCA, TP. Translation, Adaptation, Reliability and Validity Evidences of the
Visualization and Reasoning Battery of the Leiter International Performance Scale
Revised. Master's Thesis, Post-Graduation Program in Developmental Disorders.
Universidade Presbiteriana Mackenzie, City of São Paulo – Brazil, 2010.
Traditional tests that assess intelligence require skills and ways of responding that are
difficult for individuals with specific clinical conditions such as developmental disorders.
Thus, it is necessary to provide tools that enable this evaluation. An internationally used
test for evaluating nonverbal intelligence in developmental disorders is the Leiter-R,
applied from ages 2 to 20. Three performance measures are provided: Fluid Reasoning,
Estimated IQ and Total IQ, by means of subtests of the Visualization and Raciocínio
Battery. The objective of this study was to perform the translation, adaptation and to check
psychometric parameters of the Visualization and Reasoning Battery of the Leiter-R in pre-
school children. The translation and adaptation were performed according to assumptions
presented in the guidelines of the International Test Commission by following these steps:
translation, examination, adaptation and review of the final version. Participants were 254
children between ages 3 and 6, students of 1st to 3
rd Stage of Childhood Education from
two public schools in the city of São Paulo. Results of variance analysis showed significant
effect of age and grade in performance in all Leiter-R subtests, except Sequential Order.
Differences in performance due to the time of schooling were found in the “Repeated
Patterns” subtest in children at age 4 of the 1st Stage and in the “Figure-Ground and Form
Completion” subtests in children at age 5 of the 2nd
Stage. ANOVA revealed differences of
gender for age 6 in the “Paper Folding” subtest, with better performance in the feminine
group. Patterns of convergence were verified through significant and positive correlations
between scores in the Leiter-R with the Columbia Mental Maturity Scale and Raven’s
Coloured Progressive Matrices. Correlations between test and retest were positive and
significant for most subtests. The Spearman-Brown coefficients were around 0.84 and
Cronbach's Alpha for age and grade showed values around 0.77 indicating good accuracy
of subtests. Thus, the results suggest good adequacy of psychometric parameters of the
Leiter-R, fulfilling basic requirements that attest to the quality of the tool.
Keywords: Psychological Assessment, Intelligence, Leiter-R.
-
LISTA DE FIGURAS
Pag.
Figura 1: Modelo hierárquico de Gustafsson 50
Figura 2: Modelo hierárquico para os subtestes aplicados a faixa etária de 2
a 5 anos.
53
Figura 3: Modelo hierárquico para os subtestes aplicados a faixa etária de 6
a 10 anos.
53
Figura 4: Modelo hierárquico para os subtestes aplicados a faixa etária de
11 a 20 anos.
54
Figura 5. Tendências desenvolvimentais para os escores na Leiter-R. 64
Figura 6. Análise Fatorial Confirmatória para as idades de 4-5 anos. 66
Figura 7. Análise Fatorial Confirmatória para as idades de 6-10 anos. 66
Figura 8. Item 1 da forma A do teste Matrizes Coloridas de Raven 75
Figura 9. Prancha do exemplo 1 da EMMC. 76
Figura 10. Prancha do Item 2 do subteste 1. 77
Figura 11. Cartões A, B e C (esquerda para a direita) do item 2, subteste 1. 78
Figura 12. Prancha do item 1 do subteste 2. 79
Figura 13. Cartões correspondentes ao item 1 do subteste 2. 79
Figura 14. Prancha do item 1 do subteste 3 (Parte I) 80
Figura 15. Cartão correspondente ao item 1 do subteste 3 (Parte I). 80
Figura 16. Prancha do item 10, subteste 3 (Parte II). 80
Figura 17. Cartões correspondentes ao item 10 do subteste 3 (Parte II). 80
Figura 18. Prancha do item 2, subteste 4. 81
Figura 19. Cartões correspondentes ao item 2 do subteste 4. 81
Figura 20. Prancha do item 2 do subteste 5. 82
Figura 21. Cartões correspondentes ao item 2 do subteste 5. 82
Figura 22. Prancha do item 4, subteste 6. 83
Figura 23. Cartões correspondentes ao item 4 do subteste 6. 83
-
Figura 24. Prancha do item 2, subteste 7. 84
Figura 25. Cartões correspondentes ao item 2 do subteste 7. 84
Figura 26. Prancha do item 4, subteste 8. 85
Figura 27. Cartão correspondente ao item 4 do subteste 8. 85
Figura 28. Prancha do item 2, subteste 9. 86
Figura 29. Cartões correspondentes ao item 2 do subteste 9. 86
Figura 30. Prancha do item 1, subteste 10 87
Figura 31. Cartão correspondente ao item 1 do subteste 10. 87
-
LISTA DE TABELAS
Pag.
Tabela1. Modelo da Teoria dos Três Estratos e John Carroll. 20
Tabela 2. Definição dos dez fatores amplos da teoria CHC. 24
Tabela 3. Descrição dos 6 domínios incluídos no Estrato II da CHC. 25
Tabela 4: Valores de índice d e interpretações para diferença de gênero. 37
Tabela 5: Substestes da Bateria de Raciocínio e Visualização (VR) e as
idades correspondentes para a aplicação.
52
Tabela 6: Processos cognitivos avaliados pela Bateria VR da Leiter-R. 55
Tabela 7: Subtestes aplicados para obtenção de QI Estimado e QI Total
para cada faixa etária.
56
Tabela 8: Subtestes classificados por índices fatoriais e idade. 56
Tabela 9: Descrição das classificações obtidas na Leiter-R pela Bateria
de Raciocínio e Visualização.
57
Tabela 10: Consistência Interna dos subtestes da Bateria VR de acordo
com a idade.
59
Tabela 11: Médias dos pontos ponderados para Teste, Reteste e
Correlação de Pearson.
59
Tabela 12. Valores em porcentagem para sensibilidade e especificidade
segundo a amostra normal, com atraso cognitivo e altas habilidades.
61
Tabela 13. Estatísticas descritivas e Correlação de Pearson entre as duas
versões da Leiter.
62
Tabela 14: Cargas fatoriais dos subtestes para o Fator Visualização. 65
Tabela 15: Cargas fatoriais dos subtestes para o Fator Raciocínio. 65
Tabela 16: Correlações entre os subtestes da Bateria VR para as idades
de 2-3 anos.
67
Tabela 17: Correlações entre os subtestes da Bateria VR para as idades
de 4-5 anos.
67
Tabela 18: Correlações entre os subtestes da Bateria VR para as idades
de 6-10 anos.
67
Tabela 19: Caracterização da amostra: grupos etários, número de sujeitos, 73
-
porcentagem e porcentagem cumulativa.
Tabela 20: Caracterização da amostra: série, número de sujeitos,
porcentagem e porcentagem cumulativa.
73
Tabela 21: Caracterização da amostra: meses de escolarização, número
de sujeitos, porcentagem e porcentagem cumulativa.
74
Tabela 22: Estatísticas descritivas da amostra geral para a EMMC,
MPCR, subteste
90
Tabela 23. Valores de Alfa de Cronbach dos subtestes da Leiter-R em
relação à amostra geral e por faixa etária.
93
Tabela 24: Coeficientes de Correlação de Pearson (r) e valores p para
teste-reteste.
94
Tabela 25: Método das Metades para cada subteste da Leiter-R. 94
Tabela 26. Valores de Kolmogorov-Smirnov e Levene de acordo com os
grupos etários para EMMC.
97
Tabela 27. Estatísticas Descritivas da EMMC em função dos grupos
etários.
97
Tabela 28. Análise de Pares de Bonferroni para efeito da idade na
EMMC.
98
Tabela 29: Valores de Kolmogorov-Smirnov Z e Levene de acordo com
as séries escolares para EMMC.
98
Tabela 30: Estatísticas Descritivas da EMMC em função das séries
escolares.
99
Tabela 31: Análise de Pares de Bonferroni para efeito da série na
EMMC.
99
Tabela 32. Valores de Kolmogorov-Smirnov Z e Levene de acordo com
grupos etários para MPCR.
101
Tabela 33: Estatísticas Descritivas da MPCR em função dos grupos
etários.
101
Tabela 34: Teste Mann-Whitney para efeito da idade na MPCR. 101
Tabela 35. Valores de Kolmogorov-Smirnov Z e Levene de acordo com
as séries escolares para MPCR.
102
Tabela 36: Estatísticas Descritivas da MPCR em função das séries
escolares.
102
-
Tabela 37: Teste Mann-Whitney para efeito da série na MPCR. 102
Tabela 38. Valores de Kolmogorov-Smirnov Z e Levene de acordo com
grupos etários para o subteste Figura-Fundo.
104
Tabela 39: Estatísticas descritivas para o subteste Figura-Fundo de
acordo com os grupos etários.
104
Tabela 40. Teste de Kruskal-Wallis para efeito da idade no subteste
Figura-Fundo.
105
Tabela 41: Valores de Kolmogorov-Smirnov Z e Levene de acordo com
as séries escolares para o subteste Figura-Fundo.
105
Tabela 42: Estatísticas descritivas para o subteste Figura-Fundo em
função das séries escolares.
106
Tabela 43: Teste de Kruskal-Wallis para efeito da série no subteste
Figura-Fundo.
106
Tabela 44. Valores de Kolmogorov-Smirnov Z e Levene de acordo com
grupos etários para o subteste Formas Completas.
108
Tabela 45: Estatísticas descritivas para o subteste Formas Completas em
função dos grupos etários.
108
Tabela 46: Teste de Kruskal-Wallis para efeito da idade no subteste
Formas Completas.
109
Tabela 47: Valores de Kolmogorov-Smirnov Z e Levene de acordo com
as séries escolares para o subteste Formas Completas.
109
Tabela 48: Estatísticas descritivas do subteste Formas Completas em
função das séries escolares.
110
Tabela 49: Teste de Kruskal-Wallis para efeito da série no subteste
Formas Completas.
110
Tabela 50. Valores de Kolmogorov-Smirnov Z e Levene de acordo com
grupos etários para o subteste Pareamento.
112
Tabela 51: Estatísticas descritivas para o subteste Pareamento em função
dos grupos etários
112
Tabela 52: Análise de Pares de Bonferroni para efeito da idade no
subteste Pareamento.
113
Tabela 53: Valores de Kolmogorov-Smirnov Z e Levene de acordo com
as séries escolares para o subteste Pareamento.
113
Tabela 54: Estatísticas descritivas para o subteste Pareamento de em
função da série.
114
-
Tabela 55: Teste de Kruskal-Wallis para efeito da série no subteste
Pareamento.
114
Tabela 56: Valores de Kolmogorov-Smirnov Z e Levene de acordo com
grupos etários para o subteste Sequencias.
115
Tabela 57: Estatísticas descritivas para o subteste Sequencias em função
dos grupos etários.
116
Tabela 58: Teste de Kruskal-Wallis para efeito da idade no subteste
Sequencias.
116
Tabela 59: Valores de Kolmogorov-Smirnov Z e Levene de acordo com
as séries escolares para o subteste Sequencias.
117
Tabela 60: Estatísticas descritivas para o subteste Sequencias em função
das séries escolares.
117
Tabela 61: Análise de Pares de Bonferroni para efeito da série no
subteste Sequencias.
118
Tabela 62. Valores de Kolmogorov-Smirnov Z e Levene de acordo com
grupos etários para o subteste Padrões Repetidos.
120
Tabela 63: Estatísticas descritivas para o subteste Padrões Repetidos em
função dos grupos etários.
120
Tabela 64: Análise de Pares de Bonferroni para efeito da idade em
Padrões Repetidos.
121
Tabela 65. Valores de Kolmogorov-Smirnov Z e Levene de acordo com
as séries escolares para o subteste Padrões Repetidos.
121
Tabela 66: Estatísticas descritivas para o subteste Padrões Repetidos em
função das séries escolares.
122
Tabela 67: Análise de Pares de Bonferroni para efeito da série no
subteste Padrões Repetidos.
122
Tabela 68. Valores de Kolmogorov-Smirnov Z e Levene de acordo com
grupos etários para o subteste Classificação.
123
Tabela 69: Estatísticas descritivas para o subteste Classificação em
função dos grupos etários.
124
Tabela 70: Teste de Kruskal-Wallis para efeito da idade no subteste
Classificação.
124
Tabela 71. Valores de Kolmogorov-Smirnov Z e Levene de acordo com
as séries escolares para o subteste Classificação.
124
Tabela 72: Estatísticas descritivas para o subteste Classificação em 125
-
função das séries escolares.
Tabela 73: Teste de Kruskal-Wallis para efeito da série no subteste
Classificação.
125
Tabela 74: Estatísticas descritivas para o subteste Analogias de Desenho
(AD) e Dobra de Papel (DP).
127
Tabela75: Sumário do modelo oriundo da Regressão Linear Múltipla. 129
Tabela 76. Coeficientes de regressão. 130
Tabela 77. Estatísticas descritivas em função de meses de escolarização
para crianças de 4 anos do 1º estágio.
131
Tabela 78. Estatísticas descritivas em função de meses de escolarização
para crianças de 5 anos do 2º estágio.
132
Tabela 79: ANOVA para o desempenho nos subtestes da Leiter-R em
função do tempo de escolarização
133
Tabela 80. ANOVA para efeito de gênero na Leiter-R 135
Tabela 81. Correlações de Pearson entre MPCR, EMMC, QI Estimado e
Raciocínio Fluido.
136
Tabela 82 : Correlação da MPCR e EMMC com o QI Total da Leiter-R 137
Tabela 83: Valores de Correlação de Pearson entre os Subtestes da
Leiter-R, EMMC e MPCR.
138
Tabela 84: Correlações entre os subtestes da Bateria VR para a idade de 3
anos.
138
Tabela 85: Correlações entre os subtestes da Bateria VR para as idades
de 4-5 anos.
139
Tabela 86: Correlações entre os subtestes da Bateria VR para a idade de 6
anos.
139
Tabela 87. Análise Fatorial Exploratória referente ao grupo etário de 3
anos.
140
Tabela 88. Análise Fatorial Exploratória referente ao grupo etário de 4-5
anos.
141
Tabela 89. Análise Fatorial Exploratória referente ao grupo etário de 6
anos.
142
-
SUMÁRIO
1. APRESENTAÇÃO....................................................................................15
2. PRESSUPOSTOS TEÓRICOS..................................................................17
2.1. Inteligência: Estrutura e Cognição...................................................17
2.2. Instrumentos Psicológicos: Tradução, Adaptação e Parâmetros
Psicométricos...............................................................................................27
2.3. Diferenças Individuais na Inteligência em Função de Critérios
Externos.......................................................................................................37
2.4. Avaliação da Inteligência na Infância................................................41
2.5. The Leiter International Performance Scale Revised…………….....49
2.5.1. Aspectos gerais do instrumento...............................................49
2.5.2. Parâmetros Psicométricos da Bateria VR da Leiter-R..............58
2.5.3. Leiter-R e os Distúrbios do Desenvolvimento........................68
3. OBJETIVOS...............................................................................................72
3.1. Objetivo Geral.....................................................................................72
3.2. Objetivos Específicos..........................................................................72
4. MÉTODO...................................................................................................73
4.1.Participantes..........................................................................................73
4.2.Instrumentos..........................................................................................74
4.3. Procedimentos......................................................................................87
5. RESULTADOS E DISCUSSÃO...............................................................90
5.1. Dados Gerais da Amostra.....................................................................90
5.2. Coeficientes de Fidedignidade.............................................................92
5.3. Evidências de Validade por Mudanças Desenvolvimentais..................95
5.3.1. Escala de Maturidade Mental Colúmbia.........................................96
5.3.2. Matrizes Progressivas Coloridas de Raven...................................100
5.3.3. Figura-Fundo da Leiter-R.............................................................103
5.3.4. Formas Completas da Leiter-R.....................................................107
5.3.5. Pareamento da Leiter-R................................................................111
5.3.6. Sequencias da Leiter-R.................................................................115
5.3.7. Padrões Repetidos da Leiter-R.....................................................119
5.3.8. Classificação da Leiter-R..............................................................123
-
5.3.9. Subtestes Analogias de Desenho e Dobra de Papel...................126
5.3.10. Síntese dos Resultados por Tendências Desenvolvimentais....127
5.4. Análise de Regressão Linear Múltipla...............................................129
5.5. Análise por Tempo de Escolarização.................................................130
5.6. Análise por Diferença de Gênero.......................................................134
5.7. Análises de Correlação com outros instrumentos..............................136
5.8. Análise Fatorial Exploratória.............................................................140
6. CONCLUSÃO..........................................................................................143
7. REFERÊNCIAS BIBLIOGRÁFICAS.....................................................145
8. APÊNDICES............................................................................................159
A. Carta de Informação à Instituição........................................................159
B. Carta de Consentimento Livre e Esclarecido aos pais.........................160
C. Carta de aprovação do Comitê de Ética...............................................161
-
15
1. APRESENTAÇÃO
A avaliação de habilidades cognitivas de indivíduos com distúrbios do
desenvolvimento compreende uma prática clínica e pesquisas fundamentadas em
instrumentos adequados para tal. No entanto, os instrumentos atualmente disponíveis no
mercado nacional foram construídos e padronizados para a avaliação de indivíduos que
possuem certas habilidades preservadas, tais como: linguagem, leitura, escrita e
motricidade.
Tais habilidades e formas de responder determinados grupos não desenvolveram
adequadamente ou até mesmo não as possuem como pode ser observado em indivíduos
com Transtorno do Espectro Autista, Síndrome de Down e outras síndromes genéticas
acompanhadas de deficiência intelectual, Distúrbios de Linguagem, Paralisia Cerebral,
Deficiência Auditiva, entre outras condições. Conseqüentemente, tais instrumentos não são
indicados para avaliação de indivíduos com distúrbios do desenvolvimento já que este
grupo apresenta determinadas características como ausência ou prejuízo na
linguagem/comunicação e deficiência motora, que freqüentemente impossibilita expressar
de fato suas habilidades ou dificuldades.
No Programa de Pós-Graduação em Distúrbios do Desenvolvimento são
conduzidos diferentes estudos que envolvem a avaliação cognitiva de crianças e
adolescentes. Desta forma, é importante criar e/ou adaptar instrumentos de avaliação
psicológica que possam ser usados nestes estudos, bem como disponibilizá-los para
clínicos e educadores. De fato, nos últimos anos tem aumentado, entre os pesquisadores, a
preocupação com a disponibilização de instrumentos mais adequados e acessíveis aos
grupos avaliados. Por isso, alternativas têm sido propostas para suprir esta lacuna.
Entre os aspectos cognitivos mais estudados e de fundamental importância na
avaliação cognitiva é a inteligência. Tal construto está relacionado a uma capacidade
mental geral que implica em raciocinar, planejar, resolver problemas, pensar de forma
abstrata e aprender com a experiência.
Uma das possibilidades de avaliar a inteligência de pessoas com distúrbios do
desenvolvimento é por meio de testes não-verbais que exijam resposta motora discreta,
como é o caso da Leiter International Performance Scale – Revised (Leiter-R). Trata-se de
uma escala de avaliação de inteligência não-verbal, aplicada para uma faixa etária de 2 a
20 anos de idade e constantemente utilizada em diversas pesquisas internacionais que
-
16
avaliam indivíduos com distúrbios do desenvolvimento. Ela é especificamente adequada
para ser utilizada com indivíduos que apresentam prejuízos cognitivos, comprometimento
auditivo, motor e dificuldades de linguagem.
Entretanto, para que um instrumento esteja devidamente qualificado para ser
utilizado na avaliação psicológica, a Comissão Internacional de Testes aponta como sendo
necessários alguns requisitos básicos relacionados a modelos de adaptação e parâmetros
psicométricos. No caso de instrumentos internacionais, alguns requisitos são: tradução e
adaptação cultural, bem como medidas adequadas referentes a fontes de evidências de
fidedignidade ou precisão e validade que garantem a confiabilidade e especificidade do
instrumento.
Sendo assim, os objetivos do presente estudo são: traduzir, adaptar e apresentar
evidências de fidedignidade e validade da Bateria de Visualização e Raciocínio da Leiter-R
em uma amostra de 200 crianças de 3 a 6 anos, de escolas públicas da cidade de São Paulo.
Trata-se de um estudo com relevância social, pois instrumentos que de fato avaliem
as reais habilidades do sujeito podem auxiliar em processos diagnósticos e no
planejamento de intervenções mais eficazes. A implicação prática da pesquisa é a
possibilidade de se avaliar futuramente através de um instrumento adequado, indivíduos,
que muitas vezes são considerados incapazes de serem testados, devido à dificuldade de
acessar seus conhecimentos através dos testes tradicionais.
-
17
2. PRESSUPOSTOS TEÓRICOS
2.1. Inteligência: Estrutura e Cognição
De acordo com Mäder, Thais e Ferreira (2004), a inteligência é um conceito amplo,
pois a capacidade humana de conceituar, organizar, desenvolver e memorizar é abrangente
para ser determinada por apenas um único aspecto. De fato, Almeida (2002) mostra que
este conceito ou construto não desfruta de consenso entre os estudiosos do tema.
Uma das controvérsias está relacionada à questão se a inteligência é mais bem
definida através de uma capacidade geral ou através de um conjunto de aptidões
diferenciadas, como no caso das inteligências múltiplas. Mesmo assim, existe um acordo
de que a inteligência está relacionada com a capacidade de pensar e de resolver problemas,
ou seja, reportam-se as capacidades e habilidades dos indivíduos (Almeida, Guisande,
Primi e Ferreira, 2008). Neste sentido, uma declaração assinada por 52 pesquisadores
renomados publicada na Revista Intelligence em 1997 define a inteligência como uma
capacidade mental geral que implica em habilidades como raciocínio, planejamento,
resolução de problemas, pensar de maneira abstrata e aprender com a experiência (Flores-
Mendoza, 2010).
Segundo Primi e Flores-Mendoza (2006), o estudo da inteligência se confunde com
a história da própria psicologia, pois as primeiras pesquisas empíricas tratavam da medida
da inteligência e é marcado por diferentes abordagens teóricas e metodológicas. Neste
sentido, três abordagens principais têm sido utilizadas em pesquisas referentes a
inteligência: a cognitiva, a desenvolvimental e a psicométrica (Primi, 2002; Almeida,
2002; Roazzi e Souza, 2002; Mader e cols., 2004).
A abordagem cognitiva busca identificar os elementos estruturais, esquemas
lógicos e processos de funcionamento da atividade mental. Trata-se de uma visão sistêmica
da inteligência baseada em seus mecanismos cognitivos, sua arquitetura e dinâmica
(Roazzi e Souza, 2002). Sternberg (2008), um dos maiores expoentes desta abordagem,
ressalta a importância de se compreender os componentes, estratégias e representações
envolvidos nos processos mentais.
A inteligência, de acordo com a abordagem desenvolvimental está relacionada ao
conceito de adaptação de Piaget que se refere a um estado de equilíbrio para o qual tendem
todas as adaptações sucessivas sensório-motoras e cognitivas baseadas na experiência do
sujeito. Trata-se de um modelo hierárquico, no qual o desenvolvimento intelectual é
-
18
dividido em estágios, cada qual mais complexo que o seu precedente e corresponde a uma
forma de adaptação biológica. Isto significa que o desenvolvimento cognitivo é construído
até o estágio no qual o indivíduo se encontra (Mader e cols., 2004). A abordagem
psicométrica será discutida detalhadamente pelo fato de estar mais diretamente relacionada
com os objetivos deste estudo.
Historicamente, a psicometria começou a ser usada na elaboração de instrumentos
de medida sem que se soubesse bem o que eles mediam. Ou seja, sem uma compreensão
teórica sobre a inteligência, mas que evoluiu para formulações teoricamente mais
sofisticadas (Sternberg, 2008). Nesta abordagem, a inteligência é uma habilidade que pode
ser mensurada através do desempenho em testes (Roazzi e Sousa, 2002). E o termo
“psicometria” se refere ao foco e esforço colocado sobre a medida e o cuidado despendido
na construção e validação de instrumentos (Almeida e cols., 2008a).
Gauer, Gomes e Haase (2010) definem a psicometria como o campo de estudos das
características de instrumentos ou testes que visam à mensuração de variáveis psicológicas.
As características, ou qualidade dos instrumentos são definidas em termos da adequação
teórica, empírica, lógica e estatística que eles apresentam, tendo em vista que são utilizados
como artefatos de medida. Os indicadores dessas características são analisados desde o
nível de operacionalização dos conceitos da teoria nos itens do teste, até as propriedades
estatísticas dos valores aferidos pelo instrumento em uma amostra.
O início da psicometria se deu a partir das idéias de Francis Galton que focalizou
seus interesses na hereditariedade, especialmente na herança de altos níveis de habilidade
(Hogan, 2006) e partia do pressuposto de que havia uma habilidade intelectual geral nos
indivíduos (Mader e cols., 2004). Partindo desta concepção, o psicólogo inglês Charles
Spearman desenvolveu no início do século XX a extração estatística do que veio a
denominar de “fator g” (Mader e cols., 2004). Sendo este uma energia mental inata, um
fator com base neurológica (Schelini, 2006) capaz de ativar operações cognitivas comuns a
todas as atividades mentais (Primi, 2002; Mader e cols., 2004).
A concepção bifatorial proposta por Spearman, apresenta um fator geral e outro
específico. A alta correlação entre dois testes psicológicos seria explicada por estes serem
altamente saturados em g, já que a presença de fatores específicos tenderia a baixar a
correlação. (Schelini, 2006; Cruz, 2008). Para Spearman, o funcionamento cognitivo se
dava a partir de três processos básicos que estariam presentes em todas as habilidades
-
19
mentais: 1) apreensão das experiências relacionada à rapidez e acuidade na percepção de
estímulos; 2) edução de relações como capacidade de estabelecer relação entre duas ou
mais idéias e; 3) edução de correlatos referente à capacidade de criar novas idéias a partir
de relações e idéias previamente estabelecidas (Primi, 2002). Embora Spearman não
tivesse criado nenhum tipo de teste, tampouco empreendeu projetos para coleta de dados,
sua importância se deve ao fato de que através do método estatístico de análise fatorial
deu-se a primeira tentativa de fornecer uma teoria da inteligência humana de base empírica
(Hogan, 2006).
Louis Leon Thurstone também deu continuidade a estudos que explicassem o
funcionamento cognitivo e ao verificar os componentes da inteligência através da análise
fatorial, propôs a Teoria das Aptidões Primárias. Descreveu sete fatores ou capacidades
independentes: habilidade espacial, compreensão verbal, fluência verbal, velocidade
perceptiva, aptidão numérica, memória e raciocínio indutivo. A independência dos fatores
descarta a idéia de um fator geral subjacente às habilidades específicas (Almeida, 2002;
McGrew, 2004).
Em 1993, com a publicação de Human Cognitive Abilities: A Survey of Factor
Analytic Studies por John Carroll, houve um avanço na visão psicométrica a respeito da
inteligência, resultando na criação de um modelo hierárquico chamado de Teoria dos Três
Estratos. Os estratos seriam camadas dispostas em três níveis em função da generalidade.
O estrato I seria em torno de setenta fatores específicos propostos pelos testes
psicométricos. O estrato II agrupa estes fatores específicos em oito fatores mais amplos:
raciocínio, conhecimento-linguagem, memória-aprendizagem, percepção visual, percepção
auditiva, produção de idéias, velocidade de processamento cognitivo e velocidade de
decisão. O Estrato III corresponderia ao fator g (Sternberg, 2008). A tabela 1 mostra o
modelo da Teoria dos Três Estratos de John Carroll (1993) adaptado por Primi, Santos,
Vendramini, Taxa, Muller, Lukjanenko e Sampaio (2001).
-
20
Tabela1. Modelo da Teoria dos Três Estratos e John Carroll.
ESTRATO
III
ESTRATO
II
DESCRIÇÃO ESTRATO
I
Exemplos de fatores mais
significativos
Fator g Inteligência Fluida
Gf
Raciocínio em situações
novas, minimamente
dependente de conhecimentos
adquiridos. Resolver
problemas novos, relacionar
idéias, induzir conceitos
abstratos, compreender
implicações.
Raciocínio sequencial,
Indução,
Raciocínio quantitativo.
Inteligência
Cristalizada
Gc
Extensão e profundidade dos
conhecimentos adquiridos de
uma determinada cultura.
Raciocínio adquirido pelo
investimento da capacidade
geral em experiências de
aprendizagem.
Desenvolvimento
lingüístico, Conhecimento
léxico, Compreensão em
leitura.
Memória e
Aprendizagem
Gsm
Manutenção de informações
na consciência por um curto
espaço de tempo para poder
recuperá-las logo em seguida.
Capacidade de informação
retida após exposição a uma
situação de aprendizagem
(geralmente conteúdos
simples).
Extensão da memória
Memória associativa,
Memória visual.
Percepção Visual
Gv
Gerar, reter e manipular
imagens visuais abstratas.
Visualização, Relações
espaciais, Velocidade de
fechamento.
Recepção Auditiva
Ga
Percepção e discriminação de
padrões sonoros (incluindo a
linguagem oral)
particularmente quando
apresentados em contextos
mais complexos envolvendo
distorções ou estruturas
musicais complexas.
Acuidade auditiva,
discriminação da
linguagem oral,
Discriminação e
julgamento de padrões
tonais musicais.
Habilidade de
Recuperação
Glr
Habilidade associada à
extensão e fluência que itens
de informação ou conceitos
são recuperados da memória
de longo prazo por
associação.
Fluência de idéias,
Facilidade de recordação
de nomes, Fluência de
associações,
Originalidade/Criatividade
Velocidade de
Processamento
Cognitivo
Gs
Habilidade associada à taxa
de rapidez de processamento
cognitivo em tarefas
cognitivas simples.
Velocidade perceptual,
Tempo de reação simples,
Velocidade de
processamento semântico.
Fonte: Primi e colaboradores (2001, p.154).
-
21
Em 1998, McGrew e Flanagan propuseram uma integração da Teoria dos Três
Estratos de Carroll com a Teoria da Inteligência Fluída e Cristalizada de Horn e Cattell.
Esta última se refere a dois tipos de inteligência: a cristalizada e a fluída (Primi e cols.,
2001)
A inteligência cristalizada (Gc) corresponde à extensão e profundidade dos
conhecimentos adquiridos de uma determinada cultura e suas aplicações de forma efetiva.
Capacidade de raciocínio adquirida pelo investimento da capacidade geral em experiências
de aprendizagem e primariamente baseada na linguagem. Está associada ao conhecimento
declarativo, como o conhecimento de fatos, idéias e conceitos. E relacionada a habilidades
como raciocinar com procedimentos aprendidos previamente para transformar o
conhecimento (Primi, 2002; Primi, 2003; Schelini e Wechsler, 2005; Schelini, 2006).
Já a inteligência fluída (Gf) está relacionada à inteligência não-verbal,
correspondente à habilidade necessária na previsão da capacidade geral de adaptação às
situações novas ou inesperadas, pouco estruturadas, que requerem autonomia intelectual,
relacionar idéias, induzir conceitos abstratos, compreender implicações, extrapolação,
reorganização, transformação e generalização de informações. As deficiências neste fator
caracterizam-se pela dificuldade em generalizar regras, formar conceitos e observar
implicações (Primi, 2002; Primi, 2003; Schelini e Wechsler, 2005; Schelini, 2006). E
devido aos objetivos deste trabalho, o fator Gf será discutido mais detalhadamente.
Primi (2002) aponta que Carroll descreveu três grupos de tarefas gerais
relacionadas à inteligência fluída: raciocínio seqüencial geral, indução e raciocínio
quantitativo. O raciocínio seqüencial é a capacidade de derivar implicações ou conclusões
a partir da análise de combinação de premissas claramente formuladas seguindo dois ou
mais passos lógicos, tais como tarefas de silogismos categóricos, silogismos lineares e
raciocínio verbal geral. Já a indução se refere a tarefas como descoberta de
conceitos/regras, seriação, tarefas de múltiplos exemplares, matrizes, elementos ímpares,
analogias, nas quais a pessoa deve analisar um conjunto de estímulos observando as
regularidades, as características comuns, para inferir as relações entre os estímulos.
Enquanto que o raciocínio quantitativo envolve tarefas que utilizam o raciocínio dedutivo e
indutivo, misturando-se com conceitos e relações quantitativas matemáticas, como por
exemplo, aritmética, álgebra, geometria e cálculo.
-
22
O fator Gf tem sido associado à complexidade cognitiva que pode ser definida
como uma maior utilização de um vasto e diversificado leque de processos cognitivos
elementares durante a execução de uma tarefa (McGrew, 2004). O pico de
desenvolvimento da Gf se dá no final da adolescência. Esta se mantém estabilizada por
alguns anos e partir daí, entra em declínio principalmente no que concerne a habilidade de
velocidade de processamento (Arckerman, 1996).
Em relação aos processos cognitivos que são elementares durante a execução de
tarefas como o raciocínio fluido, estudos de neuroimagem têm buscado compreende-los em
termos de estruturas e ativação cerebral. Hampshire e colaboradores (2010) apontam que o
raciocínio é um componente fundamental para um comportamento executivo bem
adaptado. Estes autores investigaram a relação entre raciocínio, controle executivo e
funcionamento de regiões frontoparietais. Os resultados deste estudo mostram que os
circuitos frontoparietais devem ser fracionados em sub-regiões que são ativadas de acordo
com demandas distintas de raciocínio que são apresentadas. Tarefas de maior
complexidade apresentam modulação de atividade no hemisfério direito incluindo giro
frontal medial e a parte superior do córtex parietal. Já tarefas de analogias recrutam áreas
do hemisfério esquerdo como a região inferior do córtex pré-frontal dorsolateral. Sendo
que estas regiões têm sido associadas a uma gama de demandas cognitivas denominadas
funções executivas.
Estudos têm mostrado que alguns construtos elaborados a partir de perspectivas
teóricas diferentes, como a psicometria e a psicologia cognitiva, apresentam sobreposições.
Uma das sobreposições que tem sido estudada se dá entre os construtos fator G e
inteligência fluida da psicometria e o construto funções executivas definido na psicologia
cognitiva (García-Molina e cols., 2010). As funções executivas têm sido definidas como as
habilidades cognitivas necessárias para realizar comportamentos complexos dirigidos para
determinado objetivo e a capacidade adaptativa a diversas demandas e mudanças
ambientais (Hamdan e Pereira, 2009), sendo indicadas como semelhantes ao conceito de
resolução de problemas novos relacionados à Gf (García-Molina e cols, 2010). A
importância de sua avaliação se dá pelo fato de que elas estão alteradas em alguns quadros
de distúrbios do desenvolvimento, tais como os Transtornos do Espectro Autista (Happé e
Frith, 1996), o Transtorno de Déficit de Atenção e Hiperatividade (Gordon, Barkley e
Lovett, 2006), a Síndrome de Williams-Beuren (Menghini e cols, 2010), Epilepsia do lobo
frontal em crianças (Luton, Burns e Defilippis, 2010) entre outras condições. Além disso,
http://www.ncbi.nlm.nih.gov/pubmed?term=%22Defilippis%20N%22%5BAuthor%5D
-
23
Shelton e colaboradores (2010) apontam que Gf e memória de trabalho são construtos
altamente correlacionados. Já Tilman e colaboradores (2009) mostram que velocidade de
processamento, controle inibitório bem como a memória de trabalho, são os principais
construtos que explicam o desempenho em tarefas de raciocínio fluido.
Segundo McGrew (2004), a Gf é pouco dependente de conhecimentos previamente
adquiridos e de questões culturais e mais determinada por aspectos biológicos. Entretanto,
isto não significa que a Gf não sofre influencia de aspectos ambientais. Um estudo
realizado por Flores-Mendoza e Nascimento (2007) em 144 crianças de uma zona rural
cuja situação socioeconômica se caracterizava bastante precária, mostrou que os déficits
ambientais afetam com maior intensidade a inteligência fluida que a inteligência
cristalizada. Desta forma, a estimulação ambiental não pode ser descartada e deve-se levar
em consideração que intervenções podem ser eficazes para estimular o raciocínio fluido.
Klauer e Phye (1995) em sua obra “Cognitive Training for Children” mostram que é
possível estimular a inteligência fluida através de um programa de atividades de raciocínio
indutivo e solução de problemas. De acordo com estes autores, habilidades como
generalização, discriminação e o reconhecimento de semelhanças e diferenças entre
estímulos influenciam no potencial para a aprendizagem e no desenvolvimento de
habilidades para solução de problemas.
A inteligência fluida passou a ter maior destaque a partir do último modelo
psicométrico proposto por McGrew e Flanagan (1998). Trata-se da Teoria de Catell-Horn-
Carrol (CHC) das habilidades cognitivas que atualmente fundamenta a construção de
novos testes de inteligência. A priori esta teoria postulou dez fatores amplos de habilidades
cognitivas: inteligência fluída, conhecimento quantitativo, inteligência cristalizada, leitura
e escrita, memória de curto prazo, processamento visual, processamento auditivo,
armazenamento e recuperação da memória de longo prazo, velocidade de processamento e
rapidez de decisão. A estes dez fatores amplos estariam subjacentes pouco mais de sessenta
fatores específicos. A Tabela 2 apresenta o modelo CHC de acordo com os dez fatores
amplos a ele subjacentes.
-
24
Tabela 2. Definição dos dez fatores amplos da teoria CHC.
Fator do Estrato II Descrição
Inteligência Fluida (Gf)
Capacidade ligada às operações mentais de raciocínio em
situações novas, minimamente dependente de
conhecimentos adquiridos. Capacidade de resolver
problemas novos, relacionar idéias, induzir conceitos
abstratos, compreender implicações, extrapolação e
reorganização de informações (os testes psicométricos do
fator g geralmente avaliam a inteligência fluida tais
como Raven, a maioria dos testes da BPR-5, Colúmbia,
R1, INV, etc...).
Inteligência Cristalizada (Gc)
Extensão e profundidade dos conhecimentos adquiridos
de uma determinada cultura e a aplicação efetiva deste
conhecimento. Capacidade de raciocínio adquirida pelo
investimento da capacidade geral em experiências de
aprendizagem. Primariamente baseada na linguagem.
Está associado ao conhecimento declarativo
(conhecimento de fatos, idéias, conceitos) e ao
conhecimento de procedimentos (raciocinar com
procedimentos aprendidos previamente para transformar
o conhecimento).
Conhecimento Quantitativo (Gq)
Estoque de conhecimentos declarativos e de
procedimentos quantitativos. Capacidade de usar
informação quantitativa e manipular símbolos
numéricos.
Leitura e Escrita (Grw)
Conhecimento adquirido em competências básicas da
compreensão de textos e expressão escrita. Inclui desde
habilidades elementares como decodificação em leitura e
ortografia até habilidades mais complexas como a
compreensão de textos e a composição de histórias.
Memória de Curto Prazo (Gsm)
Capacidade associada à manutenção de informações na
consciência por um curto espaço de tempo para poder
recuperá-las logo em seguida.
Processamento Visual (Gv)
Capacidade de gerar, perceber, armazenar, analisar, e
transformar imagens visuais, isto é, os processos
cognitivos específicos de processamento mental de
imagens (geração, transformação, armazenamento e
recuperação).
Processamento Auditivo (Ga)
Capacidade associada à percepção, análise e síntese de
padrões sonoros. Capacidade discriminativa de padrões
sonoros (incluindo a linguagem oral) particularmente
quando apresentados em contextos mais complexos
como, por exemplo, a percepção de nuances em
estruturas musicais complexas.
Capacidade, Armazenamento e
Recuperação da Memória de Longo
Prazo (Glr)
Extensão e fluência que itens de informação ou conceitos
são recuperados da memória de longo prazo por
associação. Está ligada ao processo de armazenamento e
recuperação posterior por associação. Capacidade de
recuperar os itens de informação da base de
conhecimentos por meio de associações. Este fator
agrupa os testes psicométricos criados de avaliação da
criatividade sendo muitas vezes chamado de domínio da
produção de idéias.
Velocidade de Processamento (Gs) Capacidade de manter a atenção e realizar rapidamente
-
25
tarefas simples automatizadas em situações que
pressionam o foco da atenção. Está geralmente ligado a
situações em que há um intervalo fixo definido para que
a pessoa execute o maior número possível de tarefas
simples e repetitivas (sustentabilidade).
Rapidez de Decisão (Gt)
Rapidez em reagir ou tomar decisões envolvendo
processamentos mais complexos. Refere-se à reação
rápida a um problema envolvendo processamento e
decisão (imediaticidade).
Fonte: Primi (2003, p.69).
Devido a estudos recentes, alguns domínios foram acrescentados ao modelo CHC,
incluindo 6 fatores amplos na camada II (McGrew, 2009) conforme apresentados na
Tabela 3.
Tabela 3. Descrição dos 6 domínios incluídos no Estrato II da CHC.
Fator do Estrato II Descrição
Conhecimento Geral (Gkn)
Amplitude, profundidade e domínio adquiridos pela
pessoa em áreas especializadas que não representam a
experiência geral e universal adquirida culturalmente
pelos indivíduos. Adquirido pela prática e formação
intensas e sistemáticas. Especialização.
Habilidades táteis (Gh) Habilidades envolvidas na percepção e julgamento das
sensações que são recebidas através de receptores táteis.
Habilidades Sinestésicas (Gk)
Habilidades que dependem de receptores sensoriais que
detectam posição corporal, peso, movimento dos
músculos, tendões e articulações. Controle e
coordenação dos movimentos do corpo, incluindo o
andar, falar, expressões faciais, gestos e postura.
Habilidades Olfatórias (Go) São habilidades que dependem de receptores sensoriais
do sistema olfativo.
Habilidades Psicomotoras (Gp)
Capacidade de realizar movimento motores com o corpo
(movimento de dedos, mãos, pernas, etc) com precisão
coordenação ou força. Comportamentos motores são
tipicamente resultados de atividades mentais.
Velocidade Psicomotora (Gps)
Capacidade de executar movimentos corporais de forma
rápida e fluente. Em grande parte, independente do
controle cognitivo.
Fonte: McGrew (2009, p.6-7).
O modelo CHC passou a identificar a inteligência fluida como sendo mais próxima
ao fator g. Um dos fatores específicos relacionados à Gf, o raciocínio indutivo seria uma
das formas de se compreender os processos cognitivos gerais presentes nas mais variadas
habilidades. Este tipo de raciocínio está relacionado à capacidade de analisar um conjunto
de estímulos observando as regularidades, as características comuns, para inferir relações
entre eles (Primi, 2002; Almeida e cols., 2008b).
-
26
De acordo com Klauer e Phye (1995) o raciocínio indutivo se refere ao
descobrimento de regularidades através de processos que comparam atributos e relações de
objetos ou eventos. Para estes autores existem 6 processos de raciocínio indutivo:
generalização – buscar similaridades entre atributos; discriminação – buscar diferenças
entre atributos; classificação cruzada – semelhanças e diferenças nos atributos;
reconhecimento de relações – de similaridades; diferenciação de relações –
reconhecimento das diferenças; construção de sistemas – relações de similaridades e
diferenças.
Além da evolução ocorrida na definição e estrutura da inteligência, outras
mudanças têm sido descritas na literatura como relevantes para entender este construto.
Entre elas, podemos observar um fenômeno denominado Efeito Flynn (EF). O EF é em
termos gerais, a tendência a ganhos no QI da população ao longo dos anos. Dados de
diferentes países mostram ganhos significativos de QI a cada geração com o passar do
tempo. Estudos como o que foi realizado na Holanda em 1982 onde foi observado que
jovens de 18 anos apresentavam 20 pontos acima de pares da mesma idade em 1952. Trata-
se de um desvio padrão de 1,33 que coloca a segunda geração no percentil 90 da primeira
(Flynn, 2006).
Um dos aspectos percebido é a correspondência entre aumento no QI e
industrialização, disponibilidade de escolas e melhoria nos sistemas de saúde (Flynn,
2006). Outra questão levantada é a mudança nas instruções dos testes (Sternberg, 2010).
Khou, Zhu e Weiss (2010) mostram que o EF não é distribuído igualmente entre os
diferentes níveis de habilidade, ou seja, o efeito pode variar ao longo da distribuição do QI
na população. Por isso, Sternberg (2010) aponta que devido à complexidade do construto e
das mudanças ocorridas no mundo ao longo dos anos, não é possível atribuir este aumento
a um único aspecto.
Os ganhos observados nos últimos 55 anos são maiores em testes de inteligência
fluida, como nas Matrizes Progressivas de Raven, que avaliam a capacidade de resolver
imediatamente problemas para os quais não há método aprendido de antemão. Estudos
apontam cerca de 18 pontos a cada 30 anos (Flynn, 2006). Além disso, estudos têm
mostrado que ao comparar a proporção de ganhos em testes não-verbais e verbais, os
ganhos se apresentam numa proporção de até 4:1 respectivamente (Flynn e Weiss, 2007)
Acompanhando a evolução das teorias sobre inteligência, diferentes instrumentos
de avaliação têm sido desenvolvidos. Estas mudanças ocorrem desde a primeira escala
-
27
criada por Alfred Binet que foi uma operacionalização pioneira do construto inteligência
(Miranda, 2002) permitindo sintetizar as habilidades cognitivas em uma medida única,
aferida com base em itens padronizados e definida como o Quociente de Inteligência
(Gauer, Gomes e Haase, 2010). Binet construiu seu instrumento pensando na relação
existente entre a inteligência e a eficácia do desempenho acadêmico. O termo Quociente de
Inteligência (QI) foi proposto em 1911 pelo psicólogo alemão, William Stern. Segundo ele,
o nível obtido na escala Binet-Simon seria o escore de idade mental dividido pela idade
cronológica do sujeito para se obter um quociente mental que representaria de forma mais
precisa a capacidade em diferentes idades (Urbina, 2007).
Outros instrumentos destinados a avaliação de inteligência também foram criados
com pressupostos semelhantes ao teste de Binet, como as escalas de David Wechsler, cuja
definição de inteligência subjacente se refere à capacidade conjunta ou global do indivíduo
para agir com finalidade, pensar racionalmente e lidar efetivamente com seu meio
ambiente (Figueiredo, 2002). Esta definição estaria relacionada à teoria da inteligência
composta, ancorada em uma perspectiva integral do desenvolvimento e funcionamento
cognitivo, justificando uma medida global de potencial cognitivo como o QI.
A partir da escala original de Binet-Simon, diversos instrumentos vêm sendo
desenvolvidos, desde as revisões e atualizações do teste de Binet (Roid, 2003). As mais
conhecidas e utilizadas são as escalas Wechsler de inteligência para crianças e adultos
(Wechsler, 1981; 2003), a Kaufman Brief Intelligence Test (1990) passando pelos testes
não verbais como as Matrizes Progressivas de Raven (Raven, 1947) e Toni-3 (Brown,
Sherbenou e Johnson, 1997) que avaliam o fator g. Posteriormente temos as escalas
baseadas na teoria das habilidades cognitivas de Carroll, como a Leiter International
Performance Scale Revised (Roid e Miller, 1997) até Woodcock-Johnson Psycho-
Educational Battery (McGrew e Woodcock, 2001) baseada no modelo CHC.
2.2. Instrumentos Psicológicos: tradução, adaptação e parâmetros psicométricos.
A avaliação psicológica compreende um processo de busca de informações sobre o
funcionamento psicológico das pessoas sobre determinadas situações para que o psicólogo
possa tomar decisões, sendo uma atividade exclusiva do profissional de psicologia. De
acordo com Primi (2003) a avaliação psicológica representa um conhecimento legítimo
além de se constituir num critério de avanço embasado cientificamente.
-
28
Quando se trata de avaliação psicológica, o psicólogo precisa ser capacitado a
avaliar a qualidade dos instrumentos e fazer um uso adequado dos mesmos em sua
testagem psicológica, pois:
“...os testes psicológicos são procedimentos sistemáticos
de observação e registro de amostras de comportamentos e
respostas de indivíduos com o objetivo de descrever e/ou
mensurar características e processos psicológicos,
compreendidos tradicionalmente nas áreas emoção/afeto,
cognição/inteligência, motivação, personalidade,
psicomotricidade, atenção, memória, percepção, dentre
outras, nas suas mais diversas formas de expressão,
segundo padrões definidos pela construção dos
instrumentos” (CFP, 2003; p.2)
Segundo Anastasi e Urbina (2000), o conceito de teste psicológico é: “Uma
ferramenta e essencialmente uma medida objetiva e padronizada de uma amostra de
comportamento”. Sendo assim, esta definição leva a duas inferências a respeito da
testagem psicológica. A primeira seria que os comportamentos são amplos e variados,
sendo tecnicamente inviável ou até mesmo impossível a avaliação de todas as suas
possibilidades. E a segunda é a possibilidade de avaliar um comportamento a partir de sua
amostra.
Em 1996, Cronbach adota uma definição mais ampla a respeito de testagem
psicológica, alegando se tratar de um procedimento sistematizado com o uso de escalas
numéricas e categorias fixas para a observação e descrição do comportamento (Campos,
2008). Ainda de acordo com Cronbach (1996 apud Campos 2008), existem três conceitos
fundamentais que devem estar relacionados à testagem psicológica: a objetividade, a
padronização e a estruturação. Estes estão relacionadas ao grau de interpretação de
diferentes avaliadores a respeito do mesmo resultado obtido no teste, ao grau de
similaridade entre as aplicações do teste e ao grau em que um item só pode ser respondido
de uma forma, sem que haja diversas interpretações da pergunta ou vários caminhos para
respondê-la.
Um teste psicométrico tem como objetivo a medida do comportamento em
determinada quantidade e tem como alvo comportamentos inerentes a todas as pessoas.
Procura-se atingir a objetividade por meio da padronização da aplicação e da estruturação
dos itens. O resultado deve ser expresso em forma de números e deve-se avaliar a margem
de erro que a medida apresenta (Urbina, 2007).
-
29
Os instrumentos de medida são classificados de acordo com as diferentes técnicas
de aferição dos seus parâmetros psicométricos e teorias que fundamentam sua construção
(Pasquali, 2010). Segundo este autor, a taxonomia dos instrumentos psicológicos pode ser
dividida em: testes referentes a critério, a construto, a conteúdo, testes comportamentais,
levantamentos (survey) e novas tecnologias. Os testes de inteligência se encontram no tipo
referente a construto. Sua característica é a construção a partir de uma referencia teórica e
o objetivo é representar um traço latente através do comportamento (resposta ao item), ou
seja, são construídos e validados para medir traços latentes.
Para que um instrumento esteja devidamente qualificado para ser comercializado e
conseqüentemente utilizado na avaliação psicológica, são necessários alguns requisitos
básicos. O Conselho Federal de Psicologia (CFP) bem como outras entidades científicas
internacionais como a American Educational Research Association, a American
Psychological Association e a National Council on Measurement in Education (Aera; Apa;
Ncme, 1999), estão empenhados em proporcionar condições efetivas e seguras para a
utilização de instrumentos psicológicos e são destinadas a apreciar um conjunto de
propriedades básicas que os instrumentos devem possuir de acordo com os parâmetros
estabelecidos internacionalmente, reconhecidos pela comunidade científica.
Na ausência de instrumentos, cria-se um novo que possa medir o construto desejado
para determinada faixa etária ou grupo específico ou adapta-se um já existente em outra
cultura. Para Hambleton e Patsula (1999), existem razões a favor da adaptação de
instrumentos: Muitas vezes a adaptação de um teste é mais barata e rápida do que construir
um novo teste; Quando o instrumento é transcultural, a adaptação é mais eficaz do que a
produção de um instrumento equivalente em uma segunda língua; Pode haver falta de
conhecimento para o desenvolvimento de um novo instrumento; Quando o teste original é
conhecido, há uma segurança maior para utilizá-lo em uma segunda língua.
Na tentativa de evitar instrumentos inadequados, modelos de tradução e adaptação
cultural têm sido propostos pelas Diretrizes Internacionais de Testes. Dentre os vários
modelos, destaca-se o Universal. No modelo universal, em geral, utiliza-se um instrumento
com enfoque transcultural. Essa universalização permite equacionar as dificuldades
referentes à padronização, equivalência e tradução, considerando as diferenças sociais,
econômicas e religiosas dos diferentes países e minimizando a diferença entre as diversas
versões adaptadas (Fleck, 2000).
-
30
Outras importantes contribuições para melhorar a prática do processo de adaptação
de testes para outra cultura estão relacionadas ao desenvolvimento de instrumentos a partir
de parâmetros como as diretrizes propostas pela International Test Commission (ITC).
Foram elaboradas vinte e duas diretrizes divididas em quatro domínios: contexto, descrição
dos princípios básicos de estudos em vários idiomas; desenvolvimento, recomendações da
prática do desenvolvimento de instrumentos em várias línguas; aplicação, publicação dos
procedimentos do instrumento; manual com a interpretação e normatização, relato da
interpretação e comparação dos resultados em diversas culturas. Hambleton e Patsula
(1999) descrevem etapas nas quais o processo de tradução e adaptação deve ser baseado:
1) Equivalência do construto: é necessário assegurar a equivalência do constructo
nas versões original e traduzida, verificando se o mesmo fenômeno pode ser medido nas
duas culturas.
2) Criar ou traduzir o instrumento: decidir se é melhor traduzir ou criar um novo
instrumento devido a semelhanças ou diferenças nos idiomas em questão.
3) Escolha do tradutor (individual ou comitê): o tradutor deve ter fluência nas duas
línguas, familiaridade com as duas culturas envolvidas no estudo, ter conhecimento na
construção de teste e saber como mensurá-lo adequadamente. Sendo que a formação de um
comitê permite melhores resultados.
4) Tradução e adaptação do teste: deve se utilizar como referência a versão original
do teste e não a versão já adaptada para outra língua. Esta etapa envolve a tradução para
outro idioma e retrotradução para versão original.
5) Revisão da adaptação: revisão necessária para a equivalência do teste. É
necessário verificar a clareza dos itens e também o nível de dificuldade das palavras
utilizadas na tradução.
As etapas descritas acima são relevantes, pois mesmo em se tratando de
instrumentos ditos “transculturais”, como a Leiter-R (Anastasi e Urbina, 2000), é inviável
pensar em provas totalmente livres de cultura, levando-se em consideração que o peso das
variáveis culturais pode ser diminuído, mas não anulado (Almeida e cols, 2008a)
6) Teste Piloto: realizado com uma amostra menor para verificar a consistência do
instrumento.
-
31
7) Análise estatística: nesta etapa é feita análise dos resultados e dos itens do teste,
em que podem ser verificadas possíveis falhas.
8) Comparação com outros grupos: necessária quando o foco da pesquisa for a
comparação transcultural ou a normatização na nova versão.
9) Revisão das etapas 7 e 8: No caso do instrumento apresentar falhas, será
necessário re-traduzir, re-analisar e re-escrever o teste.
10 e 11) Padronização / normatização e manual: referente à aplicação do teste,
validação, normatização, documentação descrevendo o processo de cada etapa e a
preparação do manual para os usuários do teste.
Além de uma tradução e adaptação consistente e adequada, os testes psicológicos
devem ter seus aspectos psicométricos verificados para garantir sua qualidade. De acordo
Urbina (2007), as principais características que definem a adequação de um instrumento
psicométrico, são a fidedignidade e a validade.
A fidedignidade ou precisão do instrumento indica a confiabilidade dos resultados
do processo de mensuração, ou seja, é a qualidade dos escores de teste que sugere que eles
são suficientemente consistentes e livres de erros de mensuração para serem úteis. Sendo
assim, um instrumento pode ser considerado fidedigno à medida que ele mantém
estabilidade e consistência da medida de um construto que em teoria deve ser estável e
consistente, independente das condições externas. Portanto, vale ressaltar que a qualidade
da fidedignidade não pertence aos testes em si, mas aos escores deles obtidos (Urbina,
2007; Gauer, Gomes e Haase, 2010).
Os métodos para investigar a fidedignidade dos escores oferecem um meio para
estimar escores verdadeiros, ou pelo menos os limites dentro dos quais estes poderiam se
localizar. O conceito de escore verdadeiro se refere às entidades hipotéticas que
resultariam de mensurações completamente livres de erros (Gulliksen, 1950 apud Urbina,
2007). Na prática é impossível obter tal escore e por isso obtém-se o escore observado, ou
seja, escores que os indivíduos efetivamente obtêm.
Ao analisar um conjunto de escores observados numa amostra, é possível verificar
sua variância. A variância consiste em uma porção de variância verdadeira e uma porção
de variância de erro. A primeira se refere as diferenças entre os escores dos indivíduos de
um grupo que refletem sua posição na característica avaliada pelo teste. A segunda é
composta pelas diferenças entre os escores que refletem fatores irrelevantes ao que o teste
-
32
avalia. Sendo assim, a fidedignidade dos escores aumenta à medida que o componente de
erro diminui.
A informação sobre o erro de medida é indispensável para a própria avaliação e
para o uso do instrumento (Noronha, Freitas e Ottati, 2002) e por isso a avaliação da
fidedignidade de um escore envolve determinar quais as possíveis fontes de erro que
podem interferir no escore e estimar a magnitude destes erros. De acordo com Urbina
(2007) existem diversas e variadas fontes de erros que cada tipo de teste está propenso. As
principais são: diferenças entre avaliadores, erros de amostragem de tempo, erro de
amostragem de conteúdo, inconsistência entre itens, inconsistência entre itens e
heterogeneidade de conteúdo combinados e por fim, erros de amostragem de tempo e
conteúdo combinados. Sendo que para cada tipo de erro, existem medidas apropriadas para
estimá-los.
Alguns autores descrevem formas de se obter o coeficiente de fidedignidade, tais
como: fidedignidade do avaliador, de teste-reteste, de forma alternativa, método das
metades, medidas de consistência interna, entre outras. A fidedignidade do avaliador, ou
fidedignidade interjuízes, consiste em fazer com que pelo menos dois indivíduos diferentes
avaliem o mesmo conjunto de testes, em que o desempenho de cada testando gere dois ou
mais escores independentes, sendo um método básico para estimar erros devido a
diferenças entre avaliadores. As correlações entre os conjuntos de escores gerados devem
ser altas e positivas, ou seja, maior ou igual a 0,90 sugerindo que a proporção do erro deve
ser menor ou igual a 0,10. Este tipo de análise se aplica a testes abertos, que envolvem
algum grau de subjetividade, em que as respostas não são classificadas com certas ou
erradas (Urbina, 2007; Gauer, Gomes e Haase, 2010).
A fidedignidade teste-reteste é utilizada em testes de traços ou comportamento
relativamente estáveis, cuja fonte de erro está relacionada à amostragem de tempo. Trata-se
de uma medida de estabilidade em que o mesmo instrumento é aplicado na mesma amostra
de sujeitos em duas ou mais ocasiões, separadas por um certo intervalo de tempo. A
correlação entre os escores reflete o quanto o instrumento mantém a consistência de sua
medida ao longo do tempo e o quanto os itens são representativos independentemente de
fatores externos. No entanto vale ressaltar que o intervalo de tempo entre as duas
administrações pode afetar a estabilidade dos escores, pois se for muito curto, os testandos
podem lembrar-se das respostas que deram anteriormente e haverá o componente de
memória interferindo nos escores. Se for um intervalo demasiadamente extenso, existe a
-
33
possibilidade de que experiências intervenientes venham afetar os segundos escores, bem
como a própria maturação cerebral em caso de crianças em idade escolar.
Já a fidedignidade de forma alternativa ou paralela se faz pertinente quando a fonte
de erro está relacionada à amostragem de conteúdo em testes que requerem estabilidade e
consistência dos resultados como um todo. Para isso, desenvolvem-se duas ou mais formas
diferentes de um teste, de itens equivalentes em conteúdo e dificuldade e posteriormente
avalia-se a correlação entre os escores obtidos nas duas versões pela mesma amostra.
Trata-se de uma forma mais sensível de obter o coeficiente de estabilidade em relação ao
teste-reteste porque defende o procedimento contra possíveis efeitos de aprendizagem
advindos da aplicação dos mesmos itens.
O desenvolvimento de formas paralelas de um instrumento ou seu reteste podem
envolver problemas teóricos e práticos. Desta forma, uma solução é administrar um teste
em uma amostra e criar dois escores para cada indivíduo. Esta seria a fidedignidade pelo
método das metades ou split-half. O método das metades consiste em dividir um teste em
duas partes e correlacionar os resultados obtidos nas duas metades. Trata-se de uma forma
simples e rápida de verificar a homogeneidade dos itens que compõe um instrumento. Vale
ressaltar que este método fornece um índice de heterogeneidade, mas não permite
descobrir quais itens são responsáveis por ela. Para que isto ocorra, é necessária uma
análise do conteúdo do instrumento para localizar tais itens (Urbina, 2007). Quando se
trata de instrumentos que avaliam diversas características para inferir uma terceira, este
procedimento deve ser realizado com cada uma das características separadamente
(Campos, 2008).
No entanto, os escores dos testes podem ser fidedignos e ainda assim não terem
utilidade para se fazer inferências. Por isso, além dos escores serem precisos (consistentes
e confiáveis), é necessário que sejam válidos. (Pasquali, 1998, Colzby, 2003; Urbina, 2007;
Gauer, Gomes e Haase, 2010).
O segundo conceito relevante ao falarmos de parâmetros psicométricos é a
validade. De acordo com a definição clássica, a validade se refere àquilo que o teste mede
e quão bem ele o faz (Anastasi e Urbina, 2000). Entretanto, a definição dada pelos
Standards for Educational and Psychological Testing mostra-se mais adequada e por isso
mais utilizada atualmente. De acordo com a definição apresentada pelos Standards, a
validade se refere ao grau no qual as evidências e teoria apóiam as interpretações dos
-
34
escores implicadas no uso de testes (Aera; Apa; Ncme, 1999). O conceito atual de validade
foi fortemente influenciado por Samuel Messick. Segundo este autor:
“A validade é um julgamento avaliativo integrado do grau
em que as evidências empíricas e a fundamentação teórica
corroboram a adequação e a propriedade de inferências e
ações baseadas em escores de teste ou outros modos de
avaliação (Messick, 1989, p.13)”
A essência do julgamento a respeito da validade dos escores de teste está centrada
no relacionamento entre aquilo que os escores representam e as perguntas que os usuários
de testes querem responder com o seu uso. Portanto, a validade se estabelece pela
adequação do conteúdo semântico dos itens ao construto teórico que o teste quer medir
(Urbina, 2007; Gauer, Gomes e Haase, 2010). Sendo assim, Anastasi e Urbina (2000)
ressaltam que não se pode afirmar que um teste possui alta ou baixa validade, pois esta
precisa ser estabelecida com referência ao uso específico para o qual o teste está sendo
considerado.
O processo de validação é semelhante à testagem de hipóteses, incluindo noções
como a de fidedignidade dos escores e os modos como as aplicações dos dados de teste na
pesquisa e na prática psicológica podem ser justificados (Urbina, 2007). E todos os
procedimentos para determinar a validade de um teste preocupam-se com as relações entre
o desempenho no teste e outros fatos que podem ser independentemente observados que
estão relacionados ao comportamento em consideração.
De acordo com Urbina (2007), existem fontes de evidências de validade que estão
relacionadas a três aspectos: ao conteúdo, a padrões de convergência e divergência e ao
critério. Segundo Campos (2008), os tipos de validade não são mutuamente excludentes e
podem estar presentes em um mesmo instrumento.
Na validade relacionada ao conteúdo, estão incluídas a relevância e
representatividade do conteúdo do teste e dos processos de resposta às tarefas e a validade
de face (Urbina, 2007). Os procedimentos de validação do conteúdo envolvem o exame
sistemático do conteúdo do teste para determinar se ele abrange uma amostra
representativa do domínio de comportamento a ser medido. E o domínio do
comportamento a ser testado deve ser analisado para assegurar que todos os aspectos mais
importantes estão incluídos nos itens do teste e nas proporções corretas (Anastasi e Urbina,
2000).
-
35
A segunda fonte está relacionada a padrões de convergência e divergência. Estes
compreendem a consistência interna de resultados de teste e outras medidas de
fidedignidade, correlação entre testes e subtestes, matriz multitraço-multimétodo,
diferenciação de escores de acordo com diferenças esperadas com base na idade e outras
variáveis de status, resultados experimentais (correspondência entre escores de teste e os
efeitos preditos de intervenções experimentais ou hipóteses baseadas em teorias), análise
fatorial exploratória e técnicas de modelagem de equação estrutural (Urbina, 2007).
Por fim, evidências de validade relacionadas ao critério se referem à precisão das
decisões baseadas na validação concorrente (correlação entre escores de teste e critérios
existentes) e precisão de decisões ou predições baseadas na validação preditiva (correlação
entre escores de teste e critérios preditivos). Desta forma, a validade é a consideração mais
fundamental relacionada à construção e análise dos testes, pois revela o quanto a evidência
e o suporte teórico do teste estão absorvidos na proposta apresentada que podem
corroborar qualquer inferência feita a partir dos resultados do teste (Noronha, Freitas e
Ottati, 2002; Urbina 2007).
Visto a relevância de estudos que contemplem a tradução, adaptação, fidedignidade
e evidências de validade, pesquisas têm sido desenvolvidas no sentido de adaptação de
testes para avaliação de diversas habilidades cognitivas. Podemos citar os estudos
realizados e orientados por Macedo e outros pesquisadores, que têm por objetivo a a
adaptação de testes para avaliação de funções cognitivas, tais como: linguagem (Capovilla,
Thiers, Macedo, Duduchi, 1998; Macedo, Charin, Capovilla, 2002; Capovilla, Capovilla,
Macedo, Charin, 2004a; Macedo, Capovilla, Duduchi, D'antino, Firmo, 2006; Macedo,
Firmo, Duduchi, Capovilla, 2007), leitura e escrita (Capovilla, Macedo, Penna, Capovilla,
2006) atenção (Capovilla, Capovilla, Macedo, Charin, 2004b) entre outros. Além disso,
outros estudos tiveram como objetivo realizar adaptações culturais de testes desenvolvidos
no Brasil para outros idiomas, como a Bateria de Avaliação de Leitura e Escrita em
japonês (Kuryiama, 2007) e hebraico (Dichi, 2008).
Com relação aos testes de inteligência, o tema tem sido amplamente estudado a
nível nacional, abarcando desde questões teóricas referentes aos modelos existentes,
desenvolvimento de instrumentos e aplicações destes em populações específicas. Isto
reflete uma preocupação de pesquisadores na busca pela qualidade dos testes
disponibilizados no mercado e na criação de novos instrumentos. Nesta linha, podemos
-
36
citar alguns dos estudos realizados na última década referentes à criação, adaptação e
evidências de validade e fidedignidade de instrumentos:
Estudo de validação da Bateria de Provas de Raciocínio – BPR-5 (Primi e
Almeida, 2000);
Matrizes progressivas do Raven Infantil: um estudo de validação para o
Brasil (Pasquali, Wechsler e Bensusan, 2002);
Uma alternativa na avaliação da inteligência infantil: o Teste R-2 (Rinaldi,
2003);
Critério de Integração do Teste de Bender: Explorando Evid�