traduÇÃo, adaptaÇÃo, fidedignidade e evidÊncias de...

UNIVERSIDADE PRESBITERIANA MACKENZIE

TATIANA PONTRELLI MECCA

TRADUÇÃO, ADAPTAÇÃO, FIDEDIGNIDADE E EVIDÊNCIAS DE VALIDADE

DA BATERIA DE VISUALIZAÇÃO E RACIOCÍNIO DA

“LEITER INTERNATIONAL PERFORMANCE SCALE-REVISED”

SÃO PAULO

2010




LEITER INTERNATIONAL PERFORMANCE SCALE-REVISED

Dissertação apresentada ao

Programa de Pós-Graduação em

Distúrbios do Desenvolvimento

da Universidade Presbiteriana

Mackenzie como requisito para

obtenção do título de mestre.

Orientador: Prof. Dr. Elizeu Coutinho de Macedo.

SÃO PAULO

2010

M486t Mecca, Tatiana Pontrelli Traduçăo, adaptação, fidedignidade e evidencias de validade da bateria de raciocínio e visualizaçăo da Leiter International Performance Scale Revised / Tatiana Pontrelli Mecca - São Paulo, 2010 161 f. : il. ; 30 cm

Dissertação (Mestrado em Distúrbios do Desenvolvimento) - Universidade Presbiteriana Mackenzie, 2010.

Referências bibliográficas: f. 145-158.

1. Avaliação Psicológica. 2. Inteligência. 3. Leiter-R. I. Título.

CDD 153.9




LEITER INTERNATIONAL PERFORMANCE SCALE-REVISED

Dissertação apresentada ao

Programa de Pós-Graduação em

Distúrbios do Desenvolvimento

da Universidade Presbiteriana

Mackenzie como requisito para

obtenção do título de mestre.

Aprovada em __________________

BANCA EXAMINADORA

Profº Dr. Elizeu Coutinho de Macedo – Orientador

Universidade Presbiteriana Mackenzie

Profª Dra. Alessandra Gotuzo Seabra

Universidade Presbiteriana Mackenzie

Profº Dr. Ricardo Primi

Universidade São Francisco

APOIO:

Este trabalho obteve apoio e financiamento da

Fundação de Amparo à Pesquisa do Estado de

São Paulo e Mackpesquisa.

AGRADECIMENTOS

Este trabalho é fruto da dedicação, investimento, colaboração e esforço de muitas

pessoas e aqui vai o meu “muito obrigada” a cada um que me ajudou a torná-lo possível.

Primeiramente agradeço ao meu orientador, professor doutor Elizeu Coutinho de

Macedo. Obrigada por tudo! Pelo que me ensinou enquanto meu professor na graduação,

pelos anos de iniciação científica e por ter aceitado orientar este trabalho. Todas as lições,

todas as conversas, todos os ensinamentos foram muito valiosos, essenciais e

determinantes para o meu caminho profissional e pessoal. Não há palavras que traduzem a

imensa admiração que tenho por você.

À professora doutora Alessandra Gotuzo Seabra que além de trazer ricas

contribuições como parte da banca examinadora, me incentivou e me ajudou com seus

conhecimentos na elaboração do projeto inicial que resultou neste trabalho. Sua

competência e sua gentileza é exemplo para todos que estão a sua volta. Muitíssimo

obrigada Alê!

Ao professor doutor Ricardo Primi que contribuiu não só com suas discussões e

conhecimento compartilhado como parte da banca examinadora, mas também como autor

de muitas das referencias lidas para o corpo teórico deste trabalho. Suas pesquisas têm sido

de fundamental importância para aqueles que estudam avaliação da inteligência. Também

agradeço pela oportunidade de assistir as aulas de TRI!

Agradeço àquelas que me ensinaram a dar os primeiros passos. As colegas de

laboratório que fizeram parte do início da minha trajetória profissional e que me serviram

de exemplo durante esses anos: Katerina Lukasova, Carolina Nikaedo, Luane Natalle,

Carolina Kuriyama e Riviane Borghesi Bravo. Especialmente à Fernanda Tebexreni Orsati,

que nestes seis anos não poupou esforços para me ensinar, me orientar e mesmo longe,

sempre esteve presente. Fe, deixo aqui registrado o quanto você é essencial na minha

formação.

Aos professores e colegas do grupo de Transtornos Globais do Desenvolvimento da

Universidade Presbiteriana Mackenzie com quem dividi boa parte destes anos. Cada um a

sua maneira contribuiu de forma valiosa para o meu crescimento profissional e pessoal:

Salomão, Decio, Elói, Maria Cristina, Cristiane, Roberta, Renata e Alessandra. Sou

imensamente grata por todos os momentos. Aliás, devo ressaltar aqui que minha maior

motivação para este trabalho veio dos 4 anos que dividi com vocês.

Darlene, Camila, Bruna, Rivi, Cintia e Natália: mais do que minhas colegas de

mestrado ou de laboratório, minhas amigas queridas! Obrigada pelo carinho, amizade,

companheirismo, apoio, incentivo...enfim...contar com vocês fez toda a diferença!!!!!! Me

sinto honrada de ter amigas como vocês.

Àqueles que de alguma forma me ajudaram na execução deste trabalho, seja na

tradução e adaptação da Leiter-R, bem como na coleta, tabulação e análise dos dados:

professora Ceres Alves de Araújo, Natália Martins Dias, Bruna Tonietti Trevisan, Arthur

Berberian, Alexandre Bizzocchi, Mayra Fernanda Ferreira Seraceni e Gizelly de Lima

Alemida . Agradeço especialmente à Daniela Aguilera Moura Antonio pela super força e

disponibilidade durante a coleta e tabulação dos dados e também por dar continuidade a

este trabalho. Dani, obrigada por ter participado deste trabalho como se ele fosse seu. Sua

ajuda fez toda a diferença! E ainda temos mais dois anos nessa jornada...

Agradeço a todos os professores do Programa de Pós-Graduação em Distúrbios do

Desenvolvimento e aos colegas do Laboratório de Neurociência Cognitiva, por todos os

momentos de aprendizado que me proporcionaram.

Lembro especialmente da Alícia e Karine, secretárias do Programa de Pós-

Graduação em Distúrbios do Desenvolvimento e Denise da Coordenadoria de Pesquisa da

Universidade Presbiteriana Mackenzie, que sempre estiveram dispostas a me ajudar em

todos os momentos que precisei.

À minha família: Aninha, Gordinho, Tico e Le. Vocês tornaram isso possível. Se

cheguei até aqui foi graças ao investimento, apoio e auxílio incondicional que eu tive desde

o início. Agradeço imensamente todo o esforço e dedicação que vocês tiveram ao me

proporcionar todas as condições necessárias para que eu pudesse realizar este trabalho e

me dedicar exclusivamente a ele. Eu amo vocês!

Por fim, agradeço aos professores, coordenação, direção e a todos os funcionários

das escolas que fizeram o possível e o impossível para que eu conseguisse realizar meu

trabalho. Aos pais e alunos que participaram da pesquisa. Vocês formam os maiores

responsáveis por todo este aprendizado.

RESUMO

MECCA, TP. Tradução, Adaptação, Fidedignidade e Evidências de Validade da Bateria

de Visualização e Raciocínio da Leiter International Performance Scale Revised.

Dissertação de Mestrado, Programa de Pós-Graduação em Distúrbios do Desenvolvimento.

Universidade Presbiteriana Mackenzie, São Paulo, 2010.

Testes tradicionais que avaliam inteligência exigem habilidades e formas de responder que

são difíceis para sujeitos com condições clínicas específicas como os distúrbios do

desenvolvimento. Assim, é necessário disponibilizar instrumentos que possibilitem essa

avaliação. Um teste utilizado internacionalmente para avaliação de inteligência não-verbal

nos distúrbios do desenvolvimento é a Leiter-R, aplicada dos 2 aos 20 anos. São fornecidas

três medidas de desempenho: Raciocínio Fluido, QI Estimado e QI Total, por meio dos

subtestes da Bateria de Visualização e Raciocínio. O objetivo deste estudo foi realizar a

tradução, adaptação e verificar parâmetros psicométricos da Bateria de Visualização e

Raciocínio da Leiter-R em pré-escolares. A tradução e adaptação foram realizadas de

acordo com pressupostos apresentados nas diretrizes da International Test Commission

seguindo as seguintes etapas: tradução, julgamento, adaptação e revisão da versão final.

Participaram 254 crianças entre 3 e 6 anos, alunos de 1º a 3º Estágio do Ensino Infantil de

duas escolas públicas da cidade de São Paulo. Resultados de análise de variância

mostraram efeito da idade e série no desempenho em todos os subtestes da Leiter-R, exceto

para o subteste de Sequencias. Diferenças no desempenho devido ao tempo de

escolarização foram encontradas no subteste Padrões Repetidos em crianças de 4 anos do

1º Estágio e nos subtestes Figura-Fundo e Formas Completas em crianças de 5 anos no 2º

Estágio. ANOVA revelou diferença de gênero para a idade de 6 anos no subteste Dobra de

Papel com melhor desempenho no grupo feminino. Padrões de convergência foram

verificados através de correlações positivas e significativas entre os escores na Leiter-R

com a Escala de Maturidade Mental Columbia e Matrizes Progressivas Coloridas de

Raven. Correlações entre teste e reteste foram positivas e significativas para a maioria dos

subtestes. Os coeficientes de Spearman-Brown ficaram em torno de 0,84 e Alfa de

Cronbach por idade e série, mostraram valores em torno de 0,77 indicando boa precisão

dos subtestes. Desta forma, os resultados sugerem boa adequação dos parâmetros

psicométricos da Leiter-R, preenchendo requisitos básicos que atestam a qualidade do

instrumento.

Palavras-chave: Avaliação Psicológica, Inteligência, Leiter-R.

ABSTRACT

MECCA, TP. Translation, Adaptation, Reliability and Validity Evidences of the

Visualization and Reasoning Battery of the Leiter International Performance Scale

Revised. Master's Thesis, Post-Graduation Program in Developmental Disorders.

Universidade Presbiteriana Mackenzie, City of São Paulo – Brazil, 2010.

Traditional tests that assess intelligence require skills and ways of responding that are

difficult for individuals with specific clinical conditions such as developmental disorders.

Thus, it is necessary to provide tools that enable this evaluation. An internationally used

test for evaluating nonverbal intelligence in developmental disorders is the Leiter-R,

applied from ages 2 to 20. Three performance measures are provided: Fluid Reasoning,

Estimated IQ and Total IQ, by means of subtests of the Visualization and Raciocínio

Battery. The objective of this study was to perform the translation, adaptation and to check

psychometric parameters of the Visualization and Reasoning Battery of the Leiter-R in pre-

school children. The translation and adaptation were performed according to assumptions

presented in the guidelines of the International Test Commission by following these steps:

translation, examination, adaptation and review of the final version. Participants were 254

children between ages 3 and 6, students of 1st to 3

rd Stage of Childhood Education from

two public schools in the city of São Paulo. Results of variance analysis showed significant

effect of age and grade in performance in all Leiter-R subtests, except Sequential Order.

Differences in performance due to the time of schooling were found in the “Repeated

Patterns” subtest in children at age 4 of the 1st Stage and in the “Figure-Ground and Form

Completion” subtests in children at age 5 of the 2nd

Stage. ANOVA revealed differences of

gender for age 6 in the “Paper Folding” subtest, with better performance in the feminine

group. Patterns of convergence were verified through significant and positive correlations

between scores in the Leiter-R with the Columbia Mental Maturity Scale and Raven’s

Coloured Progressive Matrices. Correlations between test and retest were positive and

significant for most subtests. The Spearman-Brown coefficients were around 0.84 and

Cronbach's Alpha for age and grade showed values around 0.77 indicating good accuracy

of subtests. Thus, the results suggest good adequacy of psychometric parameters of the

Leiter-R, fulfilling basic requirements that attest to the quality of the tool.

Keywords: Psychological Assessment, Intelligence, Leiter-R.

LISTA DE FIGURAS

Pag.

Figura 1: Modelo hierárquico de Gustafsson 50

Figura 2: Modelo hierárquico para os subtestes aplicados a faixa etária de 2

a 5 anos.

53

Figura 3: Modelo hierárquico para os subtestes aplicados a faixa etária de 6

a 10 anos.

53

Figura 4: Modelo hierárquico para os subtestes aplicados a faixa etária de

11 a 20 anos.

54

Figura 5. Tendências desenvolvimentais para os escores na Leiter-R. 64

Figura 6. Análise Fatorial Confirmatória para as idades de 4-5 anos. 66

Figura 7. Análise Fatorial Confirmatória para as idades de 6-10 anos. 66

Figura 8. Item 1 da forma A do teste Matrizes Coloridas de Raven 75

Figura 9. Prancha do exemplo 1 da EMMC. 76

Figura 10. Prancha do Item 2 do subteste 1. 77

Figura 11. Cartões A, B e C (esquerda para a direita) do item 2, subteste 1. 78

Figura 12. Prancha do item 1 do subteste 2. 79

Figura 13. Cartões correspondentes ao item 1 do subteste 2. 79

Figura 14. Prancha do item 1 do subteste 3 (Parte I) 80

Figura 15. Cartão correspondente ao item 1 do subteste 3 (Parte I). 80

Figura 16. Prancha do item 10, subteste 3 (Parte II). 80

Figura 17. Cartões correspondentes ao item 10 do subteste 3 (Parte II). 80

Figura 18. Prancha do item 2, subteste 4. 81


Figura 20. Prancha do item 2 do subteste 5. 82







Figura 27. Cartão correspondente ao item 4 do subteste 8. 85



Figura 30. Prancha do item 1, subteste 10 87

Figura 31. Cartão correspondente ao item 1 do subteste 10. 87

LISTA DE TABELAS

Pag.

Tabela1. Modelo da Teoria dos Três Estratos e John Carroll. 20

Tabela 2. Definição dos dez fatores amplos da teoria CHC. 24

Tabela 3. Descrição dos 6 domínios incluídos no Estrato II da CHC. 25

Tabela 4: Valores de índice d e interpretações para diferença de gênero. 37

Tabela 5: Substestes da Bateria de Raciocínio e Visualização (VR) e as

idades correspondentes para a aplicação.

52

Tabela 6: Processos cognitivos avaliados pela Bateria VR da Leiter-R. 55

Tabela 7: Subtestes aplicados para obtenção de QI Estimado e QI Total

para cada faixa etária.

56

Tabela 8: Subtestes classificados por índices fatoriais e idade. 56

Tabela 9: Descrição das classificações obtidas na Leiter-R pela Bateria

de Raciocínio e Visualização.

57

Tabela 10: Consistência Interna dos subtestes da Bateria VR de acordo

com a idade.

59

Tabela 11: Médias dos pontos ponderados para Teste, Reteste e

Correlação de Pearson.

59

Tabela 12. Valores em porcentagem para sensibilidade e especificidade

segundo a amostra normal, com atraso cognitivo e altas habilidades.

61

Tabela 13. Estatísticas descritivas e Correlação de Pearson entre as duas

versões da Leiter.

62

Tabela 14: Cargas fatoriais dos subtestes para o Fator Visualização. 65

Tabela 15: Cargas fatoriais dos subtestes para o Fator Raciocínio. 65

Tabela 16: Correlações entre os subtestes da Bateria VR para as idades

de 2-3 anos.

67


de 4-5 anos.

67


de 6-10 anos.

67

Tabela 19: Caracterização da amostra: grupos etários, número de sujeitos, 73

porcentagem e porcentagem cumulativa.

Tabela 20: Caracterização da amostra: série, número de sujeitos,

porcentagem e porcentagem cumulativa.

73

Tabela 21: Caracterização da amostra: meses de escolarização, número

de sujeitos, porcentagem e porcentagem cumulativa.

74

Tabela 22: Estatísticas descritivas da amostra geral para a EMMC,

MPCR, subteste

90

Tabela 23. Valores de Alfa de Cronbach dos subtestes da Leiter-R em

relação à amostra geral e por faixa etária.

93

Tabela 24: Coeficientes de Correlação de Pearson (r) e valores p para

teste-reteste.

94

Tabela 25: Método das Metades para cada subteste da Leiter-R. 94

Tabela 26. Valores de Kolmogorov-Smirnov e Levene de acordo com os

grupos etários para EMMC.

97

Tabela 27. Estatísticas Descritivas da EMMC em função dos grupos

etários.

97

Tabela 28. Análise de Pares de Bonferroni para efeito da idade na

EMMC.

98

Tabela 29: Valores de Kolmogorov-Smirnov Z e Levene de acordo com

as séries escolares para EMMC.

98

Tabela 30: Estatísticas Descritivas da EMMC em função das séries

escolares.

99

Tabela 31: Análise de Pares de Bonferroni para efeito da série na

EMMC.

99

Tabela 32. Valores de Kolmogorov-Smirnov Z e Levene de acordo com

grupos etários para MPCR.

101

Tabela 33: Estatísticas Descritivas da MPCR em função dos grupos

etários.

101

Tabela 34: Teste Mann-Whitney para efeito da idade na MPCR. 101


as séries escolares para MPCR.

102

Tabela 36: Estatísticas Descritivas da MPCR em função das séries

escolares.

102

Tabela 37: Teste Mann-Whitney para efeito da série na MPCR. 102


grupos etários para o subteste Figura-Fundo.

104

Tabela 39: Estatísticas descritivas para o subteste Figura-Fundo de

acordo com os grupos etários.

104

Tabela 40. Teste de Kruskal-Wallis para efeito da idade no subteste

Figura-Fundo.

105


as séries escolares para o subteste Figura-Fundo.

105

Tabela 42: Estatísticas descritivas para o subteste Figura-Fundo em

função das séries escolares.

106

Tabela 43: Teste de Kruskal-Wallis para efeito da série no subteste

Figura-Fundo.

106


grupos etários para o subteste Formas Completas.

108

Tabela 45: Estatísticas descritivas para o subteste Formas Completas em

função dos grupos etários.

108

Tabela 46: Teste de Kruskal-Wallis para efeito da idade no subteste

Formas Completas.

109


as séries escolares para o subteste Formas Completas.

109

Tabela 48: Estatísticas descritivas do subteste Formas Completas em


110


Formas Completas.

110


grupos etários para o subteste Pareamento.

112

Tabela 51: Estatísticas descritivas para o subteste Pareamento em função

dos grupos etários

112

Tabela 52: Análise de Pares de Bonferroni para efeito da idade no

subteste Pareamento.

113


as séries escolares para o subteste Pareamento.

113

Tabela 54: Estatísticas descritivas para o subteste Pareamento de em

função da série.

114


Pareamento.

114


grupos etários para o subteste Sequencias.

115

Tabela 57: Estatísticas descritivas para o subteste Sequencias em função

dos grupos etários.

116


Sequencias.

116


as séries escolares para o subteste Sequencias.

117

Tabela 60: Estatísticas descritivas para o subteste Sequencias em função

das séries escolares.

117

Tabela 61: Análise de Pares de Bonferroni para efeito da série no

subteste Sequencias.

118


grupos etários para o subteste Padrões Repetidos.

120

Tabela 63: Estatísticas descritivas para o subteste Padrões Repetidos em


120

Tabela 64: Análise de Pares de Bonferroni para efeito da idade em

Padrões Repetidos.

121


as séries escolares para o subteste Padrões Repetidos.

121

Tabela 66: Estatísticas descritivas para o subteste Padrões Repetidos em


122

Tabela 67: Análise de Pares de Bonferroni para efeito da série no

subteste Padrões Repetidos.

122


grupos etários para o subteste Classificação.

123

Tabela 69: Estatísticas descritivas para o subteste Classificação em


124


Classificação.

124


as séries escolares para o subteste Classificação.

124

Tabela 72: Estatísticas descritivas para o subteste Classificação em 125



Classificação.

125

Tabela 74: Estatísticas descritivas para o subteste Analogias de Desenho

(AD) e Dobra de Papel (DP).

127

Tabela75: Sumário do modelo oriundo da Regressão Linear Múltipla. 129

Tabela 76. Coeficientes de regressão. 130

Tabela 77. Estatísticas descritivas em função de meses de escolarização

para crianças de 4 anos do 1º estágio.

131

Tabela 78. Estatísticas descritivas em função de meses de escolarização

para crianças de 5 anos do 2º estágio.

132

Tabela 79: ANOVA para o desempenho nos subtestes da Leiter-R em

função do tempo de escolarização

133

Tabela 80. ANOVA para efeito de gênero na Leiter-R 135

Tabela 81. Correlações de Pearson entre MPCR, EMMC, QI Estimado e

Raciocínio Fluido.

136

Tabela 82 : Correlação da MPCR e EMMC com o QI Total da Leiter-R 137

Tabela 83: Valores de Correlação de Pearson entre os Subtestes da

Leiter-R, EMMC e MPCR.

138

Tabela 84: Correlações entre os subtestes da Bateria VR para a idade de 3

anos.

138


de 4-5 anos.

139

Tabela 86: Correlações entre os subtestes da Bateria VR para a idade de 6

anos.

139

Tabela 87. Análise Fatorial Exploratória referente ao grupo etário de 3

anos.

140

Tabela 88. Análise Fatorial Exploratória referente ao grupo etário de 4-5

anos.

141

Tabela 89. Análise Fatorial Exploratória referente ao grupo etário de 6

anos.

142

SUMÁRIO

1. APRESENTAÇÃO....................................................................................15

2. PRESSUPOSTOS TEÓRICOS..................................................................17

2.1. Inteligência: Estrutura e Cognição...................................................17

2.2. Instrumentos Psicológicos: Tradução, Adaptação e Parâmetros

Psicométricos...............................................................................................27

2.3. Diferenças Individuais na Inteligência em Função de Critérios

Externos.......................................................................................................37

2.4. Avaliação da Inteligência na Infância................................................41

2.5. The Leiter International Performance Scale Revised…………….....49

2.5.1. Aspectos gerais do instrumento...............................................49

2.5.2. Parâmetros Psicométricos da Bateria VR da Leiter-R..............58

2.5.3. Leiter-R e os Distúrbios do Desenvolvimento........................68

3. OBJETIVOS...............................................................................................72

3.1. Objetivo Geral.....................................................................................72

3.2. Objetivos Específicos..........................................................................72

4. MÉTODO...................................................................................................73

4.1.Participantes..........................................................................................73

4.2.Instrumentos..........................................................................................74

4.3. Procedimentos......................................................................................87

5. RESULTADOS E DISCUSSÃO...............................................................90

5.1. Dados Gerais da Amostra.....................................................................90

5.2. Coeficientes de Fidedignidade.............................................................92

5.3. Evidências de Validade por Mudanças Desenvolvimentais..................95

5.3.1. Escala de Maturidade Mental Colúmbia.........................................96

5.3.2. Matrizes Progressivas Coloridas de Raven...................................100

5.3.3. Figura-Fundo da Leiter-R.............................................................103

5.3.4. Formas Completas da Leiter-R.....................................................107

5.3.5. Pareamento da Leiter-R................................................................111

5.3.6. Sequencias da Leiter-R.................................................................115

5.3.7. Padrões Repetidos da Leiter-R.....................................................119

5.3.8. Classificação da Leiter-R..............................................................123

5.3.9. Subtestes Analogias de Desenho e Dobra de Papel...................126

5.3.10. Síntese dos Resultados por Tendências Desenvolvimentais....127

5.4. Análise de Regressão Linear Múltipla...............................................129

5.5. Análise por Tempo de Escolarização.................................................130

5.6. Análise por Diferença de Gênero.......................................................134

5.7. Análises de Correlação com outros instrumentos..............................136

5.8. Análise Fatorial Exploratória.............................................................140

6. CONCLUSÃO..........................................................................................143

7. REFERÊNCIAS BIBLIOGRÁFICAS.....................................................145

8. APÊNDICES............................................................................................159

A. Carta de Informação à Instituição........................................................159

B. Carta de Consentimento Livre e Esclarecido aos pais.........................160

C. Carta de aprovação do Comitê de Ética...............................................161

15

1. APRESENTAÇÃO

A avaliação de habilidades cognitivas de indivíduos com distúrbios do

desenvolvimento compreende uma prática clínica e pesquisas fundamentadas em

instrumentos adequados para tal. No entanto, os instrumentos atualmente disponíveis no

mercado nacional foram construídos e padronizados para a avaliação de indivíduos que

possuem certas habilidades preservadas, tais como: linguagem, leitura, escrita e

motricidade.

Tais habilidades e formas de responder determinados grupos não desenvolveram

adequadamente ou até mesmo não as possuem como pode ser observado em indivíduos

com Transtorno do Espectro Autista, Síndrome de Down e outras síndromes genéticas

acompanhadas de deficiência intelectual, Distúrbios de Linguagem, Paralisia Cerebral,

Deficiência Auditiva, entre outras condições. Conseqüentemente, tais instrumentos não são

indicados para avaliação de indivíduos com distúrbios do desenvolvimento já que este

grupo apresenta determinadas características como ausência ou prejuízo na

linguagem/comunicação e deficiência motora, que freqüentemente impossibilita expressar

de fato suas habilidades ou dificuldades.

No Programa de Pós-Graduação em Distúrbios do Desenvolvimento são

conduzidos diferentes estudos que envolvem a avaliação cognitiva de crianças e

adolescentes. Desta forma, é importante criar e/ou adaptar instrumentos de avaliação

psicológica que possam ser usados nestes estudos, bem como disponibilizá-los para

clínicos e educadores. De fato, nos últimos anos tem aumentado, entre os pesquisadores, a

preocupação com a disponibilização de instrumentos mais adequados e acessíveis aos

grupos avaliados. Por isso, alternativas têm sido propostas para suprir esta lacuna.

Entre os aspectos cognitivos mais estudados e de fundamental importância na

avaliação cognitiva é a inteligência. Tal construto está relacionado a uma capacidade

mental geral que implica em raciocinar, planejar, resolver problemas, pensar de forma

abstrata e aprender com a experiência.

Uma das possibilidades de avaliar a inteligência de pessoas com distúrbios do

desenvolvimento é por meio de testes não-verbais que exijam resposta motora discreta,

como é o caso da Leiter International Performance Scale – Revised (Leiter-R). Trata-se de

uma escala de avaliação de inteligência não-verbal, aplicada para uma faixa etária de 2 a

20 anos de idade e constantemente utilizada em diversas pesquisas internacionais que

16

avaliam indivíduos com distúrbios do desenvolvimento. Ela é especificamente adequada

para ser utilizada com indivíduos que apresentam prejuízos cognitivos, comprometimento

auditivo, motor e dificuldades de linguagem.

Entretanto, para que um instrumento esteja devidamente qualificado para ser

utilizado na avaliação psicológica, a Comissão Internacional de Testes aponta como sendo

necessários alguns requisitos básicos relacionados a modelos de adaptação e parâmetros

psicométricos. No caso de instrumentos internacionais, alguns requisitos são: tradução e

adaptação cultural, bem como medidas adequadas referentes a fontes de evidências de

fidedignidade ou precisão e validade que garantem a confiabilidade e especificidade do

instrumento.

Sendo assim, os objetivos do presente estudo são: traduzir, adaptar e apresentar

evidências de fidedignidade e validade da Bateria de Visualização e Raciocínio da Leiter-R

em uma amostra de 200 crianças de 3 a 6 anos, de escolas públicas da cidade de São Paulo.

Trata-se de um estudo com relevância social, pois instrumentos que de fato avaliem

as reais habilidades do sujeito podem auxiliar em processos diagnósticos e no

planejamento de intervenções mais eficazes. A implicação prática da pesquisa é a

possibilidade de se avaliar futuramente através de um instrumento adequado, indivíduos,

que muitas vezes são considerados incapazes de serem testados, devido à dificuldade de

acessar seus conhecimentos através dos testes tradicionais.

17

2. PRESSUPOSTOS TEÓRICOS

2.1. Inteligência: Estrutura e Cognição

De acordo com Mäder, Thais e Ferreira (2004), a inteligência é um conceito amplo,

pois a capacidade humana de conceituar, organizar, desenvolver e memorizar é abrangente

para ser determinada por apenas um único aspecto. De fato, Almeida (2002) mostra que

este conceito ou construto não desfruta de consenso entre os estudiosos do tema.

Uma das controvérsias está relacionada à questão se a inteligência é mais bem

definida através de uma capacidade geral ou através de um conjunto de aptidões

diferenciadas, como no caso das inteligências múltiplas. Mesmo assim, existe um acordo

de que a inteligência está relacionada com a capacidade de pensar e de resolver problemas,

ou seja, reportam-se as capacidades e habilidades dos indivíduos (Almeida, Guisande,

Primi e Ferreira, 2008). Neste sentido, uma declaração assinada por 52 pesquisadores

renomados publicada na Revista Intelligence em 1997 define a inteligência como uma

capacidade mental geral que implica em habilidades como raciocínio, planejamento,

resolução de problemas, pensar de maneira abstrata e aprender com a experiência (Flores-

Mendoza, 2010).

Segundo Primi e Flores-Mendoza (2006), o estudo da inteligência se confunde com

a história da própria psicologia, pois as primeiras pesquisas empíricas tratavam da medida

da inteligência e é marcado por diferentes abordagens teóricas e metodológicas. Neste

sentido, três abordagens principais têm sido utilizadas em pesquisas referentes a

inteligência: a cognitiva, a desenvolvimental e a psicométrica (Primi, 2002; Almeida,

2002; Roazzi e Souza, 2002; Mader e cols., 2004).

A abordagem cognitiva busca identificar os elementos estruturais, esquemas

lógicos e processos de funcionamento da atividade mental. Trata-se de uma visão sistêmica

da inteligência baseada em seus mecanismos cognitivos, sua arquitetura e dinâmica

(Roazzi e Souza, 2002). Sternberg (2008), um dos maiores expoentes desta abordagem,

ressalta a importância de se compreender os componentes, estratégias e representações

envolvidos nos processos mentais.

A inteligência, de acordo com a abordagem desenvolvimental está relacionada ao

conceito de adaptação de Piaget que se refere a um estado de equilíbrio para o qual tendem

todas as adaptações sucessivas sensório-motoras e cognitivas baseadas na experiência do

sujeito. Trata-se de um modelo hierárquico, no qual o desenvolvimento intelectual é

18

dividido em estágios, cada qual mais complexo que o seu precedente e corresponde a uma

forma de adaptação biológica. Isto significa que o desenvolvimento cognitivo é construído

até o estágio no qual o indivíduo se encontra (Mader e cols., 2004). A abordagem

psicométrica será discutida detalhadamente pelo fato de estar mais diretamente relacionada

com os objetivos deste estudo.

Historicamente, a psicometria começou a ser usada na elaboração de instrumentos

de medida sem que se soubesse bem o que eles mediam. Ou seja, sem uma compreensão

teórica sobre a inteligência, mas que evoluiu para formulações teoricamente mais

sofisticadas (Sternberg, 2008). Nesta abordagem, a inteligência é uma habilidade que pode

ser mensurada através do desempenho em testes (Roazzi e Sousa, 2002). E o termo

“psicometria” se refere ao foco e esforço colocado sobre a medida e o cuidado despendido

na construção e validação de instrumentos (Almeida e cols., 2008a).

Gauer, Gomes e Haase (2010) definem a psicometria como o campo de estudos das

características de instrumentos ou testes que visam à mensuração de variáveis psicológicas.

As características, ou qualidade dos instrumentos são definidas em termos da adequação

teórica, empírica, lógica e estatística que eles apresentam, tendo em vista que são utilizados

como artefatos de medida. Os indicadores dessas características são analisados desde o

nível de operacionalização dos conceitos da teoria nos itens do teste, até as propriedades

estatísticas dos valores aferidos pelo instrumento em uma amostra.

O início da psicometria se deu a partir das idéias de Francis Galton que focalizou

seus interesses na hereditariedade, especialmente na herança de altos níveis de habilidade

(Hogan, 2006) e partia do pressuposto de que havia uma habilidade intelectual geral nos

indivíduos (Mader e cols., 2004). Partindo desta concepção, o psicólogo inglês Charles

Spearman desenvolveu no início do século XX a extração estatística do que veio a

denominar de “fator g” (Mader e cols., 2004). Sendo este uma energia mental inata, um

fator com base neurológica (Schelini, 2006) capaz de ativar operações cognitivas comuns a

todas as atividades mentais (Primi, 2002; Mader e cols., 2004).

A concepção bifatorial proposta por Spearman, apresenta um fator geral e outro

específico. A alta correlação entre dois testes psicológicos seria explicada por estes serem

altamente saturados em g, já que a presença de fatores específicos tenderia a baixar a

correlação. (Schelini, 2006; Cruz, 2008). Para Spearman, o funcionamento cognitivo se

dava a partir de três processos básicos que estariam presentes em todas as habilidades

19

mentais: 1) apreensão das experiências relacionada à rapidez e acuidade na percepção de

estímulos; 2) edução de relações como capacidade de estabelecer relação entre duas ou

mais idéias e; 3) edução de correlatos referente à capacidade de criar novas idéias a partir

de relações e idéias previamente estabelecidas (Primi, 2002). Embora Spearman não

tivesse criado nenhum tipo de teste, tampouco empreendeu projetos para coleta de dados,

sua importância se deve ao fato de que através do método estatístico de análise fatorial

deu-se a primeira tentativa de fornecer uma teoria da inteligência humana de base empírica

(Hogan, 2006).

Louis Leon Thurstone também deu continuidade a estudos que explicassem o

funcionamento cognitivo e ao verificar os componentes da inteligência através da análise

fatorial, propôs a Teoria das Aptidões Primárias. Descreveu sete fatores ou capacidades

independentes: habilidade espacial, compreensão verbal, fluência verbal, velocidade

perceptiva, aptidão numérica, memória e raciocínio indutivo. A independência dos fatores

descarta a idéia de um fator geral subjacente às habilidades específicas (Almeida, 2002;

McGrew, 2004).

Em 1993, com a publicação de Human Cognitive Abilities: A Survey of Factor

Analytic Studies por John Carroll, houve um avanço na visão psicométrica a respeito da

inteligência, resultando na criação de um modelo hierárquico chamado de Teoria dos Três

Estratos. Os estratos seriam camadas dispostas em três níveis em função da generalidade.

O estrato I seria em torno de setenta fatores específicos propostos pelos testes

psicométricos. O estrato II agrupa estes fatores específicos em oito fatores mais amplos:

raciocínio, conhecimento-linguagem, memória-aprendizagem, percepção visual, percepção

auditiva, produção de idéias, velocidade de processamento cognitivo e velocidade de

decisão. O Estrato III corresponderia ao fator g (Sternberg, 2008). A tabela 1 mostra o

modelo da Teoria dos Três Estratos de John Carroll (1993) adaptado por Primi, Santos,

Vendramini, Taxa, Muller, Lukjanenko e Sampaio (2001).

20

Tabela1. Modelo da Teoria dos Três Estratos e John Carroll.

ESTRATO

III

ESTRATO

II

DESCRIÇÃO ESTRATO

I

Exemplos de fatores mais

significativos

Fator g Inteligência Fluida

Gf

Raciocínio em situações

novas, minimamente

dependente de conhecimentos

adquiridos. Resolver

problemas novos, relacionar

idéias, induzir conceitos

abstratos, compreender

implicações.

Raciocínio sequencial,

Indução,

Raciocínio quantitativo.

Inteligência

Cristalizada

Gc

Extensão e profundidade dos

conhecimentos adquiridos de

uma determinada cultura.

Raciocínio adquirido pelo

investimento da capacidade

geral em experiências de

aprendizagem.

Desenvolvimento

lingüístico, Conhecimento

léxico, Compreensão em

leitura.

Memória e

Aprendizagem

Gsm

Manutenção de informações

na consciência por um curto

espaço de tempo para poder

recuperá-las logo em seguida.

Capacidade de informação

retida após exposição a uma

situação de aprendizagem

(geralmente conteúdos

simples).

Extensão da memória

Memória associativa,

Memória visual.

Percepção Visual

Gv

Gerar, reter e manipular

imagens visuais abstratas.

Visualização, Relações

espaciais, Velocidade de

fechamento.

Recepção Auditiva

Ga

Percepção e discriminação de

padrões sonoros (incluindo a

linguagem oral)

particularmente quando

apresentados em contextos

mais complexos envolvendo

distorções ou estruturas

musicais complexas.

Acuidade auditiva,

discriminação da

linguagem oral,

Discriminação e

julgamento de padrões

tonais musicais.

Habilidade de

Recuperação

Glr

Habilidade associada à

extensão e fluência que itens

de informação ou conceitos

são recuperados da memória

de longo prazo por

associação.

Fluência de idéias,

Facilidade de recordação

de nomes, Fluência de

associações,

Originalidade/Criatividade

Velocidade de

Processamento

Cognitivo

Gs

Habilidade associada à taxa

de rapidez de processamento

cognitivo em tarefas

cognitivas simples.

Velocidade perceptual,

Tempo de reação simples,

Velocidade de

processamento semântico.

Fonte: Primi e colaboradores (2001, p.154).

21

Em 1998, McGrew e Flanagan propuseram uma integração da Teoria dos Três

Estratos de Carroll com a Teoria da Inteligência Fluída e Cristalizada de Horn e Cattell.

Esta última se refere a dois tipos de inteligência: a cristalizada e a fluída (Primi e cols.,

2001)

A inteligência cristalizada (Gc) corresponde à extensão e profundidade dos

conhecimentos adquiridos de uma determinada cultura e suas aplicações de forma efetiva.

Capacidade de raciocínio adquirida pelo investimento da capacidade geral em experiências

de aprendizagem e primariamente baseada na linguagem. Está associada ao conhecimento

declarativo, como o conhecimento de fatos, idéias e conceitos. E relacionada a habilidades

como raciocinar com procedimentos aprendidos previamente para transformar o

conhecimento (Primi, 2002; Primi, 2003; Schelini e Wechsler, 2005; Schelini, 2006).

Já a inteligência fluída (Gf) está relacionada à inteligência não-verbal,

correspondente à habilidade necessária na previsão da capacidade geral de adaptação às

situações novas ou inesperadas, pouco estruturadas, que requerem autonomia intelectual,

relacionar idéias, induzir conceitos abstratos, compreender implicações, extrapolação,

reorganização, transformação e generalização de informações. As deficiências neste fator

caracterizam-se pela dificuldade em generalizar regras, formar conceitos e observar

implicações (Primi, 2002; Primi, 2003; Schelini e Wechsler, 2005; Schelini, 2006). E

devido aos objetivos deste trabalho, o fator Gf será discutido mais detalhadamente.

Primi (2002) aponta que Carroll descreveu três grupos de tarefas gerais

relacionadas à inteligência fluída: raciocínio seqüencial geral, indução e raciocínio

quantitativo. O raciocínio seqüencial é a capacidade de derivar implicações ou conclusões

a partir da análise de combinação de premissas claramente formuladas seguindo dois ou

mais passos lógicos, tais como tarefas de silogismos categóricos, silogismos lineares e

raciocínio verbal geral. Já a indução se refere a tarefas como descoberta de

conceitos/regras, seriação, tarefas de múltiplos exemplares, matrizes, elementos ímpares,

analogias, nas quais a pessoa deve analisar um conjunto de estímulos observando as

regularidades, as características comuns, para inferir as relações entre os estímulos.

Enquanto que o raciocínio quantitativo envolve tarefas que utilizam o raciocínio dedutivo e

indutivo, misturando-se com conceitos e relações quantitativas matemáticas, como por

exemplo, aritmética, álgebra, geometria e cálculo.

22

O fator Gf tem sido associado à complexidade cognitiva que pode ser definida

como uma maior utilização de um vasto e diversificado leque de processos cognitivos

elementares durante a execução de uma tarefa (McGrew, 2004). O pico de

desenvolvimento da Gf se dá no final da adolescência. Esta se mantém estabilizada por

alguns anos e partir daí, entra em declínio principalmente no que concerne a habilidade de

velocidade de processamento (Arckerman, 1996).

Em relação aos processos cognitivos que são elementares durante a execução de

tarefas como o raciocínio fluido, estudos de neuroimagem têm buscado compreende-los em

termos de estruturas e ativação cerebral. Hampshire e colaboradores (2010) apontam que o

raciocínio é um componente fundamental para um comportamento executivo bem

adaptado. Estes autores investigaram a relação entre raciocínio, controle executivo e

funcionamento de regiões frontoparietais. Os resultados deste estudo mostram que os

circuitos frontoparietais devem ser fracionados em sub-regiões que são ativadas de acordo

com demandas distintas de raciocínio que são apresentadas. Tarefas de maior

complexidade apresentam modulação de atividade no hemisfério direito incluindo giro

frontal medial e a parte superior do córtex parietal. Já tarefas de analogias recrutam áreas

do hemisfério esquerdo como a região inferior do córtex pré-frontal dorsolateral. Sendo

que estas regiões têm sido associadas a uma gama de demandas cognitivas denominadas

funções executivas.

Estudos têm mostrado que alguns construtos elaborados a partir de perspectivas

teóricas diferentes, como a psicometria e a psicologia cognitiva, apresentam sobreposições.

Uma das sobreposições que tem sido estudada se dá entre os construtos fator G e

inteligência fluida da psicometria e o construto funções executivas definido na psicologia

cognitiva (García-Molina e cols., 2010). As funções executivas têm sido definidas como as

habilidades cognitivas necessárias para realizar comportamentos complexos dirigidos para

determinado objetivo e a capacidade adaptativa a diversas demandas e mudanças

ambientais (Hamdan e Pereira, 2009), sendo indicadas como semelhantes ao conceito de

resolução de problemas novos relacionados à Gf (García-Molina e cols, 2010). A

importância de sua avaliação se dá pelo fato de que elas estão alteradas em alguns quadros

de distúrbios do desenvolvimento, tais como os Transtornos do Espectro Autista (Happé e

Frith, 1996), o Transtorno de Déficit de Atenção e Hiperatividade (Gordon, Barkley e

Lovett, 2006), a Síndrome de Williams-Beuren (Menghini e cols, 2010), Epilepsia do lobo

frontal em crianças (Luton, Burns e Defilippis, 2010) entre outras condições. Além disso,

http://www.ncbi.nlm.nih.gov/pubmed?term=%22Defilippis%20N%22%5BAuthor%5D

23

Shelton e colaboradores (2010) apontam que Gf e memória de trabalho são construtos

altamente correlacionados. Já Tilman e colaboradores (2009) mostram que velocidade de

processamento, controle inibitório bem como a memória de trabalho, são os principais

construtos que explicam o desempenho em tarefas de raciocínio fluido.

Segundo McGrew (2004), a Gf é pouco dependente de conhecimentos previamente

adquiridos e de questões culturais e mais determinada por aspectos biológicos. Entretanto,

isto não significa que a Gf não sofre influencia de aspectos ambientais. Um estudo

realizado por Flores-Mendoza e Nascimento (2007) em 144 crianças de uma zona rural

cuja situação socioeconômica se caracterizava bastante precária, mostrou que os déficits

ambientais afetam com maior intensidade a inteligência fluida que a inteligência

cristalizada. Desta forma, a estimulação ambiental não pode ser descartada e deve-se levar

em consideração que intervenções podem ser eficazes para estimular o raciocínio fluido.

Klauer e Phye (1995) em sua obra “Cognitive Training for Children” mostram que é

possível estimular a inteligência fluida através de um programa de atividades de raciocínio

indutivo e solução de problemas. De acordo com estes autores, habilidades como

generalização, discriminação e o reconhecimento de semelhanças e diferenças entre

estímulos influenciam no potencial para a aprendizagem e no desenvolvimento de

habilidades para solução de problemas.

A inteligência fluida passou a ter maior destaque a partir do último modelo

psicométrico proposto por McGrew e Flanagan (1998). Trata-se da Teoria de Catell-Horn-

Carrol (CHC) das habilidades cognitivas que atualmente fundamenta a construção de

novos testes de inteligência. A priori esta teoria postulou dez fatores amplos de habilidades

cognitivas: inteligência fluída, conhecimento quantitativo, inteligência cristalizada, leitura

e escrita, memória de curto prazo, processamento visual, processamento auditivo,

armazenamento e recuperação da memória de longo prazo, velocidade de processamento e

rapidez de decisão. A estes dez fatores amplos estariam subjacentes pouco mais de sessenta

fatores específicos. A Tabela 2 apresenta o modelo CHC de acordo com os dez fatores

amplos a ele subjacentes.

24

Tabela 2. Definição dos dez fatores amplos da teoria CHC.

Fator do Estrato II Descrição

Inteligência Fluida (Gf)

Capacidade ligada às operações mentais de raciocínio em

situações novas, minimamente dependente de

conhecimentos adquiridos. Capacidade de resolver

problemas novos, relacionar idéias, induzir conceitos

abstratos, compreender implicações, extrapolação e

reorganização de informações (os testes psicométricos do

fator g geralmente avaliam a inteligência fluida tais

como Raven, a maioria dos testes da BPR-5, Colúmbia,

R1, INV, etc...).

Inteligência Cristalizada (Gc)

Extensão e profundidade dos conhecimentos adquiridos

de uma determinada cultura e a aplicação efetiva deste

conhecimento. Capacidade de raciocínio adquirida pelo

investimento da capacidade geral em experiências de

aprendizagem. Primariamente baseada na linguagem.

Está associado ao conhecimento declarativo

(conhecimento de fatos, idéias, conceitos) e ao

conhecimento de procedimentos (raciocinar com

procedimentos aprendidos previamente para transformar

o conhecimento).

Conhecimento Quantitativo (Gq)

Estoque de conhecimentos declarativos e de

procedimentos quantitativos. Capacidade de usar

informação quantitativa e manipular símbolos

numéricos.

Leitura e Escrita (Grw)

Conhecimento adquirido em competências básicas da

compreensão de textos e expressão escrita. Inclui desde

habilidades elementares como decodificação em leitura e

ortografia até habilidades mais complexas como a

compreensão de textos e a composição de histórias.

Memória de Curto Prazo (Gsm)

Capacidade associada à manutenção de informações na

consciência por um curto espaço de tempo para poder

recuperá-las logo em seguida.

Processamento Visual (Gv)

Capacidade de gerar, perceber, armazenar, analisar, e

transformar imagens visuais, isto é, os processos

cognitivos específicos de processamento mental de

imagens (geração, transformação, armazenamento e

recuperação).

Processamento Auditivo (Ga)

Capacidade associada à percepção, análise e síntese de

padrões sonoros. Capacidade discriminativa de padrões

sonoros (incluindo a linguagem oral) particularmente

quando apresentados em contextos mais complexos

como, por exemplo, a percepção de nuances em

estruturas musicais complexas.

Capacidade, Armazenamento e

Recuperação da Memória de Longo

Prazo (Glr)

Extensão e fluência que itens de informação ou conceitos

são recuperados da memória de longo prazo por

associação. Está ligada ao processo de armazenamento e

recuperação posterior por associação. Capacidade de

recuperar os itens de informação da base de

conhecimentos por meio de associações. Este fator

agrupa os testes psicométricos criados de avaliação da

criatividade sendo muitas vezes chamado de domínio da

produção de idéias.

Velocidade de Processamento (Gs) Capacidade de manter a atenção e realizar rapidamente

25

tarefas simples automatizadas em situações que

pressionam o foco da atenção. Está geralmente ligado a

situações em que há um intervalo fixo definido para que

a pessoa execute o maior número possível de tarefas

simples e repetitivas (sustentabilidade).

Rapidez de Decisão (Gt)

Rapidez em reagir ou tomar decisões envolvendo

processamentos mais complexos. Refere-se à reação

rápida a um problema envolvendo processamento e

decisão (imediaticidade).

Fonte: Primi (2003, p.69).

Devido a estudos recentes, alguns domínios foram acrescentados ao modelo CHC,

incluindo 6 fatores amplos na camada II (McGrew, 2009) conforme apresentados na

Tabela 3.

Tabela 3. Descrição dos 6 domínios incluídos no Estrato II da CHC.

Fator do Estrato II Descrição

Conhecimento Geral (Gkn)

Amplitude, profundidade e domínio adquiridos pela

pessoa em áreas especializadas que não representam a

experiência geral e universal adquirida culturalmente

pelos indivíduos. Adquirido pela prática e formação

intensas e sistemáticas. Especialização.

Habilidades táteis (Gh) Habilidades envolvidas na percepção e julgamento das

sensações que são recebidas através de receptores táteis.

Habilidades Sinestésicas (Gk)

Habilidades que dependem de receptores sensoriais que

detectam posição corporal, peso, movimento dos

músculos, tendões e articulações. Controle e

coordenação dos movimentos do corpo, incluindo o

andar, falar, expressões faciais, gestos e postura.

Habilidades Olfatórias (Go) São habilidades que dependem de receptores sensoriais

do sistema olfativo.

Habilidades Psicomotoras (Gp)

Capacidade de realizar movimento motores com o corpo

(movimento de dedos, mãos, pernas, etc) com precisão

coordenação ou força. Comportamentos motores são

tipicamente resultados de atividades mentais.

Velocidade Psicomotora (Gps)

Capacidade de executar movimentos corporais de forma

rápida e fluente. Em grande parte, independente do

controle cognitivo.

Fonte: McGrew (2009, p.6-7).

O modelo CHC passou a identificar a inteligência fluida como sendo mais próxima

ao fator g. Um dos fatores específicos relacionados à Gf, o raciocínio indutivo seria uma

das formas de se compreender os processos cognitivos gerais presentes nas mais variadas

habilidades. Este tipo de raciocínio está relacionado à capacidade de analisar um conjunto

de estímulos observando as regularidades, as características comuns, para inferir relações

entre eles (Primi, 2002; Almeida e cols., 2008b).

26

De acordo com Klauer e Phye (1995) o raciocínio indutivo se refere ao

descobrimento de regularidades através de processos que comparam atributos e relações de

objetos ou eventos. Para estes autores existem 6 processos de raciocínio indutivo:

generalização – buscar similaridades entre atributos; discriminação – buscar diferenças

entre atributos; classificação cruzada – semelhanças e diferenças nos atributos;

reconhecimento de relações – de similaridades; diferenciação de relações –

reconhecimento das diferenças; construção de sistemas – relações de similaridades e

diferenças.

Além da evolução ocorrida na definição e estrutura da inteligência, outras

mudanças têm sido descritas na literatura como relevantes para entender este construto.

Entre elas, podemos observar um fenômeno denominado Efeito Flynn (EF). O EF é em

termos gerais, a tendência a ganhos no QI da população ao longo dos anos. Dados de

diferentes países mostram ganhos significativos de QI a cada geração com o passar do

tempo. Estudos como o que foi realizado na Holanda em 1982 onde foi observado que

jovens de 18 anos apresentavam 20 pontos acima de pares da mesma idade em 1952. Trata-

se de um desvio padrão de 1,33 que coloca a segunda geração no percentil 90 da primeira

(Flynn, 2006).

Um dos aspectos percebido é a correspondência entre aumento no QI e

industrialização, disponibilidade de escolas e melhoria nos sistemas de saúde (Flynn,

2006). Outra questão levantada é a mudança nas instruções dos testes (Sternberg, 2010).

Khou, Zhu e Weiss (2010) mostram que o EF não é distribuído igualmente entre os

diferentes níveis de habilidade, ou seja, o efeito pode variar ao longo da distribuição do QI

na população. Por isso, Sternberg (2010) aponta que devido à complexidade do construto e

das mudanças ocorridas no mundo ao longo dos anos, não é possível atribuir este aumento

a um único aspecto.

Os ganhos observados nos últimos 55 anos são maiores em testes de inteligência

fluida, como nas Matrizes Progressivas de Raven, que avaliam a capacidade de resolver

imediatamente problemas para os quais não há método aprendido de antemão. Estudos

apontam cerca de 18 pontos a cada 30 anos (Flynn, 2006). Além disso, estudos têm

mostrado que ao comparar a proporção de ganhos em testes não-verbais e verbais, os

ganhos se apresentam numa proporção de até 4:1 respectivamente (Flynn e Weiss, 2007)

Acompanhando a evolução das teorias sobre inteligência, diferentes instrumentos

de avaliação têm sido desenvolvidos. Estas mudanças ocorrem desde a primeira escala

27

criada por Alfred Binet que foi uma operacionalização pioneira do construto inteligência

(Miranda, 2002) permitindo sintetizar as habilidades cognitivas em uma medida única,

aferida com base em itens padronizados e definida como o Quociente de Inteligência

(Gauer, Gomes e Haase, 2010). Binet construiu seu instrumento pensando na relação

existente entre a inteligência e a eficácia do desempenho acadêmico. O termo Quociente de

Inteligência (QI) foi proposto em 1911 pelo psicólogo alemão, William Stern. Segundo ele,

o nível obtido na escala Binet-Simon seria o escore de idade mental dividido pela idade

cronológica do sujeito para se obter um quociente mental que representaria de forma mais

precisa a capacidade em diferentes idades (Urbina, 2007).

Outros instrumentos destinados a avaliação de inteligência também foram criados

com pressupostos semelhantes ao teste de Binet, como as escalas de David Wechsler, cuja

definição de inteligência subjacente se refere à capacidade conjunta ou global do indivíduo

para agir com finalidade, pensar racionalmente e lidar efetivamente com seu meio

ambiente (Figueiredo, 2002). Esta definição estaria relacionada à teoria da inteligência

composta, ancorada em uma perspectiva integral do desenvolvimento e funcionamento

cognitivo, justificando uma medida global de potencial cognitivo como o QI.

A partir da escala original de Binet-Simon, diversos instrumentos vêm sendo

desenvolvidos, desde as revisões e atualizações do teste de Binet (Roid, 2003). As mais

conhecidas e utilizadas são as escalas Wechsler de inteligência para crianças e adultos

(Wechsler, 1981; 2003), a Kaufman Brief Intelligence Test (1990) passando pelos testes

não verbais como as Matrizes Progressivas de Raven (Raven, 1947) e Toni-3 (Brown,

Sherbenou e Johnson, 1997) que avaliam o fator g. Posteriormente temos as escalas

baseadas na teoria das habilidades cognitivas de Carroll, como a Leiter International

Performance Scale Revised (Roid e Miller, 1997) até Woodcock-Johnson Psycho-

Educational Battery (McGrew e Woodcock, 2001) baseada no modelo CHC.

2.2. Instrumentos Psicológicos: tradução, adaptação e parâmetros psicométricos.

A avaliação psicológica compreende um processo de busca de informações sobre o

funcionamento psicológico das pessoas sobre determinadas situações para que o psicólogo

possa tomar decisões, sendo uma atividade exclusiva do profissional de psicologia. De

acordo com Primi (2003) a avaliação psicológica representa um conhecimento legítimo

além de se constituir num critério de avanço embasado cientificamente.

28

Quando se trata de avaliação psicológica, o psicólogo precisa ser capacitado a

avaliar a qualidade dos instrumentos e fazer um uso adequado dos mesmos em sua

testagem psicológica, pois:

“...os testes psicológicos são procedimentos sistemáticos

de observação e registro de amostras de comportamentos e

respostas de indivíduos com o objetivo de descrever e/ou

mensurar características e processos psicológicos,

compreendidos tradicionalmente nas áreas emoção/afeto,

cognição/inteligência, motivação, personalidade,

psicomotricidade, atenção, memória, percepção, dentre

outras, nas suas mais diversas formas de expressão,

segundo padrões definidos pela construção dos

instrumentos” (CFP, 2003; p.2)

Segundo Anastasi e Urbina (2000), o conceito de teste psicológico é: “Uma

ferramenta e essencialmente uma medida objetiva e padronizada de uma amostra de

comportamento”. Sendo assim, esta definição leva a duas inferências a respeito da

testagem psicológica. A primeira seria que os comportamentos são amplos e variados,

sendo tecnicamente inviável ou até mesmo impossível a avaliação de todas as suas

possibilidades. E a segunda é a possibilidade de avaliar um comportamento a partir de sua

amostra.

Em 1996, Cronbach adota uma definição mais ampla a respeito de testagem

psicológica, alegando se tratar de um procedimento sistematizado com o uso de escalas

numéricas e categorias fixas para a observação e descrição do comportamento (Campos,

2008). Ainda de acordo com Cronbach (1996 apud Campos 2008), existem três conceitos

fundamentais que devem estar relacionados à testagem psicológica: a objetividade, a

padronização e a estruturação. Estes estão relacionadas ao grau de interpretação de

diferentes avaliadores a respeito do mesmo resultado obtido no teste, ao grau de

similaridade entre as aplicações do teste e ao grau em que um item só pode ser respondido

de uma forma, sem que haja diversas interpretações da pergunta ou vários caminhos para

respondê-la.

Um teste psicométrico tem como objetivo a medida do comportamento em

determinada quantidade e tem como alvo comportamentos inerentes a todas as pessoas.

Procura-se atingir a objetividade por meio da padronização da aplicação e da estruturação

dos itens. O resultado deve ser expresso em forma de números e deve-se avaliar a margem

de erro que a medida apresenta (Urbina, 2007).

29

Os instrumentos de medida são classificados de acordo com as diferentes técnicas

de aferição dos seus parâmetros psicométricos e teorias que fundamentam sua construção

(Pasquali, 2010). Segundo este autor, a taxonomia dos instrumentos psicológicos pode ser

dividida em: testes referentes a critério, a construto, a conteúdo, testes comportamentais,

levantamentos (survey) e novas tecnologias. Os testes de inteligência se encontram no tipo

referente a construto. Sua característica é a construção a partir de uma referencia teórica e

o objetivo é representar um traço latente através do comportamento (resposta ao item), ou

seja, são construídos e validados para medir traços latentes.

Para que um instrumento esteja devidamente qualificado para ser comercializado e

conseqüentemente utilizado na avaliação psicológica, são necessários alguns requisitos

básicos. O Conselho Federal de Psicologia (CFP) bem como outras entidades científicas

internacionais como a American Educational Research Association, a American

Psychological Association e a National Council on Measurement in Education (Aera; Apa;

Ncme, 1999), estão empenhados em proporcionar condições efetivas e seguras para a

utilização de instrumentos psicológicos e são destinadas a apreciar um conjunto de

propriedades básicas que os instrumentos devem possuir de acordo com os parâmetros

estabelecidos internacionalmente, reconhecidos pela comunidade científica.

Na ausência de instrumentos, cria-se um novo que possa medir o construto desejado

para determinada faixa etária ou grupo específico ou adapta-se um já existente em outra

cultura. Para Hambleton e Patsula (1999), existem razões a favor da adaptação de

instrumentos: Muitas vezes a adaptação de um teste é mais barata e rápida do que construir

um novo teste; Quando o instrumento é transcultural, a adaptação é mais eficaz do que a

produção de um instrumento equivalente em uma segunda língua; Pode haver falta de

conhecimento para o desenvolvimento de um novo instrumento; Quando o teste original é

conhecido, há uma segurança maior para utilizá-lo em uma segunda língua.

Na tentativa de evitar instrumentos inadequados, modelos de tradução e adaptação

cultural têm sido propostos pelas Diretrizes Internacionais de Testes. Dentre os vários

modelos, destaca-se o Universal. No modelo universal, em geral, utiliza-se um instrumento

com enfoque transcultural. Essa universalização permite equacionar as dificuldades

referentes à padronização, equivalência e tradução, considerando as diferenças sociais,

econômicas e religiosas dos diferentes países e minimizando a diferença entre as diversas

versões adaptadas (Fleck, 2000).

30

Outras importantes contribuições para melhorar a prática do processo de adaptação

de testes para outra cultura estão relacionadas ao desenvolvimento de instrumentos a partir

de parâmetros como as diretrizes propostas pela International Test Commission (ITC).

Foram elaboradas vinte e duas diretrizes divididas em quatro domínios: contexto, descrição

dos princípios básicos de estudos em vários idiomas; desenvolvimento, recomendações da

prática do desenvolvimento de instrumentos em várias línguas; aplicação, publicação dos

procedimentos do instrumento; manual com a interpretação e normatização, relato da

interpretação e comparação dos resultados em diversas culturas. Hambleton e Patsula

(1999) descrevem etapas nas quais o processo de tradução e adaptação deve ser baseado:

1) Equivalência do construto: é necessário assegurar a equivalência do constructo

nas versões original e traduzida, verificando se o mesmo fenômeno pode ser medido nas

duas culturas.

2) Criar ou traduzir o instrumento: decidir se é melhor traduzir ou criar um novo

instrumento devido a semelhanças ou diferenças nos idiomas em questão.

3) Escolha do tradutor (individual ou comitê): o tradutor deve ter fluência nas duas

línguas, familiaridade com as duas culturas envolvidas no estudo, ter conhecimento na

construção de teste e saber como mensurá-lo adequadamente. Sendo que a formação de um

comitê permite melhores resultados.

4) Tradução e adaptação do teste: deve se utilizar como referência a versão original

do teste e não a versão já adaptada para outra língua. Esta etapa envolve a tradução para

outro idioma e retrotradução para versão original.

5) Revisão da adaptação: revisão necessária para a equivalência do teste. É

necessário verificar a clareza dos itens e também o nível de dificuldade das palavras

utilizadas na tradução.

As etapas descritas acima são relevantes, pois mesmo em se tratando de

instrumentos ditos “transculturais”, como a Leiter-R (Anastasi e Urbina, 2000), é inviável

pensar em provas totalmente livres de cultura, levando-se em consideração que o peso das

variáveis culturais pode ser diminuído, mas não anulado (Almeida e cols, 2008a)

6) Teste Piloto: realizado com uma amostra menor para verificar a consistência do

instrumento.

31

7) Análise estatística: nesta etapa é feita análise dos resultados e dos itens do teste,

em que podem ser verificadas possíveis falhas.

8) Comparação com outros grupos: necessária quando o foco da pesquisa for a

comparação transcultural ou a normatização na nova versão.

9) Revisão das etapas 7 e 8: No caso do instrumento apresentar falhas, será

necessário re-traduzir, re-analisar e re-escrever o teste.

10 e 11) Padronização / normatização e manual: referente à aplicação do teste,

validação, normatização, documentação descrevendo o processo de cada etapa e a

preparação do manual para os usuários do teste.

Além de uma tradução e adaptação consistente e adequada, os testes psicológicos

devem ter seus aspectos psicométricos verificados para garantir sua qualidade. De acordo

Urbina (2007), as principais características que definem a adequação de um instrumento

psicométrico, são a fidedignidade e a validade.

A fidedignidade ou precisão do instrumento indica a confiabilidade dos resultados

do processo de mensuração, ou seja, é a qualidade dos escores de teste que sugere que eles

são suficientemente consistentes e livres de erros de mensuração para serem úteis. Sendo

assim, um instrumento pode ser considerado fidedigno à medida que ele mantém

estabilidade e consistência da medida de um construto que em teoria deve ser estável e

consistente, independente das condições externas. Portanto, vale ressaltar que a qualidade

da fidedignidade não pertence aos testes em si, mas aos escores deles obtidos (Urbina,

2007; Gauer, Gomes e Haase, 2010).

Os métodos para investigar a fidedignidade dos escores oferecem um meio para

estimar escores verdadeiros, ou pelo menos os limites dentro dos quais estes poderiam se

localizar. O conceito de escore verdadeiro se refere às entidades hipotéticas que

resultariam de mensurações completamente livres de erros (Gulliksen, 1950 apud Urbina,

2007). Na prática é impossível obter tal escore e por isso obtém-se o escore observado, ou

seja, escores que os indivíduos efetivamente obtêm.

Ao analisar um conjunto de escores observados numa amostra, é possível verificar

sua variância. A variância consiste em uma porção de variância verdadeira e uma porção

de variância de erro. A primeira se refere as diferenças entre os escores dos indivíduos de

um grupo que refletem sua posição na característica avaliada pelo teste. A segunda é

composta pelas diferenças entre os escores que refletem fatores irrelevantes ao que o teste

32

avalia. Sendo assim, a fidedignidade dos escores aumenta à medida que o componente de

erro diminui.

A informação sobre o erro de medida é indispensável para a própria avaliação e

para o uso do instrumento (Noronha, Freitas e Ottati, 2002) e por isso a avaliação da

fidedignidade de um escore envolve determinar quais as possíveis fontes de erro que

podem interferir no escore e estimar a magnitude destes erros. De acordo com Urbina

(2007) existem diversas e variadas fontes de erros que cada tipo de teste está propenso. As

principais são: diferenças entre avaliadores, erros de amostragem de tempo, erro de

amostragem de conteúdo, inconsistência entre itens, inconsistência entre itens e

heterogeneidade de conteúdo combinados e por fim, erros de amostragem de tempo e

conteúdo combinados. Sendo que para cada tipo de erro, existem medidas apropriadas para

estimá-los.

Alguns autores descrevem formas de se obter o coeficiente de fidedignidade, tais

como: fidedignidade do avaliador, de teste-reteste, de forma alternativa, método das

metades, medidas de consistência interna, entre outras. A fidedignidade do avaliador, ou

fidedignidade interjuízes, consiste em fazer com que pelo menos dois indivíduos diferentes

avaliem o mesmo conjunto de testes, em que o desempenho de cada testando gere dois ou

mais escores independentes, sendo um método básico para estimar erros devido a

diferenças entre avaliadores. As correlações entre os conjuntos de escores gerados devem

ser altas e positivas, ou seja, maior ou igual a 0,90 sugerindo que a proporção do erro deve

ser menor ou igual a 0,10. Este tipo de análise se aplica a testes abertos, que envolvem

algum grau de subjetividade, em que as respostas não são classificadas com certas ou

erradas (Urbina, 2007; Gauer, Gomes e Haase, 2010).

A fidedignidade teste-reteste é utilizada em testes de traços ou comportamento

relativamente estáveis, cuja fonte de erro está relacionada à amostragem de tempo. Trata-se

de uma medida de estabilidade em que o mesmo instrumento é aplicado na mesma amostra

de sujeitos em duas ou mais ocasiões, separadas por um certo intervalo de tempo. A

correlação entre os escores reflete o quanto o instrumento mantém a consistência de sua

medida ao longo do tempo e o quanto os itens são representativos independentemente de

fatores externos. No entanto vale ressaltar que o intervalo de tempo entre as duas

administrações pode afetar a estabilidade dos escores, pois se for muito curto, os testandos

podem lembrar-se das respostas que deram anteriormente e haverá o componente de

memória interferindo nos escores. Se for um intervalo demasiadamente extenso, existe a

33

possibilidade de que experiências intervenientes venham afetar os segundos escores, bem

como a própria maturação cerebral em caso de crianças em idade escolar.

Já a fidedignidade de forma alternativa ou paralela se faz pertinente quando a fonte

de erro está relacionada à amostragem de conteúdo em testes que requerem estabilidade e

consistência dos resultados como um todo. Para isso, desenvolvem-se duas ou mais formas

diferentes de um teste, de itens equivalentes em conteúdo e dificuldade e posteriormente

avalia-se a correlação entre os escores obtidos nas duas versões pela mesma amostra.

Trata-se de uma forma mais sensível de obter o coeficiente de estabilidade em relação ao

teste-reteste porque defende o procedimento contra possíveis efeitos de aprendizagem

advindos da aplicação dos mesmos itens.

O desenvolvimento de formas paralelas de um instrumento ou seu reteste podem

envolver problemas teóricos e práticos. Desta forma, uma solução é administrar um teste

em uma amostra e criar dois escores para cada indivíduo. Esta seria a fidedignidade pelo

método das metades ou split-half. O método das metades consiste em dividir um teste em

duas partes e correlacionar os resultados obtidos nas duas metades. Trata-se de uma forma

simples e rápida de verificar a homogeneidade dos itens que compõe um instrumento. Vale

ressaltar que este método fornece um índice de heterogeneidade, mas não permite

descobrir quais itens são responsáveis por ela. Para que isto ocorra, é necessária uma

análise do conteúdo do instrumento para localizar tais itens (Urbina, 2007). Quando se

trata de instrumentos que avaliam diversas características para inferir uma terceira, este

procedimento deve ser realizado com cada uma das características separadamente

(Campos, 2008).

No entanto, os escores dos testes podem ser fidedignos e ainda assim não terem

utilidade para se fazer inferências. Por isso, além dos escores serem precisos (consistentes

e confiáveis), é necessário que sejam válidos. (Pasquali, 1998, Colzby, 2003; Urbina, 2007;

Gauer, Gomes e Haase, 2010).

O segundo conceito relevante ao falarmos de parâmetros psicométricos é a

validade. De acordo com a definição clássica, a validade se refere àquilo que o teste mede

e quão bem ele o faz (Anastasi e Urbina, 2000). Entretanto, a definição dada pelos

Standards for Educational and Psychological Testing mostra-se mais adequada e por isso

mais utilizada atualmente. De acordo com a definição apresentada pelos Standards, a

validade se refere ao grau no qual as evidências e teoria apóiam as interpretações dos

34

escores implicadas no uso de testes (Aera; Apa; Ncme, 1999). O conceito atual de validade

foi fortemente influenciado por Samuel Messick. Segundo este autor:

“A validade é um julgamento avaliativo integrado do grau

em que as evidências empíricas e a fundamentação teórica

corroboram a adequação e a propriedade de inferências e

ações baseadas em escores de teste ou outros modos de

avaliação (Messick, 1989, p.13)”

A essência do julgamento a respeito da validade dos escores de teste está centrada

no relacionamento entre aquilo que os escores representam e as perguntas que os usuários

de testes querem responder com o seu uso. Portanto, a validade se estabelece pela

adequação do conteúdo semântico dos itens ao construto teórico que o teste quer medir

(Urbina, 2007; Gauer, Gomes e Haase, 2010). Sendo assim, Anastasi e Urbina (2000)

ressaltam que não se pode afirmar que um teste possui alta ou baixa validade, pois esta

precisa ser estabelecida com referência ao uso específico para o qual o teste está sendo

considerado.

O processo de validação é semelhante à testagem de hipóteses, incluindo noções

como a de fidedignidade dos escores e os modos como as aplicações dos dados de teste na

pesquisa e na prática psicológica podem ser justificados (Urbina, 2007). E todos os

procedimentos para determinar a validade de um teste preocupam-se com as relações entre

o desempenho no teste e outros fatos que podem ser independentemente observados que

estão relacionados ao comportamento em consideração.

De acordo com Urbina (2007), existem fontes de evidências de validade que estão

relacionadas a três aspectos: ao conteúdo, a padrões de convergência e divergência e ao

critério. Segundo Campos (2008), os tipos de validade não são mutuamente excludentes e

podem estar presentes em um mesmo instrumento.

Na validade relacionada ao conteúdo, estão incluídas a relevância e

representatividade do conteúdo do teste e dos processos de resposta às tarefas e a validade

de face (Urbina, 2007). Os procedimentos de validação do conteúdo envolvem o exame

sistemático do conteúdo do teste para determinar se ele abrange uma amostra

representativa do domínio de comportamento a ser medido. E o domínio do

comportamento a ser testado deve ser analisado para assegurar que todos os aspectos mais

importantes estão incluídos nos itens do teste e nas proporções corretas (Anastasi e Urbina,

2000).

35

A segunda fonte está relacionada a padrões de convergência e divergência. Estes

compreendem a consistência interna de resultados de teste e outras medidas de

fidedignidade, correlação entre testes e subtestes, matriz multitraço-multimétodo,

diferenciação de escores de acordo com diferenças esperadas com base na idade e outras

variáveis de status, resultados experimentais (correspondência entre escores de teste e os

efeitos preditos de intervenções experimentais ou hipóteses baseadas em teorias), análise

fatorial exploratória e técnicas de modelagem de equação estrutural (Urbina, 2007).

Por fim, evidências de validade relacionadas ao critério se referem à precisão das

decisões baseadas na validação concorrente (correlação entre escores de teste e critérios

existentes) e precisão de decisões ou predições baseadas na validação preditiva (correlação

entre escores de teste e critérios preditivos). Desta forma, a validade é a consideração mais

fundamental relacionada à construção e análise dos testes, pois revela o quanto a evidência

e o suporte teórico do teste estão absorvidos na proposta apresentada que podem

corroborar qualquer inferência feita a partir dos resultados do teste (Noronha, Freitas e

Ottati, 2002; Urbina 2007).

Visto a relevância de estudos que contemplem a tradução, adaptação, fidedignidade

e evidências de validade, pesquisas têm sido desenvolvidas no sentido de adaptação de

testes para avaliação de diversas habilidades cognitivas. Podemos citar os estudos

realizados e orientados por Macedo e outros pesquisadores, que têm por objetivo a a

adaptação de testes para avaliação de funções cognitivas, tais como: linguagem (Capovilla,

Thiers, Macedo, Duduchi, 1998; Macedo, Charin, Capovilla, 2002; Capovilla, Capovilla,

Macedo, Charin, 2004a; Macedo, Capovilla, Duduchi, D'antino, Firmo, 2006; Macedo,

Firmo, Duduchi, Capovilla, 2007), leitura e escrita (Capovilla, Macedo, Penna, Capovilla,

2006) atenção (Capovilla, Capovilla, Macedo, Charin, 2004b) entre outros. Além disso,

outros estudos tiveram como objetivo realizar adaptações culturais de testes desenvolvidos

no Brasil para outros idiomas, como a Bateria de Avaliação de Leitura e Escrita em

japonês (Kuryiama, 2007) e hebraico (Dichi, 2008).

Com relação aos testes de inteligência, o tema tem sido amplamente estudado a

nível nacional, abarcando desde questões teóricas referentes aos modelos existentes,

desenvolvimento de instrumentos e aplicações destes em populações específicas. Isto

reflete uma preocupação de pesquisadores na busca pela qualidade dos testes

disponibilizados no mercado e na criação de novos instrumentos. Nesta linha, podemos

36

citar alguns dos estudos realizados na última década referentes à criação, adaptação e

evidências de validade e fidedignidade de instrumentos:

Estudo de validação da Bateria de Provas de Raciocínio – BPR-5 (Primi e

Almeida, 2000);

Matrizes progressivas do Raven Infantil: um estudo de validação para o

Brasil (Pasquali, Wechsler e Bensusan, 2002);

Uma alternativa na avaliação da inteligência infantil: o Teste R-2 (Rinaldi,

2003);

Critério de Integração do Teste de Bender: Explorando Evid�

traduÇÃo, adaptaÇÃo, fidedignidade e evidÊncias de...

Documents