traduÇÃo, adaptaÇÃo, fidedignidade e evidÊncias de...

166
UNIVERSIDADE PRESBITERIANA MACKENZIE TATIANA PONTRELLI MECCA TRADUÇÃO, ADAPTAÇÃO, FIDEDIGNIDADE E EVIDÊNCIAS DE VALIDADE DA BATERIA DE VISUALIZAÇÃO E RACIOCÍNIO DA LEITER INTERNATIONAL PERFORMANCE SCALE-REVISEDSÃO PAULO 2010

Upload: others

Post on 16-Mar-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

  • UNIVERSIDADE PRESBITERIANA MACKENZIE

    TATIANA PONTRELLI MECCA

    TRADUÇÃO, ADAPTAÇÃO, FIDEDIGNIDADE E EVIDÊNCIAS DE VALIDADE

    DA BATERIA DE VISUALIZAÇÃO E RACIOCÍNIO DA

    “LEITER INTERNATIONAL PERFORMANCE SCALE-REVISED”

    SÃO PAULO

    2010

  • TATIANA PONTRELLI MECCA

    TRADUÇÃO, ADAPTAÇÃO, FIDEDIGNIDADE E EVIDÊNCIAS DE VALIDADE

    DA BATERIA DE VISUALIZAÇÃO E RACIOCÍNIO DA

    LEITER INTERNATIONAL PERFORMANCE SCALE-REVISED

    Dissertação apresentada ao

    Programa de Pós-Graduação em

    Distúrbios do Desenvolvimento

    da Universidade Presbiteriana

    Mackenzie como requisito para

    obtenção do título de mestre.

    Orientador: Prof. Dr. Elizeu Coutinho de Macedo.

    SÃO PAULO

    2010

  • M486t Mecca, Tatiana Pontrelli Traduçăo, adaptação, fidedignidade e evidencias de validade da bateria de raciocínio e visualizaçăo da Leiter International Performance Scale Revised / Tatiana Pontrelli Mecca - São Paulo, 2010 161 f. : il. ; 30 cm

    Dissertação (Mestrado em Distúrbios do Desenvolvimento) - Universidade Presbiteriana Mackenzie, 2010.

    Referências bibliográficas: f. 145-158.

    1. Avaliação Psicológica. 2. Inteligência. 3. Leiter-R. I. Título.

    CDD 153.9

  • TATIANA PONTRELLI MECCA

    TRADUÇÃO, ADAPTAÇÃO, FIDEDIGNIDADE E EVIDÊNCIAS DE VALIDADE

    DA BATERIA DE VISUALIZAÇÃO E RACIOCÍNIO DA

    LEITER INTERNATIONAL PERFORMANCE SCALE-REVISED

    Dissertação apresentada ao

    Programa de Pós-Graduação em

    Distúrbios do Desenvolvimento

    da Universidade Presbiteriana

    Mackenzie como requisito para

    obtenção do título de mestre.

    Aprovada em __________________

    BANCA EXAMINADORA

    Profº Dr. Elizeu Coutinho de Macedo – Orientador

    Universidade Presbiteriana Mackenzie

    Profª Dra. Alessandra Gotuzo Seabra

    Universidade Presbiteriana Mackenzie

    Profº Dr. Ricardo Primi

    Universidade São Francisco

  • APOIO:

    Este trabalho obteve apoio e financiamento da

    Fundação de Amparo à Pesquisa do Estado de

    São Paulo e Mackpesquisa.

  • AGRADECIMENTOS

    Este trabalho é fruto da dedicação, investimento, colaboração e esforço de muitas

    pessoas e aqui vai o meu “muito obrigada” a cada um que me ajudou a torná-lo possível.

    Primeiramente agradeço ao meu orientador, professor doutor Elizeu Coutinho de

    Macedo. Obrigada por tudo! Pelo que me ensinou enquanto meu professor na graduação,

    pelos anos de iniciação científica e por ter aceitado orientar este trabalho. Todas as lições,

    todas as conversas, todos os ensinamentos foram muito valiosos, essenciais e

    determinantes para o meu caminho profissional e pessoal. Não há palavras que traduzem a

    imensa admiração que tenho por você.

    À professora doutora Alessandra Gotuzo Seabra que além de trazer ricas

    contribuições como parte da banca examinadora, me incentivou e me ajudou com seus

    conhecimentos na elaboração do projeto inicial que resultou neste trabalho. Sua

    competência e sua gentileza é exemplo para todos que estão a sua volta. Muitíssimo

    obrigada Alê!

    Ao professor doutor Ricardo Primi que contribuiu não só com suas discussões e

    conhecimento compartilhado como parte da banca examinadora, mas também como autor

    de muitas das referencias lidas para o corpo teórico deste trabalho. Suas pesquisas têm sido

    de fundamental importância para aqueles que estudam avaliação da inteligência. Também

    agradeço pela oportunidade de assistir as aulas de TRI!

    Agradeço àquelas que me ensinaram a dar os primeiros passos. As colegas de

    laboratório que fizeram parte do início da minha trajetória profissional e que me serviram

    de exemplo durante esses anos: Katerina Lukasova, Carolina Nikaedo, Luane Natalle,

    Carolina Kuriyama e Riviane Borghesi Bravo. Especialmente à Fernanda Tebexreni Orsati,

    que nestes seis anos não poupou esforços para me ensinar, me orientar e mesmo longe,

    sempre esteve presente. Fe, deixo aqui registrado o quanto você é essencial na minha

    formação.

    Aos professores e colegas do grupo de Transtornos Globais do Desenvolvimento da

    Universidade Presbiteriana Mackenzie com quem dividi boa parte destes anos. Cada um a

    sua maneira contribuiu de forma valiosa para o meu crescimento profissional e pessoal:

    Salomão, Decio, Elói, Maria Cristina, Cristiane, Roberta, Renata e Alessandra. Sou

    imensamente grata por todos os momentos. Aliás, devo ressaltar aqui que minha maior

    motivação para este trabalho veio dos 4 anos que dividi com vocês.

  • Darlene, Camila, Bruna, Rivi, Cintia e Natália: mais do que minhas colegas de

    mestrado ou de laboratório, minhas amigas queridas! Obrigada pelo carinho, amizade,

    companheirismo, apoio, incentivo...enfim...contar com vocês fez toda a diferença!!!!!! Me

    sinto honrada de ter amigas como vocês.

    Àqueles que de alguma forma me ajudaram na execução deste trabalho, seja na

    tradução e adaptação da Leiter-R, bem como na coleta, tabulação e análise dos dados:

    professora Ceres Alves de Araújo, Natália Martins Dias, Bruna Tonietti Trevisan, Arthur

    Berberian, Alexandre Bizzocchi, Mayra Fernanda Ferreira Seraceni e Gizelly de Lima

    Alemida . Agradeço especialmente à Daniela Aguilera Moura Antonio pela super força e

    disponibilidade durante a coleta e tabulação dos dados e também por dar continuidade a

    este trabalho. Dani, obrigada por ter participado deste trabalho como se ele fosse seu. Sua

    ajuda fez toda a diferença! E ainda temos mais dois anos nessa jornada...

    Agradeço a todos os professores do Programa de Pós-Graduação em Distúrbios do

    Desenvolvimento e aos colegas do Laboratório de Neurociência Cognitiva, por todos os

    momentos de aprendizado que me proporcionaram.

    Lembro especialmente da Alícia e Karine, secretárias do Programa de Pós-

    Graduação em Distúrbios do Desenvolvimento e Denise da Coordenadoria de Pesquisa da

    Universidade Presbiteriana Mackenzie, que sempre estiveram dispostas a me ajudar em

    todos os momentos que precisei.

    À minha família: Aninha, Gordinho, Tico e Le. Vocês tornaram isso possível. Se

    cheguei até aqui foi graças ao investimento, apoio e auxílio incondicional que eu tive desde

    o início. Agradeço imensamente todo o esforço e dedicação que vocês tiveram ao me

    proporcionar todas as condições necessárias para que eu pudesse realizar este trabalho e

    me dedicar exclusivamente a ele. Eu amo vocês!

    Por fim, agradeço aos professores, coordenação, direção e a todos os funcionários

    das escolas que fizeram o possível e o impossível para que eu conseguisse realizar meu

    trabalho. Aos pais e alunos que participaram da pesquisa. Vocês formam os maiores

    responsáveis por todo este aprendizado.

  • RESUMO

    MECCA, TP. Tradução, Adaptação, Fidedignidade e Evidências de Validade da Bateria

    de Visualização e Raciocínio da Leiter International Performance Scale Revised.

    Dissertação de Mestrado, Programa de Pós-Graduação em Distúrbios do Desenvolvimento.

    Universidade Presbiteriana Mackenzie, São Paulo, 2010.

    Testes tradicionais que avaliam inteligência exigem habilidades e formas de responder que

    são difíceis para sujeitos com condições clínicas específicas como os distúrbios do

    desenvolvimento. Assim, é necessário disponibilizar instrumentos que possibilitem essa

    avaliação. Um teste utilizado internacionalmente para avaliação de inteligência não-verbal

    nos distúrbios do desenvolvimento é a Leiter-R, aplicada dos 2 aos 20 anos. São fornecidas

    três medidas de desempenho: Raciocínio Fluido, QI Estimado e QI Total, por meio dos

    subtestes da Bateria de Visualização e Raciocínio. O objetivo deste estudo foi realizar a

    tradução, adaptação e verificar parâmetros psicométricos da Bateria de Visualização e

    Raciocínio da Leiter-R em pré-escolares. A tradução e adaptação foram realizadas de

    acordo com pressupostos apresentados nas diretrizes da International Test Commission

    seguindo as seguintes etapas: tradução, julgamento, adaptação e revisão da versão final.

    Participaram 254 crianças entre 3 e 6 anos, alunos de 1º a 3º Estágio do Ensino Infantil de

    duas escolas públicas da cidade de São Paulo. Resultados de análise de variância

    mostraram efeito da idade e série no desempenho em todos os subtestes da Leiter-R, exceto

    para o subteste de Sequencias. Diferenças no desempenho devido ao tempo de

    escolarização foram encontradas no subteste Padrões Repetidos em crianças de 4 anos do

    1º Estágio e nos subtestes Figura-Fundo e Formas Completas em crianças de 5 anos no 2º

    Estágio. ANOVA revelou diferença de gênero para a idade de 6 anos no subteste Dobra de

    Papel com melhor desempenho no grupo feminino. Padrões de convergência foram

    verificados através de correlações positivas e significativas entre os escores na Leiter-R

    com a Escala de Maturidade Mental Columbia e Matrizes Progressivas Coloridas de

    Raven. Correlações entre teste e reteste foram positivas e significativas para a maioria dos

    subtestes. Os coeficientes de Spearman-Brown ficaram em torno de 0,84 e Alfa de

    Cronbach por idade e série, mostraram valores em torno de 0,77 indicando boa precisão

    dos subtestes. Desta forma, os resultados sugerem boa adequação dos parâmetros

    psicométricos da Leiter-R, preenchendo requisitos básicos que atestam a qualidade do

    instrumento.

    Palavras-chave: Avaliação Psicológica, Inteligência, Leiter-R.

  • ABSTRACT

    MECCA, TP. Translation, Adaptation, Reliability and Validity Evidences of the

    Visualization and Reasoning Battery of the Leiter International Performance Scale

    Revised. Master's Thesis, Post-Graduation Program in Developmental Disorders.

    Universidade Presbiteriana Mackenzie, City of São Paulo – Brazil, 2010.

    Traditional tests that assess intelligence require skills and ways of responding that are

    difficult for individuals with specific clinical conditions such as developmental disorders.

    Thus, it is necessary to provide tools that enable this evaluation. An internationally used

    test for evaluating nonverbal intelligence in developmental disorders is the Leiter-R,

    applied from ages 2 to 20. Three performance measures are provided: Fluid Reasoning,

    Estimated IQ and Total IQ, by means of subtests of the Visualization and Raciocínio

    Battery. The objective of this study was to perform the translation, adaptation and to check

    psychometric parameters of the Visualization and Reasoning Battery of the Leiter-R in pre-

    school children. The translation and adaptation were performed according to assumptions

    presented in the guidelines of the International Test Commission by following these steps:

    translation, examination, adaptation and review of the final version. Participants were 254

    children between ages 3 and 6, students of 1st to 3

    rd Stage of Childhood Education from

    two public schools in the city of São Paulo. Results of variance analysis showed significant

    effect of age and grade in performance in all Leiter-R subtests, except Sequential Order.

    Differences in performance due to the time of schooling were found in the “Repeated

    Patterns” subtest in children at age 4 of the 1st Stage and in the “Figure-Ground and Form

    Completion” subtests in children at age 5 of the 2nd

    Stage. ANOVA revealed differences of

    gender for age 6 in the “Paper Folding” subtest, with better performance in the feminine

    group. Patterns of convergence were verified through significant and positive correlations

    between scores in the Leiter-R with the Columbia Mental Maturity Scale and Raven’s

    Coloured Progressive Matrices. Correlations between test and retest were positive and

    significant for most subtests. The Spearman-Brown coefficients were around 0.84 and

    Cronbach's Alpha for age and grade showed values around 0.77 indicating good accuracy

    of subtests. Thus, the results suggest good adequacy of psychometric parameters of the

    Leiter-R, fulfilling basic requirements that attest to the quality of the tool.

    Keywords: Psychological Assessment, Intelligence, Leiter-R.

  • LISTA DE FIGURAS

    Pag.

    Figura 1: Modelo hierárquico de Gustafsson 50

    Figura 2: Modelo hierárquico para os subtestes aplicados a faixa etária de 2

    a 5 anos.

    53

    Figura 3: Modelo hierárquico para os subtestes aplicados a faixa etária de 6

    a 10 anos.

    53

    Figura 4: Modelo hierárquico para os subtestes aplicados a faixa etária de

    11 a 20 anos.

    54

    Figura 5. Tendências desenvolvimentais para os escores na Leiter-R. 64

    Figura 6. Análise Fatorial Confirmatória para as idades de 4-5 anos. 66

    Figura 7. Análise Fatorial Confirmatória para as idades de 6-10 anos. 66

    Figura 8. Item 1 da forma A do teste Matrizes Coloridas de Raven 75

    Figura 9. Prancha do exemplo 1 da EMMC. 76

    Figura 10. Prancha do Item 2 do subteste 1. 77

    Figura 11. Cartões A, B e C (esquerda para a direita) do item 2, subteste 1. 78

    Figura 12. Prancha do item 1 do subteste 2. 79

    Figura 13. Cartões correspondentes ao item 1 do subteste 2. 79

    Figura 14. Prancha do item 1 do subteste 3 (Parte I) 80

    Figura 15. Cartão correspondente ao item 1 do subteste 3 (Parte I). 80

    Figura 16. Prancha do item 10, subteste 3 (Parte II). 80

    Figura 17. Cartões correspondentes ao item 10 do subteste 3 (Parte II). 80

    Figura 18. Prancha do item 2, subteste 4. 81

    Figura 19. Cartões correspondentes ao item 2 do subteste 4. 81

    Figura 20. Prancha do item 2 do subteste 5. 82

    Figura 21. Cartões correspondentes ao item 2 do subteste 5. 82

    Figura 22. Prancha do item 4, subteste 6. 83

    Figura 23. Cartões correspondentes ao item 4 do subteste 6. 83

  • Figura 24. Prancha do item 2, subteste 7. 84

    Figura 25. Cartões correspondentes ao item 2 do subteste 7. 84

    Figura 26. Prancha do item 4, subteste 8. 85

    Figura 27. Cartão correspondente ao item 4 do subteste 8. 85

    Figura 28. Prancha do item 2, subteste 9. 86

    Figura 29. Cartões correspondentes ao item 2 do subteste 9. 86

    Figura 30. Prancha do item 1, subteste 10 87

    Figura 31. Cartão correspondente ao item 1 do subteste 10. 87

  • LISTA DE TABELAS

    Pag.

    Tabela1. Modelo da Teoria dos Três Estratos e John Carroll. 20

    Tabela 2. Definição dos dez fatores amplos da teoria CHC. 24

    Tabela 3. Descrição dos 6 domínios incluídos no Estrato II da CHC. 25

    Tabela 4: Valores de índice d e interpretações para diferença de gênero. 37

    Tabela 5: Substestes da Bateria de Raciocínio e Visualização (VR) e as

    idades correspondentes para a aplicação.

    52

    Tabela 6: Processos cognitivos avaliados pela Bateria VR da Leiter-R. 55

    Tabela 7: Subtestes aplicados para obtenção de QI Estimado e QI Total

    para cada faixa etária.

    56

    Tabela 8: Subtestes classificados por índices fatoriais e idade. 56

    Tabela 9: Descrição das classificações obtidas na Leiter-R pela Bateria

    de Raciocínio e Visualização.

    57

    Tabela 10: Consistência Interna dos subtestes da Bateria VR de acordo

    com a idade.

    59

    Tabela 11: Médias dos pontos ponderados para Teste, Reteste e

    Correlação de Pearson.

    59

    Tabela 12. Valores em porcentagem para sensibilidade e especificidade

    segundo a amostra normal, com atraso cognitivo e altas habilidades.

    61

    Tabela 13. Estatísticas descritivas e Correlação de Pearson entre as duas

    versões da Leiter.

    62

    Tabela 14: Cargas fatoriais dos subtestes para o Fator Visualização. 65

    Tabela 15: Cargas fatoriais dos subtestes para o Fator Raciocínio. 65

    Tabela 16: Correlações entre os subtestes da Bateria VR para as idades

    de 2-3 anos.

    67

    Tabela 17: Correlações entre os subtestes da Bateria VR para as idades

    de 4-5 anos.

    67

    Tabela 18: Correlações entre os subtestes da Bateria VR para as idades

    de 6-10 anos.

    67

    Tabela 19: Caracterização da amostra: grupos etários, número de sujeitos, 73

  • porcentagem e porcentagem cumulativa.

    Tabela 20: Caracterização da amostra: série, número de sujeitos,

    porcentagem e porcentagem cumulativa.

    73

    Tabela 21: Caracterização da amostra: meses de escolarização, número

    de sujeitos, porcentagem e porcentagem cumulativa.

    74

    Tabela 22: Estatísticas descritivas da amostra geral para a EMMC,

    MPCR, subteste

    90

    Tabela 23. Valores de Alfa de Cronbach dos subtestes da Leiter-R em

    relação à amostra geral e por faixa etária.

    93

    Tabela 24: Coeficientes de Correlação de Pearson (r) e valores p para

    teste-reteste.

    94

    Tabela 25: Método das Metades para cada subteste da Leiter-R. 94

    Tabela 26. Valores de Kolmogorov-Smirnov e Levene de acordo com os

    grupos etários para EMMC.

    97

    Tabela 27. Estatísticas Descritivas da EMMC em função dos grupos

    etários.

    97

    Tabela 28. Análise de Pares de Bonferroni para efeito da idade na

    EMMC.

    98

    Tabela 29: Valores de Kolmogorov-Smirnov Z e Levene de acordo com

    as séries escolares para EMMC.

    98

    Tabela 30: Estatísticas Descritivas da EMMC em função das séries

    escolares.

    99

    Tabela 31: Análise de Pares de Bonferroni para efeito da série na

    EMMC.

    99

    Tabela 32. Valores de Kolmogorov-Smirnov Z e Levene de acordo com

    grupos etários para MPCR.

    101

    Tabela 33: Estatísticas Descritivas da MPCR em função dos grupos

    etários.

    101

    Tabela 34: Teste Mann-Whitney para efeito da idade na MPCR. 101

    Tabela 35. Valores de Kolmogorov-Smirnov Z e Levene de acordo com

    as séries escolares para MPCR.

    102

    Tabela 36: Estatísticas Descritivas da MPCR em função das séries

    escolares.

    102

  • Tabela 37: Teste Mann-Whitney para efeito da série na MPCR. 102

    Tabela 38. Valores de Kolmogorov-Smirnov Z e Levene de acordo com

    grupos etários para o subteste Figura-Fundo.

    104

    Tabela 39: Estatísticas descritivas para o subteste Figura-Fundo de

    acordo com os grupos etários.

    104

    Tabela 40. Teste de Kruskal-Wallis para efeito da idade no subteste

    Figura-Fundo.

    105

    Tabela 41: Valores de Kolmogorov-Smirnov Z e Levene de acordo com

    as séries escolares para o subteste Figura-Fundo.

    105

    Tabela 42: Estatísticas descritivas para o subteste Figura-Fundo em

    função das séries escolares.

    106

    Tabela 43: Teste de Kruskal-Wallis para efeito da série no subteste

    Figura-Fundo.

    106

    Tabela 44. Valores de Kolmogorov-Smirnov Z e Levene de acordo com

    grupos etários para o subteste Formas Completas.

    108

    Tabela 45: Estatísticas descritivas para o subteste Formas Completas em

    função dos grupos etários.

    108

    Tabela 46: Teste de Kruskal-Wallis para efeito da idade no subteste

    Formas Completas.

    109

    Tabela 47: Valores de Kolmogorov-Smirnov Z e Levene de acordo com

    as séries escolares para o subteste Formas Completas.

    109

    Tabela 48: Estatísticas descritivas do subteste Formas Completas em

    função das séries escolares.

    110

    Tabela 49: Teste de Kruskal-Wallis para efeito da série no subteste

    Formas Completas.

    110

    Tabela 50. Valores de Kolmogorov-Smirnov Z e Levene de acordo com

    grupos etários para o subteste Pareamento.

    112

    Tabela 51: Estatísticas descritivas para o subteste Pareamento em função

    dos grupos etários

    112

    Tabela 52: Análise de Pares de Bonferroni para efeito da idade no

    subteste Pareamento.

    113

    Tabela 53: Valores de Kolmogorov-Smirnov Z e Levene de acordo com

    as séries escolares para o subteste Pareamento.

    113

    Tabela 54: Estatísticas descritivas para o subteste Pareamento de em

    função da série.

    114

  • Tabela 55: Teste de Kruskal-Wallis para efeito da série no subteste

    Pareamento.

    114

    Tabela 56: Valores de Kolmogorov-Smirnov Z e Levene de acordo com

    grupos etários para o subteste Sequencias.

    115

    Tabela 57: Estatísticas descritivas para o subteste Sequencias em função

    dos grupos etários.

    116

    Tabela 58: Teste de Kruskal-Wallis para efeito da idade no subteste

    Sequencias.

    116

    Tabela 59: Valores de Kolmogorov-Smirnov Z e Levene de acordo com

    as séries escolares para o subteste Sequencias.

    117

    Tabela 60: Estatísticas descritivas para o subteste Sequencias em função

    das séries escolares.

    117

    Tabela 61: Análise de Pares de Bonferroni para efeito da série no

    subteste Sequencias.

    118

    Tabela 62. Valores de Kolmogorov-Smirnov Z e Levene de acordo com

    grupos etários para o subteste Padrões Repetidos.

    120

    Tabela 63: Estatísticas descritivas para o subteste Padrões Repetidos em

    função dos grupos etários.

    120

    Tabela 64: Análise de Pares de Bonferroni para efeito da idade em

    Padrões Repetidos.

    121

    Tabela 65. Valores de Kolmogorov-Smirnov Z e Levene de acordo com

    as séries escolares para o subteste Padrões Repetidos.

    121

    Tabela 66: Estatísticas descritivas para o subteste Padrões Repetidos em

    função das séries escolares.

    122

    Tabela 67: Análise de Pares de Bonferroni para efeito da série no

    subteste Padrões Repetidos.

    122

    Tabela 68. Valores de Kolmogorov-Smirnov Z e Levene de acordo com

    grupos etários para o subteste Classificação.

    123

    Tabela 69: Estatísticas descritivas para o subteste Classificação em

    função dos grupos etários.

    124

    Tabela 70: Teste de Kruskal-Wallis para efeito da idade no subteste

    Classificação.

    124

    Tabela 71. Valores de Kolmogorov-Smirnov Z e Levene de acordo com

    as séries escolares para o subteste Classificação.

    124

    Tabela 72: Estatísticas descritivas para o subteste Classificação em 125

  • função das séries escolares.

    Tabela 73: Teste de Kruskal-Wallis para efeito da série no subteste

    Classificação.

    125

    Tabela 74: Estatísticas descritivas para o subteste Analogias de Desenho

    (AD) e Dobra de Papel (DP).

    127

    Tabela75: Sumário do modelo oriundo da Regressão Linear Múltipla. 129

    Tabela 76. Coeficientes de regressão. 130

    Tabela 77. Estatísticas descritivas em função de meses de escolarização

    para crianças de 4 anos do 1º estágio.

    131

    Tabela 78. Estatísticas descritivas em função de meses de escolarização

    para crianças de 5 anos do 2º estágio.

    132

    Tabela 79: ANOVA para o desempenho nos subtestes da Leiter-R em

    função do tempo de escolarização

    133

    Tabela 80. ANOVA para efeito de gênero na Leiter-R 135

    Tabela 81. Correlações de Pearson entre MPCR, EMMC, QI Estimado e

    Raciocínio Fluido.

    136

    Tabela 82 : Correlação da MPCR e EMMC com o QI Total da Leiter-R 137

    Tabela 83: Valores de Correlação de Pearson entre os Subtestes da

    Leiter-R, EMMC e MPCR.

    138

    Tabela 84: Correlações entre os subtestes da Bateria VR para a idade de 3

    anos.

    138

    Tabela 85: Correlações entre os subtestes da Bateria VR para as idades

    de 4-5 anos.

    139

    Tabela 86: Correlações entre os subtestes da Bateria VR para a idade de 6

    anos.

    139

    Tabela 87. Análise Fatorial Exploratória referente ao grupo etário de 3

    anos.

    140

    Tabela 88. Análise Fatorial Exploratória referente ao grupo etário de 4-5

    anos.

    141

    Tabela 89. Análise Fatorial Exploratória referente ao grupo etário de 6

    anos.

    142

  • SUMÁRIO

    1. APRESENTAÇÃO....................................................................................15

    2. PRESSUPOSTOS TEÓRICOS..................................................................17

    2.1. Inteligência: Estrutura e Cognição...................................................17

    2.2. Instrumentos Psicológicos: Tradução, Adaptação e Parâmetros

    Psicométricos...............................................................................................27

    2.3. Diferenças Individuais na Inteligência em Função de Critérios

    Externos.......................................................................................................37

    2.4. Avaliação da Inteligência na Infância................................................41

    2.5. The Leiter International Performance Scale Revised…………….....49

    2.5.1. Aspectos gerais do instrumento...............................................49

    2.5.2. Parâmetros Psicométricos da Bateria VR da Leiter-R..............58

    2.5.3. Leiter-R e os Distúrbios do Desenvolvimento........................68

    3. OBJETIVOS...............................................................................................72

    3.1. Objetivo Geral.....................................................................................72

    3.2. Objetivos Específicos..........................................................................72

    4. MÉTODO...................................................................................................73

    4.1.Participantes..........................................................................................73

    4.2.Instrumentos..........................................................................................74

    4.3. Procedimentos......................................................................................87

    5. RESULTADOS E DISCUSSÃO...............................................................90

    5.1. Dados Gerais da Amostra.....................................................................90

    5.2. Coeficientes de Fidedignidade.............................................................92

    5.3. Evidências de Validade por Mudanças Desenvolvimentais..................95

    5.3.1. Escala de Maturidade Mental Colúmbia.........................................96

    5.3.2. Matrizes Progressivas Coloridas de Raven...................................100

    5.3.3. Figura-Fundo da Leiter-R.............................................................103

    5.3.4. Formas Completas da Leiter-R.....................................................107

    5.3.5. Pareamento da Leiter-R................................................................111

    5.3.6. Sequencias da Leiter-R.................................................................115

    5.3.7. Padrões Repetidos da Leiter-R.....................................................119

    5.3.8. Classificação da Leiter-R..............................................................123

  • 5.3.9. Subtestes Analogias de Desenho e Dobra de Papel...................126

    5.3.10. Síntese dos Resultados por Tendências Desenvolvimentais....127

    5.4. Análise de Regressão Linear Múltipla...............................................129

    5.5. Análise por Tempo de Escolarização.................................................130

    5.6. Análise por Diferença de Gênero.......................................................134

    5.7. Análises de Correlação com outros instrumentos..............................136

    5.8. Análise Fatorial Exploratória.............................................................140

    6. CONCLUSÃO..........................................................................................143

    7. REFERÊNCIAS BIBLIOGRÁFICAS.....................................................145

    8. APÊNDICES............................................................................................159

    A. Carta de Informação à Instituição........................................................159

    B. Carta de Consentimento Livre e Esclarecido aos pais.........................160

    C. Carta de aprovação do Comitê de Ética...............................................161

  • 15

    1. APRESENTAÇÃO

    A avaliação de habilidades cognitivas de indivíduos com distúrbios do

    desenvolvimento compreende uma prática clínica e pesquisas fundamentadas em

    instrumentos adequados para tal. No entanto, os instrumentos atualmente disponíveis no

    mercado nacional foram construídos e padronizados para a avaliação de indivíduos que

    possuem certas habilidades preservadas, tais como: linguagem, leitura, escrita e

    motricidade.

    Tais habilidades e formas de responder determinados grupos não desenvolveram

    adequadamente ou até mesmo não as possuem como pode ser observado em indivíduos

    com Transtorno do Espectro Autista, Síndrome de Down e outras síndromes genéticas

    acompanhadas de deficiência intelectual, Distúrbios de Linguagem, Paralisia Cerebral,

    Deficiência Auditiva, entre outras condições. Conseqüentemente, tais instrumentos não são

    indicados para avaliação de indivíduos com distúrbios do desenvolvimento já que este

    grupo apresenta determinadas características como ausência ou prejuízo na

    linguagem/comunicação e deficiência motora, que freqüentemente impossibilita expressar

    de fato suas habilidades ou dificuldades.

    No Programa de Pós-Graduação em Distúrbios do Desenvolvimento são

    conduzidos diferentes estudos que envolvem a avaliação cognitiva de crianças e

    adolescentes. Desta forma, é importante criar e/ou adaptar instrumentos de avaliação

    psicológica que possam ser usados nestes estudos, bem como disponibilizá-los para

    clínicos e educadores. De fato, nos últimos anos tem aumentado, entre os pesquisadores, a

    preocupação com a disponibilização de instrumentos mais adequados e acessíveis aos

    grupos avaliados. Por isso, alternativas têm sido propostas para suprir esta lacuna.

    Entre os aspectos cognitivos mais estudados e de fundamental importância na

    avaliação cognitiva é a inteligência. Tal construto está relacionado a uma capacidade

    mental geral que implica em raciocinar, planejar, resolver problemas, pensar de forma

    abstrata e aprender com a experiência.

    Uma das possibilidades de avaliar a inteligência de pessoas com distúrbios do

    desenvolvimento é por meio de testes não-verbais que exijam resposta motora discreta,

    como é o caso da Leiter International Performance Scale – Revised (Leiter-R). Trata-se de

    uma escala de avaliação de inteligência não-verbal, aplicada para uma faixa etária de 2 a

    20 anos de idade e constantemente utilizada em diversas pesquisas internacionais que

  • 16

    avaliam indivíduos com distúrbios do desenvolvimento. Ela é especificamente adequada

    para ser utilizada com indivíduos que apresentam prejuízos cognitivos, comprometimento

    auditivo, motor e dificuldades de linguagem.

    Entretanto, para que um instrumento esteja devidamente qualificado para ser

    utilizado na avaliação psicológica, a Comissão Internacional de Testes aponta como sendo

    necessários alguns requisitos básicos relacionados a modelos de adaptação e parâmetros

    psicométricos. No caso de instrumentos internacionais, alguns requisitos são: tradução e

    adaptação cultural, bem como medidas adequadas referentes a fontes de evidências de

    fidedignidade ou precisão e validade que garantem a confiabilidade e especificidade do

    instrumento.

    Sendo assim, os objetivos do presente estudo são: traduzir, adaptar e apresentar

    evidências de fidedignidade e validade da Bateria de Visualização e Raciocínio da Leiter-R

    em uma amostra de 200 crianças de 3 a 6 anos, de escolas públicas da cidade de São Paulo.

    Trata-se de um estudo com relevância social, pois instrumentos que de fato avaliem

    as reais habilidades do sujeito podem auxiliar em processos diagnósticos e no

    planejamento de intervenções mais eficazes. A implicação prática da pesquisa é a

    possibilidade de se avaliar futuramente através de um instrumento adequado, indivíduos,

    que muitas vezes são considerados incapazes de serem testados, devido à dificuldade de

    acessar seus conhecimentos através dos testes tradicionais.

  • 17

    2. PRESSUPOSTOS TEÓRICOS

    2.1. Inteligência: Estrutura e Cognição

    De acordo com Mäder, Thais e Ferreira (2004), a inteligência é um conceito amplo,

    pois a capacidade humana de conceituar, organizar, desenvolver e memorizar é abrangente

    para ser determinada por apenas um único aspecto. De fato, Almeida (2002) mostra que

    este conceito ou construto não desfruta de consenso entre os estudiosos do tema.

    Uma das controvérsias está relacionada à questão se a inteligência é mais bem

    definida através de uma capacidade geral ou através de um conjunto de aptidões

    diferenciadas, como no caso das inteligências múltiplas. Mesmo assim, existe um acordo

    de que a inteligência está relacionada com a capacidade de pensar e de resolver problemas,

    ou seja, reportam-se as capacidades e habilidades dos indivíduos (Almeida, Guisande,

    Primi e Ferreira, 2008). Neste sentido, uma declaração assinada por 52 pesquisadores

    renomados publicada na Revista Intelligence em 1997 define a inteligência como uma

    capacidade mental geral que implica em habilidades como raciocínio, planejamento,

    resolução de problemas, pensar de maneira abstrata e aprender com a experiência (Flores-

    Mendoza, 2010).

    Segundo Primi e Flores-Mendoza (2006), o estudo da inteligência se confunde com

    a história da própria psicologia, pois as primeiras pesquisas empíricas tratavam da medida

    da inteligência e é marcado por diferentes abordagens teóricas e metodológicas. Neste

    sentido, três abordagens principais têm sido utilizadas em pesquisas referentes a

    inteligência: a cognitiva, a desenvolvimental e a psicométrica (Primi, 2002; Almeida,

    2002; Roazzi e Souza, 2002; Mader e cols., 2004).

    A abordagem cognitiva busca identificar os elementos estruturais, esquemas

    lógicos e processos de funcionamento da atividade mental. Trata-se de uma visão sistêmica

    da inteligência baseada em seus mecanismos cognitivos, sua arquitetura e dinâmica

    (Roazzi e Souza, 2002). Sternberg (2008), um dos maiores expoentes desta abordagem,

    ressalta a importância de se compreender os componentes, estratégias e representações

    envolvidos nos processos mentais.

    A inteligência, de acordo com a abordagem desenvolvimental está relacionada ao

    conceito de adaptação de Piaget que se refere a um estado de equilíbrio para o qual tendem

    todas as adaptações sucessivas sensório-motoras e cognitivas baseadas na experiência do

    sujeito. Trata-se de um modelo hierárquico, no qual o desenvolvimento intelectual é

  • 18

    dividido em estágios, cada qual mais complexo que o seu precedente e corresponde a uma

    forma de adaptação biológica. Isto significa que o desenvolvimento cognitivo é construído

    até o estágio no qual o indivíduo se encontra (Mader e cols., 2004). A abordagem

    psicométrica será discutida detalhadamente pelo fato de estar mais diretamente relacionada

    com os objetivos deste estudo.

    Historicamente, a psicometria começou a ser usada na elaboração de instrumentos

    de medida sem que se soubesse bem o que eles mediam. Ou seja, sem uma compreensão

    teórica sobre a inteligência, mas que evoluiu para formulações teoricamente mais

    sofisticadas (Sternberg, 2008). Nesta abordagem, a inteligência é uma habilidade que pode

    ser mensurada através do desempenho em testes (Roazzi e Sousa, 2002). E o termo

    “psicometria” se refere ao foco e esforço colocado sobre a medida e o cuidado despendido

    na construção e validação de instrumentos (Almeida e cols., 2008a).

    Gauer, Gomes e Haase (2010) definem a psicometria como o campo de estudos das

    características de instrumentos ou testes que visam à mensuração de variáveis psicológicas.

    As características, ou qualidade dos instrumentos são definidas em termos da adequação

    teórica, empírica, lógica e estatística que eles apresentam, tendo em vista que são utilizados

    como artefatos de medida. Os indicadores dessas características são analisados desde o

    nível de operacionalização dos conceitos da teoria nos itens do teste, até as propriedades

    estatísticas dos valores aferidos pelo instrumento em uma amostra.

    O início da psicometria se deu a partir das idéias de Francis Galton que focalizou

    seus interesses na hereditariedade, especialmente na herança de altos níveis de habilidade

    (Hogan, 2006) e partia do pressuposto de que havia uma habilidade intelectual geral nos

    indivíduos (Mader e cols., 2004). Partindo desta concepção, o psicólogo inglês Charles

    Spearman desenvolveu no início do século XX a extração estatística do que veio a

    denominar de “fator g” (Mader e cols., 2004). Sendo este uma energia mental inata, um

    fator com base neurológica (Schelini, 2006) capaz de ativar operações cognitivas comuns a

    todas as atividades mentais (Primi, 2002; Mader e cols., 2004).

    A concepção bifatorial proposta por Spearman, apresenta um fator geral e outro

    específico. A alta correlação entre dois testes psicológicos seria explicada por estes serem

    altamente saturados em g, já que a presença de fatores específicos tenderia a baixar a

    correlação. (Schelini, 2006; Cruz, 2008). Para Spearman, o funcionamento cognitivo se

    dava a partir de três processos básicos que estariam presentes em todas as habilidades

  • 19

    mentais: 1) apreensão das experiências relacionada à rapidez e acuidade na percepção de

    estímulos; 2) edução de relações como capacidade de estabelecer relação entre duas ou

    mais idéias e; 3) edução de correlatos referente à capacidade de criar novas idéias a partir

    de relações e idéias previamente estabelecidas (Primi, 2002). Embora Spearman não

    tivesse criado nenhum tipo de teste, tampouco empreendeu projetos para coleta de dados,

    sua importância se deve ao fato de que através do método estatístico de análise fatorial

    deu-se a primeira tentativa de fornecer uma teoria da inteligência humana de base empírica

    (Hogan, 2006).

    Louis Leon Thurstone também deu continuidade a estudos que explicassem o

    funcionamento cognitivo e ao verificar os componentes da inteligência através da análise

    fatorial, propôs a Teoria das Aptidões Primárias. Descreveu sete fatores ou capacidades

    independentes: habilidade espacial, compreensão verbal, fluência verbal, velocidade

    perceptiva, aptidão numérica, memória e raciocínio indutivo. A independência dos fatores

    descarta a idéia de um fator geral subjacente às habilidades específicas (Almeida, 2002;

    McGrew, 2004).

    Em 1993, com a publicação de Human Cognitive Abilities: A Survey of Factor

    Analytic Studies por John Carroll, houve um avanço na visão psicométrica a respeito da

    inteligência, resultando na criação de um modelo hierárquico chamado de Teoria dos Três

    Estratos. Os estratos seriam camadas dispostas em três níveis em função da generalidade.

    O estrato I seria em torno de setenta fatores específicos propostos pelos testes

    psicométricos. O estrato II agrupa estes fatores específicos em oito fatores mais amplos:

    raciocínio, conhecimento-linguagem, memória-aprendizagem, percepção visual, percepção

    auditiva, produção de idéias, velocidade de processamento cognitivo e velocidade de

    decisão. O Estrato III corresponderia ao fator g (Sternberg, 2008). A tabela 1 mostra o

    modelo da Teoria dos Três Estratos de John Carroll (1993) adaptado por Primi, Santos,

    Vendramini, Taxa, Muller, Lukjanenko e Sampaio (2001).

  • 20

    Tabela1. Modelo da Teoria dos Três Estratos e John Carroll.

    ESTRATO

    III

    ESTRATO

    II

    DESCRIÇÃO ESTRATO

    I

    Exemplos de fatores mais

    significativos

    Fator g Inteligência Fluida

    Gf

    Raciocínio em situações

    novas, minimamente

    dependente de conhecimentos

    adquiridos. Resolver

    problemas novos, relacionar

    idéias, induzir conceitos

    abstratos, compreender

    implicações.

    Raciocínio sequencial,

    Indução,

    Raciocínio quantitativo.

    Inteligência

    Cristalizada

    Gc

    Extensão e profundidade dos

    conhecimentos adquiridos de

    uma determinada cultura.

    Raciocínio adquirido pelo

    investimento da capacidade

    geral em experiências de

    aprendizagem.

    Desenvolvimento

    lingüístico, Conhecimento

    léxico, Compreensão em

    leitura.

    Memória e

    Aprendizagem

    Gsm

    Manutenção de informações

    na consciência por um curto

    espaço de tempo para poder

    recuperá-las logo em seguida.

    Capacidade de informação

    retida após exposição a uma

    situação de aprendizagem

    (geralmente conteúdos

    simples).

    Extensão da memória

    Memória associativa,

    Memória visual.

    Percepção Visual

    Gv

    Gerar, reter e manipular

    imagens visuais abstratas.

    Visualização, Relações

    espaciais, Velocidade de

    fechamento.

    Recepção Auditiva

    Ga

    Percepção e discriminação de

    padrões sonoros (incluindo a

    linguagem oral)

    particularmente quando

    apresentados em contextos

    mais complexos envolvendo

    distorções ou estruturas

    musicais complexas.

    Acuidade auditiva,

    discriminação da

    linguagem oral,

    Discriminação e

    julgamento de padrões

    tonais musicais.

    Habilidade de

    Recuperação

    Glr

    Habilidade associada à

    extensão e fluência que itens

    de informação ou conceitos

    são recuperados da memória

    de longo prazo por

    associação.

    Fluência de idéias,

    Facilidade de recordação

    de nomes, Fluência de

    associações,

    Originalidade/Criatividade

    Velocidade de

    Processamento

    Cognitivo

    Gs

    Habilidade associada à taxa

    de rapidez de processamento

    cognitivo em tarefas

    cognitivas simples.

    Velocidade perceptual,

    Tempo de reação simples,

    Velocidade de

    processamento semântico.

    Fonte: Primi e colaboradores (2001, p.154).

  • 21

    Em 1998, McGrew e Flanagan propuseram uma integração da Teoria dos Três

    Estratos de Carroll com a Teoria da Inteligência Fluída e Cristalizada de Horn e Cattell.

    Esta última se refere a dois tipos de inteligência: a cristalizada e a fluída (Primi e cols.,

    2001)

    A inteligência cristalizada (Gc) corresponde à extensão e profundidade dos

    conhecimentos adquiridos de uma determinada cultura e suas aplicações de forma efetiva.

    Capacidade de raciocínio adquirida pelo investimento da capacidade geral em experiências

    de aprendizagem e primariamente baseada na linguagem. Está associada ao conhecimento

    declarativo, como o conhecimento de fatos, idéias e conceitos. E relacionada a habilidades

    como raciocinar com procedimentos aprendidos previamente para transformar o

    conhecimento (Primi, 2002; Primi, 2003; Schelini e Wechsler, 2005; Schelini, 2006).

    Já a inteligência fluída (Gf) está relacionada à inteligência não-verbal,

    correspondente à habilidade necessária na previsão da capacidade geral de adaptação às

    situações novas ou inesperadas, pouco estruturadas, que requerem autonomia intelectual,

    relacionar idéias, induzir conceitos abstratos, compreender implicações, extrapolação,

    reorganização, transformação e generalização de informações. As deficiências neste fator

    caracterizam-se pela dificuldade em generalizar regras, formar conceitos e observar

    implicações (Primi, 2002; Primi, 2003; Schelini e Wechsler, 2005; Schelini, 2006). E

    devido aos objetivos deste trabalho, o fator Gf será discutido mais detalhadamente.

    Primi (2002) aponta que Carroll descreveu três grupos de tarefas gerais

    relacionadas à inteligência fluída: raciocínio seqüencial geral, indução e raciocínio

    quantitativo. O raciocínio seqüencial é a capacidade de derivar implicações ou conclusões

    a partir da análise de combinação de premissas claramente formuladas seguindo dois ou

    mais passos lógicos, tais como tarefas de silogismos categóricos, silogismos lineares e

    raciocínio verbal geral. Já a indução se refere a tarefas como descoberta de

    conceitos/regras, seriação, tarefas de múltiplos exemplares, matrizes, elementos ímpares,

    analogias, nas quais a pessoa deve analisar um conjunto de estímulos observando as

    regularidades, as características comuns, para inferir as relações entre os estímulos.

    Enquanto que o raciocínio quantitativo envolve tarefas que utilizam o raciocínio dedutivo e

    indutivo, misturando-se com conceitos e relações quantitativas matemáticas, como por

    exemplo, aritmética, álgebra, geometria e cálculo.

  • 22

    O fator Gf tem sido associado à complexidade cognitiva que pode ser definida

    como uma maior utilização de um vasto e diversificado leque de processos cognitivos

    elementares durante a execução de uma tarefa (McGrew, 2004). O pico de

    desenvolvimento da Gf se dá no final da adolescência. Esta se mantém estabilizada por

    alguns anos e partir daí, entra em declínio principalmente no que concerne a habilidade de

    velocidade de processamento (Arckerman, 1996).

    Em relação aos processos cognitivos que são elementares durante a execução de

    tarefas como o raciocínio fluido, estudos de neuroimagem têm buscado compreende-los em

    termos de estruturas e ativação cerebral. Hampshire e colaboradores (2010) apontam que o

    raciocínio é um componente fundamental para um comportamento executivo bem

    adaptado. Estes autores investigaram a relação entre raciocínio, controle executivo e

    funcionamento de regiões frontoparietais. Os resultados deste estudo mostram que os

    circuitos frontoparietais devem ser fracionados em sub-regiões que são ativadas de acordo

    com demandas distintas de raciocínio que são apresentadas. Tarefas de maior

    complexidade apresentam modulação de atividade no hemisfério direito incluindo giro

    frontal medial e a parte superior do córtex parietal. Já tarefas de analogias recrutam áreas

    do hemisfério esquerdo como a região inferior do córtex pré-frontal dorsolateral. Sendo

    que estas regiões têm sido associadas a uma gama de demandas cognitivas denominadas

    funções executivas.

    Estudos têm mostrado que alguns construtos elaborados a partir de perspectivas

    teóricas diferentes, como a psicometria e a psicologia cognitiva, apresentam sobreposições.

    Uma das sobreposições que tem sido estudada se dá entre os construtos fator G e

    inteligência fluida da psicometria e o construto funções executivas definido na psicologia

    cognitiva (García-Molina e cols., 2010). As funções executivas têm sido definidas como as

    habilidades cognitivas necessárias para realizar comportamentos complexos dirigidos para

    determinado objetivo e a capacidade adaptativa a diversas demandas e mudanças

    ambientais (Hamdan e Pereira, 2009), sendo indicadas como semelhantes ao conceito de

    resolução de problemas novos relacionados à Gf (García-Molina e cols, 2010). A

    importância de sua avaliação se dá pelo fato de que elas estão alteradas em alguns quadros

    de distúrbios do desenvolvimento, tais como os Transtornos do Espectro Autista (Happé e

    Frith, 1996), o Transtorno de Déficit de Atenção e Hiperatividade (Gordon, Barkley e

    Lovett, 2006), a Síndrome de Williams-Beuren (Menghini e cols, 2010), Epilepsia do lobo

    frontal em crianças (Luton, Burns e Defilippis, 2010) entre outras condições. Além disso,

    http://www.ncbi.nlm.nih.gov/pubmed?term=%22Defilippis%20N%22%5BAuthor%5D

  • 23

    Shelton e colaboradores (2010) apontam que Gf e memória de trabalho são construtos

    altamente correlacionados. Já Tilman e colaboradores (2009) mostram que velocidade de

    processamento, controle inibitório bem como a memória de trabalho, são os principais

    construtos que explicam o desempenho em tarefas de raciocínio fluido.

    Segundo McGrew (2004), a Gf é pouco dependente de conhecimentos previamente

    adquiridos e de questões culturais e mais determinada por aspectos biológicos. Entretanto,

    isto não significa que a Gf não sofre influencia de aspectos ambientais. Um estudo

    realizado por Flores-Mendoza e Nascimento (2007) em 144 crianças de uma zona rural

    cuja situação socioeconômica se caracterizava bastante precária, mostrou que os déficits

    ambientais afetam com maior intensidade a inteligência fluida que a inteligência

    cristalizada. Desta forma, a estimulação ambiental não pode ser descartada e deve-se levar

    em consideração que intervenções podem ser eficazes para estimular o raciocínio fluido.

    Klauer e Phye (1995) em sua obra “Cognitive Training for Children” mostram que é

    possível estimular a inteligência fluida através de um programa de atividades de raciocínio

    indutivo e solução de problemas. De acordo com estes autores, habilidades como

    generalização, discriminação e o reconhecimento de semelhanças e diferenças entre

    estímulos influenciam no potencial para a aprendizagem e no desenvolvimento de

    habilidades para solução de problemas.

    A inteligência fluida passou a ter maior destaque a partir do último modelo

    psicométrico proposto por McGrew e Flanagan (1998). Trata-se da Teoria de Catell-Horn-

    Carrol (CHC) das habilidades cognitivas que atualmente fundamenta a construção de

    novos testes de inteligência. A priori esta teoria postulou dez fatores amplos de habilidades

    cognitivas: inteligência fluída, conhecimento quantitativo, inteligência cristalizada, leitura

    e escrita, memória de curto prazo, processamento visual, processamento auditivo,

    armazenamento e recuperação da memória de longo prazo, velocidade de processamento e

    rapidez de decisão. A estes dez fatores amplos estariam subjacentes pouco mais de sessenta

    fatores específicos. A Tabela 2 apresenta o modelo CHC de acordo com os dez fatores

    amplos a ele subjacentes.

  • 24

    Tabela 2. Definição dos dez fatores amplos da teoria CHC.

    Fator do Estrato II Descrição

    Inteligência Fluida (Gf)

    Capacidade ligada às operações mentais de raciocínio em

    situações novas, minimamente dependente de

    conhecimentos adquiridos. Capacidade de resolver

    problemas novos, relacionar idéias, induzir conceitos

    abstratos, compreender implicações, extrapolação e

    reorganização de informações (os testes psicométricos do

    fator g geralmente avaliam a inteligência fluida tais

    como Raven, a maioria dos testes da BPR-5, Colúmbia,

    R1, INV, etc...).

    Inteligência Cristalizada (Gc)

    Extensão e profundidade dos conhecimentos adquiridos

    de uma determinada cultura e a aplicação efetiva deste

    conhecimento. Capacidade de raciocínio adquirida pelo

    investimento da capacidade geral em experiências de

    aprendizagem. Primariamente baseada na linguagem.

    Está associado ao conhecimento declarativo

    (conhecimento de fatos, idéias, conceitos) e ao

    conhecimento de procedimentos (raciocinar com

    procedimentos aprendidos previamente para transformar

    o conhecimento).

    Conhecimento Quantitativo (Gq)

    Estoque de conhecimentos declarativos e de

    procedimentos quantitativos. Capacidade de usar

    informação quantitativa e manipular símbolos

    numéricos.

    Leitura e Escrita (Grw)

    Conhecimento adquirido em competências básicas da

    compreensão de textos e expressão escrita. Inclui desde

    habilidades elementares como decodificação em leitura e

    ortografia até habilidades mais complexas como a

    compreensão de textos e a composição de histórias.

    Memória de Curto Prazo (Gsm)

    Capacidade associada à manutenção de informações na

    consciência por um curto espaço de tempo para poder

    recuperá-las logo em seguida.

    Processamento Visual (Gv)

    Capacidade de gerar, perceber, armazenar, analisar, e

    transformar imagens visuais, isto é, os processos

    cognitivos específicos de processamento mental de

    imagens (geração, transformação, armazenamento e

    recuperação).

    Processamento Auditivo (Ga)

    Capacidade associada à percepção, análise e síntese de

    padrões sonoros. Capacidade discriminativa de padrões

    sonoros (incluindo a linguagem oral) particularmente

    quando apresentados em contextos mais complexos

    como, por exemplo, a percepção de nuances em

    estruturas musicais complexas.

    Capacidade, Armazenamento e

    Recuperação da Memória de Longo

    Prazo (Glr)

    Extensão e fluência que itens de informação ou conceitos

    são recuperados da memória de longo prazo por

    associação. Está ligada ao processo de armazenamento e

    recuperação posterior por associação. Capacidade de

    recuperar os itens de informação da base de

    conhecimentos por meio de associações. Este fator

    agrupa os testes psicométricos criados de avaliação da

    criatividade sendo muitas vezes chamado de domínio da

    produção de idéias.

    Velocidade de Processamento (Gs) Capacidade de manter a atenção e realizar rapidamente

  • 25

    tarefas simples automatizadas em situações que

    pressionam o foco da atenção. Está geralmente ligado a

    situações em que há um intervalo fixo definido para que

    a pessoa execute o maior número possível de tarefas

    simples e repetitivas (sustentabilidade).

    Rapidez de Decisão (Gt)

    Rapidez em reagir ou tomar decisões envolvendo

    processamentos mais complexos. Refere-se à reação

    rápida a um problema envolvendo processamento e

    decisão (imediaticidade).

    Fonte: Primi (2003, p.69).

    Devido a estudos recentes, alguns domínios foram acrescentados ao modelo CHC,

    incluindo 6 fatores amplos na camada II (McGrew, 2009) conforme apresentados na

    Tabela 3.

    Tabela 3. Descrição dos 6 domínios incluídos no Estrato II da CHC.

    Fator do Estrato II Descrição

    Conhecimento Geral (Gkn)

    Amplitude, profundidade e domínio adquiridos pela

    pessoa em áreas especializadas que não representam a

    experiência geral e universal adquirida culturalmente

    pelos indivíduos. Adquirido pela prática e formação

    intensas e sistemáticas. Especialização.

    Habilidades táteis (Gh) Habilidades envolvidas na percepção e julgamento das

    sensações que são recebidas através de receptores táteis.

    Habilidades Sinestésicas (Gk)

    Habilidades que dependem de receptores sensoriais que

    detectam posição corporal, peso, movimento dos

    músculos, tendões e articulações. Controle e

    coordenação dos movimentos do corpo, incluindo o

    andar, falar, expressões faciais, gestos e postura.

    Habilidades Olfatórias (Go) São habilidades que dependem de receptores sensoriais

    do sistema olfativo.

    Habilidades Psicomotoras (Gp)

    Capacidade de realizar movimento motores com o corpo

    (movimento de dedos, mãos, pernas, etc) com precisão

    coordenação ou força. Comportamentos motores são

    tipicamente resultados de atividades mentais.

    Velocidade Psicomotora (Gps)

    Capacidade de executar movimentos corporais de forma

    rápida e fluente. Em grande parte, independente do

    controle cognitivo.

    Fonte: McGrew (2009, p.6-7).

    O modelo CHC passou a identificar a inteligência fluida como sendo mais próxima

    ao fator g. Um dos fatores específicos relacionados à Gf, o raciocínio indutivo seria uma

    das formas de se compreender os processos cognitivos gerais presentes nas mais variadas

    habilidades. Este tipo de raciocínio está relacionado à capacidade de analisar um conjunto

    de estímulos observando as regularidades, as características comuns, para inferir relações

    entre eles (Primi, 2002; Almeida e cols., 2008b).

  • 26

    De acordo com Klauer e Phye (1995) o raciocínio indutivo se refere ao

    descobrimento de regularidades através de processos que comparam atributos e relações de

    objetos ou eventos. Para estes autores existem 6 processos de raciocínio indutivo:

    generalização – buscar similaridades entre atributos; discriminação – buscar diferenças

    entre atributos; classificação cruzada – semelhanças e diferenças nos atributos;

    reconhecimento de relações – de similaridades; diferenciação de relações –

    reconhecimento das diferenças; construção de sistemas – relações de similaridades e

    diferenças.

    Além da evolução ocorrida na definição e estrutura da inteligência, outras

    mudanças têm sido descritas na literatura como relevantes para entender este construto.

    Entre elas, podemos observar um fenômeno denominado Efeito Flynn (EF). O EF é em

    termos gerais, a tendência a ganhos no QI da população ao longo dos anos. Dados de

    diferentes países mostram ganhos significativos de QI a cada geração com o passar do

    tempo. Estudos como o que foi realizado na Holanda em 1982 onde foi observado que

    jovens de 18 anos apresentavam 20 pontos acima de pares da mesma idade em 1952. Trata-

    se de um desvio padrão de 1,33 que coloca a segunda geração no percentil 90 da primeira

    (Flynn, 2006).

    Um dos aspectos percebido é a correspondência entre aumento no QI e

    industrialização, disponibilidade de escolas e melhoria nos sistemas de saúde (Flynn,

    2006). Outra questão levantada é a mudança nas instruções dos testes (Sternberg, 2010).

    Khou, Zhu e Weiss (2010) mostram que o EF não é distribuído igualmente entre os

    diferentes níveis de habilidade, ou seja, o efeito pode variar ao longo da distribuição do QI

    na população. Por isso, Sternberg (2010) aponta que devido à complexidade do construto e

    das mudanças ocorridas no mundo ao longo dos anos, não é possível atribuir este aumento

    a um único aspecto.

    Os ganhos observados nos últimos 55 anos são maiores em testes de inteligência

    fluida, como nas Matrizes Progressivas de Raven, que avaliam a capacidade de resolver

    imediatamente problemas para os quais não há método aprendido de antemão. Estudos

    apontam cerca de 18 pontos a cada 30 anos (Flynn, 2006). Além disso, estudos têm

    mostrado que ao comparar a proporção de ganhos em testes não-verbais e verbais, os

    ganhos se apresentam numa proporção de até 4:1 respectivamente (Flynn e Weiss, 2007)

    Acompanhando a evolução das teorias sobre inteligência, diferentes instrumentos

    de avaliação têm sido desenvolvidos. Estas mudanças ocorrem desde a primeira escala

  • 27

    criada por Alfred Binet que foi uma operacionalização pioneira do construto inteligência

    (Miranda, 2002) permitindo sintetizar as habilidades cognitivas em uma medida única,

    aferida com base em itens padronizados e definida como o Quociente de Inteligência

    (Gauer, Gomes e Haase, 2010). Binet construiu seu instrumento pensando na relação

    existente entre a inteligência e a eficácia do desempenho acadêmico. O termo Quociente de

    Inteligência (QI) foi proposto em 1911 pelo psicólogo alemão, William Stern. Segundo ele,

    o nível obtido na escala Binet-Simon seria o escore de idade mental dividido pela idade

    cronológica do sujeito para se obter um quociente mental que representaria de forma mais

    precisa a capacidade em diferentes idades (Urbina, 2007).

    Outros instrumentos destinados a avaliação de inteligência também foram criados

    com pressupostos semelhantes ao teste de Binet, como as escalas de David Wechsler, cuja

    definição de inteligência subjacente se refere à capacidade conjunta ou global do indivíduo

    para agir com finalidade, pensar racionalmente e lidar efetivamente com seu meio

    ambiente (Figueiredo, 2002). Esta definição estaria relacionada à teoria da inteligência

    composta, ancorada em uma perspectiva integral do desenvolvimento e funcionamento

    cognitivo, justificando uma medida global de potencial cognitivo como o QI.

    A partir da escala original de Binet-Simon, diversos instrumentos vêm sendo

    desenvolvidos, desde as revisões e atualizações do teste de Binet (Roid, 2003). As mais

    conhecidas e utilizadas são as escalas Wechsler de inteligência para crianças e adultos

    (Wechsler, 1981; 2003), a Kaufman Brief Intelligence Test (1990) passando pelos testes

    não verbais como as Matrizes Progressivas de Raven (Raven, 1947) e Toni-3 (Brown,

    Sherbenou e Johnson, 1997) que avaliam o fator g. Posteriormente temos as escalas

    baseadas na teoria das habilidades cognitivas de Carroll, como a Leiter International

    Performance Scale Revised (Roid e Miller, 1997) até Woodcock-Johnson Psycho-

    Educational Battery (McGrew e Woodcock, 2001) baseada no modelo CHC.

    2.2. Instrumentos Psicológicos: tradução, adaptação e parâmetros psicométricos.

    A avaliação psicológica compreende um processo de busca de informações sobre o

    funcionamento psicológico das pessoas sobre determinadas situações para que o psicólogo

    possa tomar decisões, sendo uma atividade exclusiva do profissional de psicologia. De

    acordo com Primi (2003) a avaliação psicológica representa um conhecimento legítimo

    além de se constituir num critério de avanço embasado cientificamente.

  • 28

    Quando se trata de avaliação psicológica, o psicólogo precisa ser capacitado a

    avaliar a qualidade dos instrumentos e fazer um uso adequado dos mesmos em sua

    testagem psicológica, pois:

    “...os testes psicológicos são procedimentos sistemáticos

    de observação e registro de amostras de comportamentos e

    respostas de indivíduos com o objetivo de descrever e/ou

    mensurar características e processos psicológicos,

    compreendidos tradicionalmente nas áreas emoção/afeto,

    cognição/inteligência, motivação, personalidade,

    psicomotricidade, atenção, memória, percepção, dentre

    outras, nas suas mais diversas formas de expressão,

    segundo padrões definidos pela construção dos

    instrumentos” (CFP, 2003; p.2)

    Segundo Anastasi e Urbina (2000), o conceito de teste psicológico é: “Uma

    ferramenta e essencialmente uma medida objetiva e padronizada de uma amostra de

    comportamento”. Sendo assim, esta definição leva a duas inferências a respeito da

    testagem psicológica. A primeira seria que os comportamentos são amplos e variados,

    sendo tecnicamente inviável ou até mesmo impossível a avaliação de todas as suas

    possibilidades. E a segunda é a possibilidade de avaliar um comportamento a partir de sua

    amostra.

    Em 1996, Cronbach adota uma definição mais ampla a respeito de testagem

    psicológica, alegando se tratar de um procedimento sistematizado com o uso de escalas

    numéricas e categorias fixas para a observação e descrição do comportamento (Campos,

    2008). Ainda de acordo com Cronbach (1996 apud Campos 2008), existem três conceitos

    fundamentais que devem estar relacionados à testagem psicológica: a objetividade, a

    padronização e a estruturação. Estes estão relacionadas ao grau de interpretação de

    diferentes avaliadores a respeito do mesmo resultado obtido no teste, ao grau de

    similaridade entre as aplicações do teste e ao grau em que um item só pode ser respondido

    de uma forma, sem que haja diversas interpretações da pergunta ou vários caminhos para

    respondê-la.

    Um teste psicométrico tem como objetivo a medida do comportamento em

    determinada quantidade e tem como alvo comportamentos inerentes a todas as pessoas.

    Procura-se atingir a objetividade por meio da padronização da aplicação e da estruturação

    dos itens. O resultado deve ser expresso em forma de números e deve-se avaliar a margem

    de erro que a medida apresenta (Urbina, 2007).

  • 29

    Os instrumentos de medida são classificados de acordo com as diferentes técnicas

    de aferição dos seus parâmetros psicométricos e teorias que fundamentam sua construção

    (Pasquali, 2010). Segundo este autor, a taxonomia dos instrumentos psicológicos pode ser

    dividida em: testes referentes a critério, a construto, a conteúdo, testes comportamentais,

    levantamentos (survey) e novas tecnologias. Os testes de inteligência se encontram no tipo

    referente a construto. Sua característica é a construção a partir de uma referencia teórica e

    o objetivo é representar um traço latente através do comportamento (resposta ao item), ou

    seja, são construídos e validados para medir traços latentes.

    Para que um instrumento esteja devidamente qualificado para ser comercializado e

    conseqüentemente utilizado na avaliação psicológica, são necessários alguns requisitos

    básicos. O Conselho Federal de Psicologia (CFP) bem como outras entidades científicas

    internacionais como a American Educational Research Association, a American

    Psychological Association e a National Council on Measurement in Education (Aera; Apa;

    Ncme, 1999), estão empenhados em proporcionar condições efetivas e seguras para a

    utilização de instrumentos psicológicos e são destinadas a apreciar um conjunto de

    propriedades básicas que os instrumentos devem possuir de acordo com os parâmetros

    estabelecidos internacionalmente, reconhecidos pela comunidade científica.

    Na ausência de instrumentos, cria-se um novo que possa medir o construto desejado

    para determinada faixa etária ou grupo específico ou adapta-se um já existente em outra

    cultura. Para Hambleton e Patsula (1999), existem razões a favor da adaptação de

    instrumentos: Muitas vezes a adaptação de um teste é mais barata e rápida do que construir

    um novo teste; Quando o instrumento é transcultural, a adaptação é mais eficaz do que a

    produção de um instrumento equivalente em uma segunda língua; Pode haver falta de

    conhecimento para o desenvolvimento de um novo instrumento; Quando o teste original é

    conhecido, há uma segurança maior para utilizá-lo em uma segunda língua.

    Na tentativa de evitar instrumentos inadequados, modelos de tradução e adaptação

    cultural têm sido propostos pelas Diretrizes Internacionais de Testes. Dentre os vários

    modelos, destaca-se o Universal. No modelo universal, em geral, utiliza-se um instrumento

    com enfoque transcultural. Essa universalização permite equacionar as dificuldades

    referentes à padronização, equivalência e tradução, considerando as diferenças sociais,

    econômicas e religiosas dos diferentes países e minimizando a diferença entre as diversas

    versões adaptadas (Fleck, 2000).

  • 30

    Outras importantes contribuições para melhorar a prática do processo de adaptação

    de testes para outra cultura estão relacionadas ao desenvolvimento de instrumentos a partir

    de parâmetros como as diretrizes propostas pela International Test Commission (ITC).

    Foram elaboradas vinte e duas diretrizes divididas em quatro domínios: contexto, descrição

    dos princípios básicos de estudos em vários idiomas; desenvolvimento, recomendações da

    prática do desenvolvimento de instrumentos em várias línguas; aplicação, publicação dos

    procedimentos do instrumento; manual com a interpretação e normatização, relato da

    interpretação e comparação dos resultados em diversas culturas. Hambleton e Patsula

    (1999) descrevem etapas nas quais o processo de tradução e adaptação deve ser baseado:

    1) Equivalência do construto: é necessário assegurar a equivalência do constructo

    nas versões original e traduzida, verificando se o mesmo fenômeno pode ser medido nas

    duas culturas.

    2) Criar ou traduzir o instrumento: decidir se é melhor traduzir ou criar um novo

    instrumento devido a semelhanças ou diferenças nos idiomas em questão.

    3) Escolha do tradutor (individual ou comitê): o tradutor deve ter fluência nas duas

    línguas, familiaridade com as duas culturas envolvidas no estudo, ter conhecimento na

    construção de teste e saber como mensurá-lo adequadamente. Sendo que a formação de um

    comitê permite melhores resultados.

    4) Tradução e adaptação do teste: deve se utilizar como referência a versão original

    do teste e não a versão já adaptada para outra língua. Esta etapa envolve a tradução para

    outro idioma e retrotradução para versão original.

    5) Revisão da adaptação: revisão necessária para a equivalência do teste. É

    necessário verificar a clareza dos itens e também o nível de dificuldade das palavras

    utilizadas na tradução.

    As etapas descritas acima são relevantes, pois mesmo em se tratando de

    instrumentos ditos “transculturais”, como a Leiter-R (Anastasi e Urbina, 2000), é inviável

    pensar em provas totalmente livres de cultura, levando-se em consideração que o peso das

    variáveis culturais pode ser diminuído, mas não anulado (Almeida e cols, 2008a)

    6) Teste Piloto: realizado com uma amostra menor para verificar a consistência do

    instrumento.

  • 31

    7) Análise estatística: nesta etapa é feita análise dos resultados e dos itens do teste,

    em que podem ser verificadas possíveis falhas.

    8) Comparação com outros grupos: necessária quando o foco da pesquisa for a

    comparação transcultural ou a normatização na nova versão.

    9) Revisão das etapas 7 e 8: No caso do instrumento apresentar falhas, será

    necessário re-traduzir, re-analisar e re-escrever o teste.

    10 e 11) Padronização / normatização e manual: referente à aplicação do teste,

    validação, normatização, documentação descrevendo o processo de cada etapa e a

    preparação do manual para os usuários do teste.

    Além de uma tradução e adaptação consistente e adequada, os testes psicológicos

    devem ter seus aspectos psicométricos verificados para garantir sua qualidade. De acordo

    Urbina (2007), as principais características que definem a adequação de um instrumento

    psicométrico, são a fidedignidade e a validade.

    A fidedignidade ou precisão do instrumento indica a confiabilidade dos resultados

    do processo de mensuração, ou seja, é a qualidade dos escores de teste que sugere que eles

    são suficientemente consistentes e livres de erros de mensuração para serem úteis. Sendo

    assim, um instrumento pode ser considerado fidedigno à medida que ele mantém

    estabilidade e consistência da medida de um construto que em teoria deve ser estável e

    consistente, independente das condições externas. Portanto, vale ressaltar que a qualidade

    da fidedignidade não pertence aos testes em si, mas aos escores deles obtidos (Urbina,

    2007; Gauer, Gomes e Haase, 2010).

    Os métodos para investigar a fidedignidade dos escores oferecem um meio para

    estimar escores verdadeiros, ou pelo menos os limites dentro dos quais estes poderiam se

    localizar. O conceito de escore verdadeiro se refere às entidades hipotéticas que

    resultariam de mensurações completamente livres de erros (Gulliksen, 1950 apud Urbina,

    2007). Na prática é impossível obter tal escore e por isso obtém-se o escore observado, ou

    seja, escores que os indivíduos efetivamente obtêm.

    Ao analisar um conjunto de escores observados numa amostra, é possível verificar

    sua variância. A variância consiste em uma porção de variância verdadeira e uma porção

    de variância de erro. A primeira se refere as diferenças entre os escores dos indivíduos de

    um grupo que refletem sua posição na característica avaliada pelo teste. A segunda é

    composta pelas diferenças entre os escores que refletem fatores irrelevantes ao que o teste

  • 32

    avalia. Sendo assim, a fidedignidade dos escores aumenta à medida que o componente de

    erro diminui.

    A informação sobre o erro de medida é indispensável para a própria avaliação e

    para o uso do instrumento (Noronha, Freitas e Ottati, 2002) e por isso a avaliação da

    fidedignidade de um escore envolve determinar quais as possíveis fontes de erro que

    podem interferir no escore e estimar a magnitude destes erros. De acordo com Urbina

    (2007) existem diversas e variadas fontes de erros que cada tipo de teste está propenso. As

    principais são: diferenças entre avaliadores, erros de amostragem de tempo, erro de

    amostragem de conteúdo, inconsistência entre itens, inconsistência entre itens e

    heterogeneidade de conteúdo combinados e por fim, erros de amostragem de tempo e

    conteúdo combinados. Sendo que para cada tipo de erro, existem medidas apropriadas para

    estimá-los.

    Alguns autores descrevem formas de se obter o coeficiente de fidedignidade, tais

    como: fidedignidade do avaliador, de teste-reteste, de forma alternativa, método das

    metades, medidas de consistência interna, entre outras. A fidedignidade do avaliador, ou

    fidedignidade interjuízes, consiste em fazer com que pelo menos dois indivíduos diferentes

    avaliem o mesmo conjunto de testes, em que o desempenho de cada testando gere dois ou

    mais escores independentes, sendo um método básico para estimar erros devido a

    diferenças entre avaliadores. As correlações entre os conjuntos de escores gerados devem

    ser altas e positivas, ou seja, maior ou igual a 0,90 sugerindo que a proporção do erro deve

    ser menor ou igual a 0,10. Este tipo de análise se aplica a testes abertos, que envolvem

    algum grau de subjetividade, em que as respostas não são classificadas com certas ou

    erradas (Urbina, 2007; Gauer, Gomes e Haase, 2010).

    A fidedignidade teste-reteste é utilizada em testes de traços ou comportamento

    relativamente estáveis, cuja fonte de erro está relacionada à amostragem de tempo. Trata-se

    de uma medida de estabilidade em que o mesmo instrumento é aplicado na mesma amostra

    de sujeitos em duas ou mais ocasiões, separadas por um certo intervalo de tempo. A

    correlação entre os escores reflete o quanto o instrumento mantém a consistência de sua

    medida ao longo do tempo e o quanto os itens são representativos independentemente de

    fatores externos. No entanto vale ressaltar que o intervalo de tempo entre as duas

    administrações pode afetar a estabilidade dos escores, pois se for muito curto, os testandos

    podem lembrar-se das respostas que deram anteriormente e haverá o componente de

    memória interferindo nos escores. Se for um intervalo demasiadamente extenso, existe a

  • 33

    possibilidade de que experiências intervenientes venham afetar os segundos escores, bem

    como a própria maturação cerebral em caso de crianças em idade escolar.

    Já a fidedignidade de forma alternativa ou paralela se faz pertinente quando a fonte

    de erro está relacionada à amostragem de conteúdo em testes que requerem estabilidade e

    consistência dos resultados como um todo. Para isso, desenvolvem-se duas ou mais formas

    diferentes de um teste, de itens equivalentes em conteúdo e dificuldade e posteriormente

    avalia-se a correlação entre os escores obtidos nas duas versões pela mesma amostra.

    Trata-se de uma forma mais sensível de obter o coeficiente de estabilidade em relação ao

    teste-reteste porque defende o procedimento contra possíveis efeitos de aprendizagem

    advindos da aplicação dos mesmos itens.

    O desenvolvimento de formas paralelas de um instrumento ou seu reteste podem

    envolver problemas teóricos e práticos. Desta forma, uma solução é administrar um teste

    em uma amostra e criar dois escores para cada indivíduo. Esta seria a fidedignidade pelo

    método das metades ou split-half. O método das metades consiste em dividir um teste em

    duas partes e correlacionar os resultados obtidos nas duas metades. Trata-se de uma forma

    simples e rápida de verificar a homogeneidade dos itens que compõe um instrumento. Vale

    ressaltar que este método fornece um índice de heterogeneidade, mas não permite

    descobrir quais itens são responsáveis por ela. Para que isto ocorra, é necessária uma

    análise do conteúdo do instrumento para localizar tais itens (Urbina, 2007). Quando se

    trata de instrumentos que avaliam diversas características para inferir uma terceira, este

    procedimento deve ser realizado com cada uma das características separadamente

    (Campos, 2008).

    No entanto, os escores dos testes podem ser fidedignos e ainda assim não terem

    utilidade para se fazer inferências. Por isso, além dos escores serem precisos (consistentes

    e confiáveis), é necessário que sejam válidos. (Pasquali, 1998, Colzby, 2003; Urbina, 2007;

    Gauer, Gomes e Haase, 2010).

    O segundo conceito relevante ao falarmos de parâmetros psicométricos é a

    validade. De acordo com a definição clássica, a validade se refere àquilo que o teste mede

    e quão bem ele o faz (Anastasi e Urbina, 2000). Entretanto, a definição dada pelos

    Standards for Educational and Psychological Testing mostra-se mais adequada e por isso

    mais utilizada atualmente. De acordo com a definição apresentada pelos Standards, a

    validade se refere ao grau no qual as evidências e teoria apóiam as interpretações dos

  • 34

    escores implicadas no uso de testes (Aera; Apa; Ncme, 1999). O conceito atual de validade

    foi fortemente influenciado por Samuel Messick. Segundo este autor:

    “A validade é um julgamento avaliativo integrado do grau

    em que as evidências empíricas e a fundamentação teórica

    corroboram a adequação e a propriedade de inferências e

    ações baseadas em escores de teste ou outros modos de

    avaliação (Messick, 1989, p.13)”

    A essência do julgamento a respeito da validade dos escores de teste está centrada

    no relacionamento entre aquilo que os escores representam e as perguntas que os usuários

    de testes querem responder com o seu uso. Portanto, a validade se estabelece pela

    adequação do conteúdo semântico dos itens ao construto teórico que o teste quer medir

    (Urbina, 2007; Gauer, Gomes e Haase, 2010). Sendo assim, Anastasi e Urbina (2000)

    ressaltam que não se pode afirmar que um teste possui alta ou baixa validade, pois esta

    precisa ser estabelecida com referência ao uso específico para o qual o teste está sendo

    considerado.

    O processo de validação é semelhante à testagem de hipóteses, incluindo noções

    como a de fidedignidade dos escores e os modos como as aplicações dos dados de teste na

    pesquisa e na prática psicológica podem ser justificados (Urbina, 2007). E todos os

    procedimentos para determinar a validade de um teste preocupam-se com as relações entre

    o desempenho no teste e outros fatos que podem ser independentemente observados que

    estão relacionados ao comportamento em consideração.

    De acordo com Urbina (2007), existem fontes de evidências de validade que estão

    relacionadas a três aspectos: ao conteúdo, a padrões de convergência e divergência e ao

    critério. Segundo Campos (2008), os tipos de validade não são mutuamente excludentes e

    podem estar presentes em um mesmo instrumento.

    Na validade relacionada ao conteúdo, estão incluídas a relevância e

    representatividade do conteúdo do teste e dos processos de resposta às tarefas e a validade

    de face (Urbina, 2007). Os procedimentos de validação do conteúdo envolvem o exame

    sistemático do conteúdo do teste para determinar se ele abrange uma amostra

    representativa do domínio de comportamento a ser medido. E o domínio do

    comportamento a ser testado deve ser analisado para assegurar que todos os aspectos mais

    importantes estão incluídos nos itens do teste e nas proporções corretas (Anastasi e Urbina,

    2000).

  • 35

    A segunda fonte está relacionada a padrões de convergência e divergência. Estes

    compreendem a consistência interna de resultados de teste e outras medidas de

    fidedignidade, correlação entre testes e subtestes, matriz multitraço-multimétodo,

    diferenciação de escores de acordo com diferenças esperadas com base na idade e outras

    variáveis de status, resultados experimentais (correspondência entre escores de teste e os

    efeitos preditos de intervenções experimentais ou hipóteses baseadas em teorias), análise

    fatorial exploratória e técnicas de modelagem de equação estrutural (Urbina, 2007).

    Por fim, evidências de validade relacionadas ao critério se referem à precisão das

    decisões baseadas na validação concorrente (correlação entre escores de teste e critérios

    existentes) e precisão de decisões ou predições baseadas na validação preditiva (correlação

    entre escores de teste e critérios preditivos). Desta forma, a validade é a consideração mais

    fundamental relacionada à construção e análise dos testes, pois revela o quanto a evidência

    e o suporte teórico do teste estão absorvidos na proposta apresentada que podem

    corroborar qualquer inferência feita a partir dos resultados do teste (Noronha, Freitas e

    Ottati, 2002; Urbina 2007).

    Visto a relevância de estudos que contemplem a tradução, adaptação, fidedignidade

    e evidências de validade, pesquisas têm sido desenvolvidas no sentido de adaptação de

    testes para avaliação de diversas habilidades cognitivas. Podemos citar os estudos

    realizados e orientados por Macedo e outros pesquisadores, que têm por objetivo a a

    adaptação de testes para avaliação de funções cognitivas, tais como: linguagem (Capovilla,

    Thiers, Macedo, Duduchi, 1998; Macedo, Charin, Capovilla, 2002; Capovilla, Capovilla,

    Macedo, Charin, 2004a; Macedo, Capovilla, Duduchi, D'antino, Firmo, 2006; Macedo,

    Firmo, Duduchi, Capovilla, 2007), leitura e escrita (Capovilla, Macedo, Penna, Capovilla,

    2006) atenção (Capovilla, Capovilla, Macedo, Charin, 2004b) entre outros. Além disso,

    outros estudos tiveram como objetivo realizar adaptações culturais de testes desenvolvidos

    no Brasil para outros idiomas, como a Bateria de Avaliação de Leitura e Escrita em

    japonês (Kuryiama, 2007) e hebraico (Dichi, 2008).

    Com relação aos testes de inteligência, o tema tem sido amplamente estudado a

    nível nacional, abarcando desde questões teóricas referentes aos modelos existentes,

    desenvolvimento de instrumentos e aplicações destes em populações específicas. Isto

    reflete uma preocupação de pesquisadores na busca pela qualidade dos testes

    disponibilizados no mercado e na criação de novos instrumentos. Nesta linha, podemos

  • 36

    citar alguns dos estudos realizados na última década referentes à criação, adaptação e

    evidências de validade e fidedignidade de instrumentos:

    Estudo de validação da Bateria de Provas de Raciocínio – BPR-5 (Primi e

    Almeida, 2000);

    Matrizes progressivas do Raven Infantil: um estudo de validação para o

    Brasil (Pasquali, Wechsler e Bensusan, 2002);

    Uma alternativa na avaliação da inteligência infantil: o Teste R-2 (Rinaldi,

    2003);

    Critério de Integração do Teste de Bender: Explorando Evid�