departamento: deio licenciatura: estatística aplicada ... · * manual recomendadoparaconsultadas...

47
Métodos Não-Paramétricos Departamento: DEIO Licenciatura: Estatística Aplicada 1ºAno / 2º Semestre / 6 ECTS Docente: Isabel Fraga Alves ([email protected] )

Upload: vuquynh

Post on 09-Nov-2018

221 views

Category:

Documents


0 download

TRANSCRIPT

Métodos Não-Paramétricos

Departamento: DEIOLicenciatura: Estatística Aplicada1ºAno / 2º Semestre / 6 ECTSDocente: Isabel Fraga Alves ([email protected] )

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 2

Programa�� IntroduIntroduççãoão�� AnAnáálise de Dados Categorizadoslise de Dados Categorizados

•• Teste do Teste do QuiQui--QuadradoQuadrado•• Teste de AjustamentoTeste de Ajustamento•• Tabelas de ContingênciaTabelas de Contingência

•• Teste de IndependênciaTeste de Independência•• Teste de HomogeneidadeTeste de Homogeneidade

�� EstatEstatíística stica NãoNão--ParamParaméétricatrica•• IntroduIntroduçção: O problema geral da localizaão: O problema geral da localizaçção relativo a 2 amostrasão relativo a 2 amostras•• Amostras emparelhadasAmostras emparelhadas

•• Teste dos Sinais Teste dos Sinais (pequenas e grandes amostras)(pequenas e grandes amostras)

•• Teste de Teste de WilcoxonWilcoxon (pequenas e grandes amostras)(pequenas e grandes amostras)

•• Uso das Uso das ““OrdensOrdens”” para Comparar Populapara Comparar Populaçções: Amostras Independentesões: Amostras Independentes•• 2 Popula2 Populaçções: O Teste de ões: O Teste de MannMann--WhitneyWhitney (pequenas e grandes amostras)(pequenas e grandes amostras)•• Mais de 2 PopulaMais de 2 Populaçções: ões:

•• O Teste de O Teste de KruskalKruskal--WallisWallis ((pequenas e grandespequenas e grandes amostrasamostras))•• Teste de Teste de FriedmanFriedman (pequenas e grandes amostras)(pequenas e grandes amostras)

•• Uso das Uso das ““OrdensOrdens”” para Testar Independência e Aleatoriedadepara Testar Independência e Aleatoriedade•• Teste de Teste de SpearmanSpearman (pequenas e grandes amostras)(pequenas e grandes amostras)•• Teste dos Teste dos ““RunsRuns”” para Aleatoriedade (pequenas e grandes amostras)para Aleatoriedade (pequenas e grandes amostras)

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 3

Bibliografia� CONOVER, W. J. (1999) - Practical Nonparametric Statistics, 3rd ed. Wiley.

� DANIEL, W. W. (1990) - Applied Nonparametric Statistics, 2nd ed. PWS-Kent.

� Graça Martins, M. E. (2005) – Introdução à Probabilidade e à Estatística – Com complementos de Excel, SPE.

� DeGroot, Morris H. - Probability and statistics (1986 ) - 2nd ed Massachusetts Addison-Wesley.

� Pestana e Velosa (2006) - Introdução à Probabilidade e à Estatística, I, FundaçãoGulbenkian. 2ª ed.

� SIEGEL, S. and Castellan, N. Y. (1988) - Nonparametric Statistics for the BehavioralSciences. McGraw-Hill.

�� ** WackerlyWackerly, D., Mendenhall, W. and , D., Mendenhall, W. and ScheafferScheaffer, L. (1995) , L. (1995) ––Mathematical Statistics with Applications. Duxbury Press; 5th edMathematical Statistics with Applications. Duxbury Press; 5th ed..

* Manual Recomendado para consulta das Tabelas ao longo dos slides.

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 4

Introdução

� O que é a Estatística ?

� Estudo da Incerteza

� Como a quantificar? Que podemos fazer com ela?

� As experiências repetidas

sob o que pensamos serem as condições

não resultam sempre da mesma forma…!

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 5

Tipos de Experiências

� Causais ou Determinísticas

� Ex: Deixar cair uma pedra no rio

� Aleatória ou Estocástica

� Ex: O Tempo que vou Esperar pelo Autocarro

� Como posso “prever” o resultado?

Com Estatística quantificamos e medimos o “imprevisível”!

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 6

Estatística: produz afirmações numéricas relativamente a situações sujeitas a INCERTEZA.

� Exemplos: • Quem irá ganhar as próximas eleições?

• Estarão os clientes da PT satisfeitos com o serviçoprestado?

• Qual das duas pastas dentífricas é mais eficiente que a outra para prevenir as cáries?

• Qual a previsão da quantidade de precipitação para o próximo inverno?

• Após a monitorização de pacientes com doençascardíacas, como decidir acerca dos factores queafectam a sua saúde ?

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 7

Como e Que Respostas ?� Para responder a estas perguntas frequentemente usamos modelos

probabilísticos, que são modelos matemáticos para lidar com incerteza.

� São recolhidos Dados para explorar uma População, o objectivo de nosso estudo.

� Quando é recolhida uma amostra grande é necessário produzir resumos das informações nela contidas. Existem ferramentas gráficas e numéricas que são normalmente utilizadas pelos estatísticos

•AMOSTRA

•Estatística Descritiva� Inferência Estatística - faz generalizações, válidas para a População,

a partir de Amostras.(enquanto na Previsão - é apresentada uma afirmação sobre o Futuro.)

� Dados - observações de determinadas quantidades de interesse.� Variáveis - incerteza acerca dos seus verdadeiros valores.

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 8

Tipos de Variáveis

VARIÁVEL

QUALITATIVAQUANTITATIVA

DISCRETANOMINALORDINAL

CONTÍNUA

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 9

Tipos de Variáveis (cont.)

� QUANTITATIVA vs. QUALITATIVA : variáveis com / sem representação numérica e ordenação natural única (por exemplo, a pressão arterial versus religião).

� DISCRETA vs. CONTÍNUA: variáveis quantitativascom / sem lacunas conceptuais entre os seus valores(por exemplo, número de crianças numa família versus pressão arterial).

� ORDINAL vs. NOMINAL: variáveis qualitativas com / sem ordenação (eventualmente não única) dos seusvalores (a satisfação do cliente versus religião).

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 10

De modo geral,

� as variáveis qualitativas estão mais ligadas aos modelos não-paramétricos

enquanto que

� as variáveis quantitativas aos modelos paramétricos.

Tipos de Variáveis (cont.)

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 11

� As variáveis qualitativas podem ainda ser classificadas de acordo com:� VARIÁVEL CATEGORIZADA – (Categórica, Nominal ou de Classe)

• nomes das pessoas ou coisas; as letras do alfabeto; o sexo, masculino ou feminino, macho ou fêmea; o estado civil, solteiro, casado, divorciado, viúvo; o curso, primário, secundário, colegial, universitário, pós-graduação, etc.

Representa o nível mais simples e mais elementar de medição. Os indivíduos de uma população ou amostra são medidos mediante uma certa característica que pode ser categoria, nome ou classe.

� Características binárias ou dicotomizadas: • presente ou ausente, 1 ou 0, positivo ou negativo, vivo ou morto, sim ou não, benigno

ou maligno, etc.Essas características são mutuamente exclusivas, isto é, cada indivíduo só pode se enquadrar

em um único nome, categoria ou classe, e também são exaustivas, pois devem atingir todos os indivíduos da população ou amostra em estudo, sem excepção.

� A variável categórica é qualitativa e não se presta aos cálculos aritméticos comuns: soma, subtracção, multiplicação e divisão. Apresenta as seguintes propriedades de equivalência (=): reflexiva (x=x); simétrica

(x=y então y=x); transitiva (x=y e y=z então x=z).

Tipos de Variáveis (cont.)

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 12

� VARIÁVEL ORDINAL –• no alfabeto, A,B,C,D ou D,C,B,A; em números de ordem, 1,2,3 ou 3,2,1; no sexo, F,M ou M,F; no curso, primário- secundário-superior ou superior-secundário-primário; em uma quantificação, leve-moderado-intenso ou intenso-moderado-leve; em cruzes, +,++,+++,++++ ou ++++,+++,++,+; na ordenação de dados numéricos, 11,18,23,29,35 ou 35,29,23,18,11; etc.

Os indivíduos de uma população ou amostra são classificados de acordo com as diversas categorias de uma determinada característica e em seguida são ordenados. Esta ordenação pode ser crescente oudecrescente, ou igualmente, ascendente ou descendente.

� A variável ordinal também é qualitativa. • Sabe-se que um indivíduo ou coisa é maior ou menor do que outro, porém não se

sabe o quanto é maior nem o quanto é menor. São comuns as expressões comparativas: maior, menor; superior, inferior; primeiro, último; mais intenso, menos intenso; mais alto, mais baixo; preferível; etc.

Na escala ordinal utilizam-se as comparações maior do que (>) e menor do que (<). As operações aritméticas comuns (adição, subtracção, multiplicação e divisão) não são aplicáveis.

Na ordenação, a relação maior do que (>) apresenta a propriedade transitiva (se x>y e y>z então x>z).

Tipos de Variáveis (cont.)

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 13

� VARIÁVEL INTERVALAR –• os valores de idade, altura, peso, pressão arterial, frequência cardíaca, exames

laboratoriais, medidas diversas, etc.

� A escala intervalar é verdadeiramente quantitativa. A medição é feita directamente em números reais, obtidos mediante a comparação com um determinado valor fixo, denominado unidade. O nome intervalar estáligado aos intervalos entre as categorias da variável e aqui se sabe exactamente o quanto uma categoria é menor ou maior que outra, ou ainda se há igualdade entre elas.

� As operações aritméticas comuns (soma, subtracção, multiplicação e divisão) são aplicáveis.

� A variável intervalar reúne todas as propriedades dos dois tipos anteriores de mensuração: as de equivalência (=), reflexiva (x=x), simétrica (x=y então y=x) e transitiva (x=y e y=z então x=z) e a de ordenação (>), transitiva (x>y e y>z então x>z).

Tipos de Variáveis (cont.)

ESTATÍSTICA NÃO PARAMÉTRICA

Extremamente interessante para análises de dados qualitativos.

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 15

MEDIDAS DE TENDÊNCIA CENTRAL - Localização

� Média� Mediana� Moda

� Média Amostral - é a soma de todos os valores de uma amostradividida pelo nº de elementos daamostra (dimensão).

� É aplicada em variáveis quantitativas.

� A média amostral é a contrapartida empírica do Valor Médio da População ou daVariável, µµµµ.

1

1 n

i

i

X Xn =

= ∑

1 2 ( . .) - , , , namostra aleatoria a a X X Xɺ ⋯

1 2 - , , , namostra observada x x x⋯

1

1 n

i

i

x xn =

= ∑

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 16

� Mediana Amostral - É o valor daamostra que ocupa a posição central, quando todos os valores estãoordenados em ordem crescente oudecrescente.

� Se n for ímpar, a mediana ( Med ) será o valor que ocupa a posiçãocentral na amostra ordenada. Estaposição pode ser calculada por(n+1)/2.

� Se n for par, a Med será calculadapela média aritmética dos dois valorescentrais na amostra ordenada daamostra. A posição de cada um dessesdois valores centrais pode ser calculada por n/2 e n/2+1.

� A Mediana é muito utilizada noscálculos não-paramétricos.

MEDIDAS DE TENDÊNCIA CENTRAL - Localização

1:

2

: 1:2 2

1

2

nn

n nn n

x n impar

Med

x x n par

+

+

= +

1: 2: :

ordenada -

n n n n

amostra observada

x x x≤ ≤ ≤⋯

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 17

MEDIDAS DE TENDÊNCIA CENTRAL - Localização

� Moda - É o valor da variável que corresponde àfrequência máxima.

� A moda pode ter um ou mais valores, unimodal, bimodal,...,multimodal, conforme existam uma, duas, ou mais frequências iguais, dos valores da variável.

� Dados:

� 25, 22, 28, 32, 35, 55, 83, 83, 98, 99, 43, 46, 51 (n=13)

� média

� mediana

� moda

53.9x =

1 2

-

( , , , )

(25, 22, 28, 32, 35, 55, 83, 83, 98, 99, 43, 46, 51 )

n

amostra observada

x x x =⋯

1: 2: :

ordenada -

(22, 25, 28, 32, 35, 43, 46, 51, 55, 83, 83, 98, 99)

n n n n

amostra observada

x x x≤ ≤ ≤ =⋯

46Med =

83Mo =

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 18

Localização: Mediana vs. Média

� Razões para usar a mediana:• – É menos influenciada por valores extremos

• – Se as distribuições são simétricas, a média e a mediana populacional coincidem

� Média vs. Mediana• 5 6 6 7 7 8 10

• Média = 7 Med = 7

• 5 6 6 7 7 8 50• Média = 8.43 Med = 7

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 19

� Distinguir• Metodologias Paramétricas

&

• Metodologias Não-Paramétricas

� Explicar uma• Variedade de Testes Não-Paramétricos

� Resolver • Problemas de Testes de Hipóteses

usando

• Testes Não-Paramétricos

Objectivos do Curso

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 20

Quadro Geral

� Até este ponto, todos os testes que têm utilizado estão sujeitos a suposições sobre a distribuição subjacente aos dados. Especificamente, é assumido que os dados são normaispara usar o teste-t, por exemplo.

� Poder-se-ia usar a teoria de grandes amostras e o Teorema do Limite Central, mas isso ainda apenas se verifica Assintoticamente

�� O que O que éé que acontece se que acontece se nãonão estamos dispostos ou não estamos dispostos ou não éé sensato sensato

fazer as suposifazer as suposiçções de ões de normalidadenormalidade sobre a distribuisobre a distribuiçção subjacente ão subjacente

e temos uma e temos uma amostra de dimensão pequenaamostra de dimensão pequena ??

n → ∞

TESTE DE HIPÓTESES

Trata-se de uma técnica para se fazer a inferência estatística sobre uma população a partir de uma

amostra

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 22

E E muitosmuitos maismais……! !

Teses de Hipóteses - Metodologias

Teste de Hipóteses -

metodologias

Não-ParamétricasParamétricas

Teste - z

TesteKruskal-Wallis

Teste Wilcoxon

Teste - t ANOVA

etc

etc

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 23

Amostra emparelhada

Teste-temparelhado

Teses de Hipóteses - Metodologias

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 24

Estatística Não-Paramétrica

�� Muitos dos testes estatMuitos dos testes estatíísticos sticos nãonão--paramparaméétricostricosrespondem respondem àà mesma smesma séérie de questões tal como os rie de questões tal como os testes testes paramparaméétricostricos..

•• Com Com testes testes nãonão--paramparaméétricostricos as as hiphipóótesesteses podem ser podem ser flexibilizadasflexibilizadas consideravelmente.consideravelmente.

•• Por conseguinte, são utilizados mPor conseguinte, são utilizados méétodos todos nãonão--paramparaméétricostricospara para situasituaçções que violem os pressupostos de procedimentos ões que violem os pressupostos de procedimentos paramparaméétricos.tricos.

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 25

Testes Paramétricos

� Testes Paramétricos• Incidem explicitamente sobre um ou mais parâmetrosde uma ou mais populações;• A distribuição de probabilidades da estatística de testepressupõe uma forma particular das distribuiçõespopulacionais;• As variâncias são homogéneas;

• Os erros ou resíduos são aleatórios e independentese têm distribuição normal com variância finita e constante.

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 26

Testes Não-Paramétricos

� Testes Não Paramétricos• Requerem menos pressupostos em relação àpopulação;•Não exigem normalidade;

• Não se baseiam em parâmetros da distribuição (logo, nãonecessitam variâncias homogéneas);

• Ligeiramente menos eficientes que os testes paramétricos;

• Baseiam-se nas estatísticas ordinais (e não nosvalores das observações);

• Mais fáceis de aplicar.

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 27

Testes Não-Paramétricos

� Poucos Pressupostos Relativos à População

� Facilidade de implementação

� Maior Perceptibilidade

� Aplicável em Situações Não Abrangidas Pela Normal

� Mais Eficientes quando as Populações não têm Distribuição Normal

� Os resultados podem ser tão exactos como nos procedimentos paramétricos

Vantagens

As hipóteses testadas por testes não-paramétricos tendem a ser menos específicas;Não têm Parâmetros, Dificultando Comparações Quantitativas

entre PopulaçõesEscasso Aproveitamento de Informação da AmostraPode ser de Difícil Cálculo à mão para Grandes AmostrasTabelas não amplamente disponíveis

Desvantagens

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 28

• Não incorpora as suposições restritivas, características dos testes paramétricos.

• Os dados não precisam estar normalmente distribuídos (Distribution-Free). É necessário, apenas, que eles sejam ordenáveis.

• Muitas vezes, são baseados nas ordens das observações e nãonos seus valores, como no caso paramétrico.

• Podem ser aplicados para variáveis quantitativas e qualitativas.

• Menos sensíveis aos erros de medida e rápidos para pequenas amostras.

Estatística Não-Paramétrica - Distribuição Livre

TESTE DE HIPÓTESES

Trata-se de uma técnica para se fazer a inferência estatística sobre uma população a partir de uma

amostra

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 30

PRINCIPAIS CONCEITOS

�HIPÓTESE ESTATÍSTICA• Trata-se de uma suposição quanto ao valor de um parâmetro

populacional, ou quanto à natureza da distribuição de probabilidade de uma variável populacional.

�TESTE DE HIPÓTESES• É uma regra de decisão para “aceitar” ou rejeitar uma hipótese

estatística com base nos elementos amostrais

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 31

TEORIA POPPERIANA - Falseabilidade (ou refutabilidade)

� “Science can't prove anything. It can only disprove things.”

A ciência não pode provar nada. Só pode refutar coisas.

• Considere o exemplo do famoso Cisne Negro (black swan):• Um cientista gasta sua vida observando cisnes. Observa que todos

os cisnes que jamais viu são brancos. Com base nesta evidência empírica, ele postula uma teoria de que “todos os cisnes são brancos”.

• Um dia viaja para a Austrália e vê - UPS! - um Cisne Negro.

• A sua teoria é refutada. Mas isso não significa que não era ciência quando a estabeleceu. Agora, pode estabelecer uma teorianova: “Os cisnes podem ser brancos ou pretos”.

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 32

Karl Popper(1902- 1994) - UM FILUM FILUM FILUM FILUM FILUM FILUM FILUM FILÓÓÓÓÓÓÓÓSOFO INOVADORSOFO INOVADORSOFO INOVADORSOFO INOVADORSOFO INOVADORSOFO INOVADORSOFO INOVADORSOFO INOVADOR

� Sir Karl Raimund Popper foi filósofo da ciência austríaco naturalizado britânico e um professor da London School of Economics.

� Formou-se em matemática, física e filosofia da ciência britânica.� Uma das pessoas mais influentes da filosofia da Ciência durante o século

XX.

� POPPER E A REFUTAÇÃO• Uma hipótese só é científica se puder ser colocada em questão

(“refutada”).• Isto significa que deve ser sempre possível realizar uma observação

que prove que a hipótese é falsa• Uma teoria científica não poderá em nenhuma circunstância ser

declarada “verdadeira”� A teoria científica mais não é do que uma hipótese; uma conjectura, que um dia será

refutada e substituída por uma outra.

“ What really makes science grow is new ideas, including false ideas.” –Karl Popper

� SÓ APRENDEMOS QUANDO ERRAMOS.

� OS ESTATÍSTICOS NÃO PERGUNTAM QUAL É A PROBABILIDADE DE ESTAREM CERTOS, MAS A PROBABILIDADE DE ESTAREM ERRADOS.

• Para fazerem isso estabelecem uma hipótese nula.

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 33

Data Analysis and Research for Sport and Exercise Science: A Student GuideBy Craig Williams, Chris Wragg, Routledge ed., 2003. pag 6

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 34

PRINCIPAIS CONCEITOS

� TIPOS DE HIPÓTESES• H0, hipótese nula, a hipótese estatística a ser testada

• H1, hipótese alternativa

A HIPÓTESE NULA É UMA AFIRMAÇÃO DE COMO O MUNDO DEVERIA SER, SE NOSSA SUPOSIÇÃO ESTIVESSE ERRADA.

• Ex: A hipótese nula expressa uma igualdade, enquanto a hipótese alternativa é dada por uma desigualdade.

0 1: 1.5 . : 1.5H m vs H mµ µ= ≠

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 35

Testes de Hipóteses – Erros � EXISTEM DOIS TIPOS DE ERRO:

• Erro tipo 1 - rejeição de uma hipótese nula verdadeira

• Erro tipo II – “aceitação” de uma hipótese nula falsa

• “aceitação” “não rejeição”

• A probabilidade αααα do erro tipo I é denominada

“nível de significância” do teste.

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 36

Decisão

correctaErro tipo IRejeitar

H0

Erro tipo IIDecisão

correcta

Não rejeitar

H0

H0 falsaH0 verdadeiraRealidade

Decisão

αααα = P( erro tipo I ) = P(rejeitar H0| H0 verdadeira) = P(ET ∈ RR | H0 verd.)

nível de significância ou tamanho do teste

ββββ = P(erro tipo II)= P(não rejeitar H0| H0 falsa) = P(ET ∈ RA | H0 falsa)

1-ββββ = potência do teste → Probabilidade de não cometermos um erro do tipo II

Testes de Hipóteses – Erros ET:= Estatística de Teste RR:= Região de RejeiçãoRA:= Região de Aceitação

REGRA de TESTE: ET∈ RR então Rejeitar H0

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 37

p -Value

� O resultado foi significativo?

� Quão pequeno tem de ser o p-value, para se rejeitar a hipótese nula?• Se p-value < 5 % estatisticamente significativo.

• Se p-value < 1 % altamente significativo.

� Os investigadores devem • resumir os dados,

• dizer qual o teste usado e• reportar o p-value

(em vez de apenas o comparar com os valores de 1 % ou 5 % )

� No caso de se estabelecer à partida o nível de significância α e se o TESTE indicar a aceitação de H0, diz-se que

Ao nível de significância αααα não se pode rejeitar H0 .

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 38

TIPOS DE TESTE

�� QuiQui--QuadradoQuadrado

�� Teste dos SinaisTeste dos Sinais

�� Teste de Teste de WilcoxonWilcoxon

�� Teste de Teste de MannMann--WhitneyWhitney

�� Teste de Teste de KruskalKruskal--WallisWallis

�� Teste de Teste de FriedmanFriedman

�� Teste de Teste de SpearmanSpearman

�� Teste dos Teste dos RunsRuns

QUI-QUADRADO (χχχχ2)

Testes de Ajustamento, Independência e Homogeneidade

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 40

QUI-QUADRADO

� Testes:1. Ajustamento (em inglês

“Goodness-of-fit”):

frequência observada ajustada a uma frequência esperada );

2. Independência entre duas variáveis:

Comportamento de uma variável dependente ou não de outra

(Tabelas de Contingência).

3. Homogeneidade de Populações independentes:

(Tabelas de Contingência - margem fixa)

2

2 ( )i i

i i

Observadas esperadas

esperadaX

s

−=∑

ET:ET:

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 41

Ajustamento (“Goodness-of-fit” - testes para o ajuste)

� Tradicionalmente são utilizados para verificar a qualidade da adequação (“fit”) de uma distribuição teórica em relação a um conjunto de observações (amostra) - e.g. testar a Normalidade de uma amostra.

� Testes não paramétricos:• amostras de valores contínuos (acesso aos dados originais)•Kolgomorov-Smirnov (e outros que não iremos dar neste curso…)

•• amostras de dados categorizadosamostras de dados categorizados••QuiQui--QuadradoQuadrado ΧΧ

22((sugeridosugerido por por KarlKarl PearsonPearson))

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 42

Ajustamento (“Goodness-of-fit”)

� Os testes de ajustamento servem para testar a hipótese de que uma determinada amostra observada tenha sido extraída de uma população com distribuição especificada (Hipótese Nula Simples); .

� AMOSTRA ALEATÓRIA proveniente da f.d. F(.):

i.e,

�� HipHipóóteses a testar:teses a testar:

1 2, , , nX X X⋯

0 0 1 0: ( ) ( ) . : ( ) ( )H F x F x vs H F x F x= ≠

iX iid F

0F

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 43

Exemplo 1

A procura diária de um certo produto foi, em 60 dias escolhidos ao acaso, a que consta da tabela 1:

� Será que tais observações foram extraídas de uma população com distribuição de Poisson,

ie,

� Será de admitir que tal procura segue uma distribuição de Poisson?

105

56

37

18

19

144

113

92

41

20

Número de dias

Número de unidades

�Tabela I: Procura diária de um produto registada em 60 dias.

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 44

Exemplo 2

Pretende-se construir um modelo de simulação das operações de um determinado terminal de um porto situado na Europa.

Uma das variáveis a considerar no modelo é a diferença entre a data de chegada dos navios provenientes dos EU e a respectiva data planeada. Dado que tal diferença éinfluenciada por muitos factores, pode tomar-se como uma variável aleatória.

Há razões para supor que tem distribuição Normal de valor médio 0.1 e desvio padrão 7.2.

Uma amostra de 30 navios revelou os resultados que se apresentam na Tabela 2.

� Será mesmo de admitir que tais dados foram extraídos de uma população N(0.1, 7.22) ?

�Tabela 2: Diferença entre a data de chegada e a data planeada para 30 navios.

42.24.41.8-1.8-2.87.613.2-98.2

2.2-3.7-5.6-8.9-2.415.2-5.8-612.4-7.4

2.6-0.6-7.615-0.3-1.82.45-2-6.6

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 45

� Consideremos uma População X dividida em k ≥ 2 categorias

disjuntas e exaustivas A1, A2, … , Ak,(cada indivíduo da população pertence a uma e só a uma das categorias)

� Para i=1, … , k, seja pi a proporção de indivíduos da População pertencentes a categoria Ai ,

• com

� Fazer inferência estatística acerca desta População resume-se a estudar os parâmetros• pi , i=1, … , k.

� Recolha-se da População X em estudo uma amostra de dimensão n,

� e comece-se por construir a tabela

TESTE DO QUI-QUADRADO - Ajustamento

1

1k

i

i

p=

=∑[ ]i ip P X A= ∈

1 2, , , nx x x⋯

okAk

……

oiAi

……

o2A2

o1A1

FrequênciasClasses

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 46

� Temos a generalização do modelo Binomial, ie, o modelo Multinomial :• Consideram-se n provas idênticas;• O resultado de cada prova pode pertencer a uma de k classes possiveis A1, A2,

… , Ak ;

• é sempre a mesma de prova para prova, i=1, … , k. e• As provas são independentes;• As variáveis de interesse são

• em que com

� Da tabela de frequências obtêm-se as estimativas (de máxima verosimilhança) dos parâmetros pi , i=1, … , k,

TESTE DO QUI-QUADRADO - Ajustamento

1

1k

i

i

p=

=∑[ ]i ip P X A= ∈

ˆ ii

op

n=

1 2, , , kO O O⋯

{ }#i i iO X A= ∈1

k

i

i

O n=

=∑

Isabel Fraga Alves FCUL/ DEIO - Estatística Aplicada: Métodos Não-Paramétricos 1ºAno/2ºSem (6 ECTS) 47

�Teorema: Se (O1, O2, … , Ok) é uma v.a. multinomial, com parâmetros n, pi, i=1, … , k, então a função distribuição da v.a.

aproxima-se da função distribuição dum χχχχ2com (k-1) graus de liberdade, quando n→∞→∞→∞→∞ .

TESTE DO QUI-QUADRADO - Ajustamento

2

1

( )ki i

i i

O np

np=

−∑