intervalos de confiança simultâneos (método de bonferroni) universidade do estado do rio de...
TRANSCRIPT
Intervalos de confiança simultâneos (Método de Bonferroni)
Universidade do Estado do Rio de Janeiro
Prof. José Francisco Moreira Pessanha
[email protected]/jfmpessa
Intervalos simultâneos
Considere o caso especial em que X~Np(,) onde
p
3
2
1
pp
33
22
11
As variáveis são independentes
Para cada média pode ser especificado um intervalo t com 1- de confiança, por exemplo, 95%:
n
stx
n
stx ii
niiii
ni 22 11 i=1,p
n = tamanho da amostra aleatóriaxi = média amostral da i-ésima variávelsii = variância amostral da i-ésima variável
Intervalos simultâneos
Considerando cada intervalo individualmente
122 11 n
stx
n
stxP ii
niiii
ni i=1,p
Neste caso foi assumido que as variáveis são independentes, por isso o produto de probabilidades
verdadeiro serintervalo ésimo-i conter intervalo PP i
Considerando os intervalos simultaneamente
11111 p
i
P
P
sverdadeiro sejamintervalos os todos
contenham intervalos os todos
No caso de p=6 variáveis, para =0,05 (5%) tem-se que (1- )6 = 0,74 < 0,95, ou seja, o grau de confiança simultâneo é menor que 95%
Intervalos simultâneos
A partir de uma região com (1-)x100% de confiança podem ser obtidos intervalos para as médias 1,2,...,p e suas infinitas combinações lineares aT = a11+a22+...+app. Estes intervalos são denominados por intervalos simultâneos ou intervalos T2:
Estes intervalos são mais largos que os intervalos t, de tal forma que quando considerados simultaneamente a probabilidade de que todos os intervalos contenham as respectivas médias seja (1-)x100%, igual ao grau da região de confiança.
n
SaaF
pn
npXaa
n
SaaF
pn
npXa
T
pnpTT
T
pnpT
,,
11
n = tamanho da amostra aleatóriap = número de variáveisa = vetor de constantes que definem uma combinação linear de médiasX = vetor de médias amostraisS = matriz de covariância amostral
T2
Intervalos simultâneos
Os intervalos simultâneos são projeções da região de confiança.
0.52 0.54 0.56 0.58 0.60
0.5
80
.60
0.6
20
.64
V1
V1
Região de confiança
de 95%
Intervalo de confiança simultâneo de 95% para 1
Intervalo de confiança
simultâneo de 95% para 2
Note que os intervalos simultâneos para 1 e 2 definem uma região retangular maior que a região com 95% de confiança, logo a região retangular, definida pelos dois intervalos T2, tem um grau de confiança maior que 95%.
A probabilidade que os dois intervalos T2 contenham as respectivas médias é superior a 95%
Isso só foi possível pois os intervalos T2 são maiores que o intervalo t
Método de Bonferroni
Freqüentemente estamos interessados em fazer inferência sobre um reduzido conjunto de médias ou de combinações lineares de médias.
Não estamos interessados em todas as infinitas combinações lineares das médias.
Neste caso podemos desenvolver intervalos simultâneos mais curtos (mais precisos) que os intervalos T2.
Este método alternativo é conhecido como método de Bonferroni e baseia-se na desigualdade de mesmo nome.
Método de Bonferroni
Considere que o objetivo seja inferir sobre m combinações lineares das médias:
Seja ICi o intervalo com 1-i de confiança para a i-ésima combinação (i=1,m)
pmpmTm
ppT
ppT
aaa
aaa
aaa
11
21212
11111
i
Ti
P
aP
1verdadeiro serIC
combinação vardeira a conter IC
i
i
Método de Bonferroni
Considerando todos os intervalos simultaneamente:
falso serIC um menos pelosverdadeiro sejamIC os todos ii PP 1
m
i
PP1
1 falso serICsverdadeiro sejamIC os todos ii
m
i
PP1
11 verdadeiro serICsverdadeiro sejamIC os todos ii
m
i
P1
11 ii -1sverdadeiro sejamIC os todos
m
i
P1
1 ii sverdadeiro sejamIC os todos
Estas desigualdade é um caso especial da desigualdade de Bonferroni
Método de Bonferroni
Vamos desenvolver os intervalos simultâneos para o conjunto restrito de p médias i , i=1,p.
Estes intervalos são construídos com base no intervalo t:
n
stx
n
stx ii
iniiii
ini 22 11
Na ausência de algum conhecimento sobre a importância de cada média, faz-se:
i=1,p
pi
1111 pp
Pp
i
iii respectiva a contenha IC todo
verdadeira a conhtenha IC todosverdadeiro sejamIC os todos iii PP
p termos
Implica no mesmo nível de confiança para todos os intervalos
Método de Bonferroni
1ii respectiva a contenha IC todoP
Então, os seguinte intervalos de confiança têm um grau de confiança simultâneo maior ou igual a 1-:
n
s
ptx
n
s
ptx nn
11111
1111 22
n
s
ptx
n
s
ptx nn
22122
2212 22
n
s
ptx
n
s
ptx pp
npppp
np
22 11
...
Método de Bonferroni
Comparando intervalos simultâneos T2 e Bonferroni para as médias i , i=1,p
n
s
ptx
n
s
ptx ii
niiii
ni
22 11
n
sF
pn
npx
n
sF
pn
npx ii
pnpiiii
pnpi
,,
11
Intervalo simultâneo com correção de Bonferroni para as médias i , i=1,p
Intervalo simultâneo T2 para as médias i , i=1,p
ExemploO departamento de controle de qualidade de uma fábrica de fornos de microondas realiza medições do nível de radiação emitida por estes aparelhos para verificar se os fornos fabricados atendem as especificações do projeto e as normas de segurança. Desenhe a região com 95% de confiança para o vetor média.
Para atender esta finalidade, uma amostra de 42 fornos de microondas é selecionada e ensaios em laboratório são conduzidos para medir o nível de radiação emitida com a porta fechada e com a porta aberta. A seguir são apresentados as amostras coletadas.
Forno com a porta fechada (y1) = arquivo T4-1.dat0.15 0.09 0.18 0.10 0.05 0.12 0.08 0.05 0.08 0.10 0.07 0.02 0.01 0.100.10 0.10 0.02 0.10 0.01 0.40 0.10 0.05 0.03 0.05 0.15 0.10 0.15 0.090.08 0.18 0.10 0.20 0.11 0.30 0.02 0.20 0.20 0.30 0.30 0.40 0.30 0.05
Forno com a porta aberta (y2) = arquivo T4-5.dat0.30 0.09 0.30 0.10 0.10 0.12 0.09 0.10 0.09 0.10 0.07 0.05 0.01 0.450.12 0.20 0.04 0.10 0.01 0.60 0.12 0.10 0.05 0.05 0.15 0.30 0.15 0.090.09 0.28 0.10 0.10 0.10 0.30 0.12 0.25 0.20 0.40 0.33 0.32 0.12 0.12
Construa os intervalos simultâneos T2 e com correção de Bonferroni para as médias 1 e 2 com 95% de confiança.
Exemplo
y1=read.table("T4-1.dat")hist(y1[,1])
y2=read.table("T4-5.dat")hist(y2[,1])
Histogram of y2[, 1]
y2[, 1]
Fre
qu
en
cy
0.0 0.1 0.2 0.3 0.4 0.5 0.6
05
10
15
20
Histogram of y1[, 1]
y1[, 1]
Fre
qu
en
cy
0.0 0.1 0.2 0.3 0.4
05
10
15
Distribuições assimétricas. Violação da hipótese de normalidade. Variáveis devem ser transformadas
Exemplo
x1=y1^(1/4)hist(x1)
x2=y2^(1/4)hist(x2)
Histogram of x1
x1
Fre
qu
en
cy
0.3 0.4 0.5 0.6 0.7 0.8
02
46
81
0
Histogram of x2
x2
Fre
qu
en
cy
0.3 0.4 0.5 0.6 0.7 0.8 0.9
05
10
15
20
Distribuições simétricas. Hipótese de normalidade satisfeita.
Transformação das variáveis
Exemplo
Matriz de dados X=cbind(x1,x2)
xbarra=apply(X,2,mean)
S=var(X)
Vetor de médias amostraisxbarra V1 V1 0.5642575 0.6029812
Matriz de covariâncias amostraisS V1 V1V1 0.01435023 0.01171547V1 0.01171547 0.01454530
Caso bivariado p =2
Exemplo
n
sF
pn
npx
n
sF
pn
npx pnppnp
11,11
11,1 %5
1%5
1
n
sF
pn
npx
n
sF
pn
npx pnppnp
22,22
22,2 %5
1%5
1
42
0144,023,3
40
412564,0
42
0144,023,3
40
412564,0 1
612,0516,0 1
42
0146,023,3
40
412603,0
42
0146,023,3
40
412603,0 2
651,0555,0 2
Intervalos simultâneos T2 para 1 e 2
Exemplo
42
0144,0327,2564,0
42
0144,0327,2564,0 1
607,0521,0 1
42
0146,0327,2603,0
42
0146,0327,2603,0 2
646,0560,0 2
Intervalos simultâneos com correção de Bonferroni para 1 e 2
n
s
ptx
n
s
ptx nn
11111
1111 2
%5
2
%5
n
s
ptx
n
s
ptx nn
22122
2212 22
ExemploIntervalos simultâneos T2 para 1 e 2
612,0516,0 1 651,0555,0 2
Intervalos simultâneos com correção de Bonferroni para 1 e 2
607,0521,0 1 646,0560,0 2
Intervalos simultâneos com correção de Bonferroni para 1 e 2 menores que os intervalos T2