tema 5 - introduccion tema 3. estimaci´on puntual...
Post on 06-Aug-2020
9 Views
Preview:
TRANSCRIPT
1
Tema 5 - Introduccion
Tema 3. Estimacion puntual
Tema 4. Estimadores de maxima verosimilitud
Generalizacion
Tema 5. Intervalos de confianzaDefinicion.Intervalos de confianza para medias y varianzas enpoblaciones normales.Intervalos de confianza en muestras grandes.Determinacion del tamano muestral.
Estadıstica I Andres M. Alonso
2
Distribucion temporal del temario
1 2 3 4 5 6 7 8 9Tema 1 T T T PTema 2 T T T P T T T P PTema 3 T T T P T T T P PTema 4 T T T P T T T P PTema 5 T T T P T T T P PTema 6 T T T P T T T P PTema 7 T T T P T T T P P
7 7 7 7 6 6 6 6 6 580 0 0 7 0 0 0 6 6 19T denota una hora de clase de teorıa
P denota una hora de clase practica
Estadıstica I Andres M. Alonso
3
Tema 5. Intervalos de confianza
Los contenidos a desarrollar en este tema son los siguientes:
Definicion e interpretacion frecuentista.
Intervalos de confianza para medias y varianzas en poblaciones normales:casos de una y dos poblaciones.
Intervalos de confianza en muestras grandes.
Determinacion del tamano muestral.
Lecturas recomendadas: Secciones 8.1 a 8.10 del libro de Pena (2005) y elcapıtulo 8 de Newbold (2001).
Estadıstica I Andres M. Alonso
4
Estimador por intervalos de confianza
Definicion 1. Sea XXX = (X1, X2, . . . , Xn) una muestra aleatoria de unapoblacion X con funcion de distribucion Fθθθ donde θθθ = (θ1, θ2, . . . , θk)es un vector de parametros. Un estimador por intervalos de confianzade θi al nivel de confianza 1 − α es una funcion que a la muestraxxx = (x1, x2, . . . , xn) le hace corresponder un intervalo (T1(xxx), T2(xxx)) =(T1(x1, x2, . . . , xn), T2(x1, x2, . . . , xn)
)que satisface:
Pr {θi ∈ (T1(XXX), T2(XXX))} = 1− α,
para cada θi ∈ Θi.
Observacion 1: Notar que (T1(XXX), T2(XXX)) 6= (T1(xxx), T2(xxx)).
Observacion 2: Se dice (T1(xxx), T2(xxx)) es un intervalo de confianza de θi.
Estadıstica I Andres M. Alonso
5
Ejemplo 1. Sea XXX = (X1, X2, . . . , Xn) una muestra aleatoria simple de unapoblacion X ∼ N (µ, σ2) con σ2 conocida. Hallar un estimador por intervalosde confianza para la media, µ.
Sabemos que X ∼ N (µ, σ2
n ).
Por tanto,X−µ
σ√n∼ N (0, 1).
Entonces, Pr{− zα/2 <
X−µσ√n
< zα/2
}= 1− α.
I Un intervalo de confianza para µ es:(X − zα/2
σ√n, X + zα/2
σ√n
).
I Otros intervalos son:(X − zα
σ√n,+∞
)y(−∞, X + zα
σ√n
).
Estadıstica I Andres M. Alonso
6
Cantidad pivotal
Definicion 2. Sea XXX = (X1, X2, . . . , Xn) una muestra aleatoria de unapoblacion X con funcion de distribucion Fθθθ donde θθθ = (θ1, θ2, . . . , θk) esun vector de parametros. Una cantidad pivotal para θi es una funcionC(X1, X2, . . . , Xn, θi) tal que su distribucion no depende de θi.
Ejemplo 1.
Sabemos queX−µ
σ√n∼ N (0, 1).
Entonces,X−µ
σ√n
es una cantidad pivotal para µ.
Estadıstica I Andres M. Alonso
7
Metodo de la cantidad pivotal
Si tenemos una cantidad pivotal, para construir intervalos de confianza sepuede utilizar el siguiente procedimiento:
1. Obtener la distribucion de la cantidad pivotal.
2. Obtener C1 y C2 tales que Pr {C1 < C(X1, X2, . . . , Xn, θi) < C2} = 1−α.
3. Despejar θi de las desigualdades C1 < C(X1, X2, . . . , Xn, θi) < C2, estoes, lograr T1(X1, X2, . . . , Xn) < θi < T2(X1, X2, . . . , Xn).
Finalmente, (T1(x1, x2, . . . , xn), T2(x1, x2, . . . , xn)) es un intervalo para θi.
Volvamos al Ejemplo 1
Estadıstica I Andres M. Alonso
8
Ejemplo 2. Supongamos que los rendimientos de las acciones de la empresaSEGURA.SL siguen una distribucion normal de media µ euros y varianza σ2 = 1.Se toma una m.a.s. de 20 rendimientos y se tiene:
5,29 3,66 5,71 6,62 4,30 5,85 6,25 3,40 3,55 5,574,60 5,69 5,81 5,71 6,29 5,66 6,19 3,79 4,98 4,84
(a) Calcular un intervalo de confianza al 90 % para el rendimiento promediode esta empresa.
x =120
(5,29 + 3,66 + · · ·+ 4,84) = 5,188,
(x− zα/2
σ√n, x + zα/2
σ√n
)= (5,188− 1,645× 1√
10, 5,188 + 1,645× 1√
10)
= (4,6678, 5,7082)
I ¿Pr(µ ∈ (4,6678, 5,7082))? ¿µ ∈ (4,6678, 5,7082) ?
Estadıstica I Andres M. Alonso
9
Interpretacion frecuentista del intervalo de confianza
Estadıstica I Andres M. Alonso
10
Tema 5. Intervalos de confianza
Los contenidos a desarrollar en este tema son los siguientes:
Definicion e interpretacion frecuentista. X
Intervalos de confianza para medias y varianzas en poblaciones normales:casos de una y dos poblaciones.
Intervalos de confianza en muestras grandes.
Determinacion del tamano muestral.
Estadıstica I Andres M. Alonso
11
Distribuciones asociadas a la distribucion normal - χ2χ2χ2
Definicion 3. Sean X1, X2, . . . , Xn variables aleatorias independientes eidenticamente distribuidas N (0, 1). La distribucion χ2χ2χ2 con n grados de
libertad es la distribucion de la v.a. S =n∑
i=1
X2i .
E[S] = n.
Var(S) = 2n.
χ2α
α
Estadıstica I Andres M. Alonso
12
Distribuciones asociadas a la distribucion normalttt de Student
Definicion 4. Sean Y , X1, X2, . . . , Xn variables aleatorias independientes eidenticamente distribuidas N (0, 1). La distribucion ttt de Student con n
grados de libertad es la distribucion de la v.a. T = Y∑ni=1 X2
i.
E[T ] = 0.
Var(T ) = nn−2.
− tα tα 0
α α
Estadıstica I Andres M. Alonso
13
Distribuciones asociadas a la distribucion normalFFF de Fisher
Definicion 5. Sean X1, X2, . . . , Xn e Y1, Y2, . . . , Ym variables aleatorias in-dependientes e identicamente distribuidas N (0, 1). La distribucion Fn,mFn,mFn,m deFisher–Snedecor con n y m grados de libertad es la distribucion de la v.a.
F =1n
∑ni=1 X2
i1m
∑mi=1 Y 2
i
.
E[F ] = mm−2.
Var(F ) = 2m2(n+m−2)n(m−2)2(m−4)
.
1/T ∼ Fm,n.
Fn,m,α = 1/Fm,n,1−α.F
n,m,α
α
Estadıstica I Andres M. Alonso
14
Cantidades pivotales en la distribucion normal
Lema de Fisher: Sean X1, X2, . . . , Xn v.a. i.i.d. N (µ, σ2). Entonces:
(i) X ∼ N (µ, σ2
n ).
(ii) (n−1)σ2 S2 ∼ χ2
n−1.
(iii) X y S2 son independientes.
Corolario:
X−µσ√n
es una cantidad pivotal para µ. W Util si conocemos σ2.
X−µS√n
es una cantidad pivotal para µ.
(n−1)σ2 S2 es una cantidad pivotal para σ2.
Estadıstica I Andres M. Alonso
15
I.C. en la distribucion normal
Intervalos de confianza de nivel 1− α1− α1− α para µµµ:
(a) Con σ conocida:
I =[x∓ zα/2
σ√n
](b) Con σ desconocida:
I =[x∓ tn−1;α/2
s√n
]
Intervalo de confianza de nivel 1− α1− α1− α para σ2σ2σ2:
I =
[(n− 1)s2
χ2n−1;α/2
,(n− 1)s2
χ2n−1;1−α/2
]
Estadıstica I Andres M. Alonso
16
Ejemplo 2. Supongamos que los rendimientos de las acciones de la empresaSEGURA.SL siguen una distribucion normal de media µ euros y varianza σ2,
ambas desconocidas .
(b) Calcular un intervalo de confianza al 90 % para el rendimiento promediode esta empresa.
x =120
(5,29 + 3,66 + · · ·+ 4,84) = 5,188,
s2 =119((5,29− 5,188)2 + (3,66− 5,188)2 + · · ·+ (4,84− 5,188)2
)= 0,9929.
(x− tn−1,α/2
s√n, x + tn−1,α/2
s√n
)= (5,188∓ 1,729
√0,9929/10)
= (4,6432, 5,7328)
I ¿Pr(µ ∈ (4,6432, 5,7328))? ¿µ ∈ (4,6432, 5,7328)?
Estadıstica I Andres M. Alonso
17
Ejemplo 2.
(c) Calcular un intervalo de confianza al 90 % para la varianza del rendimiento.
s2 =119((5,29− 5,188)2 + (3,66− 5,188)2 + · · ·+ (4,84− 5,188)2
)= 0,9929.
((n− 1)s2
χ2n−1;α/2
,(n− 1)s2
χ2n−1;1−α/2
)=(
19× 0,992930,14
,19× 0,9929
10,12
)= (0,6259, 1,8641)
I ¿Pr(σ2 ∈ (0,6259, 1,8641)? ¿σ2 ∈ (0,6259, 1,8641)? ¿1 ∈ (0,6259, 1,8641)?
Estadıstica I Andres M. Alonso
18
I.C. en muestras grandes - 1
Sean X1, X2, . . . , Xn variables aleatorias independientes siendo el tamano demuestra suficientemente grande (n > 30). Entonces la distribucion de X es
aproximadamente una N (µ, S2
n ).
X−µS√n
es una cantidad pivotal para µ.
Intervalos de confianza de nivel 1− α1− α1− α para µµµ (con n > 30):
I =[x∓ zα/2
s√n
]
Ejemplo 3. Aplicar el resultado anterior para obtener un intervalo deconfianza de una proporcion.
Estadıstica I Andres M. Alonso
19
Ejemplo 4. Un partido polıtico pretende conocer la intencion de voto de caraa las proximas elecciones. Para ello encarga un sondeo sobre un total de 230personas, de las que 69 contestan que le votarıan.
a) Hallar un intervalo de confianza al 90% para la verdadera proporcionpoblacional, indicando las hipotesis asumidas.
p = 69230 = 0,3.
α = 0,1 ⇒ α2 = 0,05 ⇒ zα
2= 1,645.
Hipotesis asumidas: M.A.S de una Bernoulli(p), y n grande.
p± zα2
√p(1−p)
n = 0,3± 1,645× 0,0302 = 0,3± 0,049679.
I Con lo que el intervalo resultante es (0,2503, 0,3497).
Estadıstica I Andres M. Alonso
20
b) Si el intervalo resulto ser (0,243, 0,357), ¿cual fue el nivel de confianzaelegido?
La longitud del intervalo = 0,357− 0,243 = 0,114.
0,114 = 2zα2
√0,3×(1−0,3)
230 ⇒ zα2
= 1,8874
α2 = 1− 0,9706 ⇒ 1− α = 0,9412.
I Se trata de un intervalo al 94,12 %.
Estadıstica I Andres M. Alonso
21
Cantidades pivotales en dos poblacionescon distribucion normal
Proposicion 1: Sean X1, X2, . . . , Xn v.a. i.i.d. N (µ1, σ21) e Y1, Y2, . . . , Ym
v.a. i.i.d. N (µ2, σ22) e independientes entre si. Entonces:
(i)X−Y−(µ1−µ2)√
σ21
n +σ22
m
∼ N (0, 1).
(ii) Si σ1 = σ2,X−Y−(µ1−µ2)√
S2p(1
n+ 1m)
∼ tn+m−2 donde S2p =
(n−1)S21+(m−1)S2
2n+m−2 .
(iii) Si σ1 6= σ2,X−Y−(µ1−µ2)√
S21
n +S22
m
∼ tf donde f es el entero mas proximo a
(s21/n1+s2
2/n2)2
(s21/n1)2
n1−1 +(s22/n2)2
n2−1
.
Estadıstica I Andres M. Alonso
22
Cantidades pivotales en dos poblacionescon distribucion normal
Corolario 1:
X−Y−(µ1−µ2)√σ21
n +σ22
m
es una cantidad pivotal. W Util si conocemos σ1 y σ2.
X−Y−(µ1−µ2)√S2
p(1n+ 1
m)es una cantidad pivotal. W Valida si σ1 = σ2.
X−Y−(µ1−µ2)√S21
n +S22
m
es una cantidad pivotal para µ1 − µ2.
Estadıstica I Andres M. Alonso
23
I.C. en dos poblaciones con distribucion normal
Intervalos de confianza de nivel 1− α1− α1− α para µ1 − µ2µ1 − µ2µ1 − µ2:
(a) σ1 y σ2 conocidas:
I =[x− y ∓ zα/2
√σ2
1/n + σ22/m
].
(b) σ1 y σ2 desconocidas e iguales:
I =[x− y ∓ tn1+n2−2;α/2 sp
√1/n + 1/m
].
(c) σ1 y σ2 desconocidas y diferentes:
I =[x− y ∓ tf ;α/2
√s21/n + s2
2/m
].
Estadıstica I Andres M. Alonso
24
Proposicion 1: (continuacion)
(iv)
S21
σ21
S22
σ22
∼ Fn−1,m−1.
Corolario 1: (continuacion)
S21
σ21
S22
σ22
es una cantidad pivotal para el cocienteσ2
1
σ22.
Intervalos de confianza de nivel 1− α1− α1− α para σ21/σ2
2σ21/σ2
2σ21/σ2
2:
I =[
s21/s2
2
Fn−1,m−1;α/2,s21
s22
Fm−1,n−1;α/2
].
Estadıstica I Andres M. Alonso
25
Ejemplo 5. Queremos ver mediante un intervalo de confianza si los paısesemergentes tienen en media la misma inflacion que los paıses desarrollados.Para eso, tomamos la inflacion en 10 paıses emergentes y en 10 paısesdesarrollados.
Desarrollados 3,99 4,07 3,70 1,79 5,30 3,47 2,39 3,33 4,14 3,11
Emergentes 4,73 5,01 5,07 4,66 4,49 4 4,33 5,14 3,15 3,46
a) Calcular un intervalo de confianza para el cociente de varianzas.
b) ¿Es posible calcular un I.C. para la diferencia de medias? ¿a que conclusionesllegamos?
c) Comentar los supuestos que hay que hacer.
Estadıstica I Andres M. Alonso
26
Ejemplo 5. a)
Comparison of Standard Deviations---------------------------------
Desarrollados Emergentes------------------------------------------------------------Standard deviation 0.976632 0.680199Variance 0.95381 0.462671Df 9 9
Ratio of Variances = 2.06153
95.0% Confidence IntervalsStandard deviation of Desarrollados: [0.671762;1.78295]Standard deviation of Emergentes: [0.467865;1.24178]Ratio of Variances: [0.512055;8.2997]
Estadıstica I Andres M. Alonso
27
Ejemplo 5. b)
Comparison of Means-------------------
95.0% confidence interval for mean of Desarrollados: [2.83036,4.22764]95.0% confidence interval for mean of Emergentes: [3.91741,4.89059]95.0% confidence interval for the difference between the means
assuming equal variances: -0.875 +/- 0.790708 [-1.66571,-0.0842918]
Comparison of Means-------------------
95.0% confidence interval for mean of Desarrollados: [2.83036,4.22764]95.0% confidence interval for mean of Emergentes: [3.91741,4.89059]95.0% confidence interval for the difference between the means
not assuming equal variances: -0.875 +/- 0.797578 [-1.67258,-0.0774224]
Estadıstica I Andres M. Alonso
28
I.C. en muestras grandes - 2
Sean (X1, X2, . . . , Xn) e (Y1, Y2, . . . , Ym) variables aleatorias i.i.d. e inde-pendientes entre si, siendo los tamanos de muestra suficientemente grandes(n, m > 30). Entonces la distribucion de X − Y es aproximadamente una
N (µ1 − µ2,S2
1n + S2
2m ).
X−Y−(µ1−µ2)(S21
n +S22
m
)1/2 es una cantidad pivotal para µ1 − µ2.
Intervalos de confianza de nivel 1− α1− α1− α para µµµ (con n, m > 30):
I =
[x− y ∓ zα/2
√S2
1
n+
S22
m
]
Ejemplo 6. Aplicar el resultado anterior para obtener un intervalo de confi-anza para la diferencia de dos proporciones.
Estadıstica I Andres M. Alonso
29
Ejemplo 7. En un sondeo de opinion llevado a cabo en el ano 2002 con 1000individuos en las ciudades de Murcia y Cartagena se encontro que el 55% deellos eran favorables a la construccion de un nuevo aeropuerto.
Dicho sondeo se repitio en el ano 2003 tras una intensa campana publicitaria,encontrandose esta vez un 60 % de individuos favorables a esta opcion, entre1500 encuestados. Se pide:
a) Construir un intervalo de confianza de nivel 95 % para la proporcion p1
de individuos favorables a la construccion del nuevo aeropuerto, de entre losencuestados en el ano 2002. ¿Podrıa afirmarse al nivel de significacion del 5 %que solo la mitad de los encuestados preferıan un nuevo aeropuerto?
b) Planteando los supuestos necesarios, construir un intervalo de confianza al95 % para la diferencia p2 − p1 de las proporciones de individuos favorables enlos anos 2003 y 2002. ¿Podrıa afirmarse al nivel de significacion del 5% quela campana publicitaria en favor de la construccion del nuevo aeropuerto pudotener efecto?
Estadıstica I Andres M. Alonso
30
a) IC(p1, 95 %) = p1 ± 1,96√
p1(1− p1)n1
= [0,5192, 0,5808]
Como dicho intervalo no contiene el valor p=0.5 no podemos afirmar al nivelde significacion del 5% que solo la mitad de los encuestados eran favorables alnuevo aeropuerto.
b) Si suponemos que las muestras de encuestados en los anos 2002 y 2003 sonindependientes, se tendra:
IC(p2 − p1,95 %) = p2 − p1 ± 1,96√
p1(1− p1)n1
+p2(1− p2)
n2=
= 0,6−0,55±1,96
√0,55(0,45)
1000+
0,6(0,4)1500
= 0,05±0,0396 = [0,0104, 0,0896].
Como este intervalo solo contiene valores positivos, podemos afirmar al nivel designificacion del 5 % que la campana publicitaria en favor del nuevo aeropuertopudo tener efecto.
Estadıstica I Andres M. Alonso
31
Tema 5. Intervalos de confianza
Los contenidos a desarrollar en este tema son los siguientes:
Definicion e interpretacion frecuentista. X
Intervalos de confianza para medias y varianzas en poblaciones normales:casos de una y dos poblaciones. X
Intervalos de confianza en muestras grandes. X
Determinacion del tamano muestral.
Estadıstica I Andres M. Alonso
32
Calculo del tamano muestral
Definicion 6. El error de una estimacion por intervalos de confianza denivel 1− α es la semiamplitud del intervalo obtenido.
Ejemplo 8. Volviendo al Ejemplo 1, supongamos que Var(X) = 25, ¿cualdebe ser el mınimo tamano muestral para que el error de estimacion no seasuperior a 0.5 con nivel de confianza del 95 %?
Sabemos que la semiamplitud el intervalo es: zα/2σ√n.
Imponemos que zα/2σ√n
< 0,5.
Sustituyendo los valores: 1,96 5√n
< 0,5.
Por tanto, 384,16 ≤ n. W nminimo = 385.
Estadıstica I Andres M. Alonso
33
Ejemplo 9. Volviendo al Ejemplo 4
c) Si el partido quisiera un intervalo de confianza al 90 % cuya longitud noexcediera de 0.15, ¿cual serıa el tamano muestral necesario?
La longitud del intervalo = 2zα2
√p(1−p)
n .
El intervalo de confianza alcanzara su longitud maxima cuando p = 12, de modo
que calcularemos n para este caso que es el mas desfavorable.
En ese caso, longitud = 2zα2
√14n
1− α = 0,9 ⇒ α2 = 0,05 ⇒ zα
2= 1,645.
0,15 = 2× 1,645√
14n ⇒
√n = 1,645
0,15 = 10,967 ⇒ n = 10,9672 = 120,28.
Por tanto se tomarıa n = 121.
Estadıstica I Andres M. Alonso
34
Recapitulacion
Tema 5. Intervalos de confianza
Definicion e interpretacion frecuentista. W ¿Que es un I.C.?
Intervalos de confianza para medias yvarianzas en poblaciones normales.Intervalos de confianza en muestrasgrandes.
W Ejemplos de interespractico.
Determinacion del tamano muestral. W ¿Cuando y por que?
Estadıstica I Andres M. Alonso
35
Tema 5. Intervalos de confianzaDefinicion.Ejemplos de intervalos de confianza.Determinacion del tamano muestral.
¿Esta θ en el intervalo deconfianza?
Tema 6. Contraste de hipotesisConceptos fundamentales.Contrastes para la media y la varianza en poblaciones normales.Contrastes con muestras grandes.Relacion entre los intervalos de confianza y los contrastes dehipotesis.Determinacion del tamano muestral.
Estadıstica I Andres M. Alonso
top related