estadistica (ii bimestre abril agosto 2011)

Post on 03-Jul-2015

2.554 Views

Category:

Education

3 Downloads

Preview:

Click to see full reader

DESCRIPTION

Universidad Técnica Particular de Loja Ciclo Académico Abril Agosto 2011 Carrera: Ciencias de la Computación Docente: Ing. Ana Gabriela Correa Ciclo: Tercero Bimestre: Segundo

TRANSCRIPT

ESTADÍSTICA

ESCUELA:

NOMBRES:

Informática

Ing. Gabriela Correa Mena

BIMESTRE: Segundo

Abril Agosto 2011

CONTENIDO

• UNIDAD 5: Muestreo

• UNIDAD 6: Prueba de hipótesis para dos muestras

• UNIDAD 7: Análisis de varianza

• UNIDAD 8: Métodos no paramétricos ji cuadrada

• UNIDAD 9: Correlación y regresión lineal

UNIDAD 5

MUESTREO

Herramienta para inferir algo sobre una población

Muestreo

- Entrar en contacto con todos los miembros de la población consumedemasiado tiempo

- El costo de estudiar a todos los elementos de la población es muy alto

- Resulta imposible verificar y localizar a todos los miembros de la población

- Algunas pruebas resultan negativas

Razones para muestrear:

• Media poblacional• Valores de la población (X)• Número de elementos de la población (N)

• Total de muestras• Fórmula de Combinación (C)

Aspectos a considerar

Distribución muestral de la Media

Organiza las medias de todas las muestras en una distribución de probabilidad

Media de la población = Media de la distribución muestral de la media

Ejemplo: Cierta empresa cuenta con 4 empleados deproducción (a quienes se les considera la población). En latabla siguiente se incluyen los ingresos por hora de cadaempleado.

Empleado Ingreso por hora

José 3

Arturo 1

María 4

Rosa 8

a. Media de la población

b. Distribución muestral de la media paramuestras de tamaño 2

Total de muestras:

N= 4n = 2

Empleado Ingreso por hora

José 3

Arturo 1

María 4

Rosa 8

Media muestral – Distribución de probabilidad

c. Media de la distribución muestral de la media

Comparar

La dispersión de la distribución muestral de las medias esmenor que la dispersión de los valores de la población

Comparar

La dispersión de la distribución muestral de las medias esmenor que la dispersión de los valores de la población

Preguntas Objetivas

( ) La media de las medias de lasmuestras es exactamente igual a lamedia de la población

( ) La dispersión de la distribuciónmuestral de la media es más estrechaque la distribución poblacional

UNIDAD 6

PRUEBA DE HIPOTESIS PARA DOS MUESTRAS

Afirmación relativa a un parámetro de lapoblación sujeta a verificación

Hipótesis

Se establecen las hipótesis nula (H0) y alternativa (H1)

Se selecciona un nivel de

significancia (α)

Se identifica el estadístico de

prueba

Se formula una

regla para tomar

decisiones

Se toma una muestra, se llega

a una decisión

No se rechaza H0Se rechaza H0

Se acepta H1

Procedimiento para probar una hipótesis

Formule hipótesis nula (H0) y alternativa (H1)

Ejemplo (pag 371): Los clientes de un supermercado tienen laopción de pagar en una caja registradora normal operada por uncajero o emplear un nuevo procedimiento llamado U-Scan. Lagerente necesita saber si el tiempo medio de pago con el método

tradicional es mayor que con U-scan.

Tipo Cliente Media Muestral

Desviación estándar de la

población

Tamaño de la muestra

Tradicional 5.50 min 0.40 min 50

U-Scan 5.30 min 0.30 min 100

Determine el estadístico de prueba

Seleccione el nivel de significancia (α)

Debido a que se conoce las desviaciones estándar se emplea el estadístico Z

Formule una regla de decisión

Tome la decisión respecto de H0 e interprete el resultado

13.3064.0

2.0

100

30.0

50

40.0

3.55.5

22

22

u

u

s

s

us

nn

XXz

Se rechaza H0, el método U-scan es mas rápido

UNIDAD 7

ANÁLISIS DE VARIANZA

Distribución F

Continua

No puede ser

negativos

Tiene sesgo

positivo

Esasintótica

Comparar si dos muestras que provienen de diferentes poblaciones tienen varianzas iguales

Comparar varias medias poblaciones en forma simultanea (ANOVA)

Tabla ANOVAFuente devariación

Suma de cuadrados

Grados de libertad

Media cuadrática F

Tratamiento

Aleatorio -Error

Total

Análisis de la varianza (ANOVA)

Poblaciones

Independientes

Igual desviación estándar σ

Ejemplo: Citrus Clean es un nuevo limpiador multiusos a

prueba en el mercado, y se han colocado exhibidores en treslugares distintos dentro de varios supermercados. A continuaciónse reporta la cantidad de botellas de 12onzas vendidas en cadalugar del supermercado

Cerca del pan 18 14 19 17

Cerca de las cervezas 12 18 10 16

Cerca de otros limpiadores 26 28 30 32

Con un nivel de significancia de 0.05. ¿Hay alguna diferencia en elnúmero medio de botellas vendidas en los tres lugares?

a. Formule la hipótesis nula y alternativaEl número medio de botellas vendido en los tres lugares es el

mismoH0 : µ1 = µ2 = µ3H1 : Número medio de botellas vendido no es el mismo

b. Regla de decisión

Grados de libertad en el numerador : k - 1 = 3 - 1 = 2

Grados de libertad en el denominador: n - k = 12 - 3 = 9Apéndice B.4 pag. 7884.26Rechaza H0 si F > 4.26

c. Calcule los valores de SS total

• X cada observación de la muestra

• media global total

d. Calcule los valores de SSE

• X cada observación de la muestra

• media muestral para el tratamiento c

d. Calcule los valores de SSECerca del pan Cerca de las cervezas Cerca de otros limpiadores

18 12 26

14 18 28

19 10 30

17 16 32

17 14 29

d. Calcule los valores de SST

e. Elabore una tabla ANOVA

Fuente devariación

Suma de cuadrados

Grados de libertad

Media cuadrática F

Tratamiento SST= 504 k – 1 = 2 SST/( k - 1)= 25230.65Aleatorio -Error SSE=74 n – k = 9 SSE/(n - k) = 8.22

Total SST=578 11

Conclusión:H0 se rechazo debido a que F > 4.26Hay una diferencia en el número medio de botellas vendidas en lasdistintas ubicaciones

UNIDAD VIII

MÉTODOS NO PARAMÉTRICOSJI CUADRADO

Nunca negativo

Tiene sesgo positivo

Existe una familia de

distribuciones de ji cuadradas

(k – 1 )

La distribución se aproxima a distribución

normal

Características distribución ji cuadrada

Estadístico de prueba ji cuadrado

• fo frecuencia observada en una categoría en particular

• fe frecuencia esperada en una categoría en particular

Prueba de bondad de ajuste

Comparar una distribución observada con una distribuciónesperada

Prueba de bondad de ajuste: fe iguales

Ejemplo: La directora de recursos humanos de una empresa,

está preocupada por el ausentismo entre los trabajadores por hora,por lo que decide tomar una muestra de los registros de lacompañía y determinar si el ausentismo está distribuido de manerauniforme en toda la semana de seis días. Las hipótesis son:

H0: El ausentismo está distribuido de manera uniforme en todala semana de trabajo

H1: Es ausentismo no está distribuido de manera uniforme entoda la semana de trabajo

Los resultados de la muestra son

Día Número de ausencias

Lunes 12

Martes 9

Miércoles 11

Jueves 10

Viernes 9

Sábado 9

a. ¿Cómo se denominan los números 12,9,11,10,9,9 ycuántas celdas o categorías hay?

Frecuencias observadas y hay seis celdas (días de la semana)

Día Número de ausencias

Lunes 12

Martes 9

Miércoles 11

Jueves 10

Viernes 9

Sábado 9

fe 60/6=10

b. ¿Cuál es la frecuencia esperada para cada día?

c. ¿Cuántos grados de libertad hay?gl = k -1 = 6 – 1 = 5

d. ¿Cuál es el valor crítico de ji cuadrado con un nivelde significancia de 1%?Apéndice B.3 pag. 787

Grados de libertad Área de Cola Derecha

e. Calcule el estadístico de prueba

Día Número de ausencias

Lunes 12

Martes 9

Miércoles 11

Jueves 10

Viernes 9

Sábado 9

fe 60/6=10

Conclusión:No se rechaza H0El ausentismo se distribuye de manera uniforme durante la semana

UNIDAD IX

CORRELACIÓN Y REGRESIÓN LINEAL

Análisis de Correlación

Grupo de técnicas para medir la asociación entre dos variables

Variable Independiente: Se representa en el eje X y es la variableempleada como estimador

Variable Dependiente: Se representa en el eje Y y es la variable porestimar o predecir

Análisis de Correlación

Grupo de técnicas para medir la asociación entre dos variables

Variable Independiente: Se representa en el eje X y es la variableempleada como estimador

Variable Dependiente: Se representa en el eje Y y es la variable porestimar o predecir

Coeficiente de Correlación

Medida de la fuerza de la

relación lineal entre dos variables

r = 0, no hay

asociación entre ellas

r = 1 indica una asociación directa entre las variables

R = -1 indica una

asociación inversa

entre las variables

Varia de -1 a +1

Ejemplo: Una empresa americana vende copiadoras de todo tamaño. La nuevagerente nacional de ventas desea saber la relación entre el número de llamadas deventas y el número de copiadoras vendidas. Selecciona una muestra aleatoria de 10representantes, como se se observa en la tabla. ¿Qué observaciones cabe hacerrespecto de la relación entre el número de llamadas de venta y el número decopiadoras vendidas?

G R A C I A S

top related