distribución normal
DESCRIPTION
Informe para la clase de estadística. Distribución normal.TRANSCRIPT
CORPORACIÓN UNIVERSITARIA DE LA COSTA
FACULTAD DE INGENIERÍAS
PROGRAMA DE ING. INDUSTRIAL
DISTRIBUCIÓN NORMAL
LAB. CONTROL DE CALIDAD
BRIANITH A. NAVARRO MARCHENA
PRESENTADO A:
ING. ERITH SARMIENTO CORONADO
GRUPO CD
MARZO DE 2011
TABLA DE CONTENIDO
INTRODUCCIÓN
ABSTRACT
1. OBJETIVOS
1.1. OBJETIVO GENERAL
1.2. OBJETIVOS ESPECIFICOS
2. MARCO TEORICO
2.1. DISTRIBUCIÓN NORMAL
3. PROCEDIMIENTO
3.1. INSUMOS, MATERIALES REQUERIDOS
3.2. DESARROLLO EXPERIMENTAL
4. CALCULOS Y RESULTADOS
5. ANÁLISIS DE LOS RESULTADOS
CONCLUSIONES
ARTICULO “Computer Modelling; Studies from Florida State University Provide New Data on Computer Modelling”
ANEXOS
BIBLIOGRAFÍA
INTRODUCCIÓN
La distribución normal es lo más importante en la probabilidad y estadística. Muchas poblaciones numéricas tienen distribuciones que se pueden ajustar mediante una curva normal apropiada para el análisis de variables cuantitativas como por ejemplo dimensiones, pesos, características físicas, etc.
En esta prueba se utilizará como variable el diámetro de cilindros de madera para determinar los parámetros del proceso.
ABSTRACT
The normal distribution is the most important thing in probability and statistics. Many large populations have distributions that can be adjusted by a normal curve appropriate for the analysis of quantitative variables such as dimensions, weight, physical characteristics, etc.
In this test the diameter of wood cylinders is used as a variable to determine the parameters of the process.
Keywords: normal distribution, statistics, normal curve.
1. OBJETIVOS
1.1. OBJETIVO GENERAL
Con el desarrollo de esta experiencia se persigue ilustrar, en forma general los conceptos relacionados con la distribución normal. También se practicarán el ajuste de una distribución normal de una distribución de frecuencias observadas y se demostrará el efecto de las diversas fluctuaciones del muestreo.
1.2. OBJETIVOS ESPECIFICOS
Determinar la media muestral a partir de la agrupación de los datos en una tabla.
Determinar la desviación estándar de la muestra. Analizar el valor de la probabilidad a partir de Z.
2. MARCO TEÓRICO
2.1. DISTRIBUCIÓN NORMAL
Distribución de una variable aleatoria continúa con una curva de un solo pico y en forma de campana. La media se halla en el centro de la distribución, y la curva es simétrica alrededor de una línea vertical que se yergue en la media. Los dos extremos se extienden indefinidamente, sin que nunca toquen el eje horizontal.
El modelo de probabilidad más frecuente utilizado en estadística es la distribución normal, que puede emplearse en las formas general y estandarizada. Se dice que X (variable) tiene una distribución general si cumple las siguientes condiciones:
X es una variable aleatoria continua. Si existen las constantes:
µ: α<µ<α ; σ : σ>0
La función de probabilidad viene dada por la siguiente expresión:
Para el modelo normal estándar se trabaja con una función de densidad que comprende integrales que no pueden ser reducidas a funciones elementales, se dice que una función normal es de la forma estándar si su media es cero y su varianza es la unidad.
La función de distribución de la variable normal estándar Z es:
La función acumulada correspondiente a la distribución estándar dada que la probabilidad de la variable normal asuma valores menores o iguales a Z.
Si la variable aleatoria X tiene media µ y desviación típica σ , entonces la variable aleatoria Z también tiene media µ y desviación típica σ .
Fig. 1. Representación gráfica de la varianza, desviación típica y la media en una distribución normal
Fig. 2. Representación gráfica de Z en una distribución normal
3. PROCEDIMIENTO
3.1. INSUMOS, MATERIALES Y EQUIPOS REQUERIDOS.
Para la experiencia se selecciona una muestra de 50 cilindros de madera de una población de 100.Un calibrador.
3.2. DESARROLLO EXPERIMENTAL
Se toman 50 cilindros de la población para medir sus diámetros con el calibrador y se anotan estos valores en la tabla 1.
Luego, para calcular la media y la desviación estándar, procedemos a agrupar los datos en la tabla 2:
Se calcula el Rango de la muestrea tomando el dato mayor y el menor de la misma, de esta forma continuamos para hallar el número de clases y la amplitud de los intervalos.
Hallamos el número de clases según la formula 1+3.22 log n. Para construir los intervalos y asegurarnos de que el valor
mínimo como el máximo se encuentren dentro de los datos tomados, restamos 0.005 al valor mínimo porque el número de decimales que tiene este así lo requiere.
Procedemos a hallar la frecuencia que existe entre los intervalos, la marca de clase y la clase (µ) para llenar el resto de la tabla con operaciones entre ellos.
De esta forma hallamos la media y la desviación estándar de nuestros datos para proceder con su probabilidad, las graficamos y analizamos para continuar con las respuestas a las preguntas y sus respectivas conclusiones.
Después de esto procedemos a analizar los valores de la tabla 3. con los datos de los demás grupos de clase.
4. ACTIVIDADES INDEPENDIENTES
4.1. CALCULOS Y RESULTADOS
Tabla 1. Medida de cada uno de los cilindros en milímetros
X
1 – 10 56,55 49,10 48,71 49,60 49,40 49,52 48,30 54,80 55,50 56,00
11 – 20 56,48 56,90 56,08 56,90 56,64 55,72 56,14 56,88 56,24 53,04
21 – 30 57,56 56,00 52,18 53,04 56,38 52,86 55,90 51,98 53,42 52,90
31 – 40 53,22 55,72 56,20 59,60 55,60 56,78 56,58 59,32 59,02 58,68
41 – 50 54,80 56,08 56,60 55,14 56,48 55,90 56,44 56,16 56,50 56,04
De la tabla 1. obtenemos:
n=50
Valor Mínimo: 4,830Valor Máximo: 5,960
Rango: R=V max−V min
R=5 9 ,60−4 8 ,30
R=11 , 30
Número de intervalos:
k=1+3,22 log n
k=1+3,22 log 50
k=6,47 ≈ 6
Nuestro número de clases será 6.
Amplitud de las clases:
C=Rangok
C=11 , 306
C=1 , 88
Intervalos de clase:
Primer intervalo:
V min−0,05=4 8 ,3−0 , 05=48 , 25
4 8 ,25+C=48,25+1,88=5 0 , 1348 ,25−50 ,13
Segundo intervalo:5 0 , 13+C=50 ,13+1, 88=52 ,03
50 , 13−52 ,03
Tercer intervalo:5 2 , 03+C=52, 03+1 , 88=53 , 93
52 , 03−53 ,93
Cuarto intervalo:53 , 93+C=53 , 93+1 ,88=55 , 83
53 , 93−55 ,83
Quinto intervalo:5 5 , 83+C=55 , 83+1 ,88=57 , 73
55 , 83−57 ,73
Sexto intervalo:5 7 , 73+C=57 , 73+1 ,88=59 , 63
57 , 73−59 ,63
Nos aseguramos si el valor máximo es menor que el sexto intervalo, para que este no quede por fuera de la toma de datos. 59 , 63 ≥59 , 60
Marca de clase:
X1=48 , 2550 , 13
=49 , 19
X2=5 0 , 135 2 , 03
=5 1 ,08
X3=52 , 0353 , 93
=52 , 98
X 4=53 , 935 5 ,83
=5 4 , 88
X5=55 , 8357 , 73
=56 , 78
X6=57 ,7359 , 63
=58 , 68
Media (X):
F1× X1=6 × 49 ,19=295 ,15
F2× X2=1 ×51 , 08=5 1 ,08
F3× X3=7 ×52 , 90=370 ,88
F4 × X 4=7 ×5 4 , 88=38 4 , 18
F5× X5=25 ×56 ,78=1419 ,58
F6× X6=4 ×58 ,68=23 4 , 73
X=∑ FX
∑ F=
(2 95 ,15+51, 08+370 ,88+384 , 18+1419 ,58+234 , 73 )50
X=∑ FX
∑ F=
2755 , 6250
=55,112
Por lo tanto se asume que la media poblacional es μ=55,112
Desviación típica estándar (S2)
Para la desviación típica estándar se tiene que:
S2=∑ (X−X)2
n−1
Para este caso n=F. Entonces:
( X 1−X )2=(49 , 19−5 5 , 112)2=34,520
(X 2−X )2=(51 , 08−55,112)2=23,413
(X 3−X )2=(52, 98−55,112)2=21,610
( X 4−X )2=(54 ,88−55,112 )2=19,880
(X 5−X )2=(56 ,78−55,112)2=18,222
(X 6−X )2=(5 8 ,68−55,112)2=16,636
S=∑ (X−X )2
n−1=
(34,520+23,413+21,610+19,880+18,222+16,636)49
S=∑ ( X−X )2
n−1=134,281
49=2,74
Por lo que la desviación estándar poblacional será σ=2,74
Tabla 2. Distribución de frecuencias y cálculos de la media y la desviación
INTERVALO DE CLASES
MARCA DE CLASE (X )
FRECUENCIA (
F)CLASE (μ) F∗X ¿¿¿
48,295 50,178 49,237 6 55,112 295,420 34,520
50,178 50,368 50,273 1 55,112 50,273 23,413
50,368 50,558 50,463 7 55,112 353,243 21,610
50,558 50,748 50,653 7 55,112 354,573 19,880
50,748 50,938 50,843 25 55,112 1271,083 18,222
50,938 51,128 51,033 4 55,112 204,133 16,636
TOTAL 50 2528,727 134,279
Tabla 3. Media y desviación estándar
GRUPOS MEDIA MUESTRAL DESVIACIÓN ESTÁNDAR
1 54,6 1,47
2 54,8 2,8
3 55,1 2,7
GRUPOS
1 2 3 4 5 6
1 3 1 16 14 15 1
2 6 1 7 7 25 4
TOTAL 9 2 23 21 40 5
50,178 50,368 50,558 50,748 50,938 51,12848,295 50,178 50,368 50,558 50,748 50,938
0
5
10
15
20
25
30
6
1
7 7
25
4
Gráfico de frecuencias individual
4.2. PREGUNTAS
1. ¿Porque para el cálculo de la desviación se empleó en el denominador (n−1) y no (n)?
Un principio general de la teoría matemática nos dice que si pretendemos calcular de modo aproximado la varianza de una población a partir de la varianza de una muestra suya, se tiene que el error cometido es generalmente más pequeño, si en vez de considerar como estimación de la varianza de la población, a la varianza muestral. Si hubiéramos considerado (n) como el denominador para la fórmula de la varianza, el resultado hubiera sido algún sesgo, es decir, un error sistémico que se puede controlar, como un estimador de la varianza de la población; en
concreto, tendería a ser demasiado bajo. Si se usa un divisor de n−1, se obtiene un estimador insesgado de σ 2.
2. ¿En una distribución normal qué significado tiene la Z?
la desviación estándar es útil para describir cuánto se apartan de la media de la distribución los elementos individuales de esta misma. La Z, o también llamada ‘puntuación estándar’ nos da el número desviaciones estándar a que determinada observación se encuentra por debajo o por encima de la media.
3. ¿Cuál es el valor máximo que puede tomar Z en una distribución normal? ¿Por qué?
El valor máximo que podemos encontrar en la puntuación estándar, Z, es de 4,0 y esto se debe a que es la aproximación más especifica al 100% de la probabilidad de una distribución normal.
CONCLUSIONES
Gracias a la aplicación de la distribución normal es una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales.
La importancia de esta distribución radica en que permite modelar numerosos fenómenos naturales, sociales y psicológicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de fenómenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observación se obtiene como la suma de unas pocas causas independientes.
De hecho, la estadística es un modelo matemático que sólo permite describir un fenómeno, sin explicación alguna. Para la explicación causal es preciso el diseño experimental, de ahí que al uso de la estadística en psicología y sociología sea conocido como método correlacional.
Computer Modelling; Studies from Florida State University Provide New Data on Computer Modelling
Abstract (Summary)According to a study from the United States, Quasi-Monte Carlo simulation is a popular numerical method in applications, in particular, economics and finance. Since the normal distribution occurs frequently in economic and financial modeling, one often needs a method to transform low-discrepancy sequences from the uniform distribution to the normal distribution.
Article2011 MAR 26 - (VerticalNews.com) -- According to a study from the United States, "Quasi-Monte Carlo simulation is a popular numerical method in applications, in particular, economics and finance. Since the normal distribution occurs frequently in economic and financial modeling, one often needs a method to transform low-discrepancy sequences from the uniform distribution to the normal distribution."
"Two well known methods used with pseudorandom numbers are the Box-Muller and the inverse transformation methods. Some researchers and financial engineers have claimed that it is incorrect to use the Box-Muller method with low-discrepancy sequences, and instead, the inverse transformation method should be used. In this paper we prove that the Box-Muller method can be used with low-discrepancy sequences, and discuss when its use could actually be advantageous," wrote G. Okten and colleagues, Florida State University.
The researchers concluded: "We also present numerical results that compare Box-Muller and inverse transformation methods."
Okten and colleagues published their study in Mathematical and Computer Modelling (Generating low-discrepancy sequences from the normal distribution: Box-Muller or inverse transform? Mathematical and Computer Modelling, 2011;53(5-6):1268-1281).
For more information, contact G. Okten, Florida State University, Dept. of Math, Tallahassee, FL 32306, USA.
Publisher contact information for the journal Mathematical and Computer Modelling is: Pergamon-Elsevier Science Ltd., the Boulevard, Langford Lane, Kidlington, Oxford OX5 1GB, England.
Keywords: City:Tallahassee, State:FL, Country:United States, Computer Modelling, Finance, Financial, Investing, Investment
This article was prepared by Investment Weekly News editors from staff and other reports. Copyright 2011, Investment Weekly News via VerticalNews.com.
BIBLIOGRAFÍA
LEVIN, Richard. ESTADISTICA PARA INGENIEROS. PHH Prentice Hall Editorial.
Tablas de las distribuciones de probabilidad más usadas. 28 de Marzo. Disponible en: http://www2.dis.ulpgc.es/~ii-pest/tablas_estadisticas.html
DISTRIBUCIÓN NORMAL. 28 de Marzo. Disponible en: http://personal5.iddeo.es/ztt/Tem/t21_distribucion_normal.htm
Error, Sesgo. 28 de Marzo. Disponible en: http://escuela.med.puc.cl/recursos/recepidem/insintrod3.htm
Computer Modelling; Studies from Florida State University Provide New Data on Computer Modelling, Investment Weekly News. Atlanta: Mar 26, 2011. pg. 1051, tambien disponible en: http://proquest.umi.com/pqdweb?did=2293682351&sid=2&Fmt=3&clientId=76781&RQT=309&VName=PQD