capítulo 32 - wordpress.com...valores de datos discretos diferentes o cuando un conjunto de datos...
TRANSCRIPT
Capítulo
Histogramas y
otras gráficas
© 2010 Pearson Prentice Hall. All rights reserved
32
Histogramas
• El histograma es una gráfica utilizada para
presentar datos cuantitativos y es similar a
la gráfica de barras.
• Se construye dibujando rectángulos para
cada categoría de datos pero los
rectángulos se tocan.
EjemploUn gerente de Wendy’s quiere saber la cantidad típica de clientes que
llegan durante la hora del almuerzo. Los datos en la siguiente tabla
representan la distribución de frecuencias para el número de clientes
que llegan a Wendy's durante 40 intervalos de 15 minutos
seleccionados al azar durante el almuerzo.
Sullivan (Página 74)
Histogramas para data continua• Cuando un conjunto de datos consiste de una gran cantidad de
valores de datos discretos diferentes o cuando un conjunto de datos
consta de datos continuos, construimos categorías o clases
utilizando intervalos.
• Ejemplo: El siguiente conjunto representan la tasa de rendimiento
de cinco años (en porcentaje) para una muestra aleatoria simple de
40 fondos mutuos. (Sullivan, pg 77)
Histogramas para data continuaPara construir un histograma, primero construimos la distribución de
frecuencias.
• Primero, creamos clases de igual ancho.
• Límite inferior de la primera clase : 8 (un poco menor que el valor
mínimo)
• El ancho de clase : 1.
• Elegimos un ancho de clase que creemos resumirá los datos de
manera eficiente.
Histogramas para data continua
• Distribución de frecuencias e histograma para la tasa de
rendimiento de cinco años (en porcentaje) para una muestra
aleatoria simple de 40 fondos mutuos. (Sullivan, Pag. 77-79)
Histogramas y sesgo
• Dos características presentes en una
distribución de frecuencias y que se
pueden observar en un histograma
– Simetría: cuando la mayor cantidad de datos
se acumulan en el centro del histograma.
– Sesgo o asimetría se refiere al grado en que
los datos tienden a concentrarse en los
valores inferiores al promedio, o en los
valores superiores a éste.
© 2010 Pearson Prentice Hall. All rights reserved2-8
Forma de un histograma
EJEMPLO Interpretar un histograma
2-9
Se realizó un experimento en el que dos dados justos fueron arrojados 100
veces. En cada tirada, se anotó la cantidad de puntos mostrados en los
dados.
1. ¿Cuál fue el resultado más
frecuente del experimento?
2. ¿Cuál fue el menos frecuente?
3. ¿Cuántas veces se observó una
suma 3?
4. ¿Cuántas veces más se observó
una suma de 5 que de 4?
5. Determinar el porcentaje de veces
que se observó una suma de 7.
6. Describir la forma de la distribución.
1.1 - 10
Un géiser es un tipo especial de fuente termal que emite periódicamente una columna de agua caliente y vapor al aire.
Los siguientes datos representan el tiempo entre erupciones (en segundos) de una muestra aleatoria de 45 erupciones del géiser “Old Faithful” en California.
Construya una distribución de frecuencias agrupadas (tabla e histograma) usando como ancho de clase 10.
Erupciones Old Faithful de
California
672 700 711 720 728
678 700 711 721 729
695 702 713 722 730
695 702 714 722 731
695 703 714 723 733
696 703 716 723 735
698 703 718 725 735
699 706 718 726 736
699 708 719 726 738
Actividad: Construir distribuciones de frecuencias agrupadas.
EJEMPLO Interpretar un histograma
2-11
Un vendedor de autos registra el número de autos que vende cada semana
durante el último año. El siguiente histograma de frecuencias muestra los
resultados.
1. ¿Cuál fue el número de autos
que más frecuentemente se
vendió?
2. ¿Durante cuántas semanas
vendió dos autos?
3. Determinar el porcentaje del
tiempo que vendió 2 autos?
4. Describir la forma de la
distribución
El punto medio de la clase o la marca de la clase se
determina sumando los límite inferiores de dos clases
consecutivas y dividiendo el resultado entre 2.
Un polígono de frecuencia se construye localizando para
cada clase el par ordenado compuesto por
(punto medio, frecuencia)
Luego, se unen los puntos consecutivos con segmentos de
recta.
© 2010 Pearson Prentice Hall. All rights reserved 2-12
Otras gráficas
Tiempo
entre
erupciones
Punto medio
de la clase
(marca)
Frecuencia Frecuencia
Relativa
670 – 679 2 0.0444
680 – 689 0 0
690 – 699 7 0.1556
700 – 709 9 0.2
710 – 719 9 0.2
720 – 729 11 0.2444
730 – 739 7 0.1556
© 2010 Pearson Prentice Hall. All rights reserved 2-13
Datos de Old Faithful
Tiempo
entre
erupciones
Punto medio
de la clase
(marca)
Frecuencia Frecuencia
Relativa
670 – 679 675 2 0.0444
680 – 689 685 0 0
690 – 699 695 7 0.1556
700 – 709 705 9 0.2
710 – 719 715 9 0.2
720 – 729 725 11 0.2444
730 – 739 735 7 0.1556
0
2
4
6
8
10
12
665 675 685 695 705 715 725 735
Fre
cu
en
cia
Tiempo entre erupciones
Tiempo (segundos)
Polígono de Frecuencia
© 2010 Pearson Prentice Hall. All rights reserved2-14
En Excel, entramos los datos, resaltamos las columnas y elegimos
insertar bajo Chart un Scatterplot.
0
0.05
0.1
0.15
0.2
0.25
0.3
665 675 685 695 705 715 725 735
Fre
cu
en
ca
rela
tiva
Tiempo entre erupciones
Tiempo (segundos)
© 2010 Pearson Prentice Hall. All rights reserved 2-15
Polígono de Frecuencia (frecuencia relativa)
• La ojiva es una gráfica que representa la
frecuencia acumulada o la frecuencia relativa
acumulada para cada clase.
• La ojiva se construye localizando, para cada
clase, el par ordenado compuesto por
(límite superior de la clase, frecuencia acumulada)
• Luego, se unen los puntos consecutivos con
segmentos de recta.
• Un segmento de línea adicional se dibuja
conectando el límite superior de la clase que
precedería a la primera clase (si existiera).
© 2010 Pearson Prentice Hall. All rights reserved2-16
© 2010 Pearson Prentice Hall. All rights reserved 2-17
Datos de Old Faithful
689
699
709
719
729
739
679
La Ojiva
2-18
0
0.2
0.4
0.6
0.8
1
1.2
669 679 689 699 709 719 729 739
Fre
cu
en
cia
ac
um
ula
da
Tiempo (segundos)
Tiempo entre erupciones
En Excel, entramos los datos, resaltamos las columnas y elegimos
insertar bajo Chart un Scatterplot.
No olvide
añadir un
par
ordenado
adicional a
su tabla.
Ojiva – frecuencia relativa
© 2010 Pearson Prentice Hall. All rights reserved2-19
0
0.2
0.4
0.6
0.8
1
1.2
669 679 689 699 709 719 729 739
Fre
cu
en
cia
re
lati
va
Tiempo (segundos)
Tiempo entre erupciones
Gráficas engañosas
© 2010 Pearson Prentice Hall. All rights reserved2-20
• Las gráficas bien diseñadas son herramientas
muy potentes para la visualización de grandes
cantidades de datos complejos.
• Ayudan a convertir la magnitud de información
que hay disponible en la actualidad en
conocimiento.
• Presentamos errores comunes que se deben
evitar para no producir estadísticas
engañosas.
Gráficas engañosas
© 2010 Pearson Prentice Hall. All rights reserved2-21
Escalas y manipulación de los ejes
• El mensaje de una gráfica puede ser alterada
cambiando la escala de la gráfica.
• Por ejemplo, los datos en las dos gráficas a
continuación son idénticas, pero la escala del
eje-y cambia la impresión de la magnitud de
las diferencias.
Gráficas engañosas
© 2010 Pearson Prentice Hall. All rights reserved2-22
Escalas y manipulación de los ejes
La escala del eje-y en la segunda gráfica cambia
hace que se vea una mayor diferencia entre las
barras.
EJEMPLO Errores al representar la data
Los datos de la tabla a la derecha
representan las expectativas de vida
(en años) de residentes de los
Estados Unidos.
Observe las dos gráficas de los
datos. ¿Cuál es una gráfica
engañosa? ¿Por qué?
Year, x Life Expectancy, y
1950 68.2
1960 69.7
1970 70.8
1980 73.7
1990 75.4
2000 77.0
Source: National Center for Health Statistics
(a) (b)
© 2010 Pearson Prentice Hall. All rights reserved
2-23
Gráficas engañosas
2-24
Efectos Tridimensionales
• Esta gráfica de barras en 3D no tiene una escala en el eje
vertical
• Debido a la perspectiva, parece como si las ventas de
1995 fueran mucho mayores que los de cualquier otro año.
• En realidad, las ventas de1995 fueron iguales a los de
1997.
Source: http://faculty.atu.edu/mfinan/2043/section31.pdf
Gráficas engañosas
2-25
Efectos Tridimensionales
Sería mucho mejor dibujar una gráfica de barras en 2D,
como el que se muestra, con las etiquetas adecuadas en
cada eje.
Source: http://faculty.atu.edu/mfinan/2043/section31.pdf
EJEMPLO Errores al representar la data
Una encuesta que pidió a
los estudiantes de primer
año en varias
universidades de artes
liberales cuánto tiempo
semanal pasan en
preparación para sus clase.
Los resultados de la
encuesta de 2007 se
resumen a la derecha.
Hours Relative Frequency
0 0
1 – 5 0.13
6 – 10 0.25
11 – 15 0.23
16 – 20 0.18
21 – 25 0.10
26 – 30 0.06
31 – 35 0.05
Source:
http://nsse.iub.edu/NSSE_2007_Annual_Report/d
ocs/withhold/NSSE_2007_Annual_Report.pdf
© 2010 Pearson Prentice Hall. All rights reserved2-26
(a) ¿Engañosa o no?
© 2010 Pearson Prentice Hall. All rights reserved2-27
(b) ¿Engañosa o no?
© 2010 Pearson Prentice Hall. All rights reserved2-28
Gráficas engañosas
2-29
Gráficas pictóricas
En primer lugar, note que
este pictograma no provee
una categoría para aquellas
personas que no poseen
una mascota.
Al ser las imágenes de
diferentes tamaños, parece
que más personas poseen
un caballo que cualquier otro
animal.
Gráficas engañosas
2-30
Gráficas pictóricas
¿Por qué se considera engañosa la gráfica de arriba?
Gráficas engañosas
2-31
Gráficas pictóricas
¿Por qué se considera engañosa la gráfica de arriba?
Guía para la construcción de gráficas no-engañosas
• Título de la gráfica y etiquetas en los ejes de gráficos
•Incluya las unidades de medida y una fuente de datos cuando sea
apropiado.
•Evite la distorsión.
•Minimizar la cantidad de espacio en blanco en el gráfico.
•Si las escalas son truncados, asegúrese de indicar claramente
esto al lector.
• Evite el desorden, como las líneas de división excesivos y fondos
innecesarios o imágenes. No distraiga al lector.
•Evite tres dimensiones. Los gráficos tridimensionales pueden
parecer agradables, pero distraer al lector ya menudo conducen a
una mala interpretación de la gráfica.
•No utilice más de un diseño en el mismo gráfico. A veces los
gráficos utilizan un diseño diferente en una porción de la gráfica
para llamar la atención a esa área.
•Evitar gráficos relativos que están desprovistos de datos o
escalas.
© 2010 Pearson Prentice Hall. All rights reserved2-32