capítulo 32 - wordpress.com...valores de datos discretos diferentes o cuando un conjunto de datos...

32
Capítulo Histogramas y otras gráficas © 2010 Pearson Prentice Hall. All rights reserved 3 2

Upload: others

Post on 18-Apr-2020

12 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

Capítulo

Histogramas y

otras gráficas

© 2010 Pearson Prentice Hall. All rights reserved

32

Page 2: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

Histogramas

• El histograma es una gráfica utilizada para

presentar datos cuantitativos y es similar a

la gráfica de barras.

• Se construye dibujando rectángulos para

cada categoría de datos pero los

rectángulos se tocan.

Page 3: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

EjemploUn gerente de Wendy’s quiere saber la cantidad típica de clientes que

llegan durante la hora del almuerzo. Los datos en la siguiente tabla

representan la distribución de frecuencias para el número de clientes

que llegan a Wendy's durante 40 intervalos de 15 minutos

seleccionados al azar durante el almuerzo.

Sullivan (Página 74)

Page 4: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

Histogramas para data continua• Cuando un conjunto de datos consiste de una gran cantidad de

valores de datos discretos diferentes o cuando un conjunto de datos

consta de datos continuos, construimos categorías o clases

utilizando intervalos.

• Ejemplo: El siguiente conjunto representan la tasa de rendimiento

de cinco años (en porcentaje) para una muestra aleatoria simple de

40 fondos mutuos. (Sullivan, pg 77)

Page 5: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

Histogramas para data continuaPara construir un histograma, primero construimos la distribución de

frecuencias.

• Primero, creamos clases de igual ancho.

• Límite inferior de la primera clase : 8 (un poco menor que el valor

mínimo)

• El ancho de clase : 1.

• Elegimos un ancho de clase que creemos resumirá los datos de

manera eficiente.

Page 6: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

Histogramas para data continua

• Distribución de frecuencias e histograma para la tasa de

rendimiento de cinco años (en porcentaje) para una muestra

aleatoria simple de 40 fondos mutuos. (Sullivan, Pag. 77-79)

Page 7: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

Histogramas y sesgo

• Dos características presentes en una

distribución de frecuencias y que se

pueden observar en un histograma

– Simetría: cuando la mayor cantidad de datos

se acumulan en el centro del histograma.

– Sesgo o asimetría se refiere al grado en que

los datos tienden a concentrarse en los

valores inferiores al promedio, o en los

valores superiores a éste.

Page 8: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

© 2010 Pearson Prentice Hall. All rights reserved2-8

Forma de un histograma

Page 9: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

EJEMPLO Interpretar un histograma

2-9

Se realizó un experimento en el que dos dados justos fueron arrojados 100

veces. En cada tirada, se anotó la cantidad de puntos mostrados en los

dados.

1. ¿Cuál fue el resultado más

frecuente del experimento?

2. ¿Cuál fue el menos frecuente?

3. ¿Cuántas veces se observó una

suma 3?

4. ¿Cuántas veces más se observó

una suma de 5 que de 4?

5. Determinar el porcentaje de veces

que se observó una suma de 7.

6. Describir la forma de la distribución.

Page 10: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

1.1 - 10

Un géiser es un tipo especial de fuente termal que emite periódicamente una columna de agua caliente y vapor al aire.

Los siguientes datos representan el tiempo entre erupciones (en segundos) de una muestra aleatoria de 45 erupciones del géiser “Old Faithful” en California.

Construya una distribución de frecuencias agrupadas (tabla e histograma) usando como ancho de clase 10.

Erupciones Old Faithful de

California

672 700 711 720 728

678 700 711 721 729

695 702 713 722 730

695 702 714 722 731

695 703 714 723 733

696 703 716 723 735

698 703 718 725 735

699 706 718 726 736

699 708 719 726 738

Actividad: Construir distribuciones de frecuencias agrupadas.

Page 11: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

EJEMPLO Interpretar un histograma

2-11

Un vendedor de autos registra el número de autos que vende cada semana

durante el último año. El siguiente histograma de frecuencias muestra los

resultados.

1. ¿Cuál fue el número de autos

que más frecuentemente se

vendió?

2. ¿Durante cuántas semanas

vendió dos autos?

3. Determinar el porcentaje del

tiempo que vendió 2 autos?

4. Describir la forma de la

distribución

Page 12: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

El punto medio de la clase o la marca de la clase se

determina sumando los límite inferiores de dos clases

consecutivas y dividiendo el resultado entre 2.

Un polígono de frecuencia se construye localizando para

cada clase el par ordenado compuesto por

(punto medio, frecuencia)

Luego, se unen los puntos consecutivos con segmentos de

recta.

© 2010 Pearson Prentice Hall. All rights reserved 2-12

Otras gráficas

Page 13: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

Tiempo

entre

erupciones

Punto medio

de la clase

(marca)

Frecuencia Frecuencia

Relativa

670 – 679 2 0.0444

680 – 689 0 0

690 – 699 7 0.1556

700 – 709 9 0.2

710 – 719 9 0.2

720 – 729 11 0.2444

730 – 739 7 0.1556

© 2010 Pearson Prentice Hall. All rights reserved 2-13

Datos de Old Faithful

Tiempo

entre

erupciones

Punto medio

de la clase

(marca)

Frecuencia Frecuencia

Relativa

670 – 679 675 2 0.0444

680 – 689 685 0 0

690 – 699 695 7 0.1556

700 – 709 705 9 0.2

710 – 719 715 9 0.2

720 – 729 725 11 0.2444

730 – 739 735 7 0.1556

Page 14: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

0

2

4

6

8

10

12

665 675 685 695 705 715 725 735

Fre

cu

en

cia

Tiempo entre erupciones

Tiempo (segundos)

Polígono de Frecuencia

© 2010 Pearson Prentice Hall. All rights reserved2-14

En Excel, entramos los datos, resaltamos las columnas y elegimos

insertar bajo Chart un Scatterplot.

Page 15: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

0

0.05

0.1

0.15

0.2

0.25

0.3

665 675 685 695 705 715 725 735

Fre

cu

en

ca

rela

tiva

Tiempo entre erupciones

Tiempo (segundos)

© 2010 Pearson Prentice Hall. All rights reserved 2-15

Polígono de Frecuencia (frecuencia relativa)

Page 16: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

• La ojiva es una gráfica que representa la

frecuencia acumulada o la frecuencia relativa

acumulada para cada clase.

• La ojiva se construye localizando, para cada

clase, el par ordenado compuesto por

(límite superior de la clase, frecuencia acumulada)

• Luego, se unen los puntos consecutivos con

segmentos de recta.

• Un segmento de línea adicional se dibuja

conectando el límite superior de la clase que

precedería a la primera clase (si existiera).

© 2010 Pearson Prentice Hall. All rights reserved2-16

Page 17: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

© 2010 Pearson Prentice Hall. All rights reserved 2-17

Datos de Old Faithful

689

699

709

719

729

739

679

Page 18: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

La Ojiva

2-18

0

0.2

0.4

0.6

0.8

1

1.2

669 679 689 699 709 719 729 739

Fre

cu

en

cia

ac

um

ula

da

Tiempo (segundos)

Tiempo entre erupciones

En Excel, entramos los datos, resaltamos las columnas y elegimos

insertar bajo Chart un Scatterplot.

No olvide

añadir un

par

ordenado

adicional a

su tabla.

Page 19: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

Ojiva – frecuencia relativa

© 2010 Pearson Prentice Hall. All rights reserved2-19

0

0.2

0.4

0.6

0.8

1

1.2

669 679 689 699 709 719 729 739

Fre

cu

en

cia

re

lati

va

Tiempo (segundos)

Tiempo entre erupciones

Page 20: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

Gráficas engañosas

© 2010 Pearson Prentice Hall. All rights reserved2-20

• Las gráficas bien diseñadas son herramientas

muy potentes para la visualización de grandes

cantidades de datos complejos.

• Ayudan a convertir la magnitud de información

que hay disponible en la actualidad en

conocimiento.

• Presentamos errores comunes que se deben

evitar para no producir estadísticas

engañosas.

Page 21: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

Gráficas engañosas

© 2010 Pearson Prentice Hall. All rights reserved2-21

Escalas y manipulación de los ejes

• El mensaje de una gráfica puede ser alterada

cambiando la escala de la gráfica.

• Por ejemplo, los datos en las dos gráficas a

continuación son idénticas, pero la escala del

eje-y cambia la impresión de la magnitud de

las diferencias.

Page 22: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

Gráficas engañosas

© 2010 Pearson Prentice Hall. All rights reserved2-22

Escalas y manipulación de los ejes

La escala del eje-y en la segunda gráfica cambia

hace que se vea una mayor diferencia entre las

barras.

Page 23: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

EJEMPLO Errores al representar la data

Los datos de la tabla a la derecha

representan las expectativas de vida

(en años) de residentes de los

Estados Unidos.

Observe las dos gráficas de los

datos. ¿Cuál es una gráfica

engañosa? ¿Por qué?

Year, x Life Expectancy, y

1950 68.2

1960 69.7

1970 70.8

1980 73.7

1990 75.4

2000 77.0

Source: National Center for Health Statistics

(a) (b)

© 2010 Pearson Prentice Hall. All rights reserved

2-23

Page 24: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

Gráficas engañosas

2-24

Efectos Tridimensionales

• Esta gráfica de barras en 3D no tiene una escala en el eje

vertical

• Debido a la perspectiva, parece como si las ventas de

1995 fueran mucho mayores que los de cualquier otro año.

• En realidad, las ventas de1995 fueron iguales a los de

1997.

Source: http://faculty.atu.edu/mfinan/2043/section31.pdf

Page 25: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

Gráficas engañosas

2-25

Efectos Tridimensionales

Sería mucho mejor dibujar una gráfica de barras en 2D,

como el que se muestra, con las etiquetas adecuadas en

cada eje.

Source: http://faculty.atu.edu/mfinan/2043/section31.pdf

Page 26: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

EJEMPLO Errores al representar la data

Una encuesta que pidió a

los estudiantes de primer

año en varias

universidades de artes

liberales cuánto tiempo

semanal pasan en

preparación para sus clase.

Los resultados de la

encuesta de 2007 se

resumen a la derecha.

Hours Relative Frequency

0 0

1 – 5 0.13

6 – 10 0.25

11 – 15 0.23

16 – 20 0.18

21 – 25 0.10

26 – 30 0.06

31 – 35 0.05

Source:

http://nsse.iub.edu/NSSE_2007_Annual_Report/d

ocs/withhold/NSSE_2007_Annual_Report.pdf

© 2010 Pearson Prentice Hall. All rights reserved2-26

Page 27: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

(a) ¿Engañosa o no?

© 2010 Pearson Prentice Hall. All rights reserved2-27

Page 28: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

(b) ¿Engañosa o no?

© 2010 Pearson Prentice Hall. All rights reserved2-28

Page 29: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

Gráficas engañosas

2-29

Gráficas pictóricas

En primer lugar, note que

este pictograma no provee

una categoría para aquellas

personas que no poseen

una mascota.

Al ser las imágenes de

diferentes tamaños, parece

que más personas poseen

un caballo que cualquier otro

animal.

Page 30: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

Gráficas engañosas

2-30

Gráficas pictóricas

¿Por qué se considera engañosa la gráfica de arriba?

Page 31: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

Gráficas engañosas

2-31

Gráficas pictóricas

¿Por qué se considera engañosa la gráfica de arriba?

Page 32: Capítulo 32 - WordPress.com...valores de datos discretos diferentes o cuando un conjunto de datos consta de datos continuos, construimos categorías o clases utilizando intervalos

Guía para la construcción de gráficas no-engañosas

• Título de la gráfica y etiquetas en los ejes de gráficos

•Incluya las unidades de medida y una fuente de datos cuando sea

apropiado.

•Evite la distorsión.

•Minimizar la cantidad de espacio en blanco en el gráfico.

•Si las escalas son truncados, asegúrese de indicar claramente

esto al lector.

• Evite el desorden, como las líneas de división excesivos y fondos

innecesarios o imágenes. No distraiga al lector.

•Evite tres dimensiones. Los gráficos tridimensionales pueden

parecer agradables, pero distraer al lector ya menudo conducen a

una mala interpretación de la gráfica.

•No utilice más de un diseño en el mismo gráfico. A veces los

gráficos utilizan un diseño diferente en una porción de la gráfica

para llamar la atención a esa área.

•Evitar gráficos relativos que están desprovistos de datos o

escalas.

© 2010 Pearson Prentice Hall. All rights reserved2-32