curso r-2012.pdf

Upload: gary-marsh

Post on 16-Oct-2015

74 views

Category:

Documents


1 download

TRANSCRIPT

  • 5/26/2018 CURSO R-2012.pdf

    1/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA

    UNIDAD 1: Prctica 01-Introduccin al entorno de desarrollo de R

    Pgina 1de 6

    UNA BREVE NOCIN DE R

    R es un conjunto integrado de programas para manipulacin de datos, clculo y grficos. Entre otrascaractersticas dispone de:

    Almacenamiento y manipulacin efectiva de datos, operadores para clculo sobre variables indexadas (Arrays), en particular matrices, una amplia, coherente e integrada coleccin de herramientas para anlisis de datos, posibilidades graficas para anlisis de datos, que funcionan directamente sobre pantalla o

    impresora, y

    un lenguaje de programacin bien desarrollado, simple y efectivo, que incluye condicionales,ciclos, funciones recursivas y posibilidad de entradas y salidas. (Debe destacarse que muchas

    de las funciones suministradas con el sistema estn escritas en el lenguaje R)

    R es en gran parte un vehculo para el desarrollo de nuevos mtodos de anlisis interactivo de datos.

    Como tal es muy dinmico y las diferentes versiones no siempre son totalmente compatibles con las

    anteriores. Algunos usuarios prefieren los cambios debido a los nuevos mtodos y tecnologa que los

    acompaan, a otros sin embargo les molesta ya que algn cdigo anterior deja de funcionar. Aunque

    R puede entenderse como un lenguaje de programacin, los programas escritos en R deben

    considerarse esencialmente efmeros. Sin embargo, tambin existe una interfaz grfica la cual no

    dispone de todas las funciones y operaciones que pueden programarse directamente.

    Fue inicialmente escrito por Robert Gentleman y Ross Ihaka del Departamento de Estadstica de laUniversidad de Auckland en Nueva Zelanda. R actualmente es el resultado de un esfuerzo decolaboracin de personas del todo el mundo. Desde mediados de 1997 se form lo que se conoce comoncleo de desarrollo de R, que actualmente es el que tiene la posibilidad de modificacin directa delcdigo fuente.

    R abarca una amplia gama de tcnicas estadsticas que van desde los modelos lineales a las msmodernas tcnicas de clasificacin pasando por los test clsicos y el anlisis de series temporales.Proporciona una amplia gama de grficos que adems son fcilmente adaptables y extensibles. La

    calidad de los grficos producidos y la posibilidad de incluir en ellos smbolos y frmulasmatemticas, posibilitan su inclusin en publicaciones que suelen requerir grficos de alta calidad.

    El cdigo de R est disponible como software libre bajo las condiciones de la licencia GNU-GPL.Adems est disponible precompilado para una multitud de plataformas. La pgina principal delproyecto es http://www.r-project.org.

  • 5/26/2018 CURSO R-2012.pdf

    2/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA

    UNIDAD 1: Prctica 01-Introduccin al entorno de desarrollo de R

    Pgina 2de 6

    1. Ingresar al programa haciendo doble clic sobre su icono en el escritorio, o desde el men inicio.

    2. Aparece la interfaz grfica (ventana RGui) junto con la Consola de R (ventana R-Console), dentro de

    esta consola se visualiza el prompt > y en ella se escriben los comandos o funciones de los

    clculos a desarrollar, es tambin en esa Consola donde se muestran todos los resultados, con

    excepcin de las figuras que se muestran en ventanas separadas.

    Revisar los mens de la barra de mens Escribir y ejecutar las funciones: help(), help.start(), demo()

  • 5/26/2018 CURSO R-2012.pdf

    3/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA

    UNIDAD 1: Prctica 01-Introduccin al entorno de desarrollo de R

    Pgina 3de 6

    Revisar las demostraciones o demos siguientes: demo(graphics), demo(image), demo(persp)y demo(plotmath), demo(intervals), demo(lattice) ( en los ltimos dos es necesario cargar

    previamente el paquete lattice)

    3. Con objects() o ls() puede listar los objetos creados en el espacio de trabajo o memoria (Workspace),

    al ejecutar los demos anteriores.

    Luego puede eliminar o remover los objetos con rm(list=ls()) o remove(list=objects())

    Note: que tambin se pueden listar y remover objetos desde los mens. Seleccione para esto el

    Men Misc, y dentro de el seleccione listar o remover objetos.

    4. Crear en la raz del disco duro "C:/" o en Mis Documentos una carpeta o directorio con su

    nombre para guardar sus prcticas.

    5. Ver un listado de las carpetas y archivos contenidos en un directorio utilizando las funciones:

    dir(), por ejemplo,dir("C:/", pattern = "^[a-p]", full.names=TRUE)

    Note que la instruccin "^[a-p] le indica a R que liste los archivos que empiezan con letras de la

    a hasta la p.

    O tambin list.files(), por ejemplo,list.files("C:/", pattern = NULL, all.files = TRUE, full.names = FALSE)

    Note que con la instruccin anterior se muestran todos los archivos visibles y no visibles (ocultos y

    protegidos por el sistema).

    6. R utiliza el directorio de trabajo para leer y escribir archivos. Para saber cual es este directorio puede

    utilizar la funcin getwd()(get working directory). Para cambiar el directorio de trabajo, se utiliza lafuncin setwd(); por ejemplo, setwd("C:/Curso R2012").

    Es necesario proporcionar la ruta (path) completa del archivo si este no se encuentra en el

    directorio de trabajo de R, el cual por defecto es "C:/Archivos de programa/R/R-2.13.1".

  • 5/26/2018 CURSO R-2012.pdf

    4/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA

    UNIDAD 1: Prctica 01-Introduccin al entorno de desarrollo de R

    Pgina 4de 6

    7. Ejemplos de clculo numrico en la Consola de R (R-Console)

    Ejemplo 1. Encontrar el resultado de operar: 2 ms 10 por 3 entre 5Escriba en la Consola de R: 2+10*3/5 y oprima la tecla ENTER

    Note que en R se respecta el mismo orden de preferencia de la mayora de los lenguajes de

    programacin, la multiplicacin y la divisin tienen prioridad a la suma y resta.

    Ejemplo 2. Encontrar el resultado de operar: 3 elevado a la potencia 100

    3^100 o tambin format(3^100, sci = FALSE)

    Sci=FALSE le indica a R que muestre todos los dgitos del resultado, de lo contrario (Sci=TRUE)

    solamente se mostrar la representacin cientfica.

    Ejemplo 3. Encontrar el resultado anterior con 15 cifras decimales y guardarlo en la variable y

    y

  • 5/26/2018 CURSO R-2012.pdf

    5/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA

    UNIDAD 1: Prctica 01-Introduccin al entorno de desarrollo de R

    Pgina 5de 6

    TRABAJANDO CON SCRIPT

    A medida que estemos realizando un trabajo de pequea, mediana o de gran complejidad, ser muytil manejar todas las entradas que solicitemos a R en un entorno donde podamos corregirlas,

    retocarlas, repetirlas, guardarlas para continuar el trabajo en otro momento, con otros datos, etc. Esta

    es la funcin del editor de R, a los archivos creados en este editor se les conoce como Script. Es posible

    incluir comentarios que R no leer si utilizamos lneas que comiencen con el carcter # (o en cualquier

    parte de la lnea). Por el contrario, si escribimos cualquier orden no antecedida de # R (sin importar en

    que parte se encuentre) lo reconocer como instrucciones que deben ejecutarse.

    1. Crear un script o guin, como lo indica la figura.

    2. Realizar en el script los siguientes clculos numricos.

    2*(3+4)^2

    sqrt(16)

    abs(-97.6) # abs(x) calcula el valor absoluto de x

    x = 4 # almacena el valor de 4 en la variable x

    x # Muestra el contenido de la variable x

    sqrt(x)-3/2

    p 8)

    p

    q = -6+4 < 3 && 4 != 10

    q

    r = -6+4 > 3 || 4 == 10r

    t

  • 5/26/2018 CURSO R-2012.pdf

    6/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA

    UNIDAD 1: Prctica 01-Introduccin al entorno de desarrollo de R

    Pgina 6de 6

    log(3) # Calcula el logaritmo natural de 3

    log10(8) # Calcula el logaritmo base 10 de 8

    # La sintaxis general es: logb(x, base)logb(16, 7)

    # exp() clcula la funcin exponencial

    exp(1)

    Despus de digitar el script, marque con el ratn las lneas 5, 6 y 7, ejectelas oprimiendo el botn

    derecho del ratn, y luego eligiendo la opcin "Correr lnea o seleccionar". Tambin puede ejecutar

    una lnea posicionando el cursor sobre cualquier lugar de ella y oprimiendo simultneamente las

    teclas Ctrl y R.

    3. Ejecute todas las lneas o instrucciones del script.

    4. Guarde el script en su directorio de trabajo, puede llamarle Script-Practica01, el programa le daautomticamente la extensin .R

    Nota: para guardar el script hay que tener la ventana activa y el Men: Archivo--->Guardar

    5. Salga del programa R, ejecutando la funcin q() o desde Men: Archivo--->Salir

    6. Entre nuevamente al R, recupere el archivo donde guardo el script, como se muestra en la figura, y

    ejecute algunas instrucciones.

    NOTA: Si se escribe el nombre de la funcin sin los parntesis, R mostrar el cdigo de algunasfunciones. Por ejemplo, ls

  • 5/26/2018 CURSO R-2012.pdf

    7/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 02 - Tipos de objetos, operadores y funciones que operan sobre ellos:Vectores, matrices y arreglos (matrices indexadas).

    Pgina 1de 6

    1. CREACIN Y MANEJO DE VECTORES DE DATOS.Este tipo de objetos se denominan estructuras atmicas ya que todos sus elementos son del mismo

    tipo o modo: character (carcter) o numeric (numrico) que puede ser integer (entero), double (real),

    complex (complejo), logical (lgico).

    1.1VECTORES NUMRICOSFORMA 1-Crear un vector numrico vaco y aadirle luego sus elementos.

    Ejemplo 1: v

  • 5/26/2018 CURSO R-2012.pdf

    8/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 02 - Tipos de objetos, operadores y funciones que operan sobre ellos:Vectores, matrices y arreglos (matrices indexadas).

    Pgina 2de 6

    FORMA 4-Crear un vector numrico utilizando la funcin assign(). Ejemplo 1: assign("z", c(x, 0, x)); z (crea un vector en dos copias de x con un cero entre ambas)

    FORMA 5-Crear un vector numrico generando una sucesin de valores.

    Ejemplo 1: s1

  • 5/26/2018 CURSO R-2012.pdf

    9/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 02 - Tipos de objetos, operadores y funciones que operan sobre ellos:Vectores, matrices y arreglos (matrices indexadas).

    Pgina 3de 6

    options(digits=10); u # Permite visualizar un mnimo de 10 dgitos

    OTRAS OPERACIONES: Ejemplo 1: resum

  • 5/26/2018 CURSO R-2012.pdf

    10/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 02 - Tipos de objetos, operadores y funciones que operan sobre ellos:Vectores, matrices y arreglos (matrices indexadas).

    Pgina 4de 6

    2. CREACIN Y MANEJO DE MATRICES.

    2.1CREACIN DE MATRICES NUMRICAS.FORMA 1-Crear una matriz numrica vaca y aadirle luego sus elementos.

    Ejemplo 1: M

  • 5/26/2018 CURSO R-2012.pdf

    11/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 02 - Tipos de objetos, operadores y funciones que operan sobre ellos:Vectores, matrices y arreglos (matrices indexadas).

    Pgina 5de 6

    2.2OPERACIONES CON MATRICES NUMRICAS.MULTIPLICACIN DE MATRICES MATRICES NUMRICAS:

    Ejemplo 1: Multiplicacin de un vector por una matriz: v

  • 5/26/2018 CURSO R-2012.pdf

    12/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 02 - Tipos de objetos, operadores y funciones que operan sobre ellos:Vectores, matrices y arreglos (matrices indexadas).

    Pgina 6de 6

    3. CREACIN Y MANEJO DE MATRICES INDEXADAS (ARRAY).Una variable indexada (array) es una coleccin de datos, por ejemplo numricos, indexada por

    varios ndices. R permite crear y manipular variables indexadas en general y en particular, matrices.

    Una variable indexada puede utilizar no slo un vector de ndices, sino incluso una variable

    indexada de ndices, tanto para asignar un vector a una coleccin irregular de elementos de una

    variable indexada como para extraer una coleccin irregular de elementos.

    Un vector es un array unidimensional y una matiz es un array bidimensional.

    Una variable indexada se construye con la funcin array(), que tiene la forma general siguiente:NombMatriz

  • 5/26/2018 CURSO R-2012.pdf

    13/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 03 - Tipos de objetos: factores, listas y hojas de datos, operadores yfunciones que operan sobre ellos.

    Pgina 1de 7

    1. FACTORES NOMINALES Y ORDINALES.Un factor es un vector utilizado para especificar una clasificacin discreta de los elementos de otrovector de igual longitud. En R existen factores nominales y factores ordinales. Los factores son tilesa la hora de querer hacer contrastes o de calcular medidas de resmenes para variables numricasen distintos niveles de una segunda variable la cual es no numrica.

    FACTORES NOMINALES.

    Ejemplo 1: Variables sexo (categrica) y edad en una muestra de 7 alumnos del curso.# Supongamos que se obtuvieron los siguientes datos:

    sexo

  • 5/26/2018 CURSO R-2012.pdf

    14/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 03 - Tipos de objetos: factores, listas y hojas de datos, operadores yfunciones que operan sobre ellos.

    Pgina 2de 7

    2. CREACIN Y MANEJO DE LISTAS.Una lista es un objeto que contiene una coleccin ordenada de objetos de diferente tipo (vector,matriz, arreglo, funcin, o lista), conocidos como componentes. Se construye con la funcin list(),que tiene la forma general siguiente:

    Lista

  • 5/26/2018 CURSO R-2012.pdf

    15/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 03 - Tipos de objetos: factores, listas y hojas de datos, operadores yfunciones que operan sobre ellos.

    Pgina 3de 7

    Ejemplo 3: Acceso a los elementos de la cuarta componente: lista1[[4]][2] (se indica elelemento a ingresar en el segundo corchete)

    Ejemplo 4: Acceso de las componentes de una lista por su nombre: lista$padre similar alista1["padre"].

    Forma general: Nombre_de_lista$nombre_de_componente Por ejemplo: lista1$padre equivale a lista1[[1]]; y lista1$edad.hijos[2] equivale a lista1[[4]][2].

    Ejemplo 5: Utilizar el nombre de la componente como ndice:lista1[["nombre"]] se puede ver que equivale a lista1$nombreTambin es til la forma: x

  • 5/26/2018 CURSO R-2012.pdf

    16/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 03 - Tipos de objetos: factores, listas y hojas de datos, operadores yfunciones que operan sobre ellos.

    Pgina 4de 7

    correspondientes autovectores. Si quisiramos almacenar slo los autovalores de S, podemos hacerlo siguiente:

    evals

  • 5/26/2018 CURSO R-2012.pdf

    17/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 03 - Tipos de objetos: factores, listas y hojas de datos, operadores yfunciones que operan sobre ellos.

    Pgina 5de 7

    Ejemplo 1: Creacin de un data frame teniendo como columnas tres vectores:En primer lugar generamos los tres vectoresEl primer vector tendr 20 elementos que se obtienen con reemplazamiento de una muestraaleatoria de valores lgicos.

    log

  • 5/26/2018 CURSO R-2012.pdf

    18/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 03 - Tipos de objetos: factores, listas y hojas de datos, operadores yfunciones que operan sobre ellos.

    Pgina 6de 7

    edad

  • 5/26/2018 CURSO R-2012.pdf

    19/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 03 - Tipos de objetos: factores, listas y hojas de datos, operadores yfunciones que operan sobre ellos.

    Pgina 7de 7

    Posteriormente podr desconectar el objeto utilizando la funcin detach(), utilizando comoargumento el nmero de posicin o, preferiblemente, su nombre. Teclee detach(hoja1) y compruebeque la hoja de datos ha sido eliminada de la trayectoria de bsqueda con search().

    Pruebe su puede acceder a una componente slo con su nombre, por ejemplo, Teclee Edad

    TRABAJO CON HOJAS DE DATOSUna metodologa de trabajo para tratar diferentes problemas utilizando el mismo directorio detrabajo es la siguiente:

    Rena todas las variables de un mismo problema en una hoja de datos y d le un nombreapropiado e informativo;

    Para analizar un problema, conecte, mediante attach(), la hoja de datos correspondiente (enla posicin 2) y utilice el directorio de trabajo (en la posicin 1) para los clculos y variablestemporales;

    Antes de terminar un anlisis, aada las variables que deba conservar a la hoja de datosutilizando la forma $ para la asignacin y desconecte la hoja de datos mediante detach();

    Para finalizar, elimine del directorio de trabajo las variables que no desee conservar, paramantenerlo lo ms limpio posible.

    De este modo podr analizar diferentes problemas utilizando el mismo directorio, aunque todosellos compartan variables denominadas x, y o z, por ejemplo.

  • 5/26/2018 CURSO R-2012.pdf

    20/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 04-Importacin y exportacin de datos en R.

    Pgina 1de 7

    Generalmente los datos suelen leerse desde archivos externos y no teclearse desde la consola. Las

    capacidades de lectura de archivos de R son sencillas y sus requisitos son bastante estrictos, por loque hay que tenerlas muy en cuenta, de lo contrario los resultados en la lectura no sern los

    esperados.

    1. USO DE LA FUNCIN READ.TABLE().Ejemplo: Guardar (escribir) determinados datos en un archivo de texto (ASCII) y luego recuperar

    (leer) dicho archivo desde R.

    1) Cambiar el directorio de trabajo a su directorio de trabajo, en el cual ha almacenado sus

    prcticas, desde el men File.

    2) Abrir el R Editor para crear un nuevo script desde el men File.

    3) En la ventana del R Editor, teclee los datos tal como se muestra:

  • 5/26/2018 CURSO R-2012.pdf

    21/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 04-Importacin y exportacin de datos en R.

    Pgina 2de 7

    Observaciones:

    La primera lnea del archivo debe contener el nombre de cada objeto o variable. En cada una de las siguientes lneas, el primer elemento es la etiqueta de la fila, y a

    continuacin deben aparecer los valores de cada variable.

    Si el archivo tiene un elemento menos en la primera lnea que en las restantes,obligatoriamente ser el diseo anterior el que se utilice.

    A menudo no se dispone de etiquetas de filas. En ese caso, tambin es posible la lectura y elprograma aadir unas etiquetas predeterminadas.

    La ltima lnea debe finalizar con ENTER para que R reconozca el fin del archivo.

    4) Oprimir con el puntero del ratn el icono que representa un disquete (Save script as) y guarde

    el archivo con el nombre "datos01.txt". Tambin puede darle el nombre de datos01.dat (otro

    formato soportado por la funcin read.table), e incluso puede leer datos directamente desde

    una pgina de internet, solamente proporcionando la direccin URL completa.

    Tambin puede realizar estos pasos utilizando un editor de texto como NotePad o WordPad.

    5) Recuperar los objetos o datos guardados en el archivo "datos01.txt"

    Entrada1

  • 5/26/2018 CURSO R-2012.pdf

    22/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 04-Importacin y exportacin de datos en R.

    Pgina 3de 7

    NOTA: La funcin read.table() lee los datos y los almacena en una hoja de datos (data.frame), si

    quiere hacer operaciones debe conectar esta hoja a la trayectoria de bsqueda.

    6) Leer los datos contenidos en el archivo mexico.dad

    Mexico

  • 5/26/2018 CURSO R-2012.pdf

    23/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 04-Importacin y exportacin de datos en R.

    Pgina 4de 7

    2. USO DE LA FUNCIN SCAN().La funcin scan() es ms flexible que read.table() y permite realizar lecturas ms complejas, comopuede consultar en la ayuda: help(scan)

    Ejemplo 1: Leer slo las dos primeros objetos o columnas del archivo "datos01.txt"Edat1

  • 5/26/2018 CURSO R-2012.pdf

    24/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 04-Importacin y exportacin de datos en R.

    Pgina 5de 7

    Donde:

    3. USO DE LA FUNCIN READ.CSV().Leer un conjunto de datos de Microsoft Excel pero los datos no estn almacenados en el formato

    conocido de Excel .xls, sino ms bien un formato menos conocido como .csv.

    1) Ingresar al Microsoft Excel y crear la hoja de datos siguiente:

  • 5/26/2018 CURSO R-2012.pdf

    25/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 04-Importacin y exportacin de datos en R.

    Pgina 6de 7

    Observe que debe guardar la hoja Excel en su directorio de trabajo y que el archivo debe ser de

    tipo: CSV(delimitado por comas)

    2) Regresar al entorno de R y recuperar el archivo "HojaE1.csv".

    hojaR

  • 5/26/2018 CURSO R-2012.pdf

    26/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 04-Importacin y exportacin de datos en R.

    Pgina 7de 7

    Seleccionar el archivo (el cual puede contener ms de una hoja de datos)contaminacin_mexico.xls, con la instruccin:datos.xls

  • 5/26/2018 CURSO R-2012.pdf

    27/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 05-Estructuras de control y definicin de funcin en R.

    Pgina 1de 5

    R es un lenguaje de expresiones, en el sentido de que el nico tipo de orden que posee es una

    funcin o expresin que devuelve un resultado. Incluso una asignacin es una expresin, cuyoresultado es el valor asignado y que puede utilizarse en cualquier sitio en que pueda utilizarse unaexpresin.

    Las rdenes pueden agruparse entre llaves, {expr_1;. . .; expr_m}, en cuyo caso el valor del grupo esel resultado de la ltima expresin del grupo que se haya evaluado. Puesto que un grupo es por smismo una expresin, puede incluirse entre parntesis y ser utilizado como parte de una expresinmayor. Este proceso puede repetirse si se considera necesario.

    Las estructuras de control en R son muy similares a las de cualquier lenguaje de programacin.

    1. ESTRUCTURA CONDICIONAL: LA ORDEN IF() Y IFELSE().La construccin condicional if(), la cual es la ms fcil de utilizar tiene alguna de las siguientesformas:

    if(condicion) expr if(condicion) expresion1 else expresion2

    Donde condicion es una expresin que debe producir un valor lgico, y si ste es verdadero,TRUE T, se evala expresion1, si es falso, FALSO F, y se ha escrito la opcin else, que esopcional, se ejecutar expresion2.

    Si la expresion1 expresion2 son complejas, esto es, tienen ms de un comando entonces debenencerrarse entre llaves {}

    A menudo suelen utilizarse los operadores && (AND) y || (OR) en una condicion. En tanto que &y | se aplican a todos los elementos de un vector, && y || se aplican a vectores de longitud uno yslo evalan el segundo argumento si es necesario, esto es, si el valor de la condicioncompleta no

    se deduce del primer argumento.

    Ejemplo 1: if(x>0) y

  • 5/26/2018 CURSO R-2012.pdf

    28/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 05-Estructuras de control y definicin de funcin en R.

    Pgina 2de 5

    ifelse(prueba, si, no)

    Donde:

    prueba: Es un vector lgico o condicin lgica a ser evaluada. si: devuelve valores para los elementos ciertos de "prueba". no: devuelve valores para los elementos falsos de "prueba".

    El uso de if() est limitado a expresiones que no sean vectores. Si estamos evaluando vectores omatrices entonces lo indicado es hacerlo con ifelse() que devuelve un valor con la misma forma queel argumento "prueba" el cual es llenado con elementos seleccionados bien sea del argumento "si" odel argumento "no" dependiendo de si el elemento de "prueba" es "TRUE" O "FALSE", si losargumentos "si" o "no" son muy cortos, entonces sus elementos son reciclados

    Por ejemplo, ejecute las siguientes instruccionesx = 0, x, NA)) # No produce advertenciaifelse(x >= 0, sqrt(x), NA) # Produce un mensaje de advertencia# Comente las diferencias entre cada una de las instrucciones anteriores.

    2. ESTRUCTURAS ITERATIVAS O DE REPETICIN: FOR(), WHILE() Y REPEAT().La funcin for() es una construccin repetitiva que tiene la forma:

    for(nombre in expr1) expr2

    Donde nombrees la variable de control del nmero de iteraciones, expr1 es un vector (a menudode la forma m:n), y expr2 es una expresin, a menudo agrupada, en cuyas sub-expresiones puedeaparecer la variable de control, expr2 se evala repetidamente conforme nombrerecorre los valoresdel vector expr1.

    Ejemplo:x

  • 5/26/2018 CURSO R-2012.pdf

    29/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 05-Estructuras de control y definicin de funcin en R.

    Pgina 3de 5

    Otras estructuras de repeticin son:

    while (condicin) expresin repeat expresin

    La funcin break() se utiliza para terminar cualquier ciclo. Esta es la nica forma (salvo que seproduzca un error) de finalizar un ciclo repeat. La funcin next() deja de ejecutar el resto de unciclo y pasa a ejecutar el siguiente.

    3. FUNCIONES ESCRITAS POR EL USUARIO.El lenguaje R permite al usuario definir objetos que sean funciones. stas se convierten en

    autnticas funciones de R, que se almacenan en una forma interna y se pueden utilizar enexpresiones futuras. Una funcin en R se puede delinear de la siguiente manera:

    Los argumentos pueden ser objetos ("datos", frmulas, expresiones, . . . ), algunos de los cualespueden ser definidos por defecto en la funcin; sin embargo, estos argumentos pueden sermodificados por el usuario con opciones. Una funcin en R puede carecer totalmente deargumentos, ya sea porque todos estn definidos por defecto (y sus valores son modificados conopciones), o porque la funcin realmente no utiliza argumentos.

    Una funcin se define por una asignacin de la formanombreFuncin

  • 5/26/2018 CURSO R-2012.pdf

    30/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 05-Estructuras de control y definicin de funcin en R.

    Pgina 4de 5

    Ejemplo 1: Definir en R la funcin cuadrtica ( ) 23 5 2y f x x x= = + Como nombre de la funcin podemos usar cualquier palabra (que no sea una palabra reservada porR, como log o sum) que puede incluir letras y puntos.

    Llammosle func.cuadratica y definmosla de la manera siguiente:func.cuadratica

  • 5/26/2018 CURSO R-2012.pdf

    31/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 05-Estructuras de control y definicin de funcin en R.

    Pgina 5de 5

    Pruebe la funcin media() con los siguientes vectores:

    x

  • 5/26/2018 CURSO R-2012.pdf

    32/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 04-Importacin y exportacin de datos en R.Usando la interfaz grfica (R-Commander)

    Pgina 1de 5

    Generalmente los datos suelen leerse desde archivos externos y no teclearse desde la consola. Lascapacidades de lectura de archivos de R son sencillas y sus requisitos son bastante estrictos, por lo

    que hay que tenerlas muy en cuenta, de lo contrario los resultados en la lectura no sern los

    esperados.

    1. USO DE LA FUNCIN READ.TABLE().Leeremos los datos contenidos en el archivo "datos01.txt" (el procedimiento para el archivo

    datos01.dat" es similar).

    Para importar los datos. En el Men Datos elegimos el submen Importar datos, y dentrode este seleccionamos la opcin desde archivo datos . Tal y como se muestra en la

    ilustracin.

    Una vez realizado este procedimiento, nos mostrar el siguiente cuadro de dialogo, en elcual se indica la estructura que tiene el archivo (se indican de manera grfica los parmetros

    de la funcin read.table) y el nombre que queremos darle al conjunto de datos.

  • 5/26/2018 CURSO R-2012.pdf

    33/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 04-Importacin y exportacin de datos en R.Usando la interfaz grfica (R-Commander)

    Pgina 2de 5

    Posteriormente nicamente debemos elegir el archivo correspondiente en el cuadro que semuestra. El formato de los archivos pueden ser .txt o .dat.

    Finalmente para visualizar el conjunto de datos y asegurarnos que se han ledocorrectamente. Simplemente damos al clic al botn con la opcin Visualizar conjunto de

    datos y se presentar un cuadro como el que se muestra en la siguiente figura (note que el

    nombre de la ventana corresponde al nombre que le fue asignado al conjunto de datos).

  • 5/26/2018 CURSO R-2012.pdf

    34/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 04-Importacin y exportacin de datos en R.Usando la interfaz grfica (R-Commander)

    Pgina 3de 5

    2. IMPORTANDO DATOS DE EXCEL.Si por el contrario los datos a los cuales deseamos realizar el anlisis estadstico se encuentran en

    formato XLS (versin 2003 de Microsoft Excel), debemos de seguir los siguientes pasos

    (Ilustraremos el procedimiento con el archivo contaminacin_mexico.xls):

    Para importar los datos. En el Men Datos elegimos el submen Importar datos, y dentrode este seleccionamos la opcin desde archivo datos Excel . Tal y como se muestra en

    la ilustracin.

    Al realizar el procedimiento anterior se mostrar el cuadro de dialogo que se muestra en lasiguiente figura. En el nicamente debemos especificar el nombre que le queremos dar al

    conjunto de datos que deseamos importar.

    Finalmente nicamente debemos elegir el archivo en el cual se encuentra el conjunto dedatos que deseamos analizar.

  • 5/26/2018 CURSO R-2012.pdf

    35/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 04-Importacin y exportacin de datos en R.Usando la interfaz grfica (R-Commander)

    Pgina 4de 5

    Para visualizar el conjunto de datos. Se da clic en el botn Visualizar conjunto de datos,obteniendo el siguiente cuadro que se muestra en la figura siguiente.

    3. IMPORTAR DATOS DE SPSS HACIA R.A parte de leer archivos en formato texto y delimitados por comillas, R permite leer datos en una

    gran variedad de formato entre ellos se encuentra archivos el formato de SPSS .sav.

    Para importar los datos. En el Men Datos elegimos el submen Importar datos, y dentrode este seleccionamos la opcin desde datos SPSS. Tal y como se muestra en la

    ilustracin.

  • 5/26/2018 CURSO R-2012.pdf

    36/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 1: Prctica 04-Importacin y exportacin de datos en R.Usando la interfaz grfica (R-Commander)

    Pgina 5de 5

    Al realizar el procedimiento anterior se mostrar el cuadro de dialogo que se muestra en lasiguiente figura. En el nicamente debemos especificar el nombre que le queremos dar al

    conjunto de datos que deseamos importar. Y si deseamos convertir la etiquetas de valores a

    niveles de un factor (use.value.label=T).

    Finalmente nicamente debemos elegir el archivo en el cual se encuentra el conjunto dedatos que deseamos analizar.

    Para visualizar el conjunto de datos. Se da clic en el botn Visualizar conjunto de datos,obteniendo el siguiente cuadro que se muestra en la figura siguiente.

  • 5/26/2018 CURSO R-2012.pdf

    37/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 06 - Anlisis de datos categricos.

    Pgina 1de 3

    ESCALAS DE MEDICIN

    Como la estadstica analiza los datos y stos son producto de las mediciones, necesitamos estudiar

    las escalas de medicin. Este tema es de suma importancia, pues el tipo de escala de medicin

    utilizado para reunir los datos ayuda a determinar el tipo de anlisis a utilizar en los datos. Existen

    cuatro clases de escalas que aparecen de manera comn en las ciencias: nominal, ordinal, de

    intervalo y de razn. Ellas difieren en el nmero de atributos matemticos que poseen.

    Los tipos de datos univariados que vamos a analizar en esta prctica son:

    Categricos. Tienen la caracterstica de que todos los miembros de una categora se consideran

    iguales en lo que se refiere a ese tipo. Este tipo de datos se subdivide en nominales y ordinales.

    Nominales. Los valores que pueden asumir sirven para clasificarlos pero no paraordenarlos. En caso de usarse nmeros, slo se adoptan como nombres o identificaciones.

    Ordinales.Los valores que puede asumir este tipo de datos son categoras que conllevan unjuicio de valor que exige comparar a los diferentes elementos de la muestra con respecto a

    este tipo con el objeto de establecer un orden. Es decir, que los datos se organizan a travs

    de las relaciones de igualdad, mayor o menor.

    1. ANLISIS ESTADSTICO DE DATOS CATEGRICOS.Ejemplo: Se realiza un estudio para conocer las preferencias sobre el tipo de gaseosa que se

    consume: "CC"=Coca Cola, "PC"=Pepsi Cola, "SC"=Salva Cola, para ello se toma una muestra

    aleatoria de 20 personas.

    1) Activar el directorio de trabajo

    getwd()

    setwd("C:/Curso R2012")

    2) Crear un nuevo script y llamarle Script06-DatosCategoricos

    3) Crear un vector con el tipo de gaseosa y otro con la muestra generada aleatoriamente:

    Tipo

  • 5/26/2018 CURSO R-2012.pdf

    38/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 06 - Anlisis de datos categricos.

    Pgina 2de 3

    # genera una muestra de tamao 20 obtenida de los elementos del vector Tipo y los

    elementos se seleccionan con reemplazamiento

    # Suponiendo que se quiere editar o agregar datos

    data.entry(Consumo)

    4) Guarde el vector en un archivo de datos

    # Guardar los datos en su directorio de trabajo

    write(Consumo, "Consumo.txt")

    5) Eliminar los objetos que existen en el espacio de trabajo (Workspace)

    ls()

    rm(list=ls(all=TRUE))

    ls()

    6) Leer o recuperar el vector de datos o archivo de texto

    Consumo

  • 5/26/2018 CURSO R-2012.pdf

    39/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 06 - Anlisis de datos categricos.

    Pgina 3de 3

    9) Realizar un grfico de barras

    # Para las frecuencias absolutasbarplot(frec, main="Grfico de barras", xlab=" Consumo", col=c("yellow", "white", "red"),

    sub="Agosto-2012")

    # Para las frecuencias relativas

    barplot(prop, main="Grfico de barras", xlab=" Consumo\n", col=c("yellow", "white",

    "red"), sub="Agosto-2012")

    10) Realizar un grfico de pastel

    pie(frec, main="Grfico de pastel", xlab="Tipo de Consumo", col=c("yellow", "white",

    "cyan"), sub="Agosto-2012")

    # Se puede especificar nombres para las categoras y el color de los sectores

    names(frec) = c("Coca Cola", "Pepsi", "Salva Cola")

    pie(frec, main="Grfico de pastel", xlab=" Consumo", radius=0.8, col=c("red", "gray",

    "cyan"), sub="Agosto-2012")

    # Los colores se asignas dependiendo del orden en que han sido especificados por names()

    # Note con la instruccin radius se especifica el tamao de la figura, mientras ms cerca de

    uno (uno de menos uno) se encuentre ms grande ser (el ngulo cambia).

    11) Colocar valores numricos en los sectores del grficon

  • 5/26/2018 CURSO R-2012.pdf

    40/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 07-Anlisis estadstico de datos univariados discretos con R.

    Pgina 1de 4

    Ejemplo:

    En cierta colonia de San Salvador se selecciona aleatoriamente una muestra de 30 hogares, al medirel nmero de hijos en cada unidad muestral se obtienen los siguientes datos:

    2 1 2 1 4 2 3 0 2 3

    3 2 1 0 2 4 1 2 1 3

    4 1 2 3 1 5 2 3 1 2

    ANLISIS ESTADSTICO DE LOS DATOS.

    1)# Activar el directorio de trabajo

    getwd()

    setwd("C:/Curso R2012")

    2)# Crear un nuevo Script y llamarle "Script07-DatosDiscretos"

    3)# Crear el vector de datos.

    Hijos

  • 5/26/2018 CURSO R-2012.pdf

    41/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 07-Anlisis estadstico de datos univariados discretos con R.

    Pgina 2de 4

    7)Elaborar el grfico de puntos y diagrama de tallo-hojas (stem-and-leaf)

    # Grfico de puntosstripchart(X, method="stack", vertical=FALSE, col="blue", pch=1, main="Grfico de\n

    puntos", xlab="Nmero de hijos")

    Observacin: method puede ser:"overplot" (los puntos coincidentes son superpuestos)"jitter" (los puntos se ven como alejados o inquietos)"stack" (los puntos coincidentes son apilados, uno tras otro)

    8) # Crear la tabla de frecuencias completa# frecuencias individuales

    fab

  • 5/26/2018 CURSO R-2012.pdf

    42/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 07-Anlisis estadstico de datos univariados discretos con R.

    Pgina 3de 4

    mediana

  • 5/26/2018 CURSO R-2012.pdf

    43/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 07-Anlisis estadstico de datos univariados discretos con R.

    Pgina 4de 4

    # Grfico de cajas (box-plot) es la representacin grfica de los cinco nmeros

    # Horizontalboxplot(X, main="Grfico de caja", ylab="Nmero de hijos\n")

    # Vertical

    boxplot(X, main="Grfico de caja", xlab=" Nmero de hijos\n", plot=TRUE, border="red",

    col="yellow", horizontal=TRUE)

    # NOTE QUE TODOS LOS GRFICOS DE BARRAS Y DE PASTEL SON REALIZADOSAPARTIR DE UNA TABLA DE FRECUENCIA, LA CUAL SE INDICA EN tfre[[2]].TAMBIN SE PUDO UTILIZAR tabla[[2]].

  • 5/26/2018 CURSO R-2012.pdf

    44/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATMATICA.

    UNIDAD 2: Prctica 08-Anlisis estadstico de datos univariados continuos en R.

    Pgina 1de 5

    Ejemplo:Para estudiar el examen de ingreso a la UES, se selecciona aleatoriamente una muestra de 60

    alumnos, las notas de estos alumnos son las siguientes:

    4.47 4.47 3.48 5.0 3.42 3.78 3.1 3.57 4.2 4.5

    3.6 3.75 4.5 2.85 3.7 4.2 3.2 4.05 4.9 5.1

    5.3 4.16 4.56 3.54 3.5 5.2 4.71 3.7 4.78 4.14

    4.14 4.8 4.1 3.83 3.6 2.98 4.32 5.1 4.3 3.9

    3.96 3.54 4.8 4.3 3.39 4.47 3.19 3.75 3.1 4.7

    3.69 3.3 2.85 5.25 4.68 4.04 4.44 5.43 3.04 2.95

    ANLISIS ESTADSTICO DE LOS DATOS.1) Visualiza el directorio por defecto y activa su directorio de trabajo

    getwd()

    setwd("C:/Curso R2012")

    2) Crea un nuevo Script y llmale "Script08-DatosContinuos"

    3) Crea el vector que contendr los datos.

    Notas

  • 5/26/2018 CURSO R-2012.pdf

    45/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATMATICA.

    UNIDAD 2: Prctica 08-Anlisis estadstico de datos univariados continuos en R.

    Pgina 2de 5

    7) Crea la tabla de frecuencias.# Define el nmero k de los intervalos o clases.

    # Usa el Mtodo de Herbert A. Sturges para determinar dicho nmero.

    n

  • 5/26/2018 CURSO R-2012.pdf

    46/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATMATICA.

    UNIDAD 2: Prctica 08-Anlisis estadstico de datos univariados continuos en R.

    Pgina 3de 5

    # Encuentra las frecuencias relativas o proporciones fri.options(digits=4)

    fri

  • 5/26/2018 CURSO R-2012.pdf

    47/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATMATICA.

    UNIDAD 2: Prctica 08-Anlisis estadstico de datos univariados continuos en R.

    Pgina 4de 5

    10) Crea el polgono de frecuenciash

  • 5/26/2018 CURSO R-2012.pdf

    48/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATMATICA.

    UNIDAD 2: Prctica 08-Anlisis estadstico de datos univariados continuos en R.

    Pgina 5de 5

    # Calcula los principales estadsticos.estadisticos

  • 5/26/2018 CURSO R-2012.pdf

    49/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 3: Prctica 09-Anlisis de una variable bidimensional categrica.

    Pgina 1de 4

    Ejemplo:

    Se selecciona aleatoriamente una muestra de 18 personas adultas, para estudiar si existe relacinentre su estado civil y su ocupacin.

    Estado casado soltero soltero casado acompaado soltero casado

    Ocupacin desocupado estudia trabaja estudia trabaja desocupado trabaja

    casado acompaado acompaado casado soltero acompaado casado soltero

    estudia desocupado estudia trabaja estudia desocupado desocupado estudia

    soltero casado soltero

    trabaja desocupado trabaja

    REALICE UN ANLISIS ESTADSTICO DE LOS DATOS.1) Activa tu directorio de trabajo.

    getwd()

    setwd("C:/Curso R2012")

    2) Limpia de objetos el rea de trabajo (Workspace).

    ls()rm(list=ls(all=TRUE))

    ls()

    3) Crea un nuevo Script y llmale "Script09-DatosBivariados1".

    4) Crea en Excel una hoja de datos con dos columnas o variables

    # Recuerda que al guardar la hoja, el tipo de archivo es de extensin .csv(delimitado por comas).

    # Llmale al archivo: HojaCat

    # Otra forma de crear la hoja de datos es la siguiente (Vea la Prctica 04):# Primero crear las dos variables categricas en un editor de texto como NotePad o WordPad,

    colocando nombre a cada columna, y llamndole "HojaCat.txt".

    # Luego puede leer o recuperar este archivo con la funcin read.table()

    HojaCat

  • 5/26/2018 CURSO R-2012.pdf

    50/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 3: Prctica 09-Anlisis de una variable bidimensional categrica.

    Pgina 2de 4

    5) Recupera desde el entorno de R la hoja de datos de Excel.

    HojaCat

  • 5/26/2018 CURSO R-2012.pdf

    51/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 3: Prctica 09-Anlisis de una variable bidimensional categrica.

    Pgina 3de 4

    barplot(tablaCont, main="Grfico de barras (Ocupacin, Estado)", xlab="Ocupacin\n",ylab="Estado civil", beside=TRUE, legend.text=TRUE)

    8) Calcula tablas de proporciones o de probabilidades.

    # Guardar las todas las opciones iniciales y modificar nmero de decimales

    op

  • 5/26/2018 CURSO R-2012.pdf

    52/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 3: Prctica 09-Anlisis de una variable bidimensional categrica.

    Pgina 4de 4

    barplot(table(Estado, Ocupacion), main="Grfico de barras (Ocupacin, Estado)",

    xlab="Ocupacin", ylab="Estado civil", beside=TRUE, legend.text=c("menor que 2", "2-3","mayor que 3"))

    # Note que se puede definir a conveniencia la leyenda que se desea incorporar en el grfico con

    la instruccin legend.text

    10) Realizar la prueba o contraste Chi-cuadrado de independencia

    prueba

  • 5/26/2018 CURSO R-2012.pdf

    53/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 10-Anlisis de una variable bidimensional (categrica, continua)

    Pgina 1de 6

    Ejemplo 1:Se estn estudiando tres procesos (A, B, C) para fabricar pilas o bateras. Se sospecha que el proceso

    incide en la duracin (en semanas) de las bateras, es decir, que la duracin (en semanas) de los

    procesos es diferente. Se seleccionan aleatoriamente cinco bateras de cada proceso y al medirles

    aleatoriamente su duracin los datos que se obtienen, son los siguientes:

    Proceso Duracin (en semanas)

    A 100 96 92 96 92

    B 76 80 75 84 82

    C 108 100 96 98 100

    Realice un anlisis estadstico de los datos.

    Nota: Cuando los datos bivariados se obtiene de una variable cualitativa y otra cuantitativa, losvalores cuantitativos de cada categora o nivel de la variable cualitativa se consideran comomuestras o grupos diferentes. Cada muestra se describe aplicando la representacin ymedidas de resumen de una variable univariada pero de manera conjunta.

    1) Activa tu directorio de trabajo.

    getwd()setwd("C:/Curso R2012")

    2) Crea un nuevo script y llmale "Script10-DatosBivariados2"

    3) Crea un vector de datos para cada proceso descrito en el problema.

    A

  • 5/26/2018 CURSO R-2012.pdf

    54/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 10-Anlisis de una variable bidimensional (categrica, continua)

    Pgina 2de 6

    5) Guarda la hoja de datos en un archivo.write.table(Baterias, file="Baterias.txt", append=FALSE, quote=TRUE, sep=" ", na="NA",

    col.names=TRUE)

    6) Elimina todos objetos que existen en el espacio de trabajo (Workspace)

    ls(); rm(list=ls(all=TRUE)); ls()

    7) Recupera la hoja de datos, para probar si fue guardada.

    Baterias

  • 5/26/2018 CURSO R-2012.pdf

    55/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 10-Anlisis de una variable bidimensional (categrica, continua)

    Pgina 3de 6

    13) Presenta la desviacin estndar de cada proceso.desv

  • 5/26/2018 CURSO R-2012.pdf

    56/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 10-Anlisis de una variable bidimensional (categrica, continua)

    Pgina 4de 6

    Ejemplo 2:Suponga que un estudiante hace una encuesta para evaluar s los estudiantes que fuman estudian

    menos que los que no fuman. Los datos registrados son:

    Persona FumaCantidad

    (horas estudiando)

    Cdigo para el

    intervalo

    1 Si menos de 5 horas 1

    2 No 5-10 horas 2

    3 No 5-10 horas 2

    4 Si ms de 10 horas 35 No ms de 10 horas 3

    6 Si menos de 5 horas 1

    7 Si 5-10 horas 2

    8 Si menos de 5 horas 1

    9 Si ms de 10 horas 3

    10 Si 5-10 horas 2

    REALICE UN ANLISIS ESTADSTICO DE LOS DATOS.

    1) Activa tu directorio de trabajo.

    getwd()

    setwd("C:/Curso R2012")

    2) Crea un nuevo script y llmale "Script11-DatosBivariados3"

    3) Crea dos vectores con los datos.

    Fuma = c("Si","No","No","Si","No","Si","Si","Si","No","Si"); Fuma

    Cantidad = c(1,2,2,3,3,1,2,1,3,2); Cantidad

    4) Crea una hoja de datos que tenga como componentes o columnas los dos vectores.

    Estudia

  • 5/26/2018 CURSO R-2012.pdf

    57/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 10-Anlisis de una variable bidimensional (categrica, continua)

    Pgina 5de 6

    5) Guarda la hoja de datos en un archivo.write.table(Estudia, file="Estudia.txt", append=FALSE, quote=TRUE, sep=" ", na="NA",

    col.names=TRUE)

    6) Elimina los objetos almacenados en el rea de trabajo (Workspace).

    ls()

    rm(list=ls(all=TRUE))

    ls()

    7) Recupera desde el archivo la hoja de datos.

    Estudia

  • 5/26/2018 CURSO R-2012.pdf

    58/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 10-Anlisis de una variable bidimensional (categrica, continua)

    Pgina 6de 6

    11) Construya los grficos de barras de la variable bidimensional.# Grfico de barras apiladas con la frecuencia de Cantidad como altura

    barplot(table(Estudia$Cantidad, Estudia$Fuma), beside = FALSE, horizontal=FALSE, main="Grfico

    de barras (Fuma, Cantidad de horas de estudio)", legend.text =T, xlab="Fuma", ylab="Cantidad de

    horas-estudio")

    # Grfico de barras apiladas con la frecuencia de Fuma como altura

    barplot(table(Estudia$Fuma, Estudia$Cantidad), beside = FALSE, horizontal=FALSE,main="Grfico

    de barras (Cantidad de horas de estudio,Fuma)", legend.text =T, xlab="Cantidad de horas-estudio",

    ylab="Fuma")

    # Grfico de barras no apiladas y colocacin de leyenda

    # Crear un factor para los nombres en la leyenda

    Fuma=factor(Estudia$Fuma); Fuma

    barplot(table(Estudia$Cantidad, Estudia$Fuma), main="Grfico de barras (Fuma, Cantidad de horas

    de estudio)", xlab="Fuma", ylab="Cantidad de horas-estudio", beside=TRUE, legend.text=T)

    barplot(table(Estudia$Cantidad, Estudia$Fuma), main="Grfico de barras (Fuma, Cantidad de horas

    de estudio)", xlab="Fuma", ylab="Cantidad de horas-estudio", beside=TRUE, legend.text=c("menor

    que 5", "5-10", "mayor que 10"))

    12) Realiza la prueba o contraste Chi-cuadrado para las probabilidades dadas

    chisq.test(tablaCont)

    # S p-value > aceptar0

    H : Las variables son independientes

    # Recuerde que las frecuencias esperadas deben ser mayores a 5 para poder utilizarlas.

    # Probabilidades esperadas para la prueba Chi-cuadrada

    chisq.test(tablaCont) $expected

  • 5/26/2018 CURSO R-2012.pdf

    59/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 11-Anlisis de una variable bidimensional cuantitativa

    Pgina 1de 2

    Ejemplo:

    El tiempo que tarda un sistema informtico en red en ejecutar una instruccin depende del nmerode usuarios conectados a l. S no hay usuarios el tiempo es cero. Se tienen registrados los siguientes

    datos:

    No. usuarios Tiempo de ejecucin

    10 1.0

    15 1.2

    20 2.0

    20 2.1

    25 2.2

    30 2.0

    30 1.9

    REALICE UN ANLISIS ESTADSTICO.

    1) Activa tu directorio de trabajo

    getwd()

    setwd("C:/Curso R2012")

    2) Crea un nuevo script y llmale "Script11-DatosBivariados4"

    3) Crea los dos vectores para las dos variables

    # Nmero de usuarios = Variable explicativa o independiente

    usuarios

  • 5/26/2018 CURSO R-2012.pdf

    60/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 11-Anlisis de una variable bidimensional cuantitativa

    Pgina 2de 2

    7) Recupera la hoja de datos.

    Sistema

  • 5/26/2018 CURSO R-2012.pdf

    61/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 12- Recodificacin y Clculo de nuevas variables.

    Pgina 1de 3

    1. RECODIFICACIN DE VARIABLES.Recodificar una variable consiste en construir una nueva variable mediante la transformacin de losvalores de una variable ya existente en el conjunto de datos que se est analizando. La recodificacines, en muchos casos, la base de todo el anlisis estadstico pues de sta depende una correctainterpretacin de la informacin disponible. En ciertas ocasiones, no basta la informacin tal y como larecolectamos o nos la proporcionaron; pues necesitamos realizar ciertas comparaciones, y para poderhacerlas necesitamos crear una nueva variable (recodificar las variables ya existentes); si bien es ciertoestas nuevas variables no tienen la misma informacin que las variables originales, si nos permitenrealizar una anlisis mucho ms elegante y valioso del conjunto de datos.

    Para poder ilustrar como realizar una recodificacin, se utilizar la informacin disponible en elarchivo Densidad_poblacional.xls; el cual contiene la poblacin total (desagregada tambin a nivelde gnero) y la extensin territorial de cada uno de los municipios del pas. ESTE ARCHIVO SEENCUENTRA DISPONIBLE EN EL SERVIDO DE DIGESTYC, Y HA SIDO MODIFCADONICAMENTE PARA FINES DIDCTICOS.

    En la primera columna del archivo, se encuentra un nmero que sirve nicamente para identificar alos municipios. Los municipios estn ordenados por departamento, empezando por los deAhuachapn y terminando con los de La Unin (los primeros 12 datos corresponden al departamentode Ahuachapn, los siguientes 13 al departamento de Santa Ana, etc).

    Lo que deseamos es crear una nueva variable Departamento, con la cual se identifique eldepartamento, a partir de esta primera columna, teniendo en cuenta nicamente el nmero demunicipios en cada municipio, y el orden en el cual se encuentra en los datos. El procedimiento,podra ser:

    1) Activa tu directorio de trabajo

    getwd()setwd("C:/Curso R2012")

    2) Crea un nuevo script y llmale "Script12-Recodificacion"

    3) Recupera desde el archivo la hoja de datos. Cargar el paquete con la siguiente instruccin:

    library(RODBC)

  • 5/26/2018 CURSO R-2012.pdf

    62/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 12- Recodificacin y Clculo de nuevas variables.

    Pgina 2de 3

    Seleccionar el archivo Densidad_poblacional.xls, con la instruccin:Datos.xls

  • 5/26/2018 CURSO R-2012.pdf

    63/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 12- Recodificacin y Clculo de nuevas variables.

    Pgina 3de 3

    2. CLCULO DE NUEVAS VARIABLES.En ocasiones tambin ser necesario realizar el clculo de nuevas variables sobre el conjunto devariables ya existentes (tales como la suma, resta, multiplicacin o divisin, o cualquier otra operacinaritmtica o matemtica entre dos o ms variables).

    1) Para ilustrar esto, realizaremos o calcularemos la densidad poblacional de cada uno de losmunicipios, la cual se define como poblacin total entre rea en kilmetros, informacin quedisponemos en nuestro caso.

    # Creamos la nueva variable llamada DensidadDatos$Densidad = Datos$POBLACION.TOTAL/Datos$AREA

    # Definida como el cociente entre las variables POBLACION.TOTAL y AREA, y nos dice el nmerode personas residiendo por cada kilmetro cuadrado.

    2) ilustremos tambin el clculo del ndice de masculinidad en cada uno de los municipios; el cual sedefine como el nmero de hombres entre el nmero de mujeres (multiplicada por 100 para mejorar lasinterpretaciones).

    # Creamos la nueva variable llamada IND.MASCULINIDADDatos$IND.MASCULINIDAD = Datos$POBLACION.HOMBRES/Datos$POBLACION.MUJERES*100

  • 5/26/2018 CURSO R-2012.pdf

    64/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 06 - Anlisis de datos categricos.Usando la interfaz grfica ( R-Commander)

    Pgina 1de 3

    1. ANLISIS ESTADSTICO DE DATOS CATEGRICOS.Ejemplo: Se realiza un estudio para conocer las preferencias sobre el tipo de gaseosa que se

    consume: "CC"=Coca Cola, "PC"=Pepsi Cola, "SC"=Salva Cola, para ello se toma una muestra

    aleatoria de 20 personas.

    1) Leer o recuperar el vector de datos o archivo de texto.

    El procedimiento para importar datos es como se coment en la prctica 4, indicamos nicamente

    las opciones que deben especificarse para la lectura del archivo Consumo.txt. Nos vamos al

    Men Datos, y dentro de ste, elegimos el Sub Men Importar datos, finalmente se elige desdearchivo de texto tal y como se muestra en la figura.

    Indicamos el nombre a darle al conjunto de datos, en este caso le dejaremos Datos, pero puede ser

    el que se desee. Debemos desmarcar el cheque que corresponde a Nombre de las variables, pues de

    lo contrario el primer dato del archivo se perder y ser reconocido como el nombre de la variable.

  • 5/26/2018 CURSO R-2012.pdf

    65/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 06 - Anlisis de datos categricos.Usando la interfaz grfica ( R-Commander)

    Pgina 2de 3

    2) Crear la tabla de distribucin de frecuencias

    Solamente podemos calcular tablas de distribucin de frecuencia desde la interfaz grfica del R. El

    procedimiento es el siguiente: en el Men Estadsticos, elegimos el sub men Resmenes y dentro

    de ste se elige Conjunto de datos activos, obteniendo el mismo resultado que con la instruccin

    table()

    3) Realizar un grfico de barras

    Para realizar los diagramas de barras el procedimiento es el siguiente: en el Men Grficaselegimos la opcin Grfica de barras, posteriormente nos aparecer un cuadro de dialogo en el que

    nos pide introduzcamos la variable de la cual deseamos generar el grfico (en el caso de que exista

    ms de una). El procedimiento podra ser resumido en la siguiente figura.

    Note que solamente se genera el grfico, no coloca ningn ttulo y los colores se asignan por

    defecto, si queremos especificarlo tendran que usar el cdigo correspondiente.

  • 5/26/2018 CURSO R-2012.pdf

    66/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 06 - Anlisis de datos categricos.Usando la interfaz grfica ( R-Commander)

    Pgina 3de 3

    4) Realizar un grfico de pastel

    El procedimiento para generar un diagrama de pastel es muy similar al utilizado para generar las

    grficas de barras. En el Men Grficas seleccionamos la opcin Grfica de sectores, posteriormente

    solamente debe especificarse la variable de la cual se desea obtener el grfico. Tal y como se

    muestra en la siguiente figura.

  • 5/26/2018 CURSO R-2012.pdf

    67/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 08-Anlisis estadstico de datos univariados cuantitativos en R.Usando la interfaz grfica (R-Commander)

    Pgina 1de 3

    Para ilustrar como llevar a cabo un anlisis estadstico univariado con la interfaz grfica de R, se

    utilizar el conjunto de datos cancer contenidos en el paquete survival. Son datos propios de R, y

    pueden utilizarse con toda libertad.

    Los datos corresponden a la sobrevivencia de pacientes con cncer avanzado tomados de North

    Central Cancer Treatment Group. Puede obtener ms informacin sobre el conjunto de datos

    digitando en R la siguiente instruccin, ?cancer.

    ANLISIS ESTADSTICO DE LOS DATOS.1) Visualiza el directorio por defecto y activa su directorio de trabajo

    getwd()

    setwd("C:/Curso R2012")

    2) Cargando el conjunto de datos al espacio de trabajo.

    Para poder cargar los datos al rea de trabajo y poder trabajar con ellos y realizar cualquier anlisis

    estadstico desde R-Commander, el procedimiento sera el siguiente: en el Men Datos, se elige la

    opcin Conjunto de datos en paquetes, el Men desplegable que se muestra al elegir Leer conjunto

    de datos ..

    Al realizar este procedimiento, nos mostrar un cuadro

    de dialogo como el que se muestra en la figura del lado.

    Solamente debemos especificar el paquete en el que se

    encuentran los datos a cargar (survival), y finalmente

    elegir el conjunto de datos (para nuestro caso es cancer).

    Note que adems puede consultar ayuda sobre el

    conjunto de datos

  • 5/26/2018 CURSO R-2012.pdf

    68/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 08-Anlisis estadstico de datos univariados cuantitativos en R.Usando la interfaz grfica (R-Commander)

    Pgina 2de 3

    Para ilustrar como realizar un anlisis estadstico, se trabajar con la variable age la cual representa

    la edad en aos cumplidos de los pacientes, sin embargo, el procedimiento aqu descrito puede

    realizarse con cualquiera de las variables del conjunto de datos. OBSERVE QUE ALGUNASOPCIONES NO ESTN ACTIVADAS EN LA INTERFAZ GRFICA, PUES DEPEDEN DEL TIPODE DATOS CON LOS QUE SE EST TRABAJANDO. POR EJEMPLO, LOS GRFICOS DEBARRAS Y SECTORES NO ESTN ACTIVADOS, ES DECIR QUE R RECONOCE A LOS DATOSCOMO NUMRICOS CONTINUOS. SIN EMBARGO, PUEDEN REALIZARSE A PARTIR DELPROPIO CDIGO DE R.

    3) Crea el histograma de frecuenciasPara crear un histograma de la variable age, el procedimiento es el siguiente: En el Men Grficas

    seleccionamos la opcin Histograma, tal y como se muestra en la figura siguiente.

    Al realizar el procedimiento anterior se mostrar un

    cuadro de dialogo como el de la figura de lado; en elcual solamente debemos especificar la variable de la

    cual se desea el histograma, y si el histograma se har

    en base a porcentajes (frecuencias relativas) o

    frecuencias absolutas, inclusive podemos especificar el

    nmero de intervalos del histograma.

  • 5/26/2018 CURSO R-2012.pdf

    69/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 08-Anlisis estadstico de datos univariados cuantitativos en R.Usando la interfaz grfica (R-Commander)

    Pgina 3de 3

    4) Calcula los principales estadsticos descriptivos de la variable

    Para obtener un resumen de los principales estadsticos de la variable age, el procedimiento a seguir

    es el siguiente; en el Men Estadsticos elegimos la opcin Resmenes, y dentro del sub Men que se

    muestra dar clic en Resmenes numricos, tal y como se muestra en la figura siguiente. Note que alelegir la opcin Conjunto de datos activo, nos mostrarn los principales estadsticos de todas lasvariables en el conjunto de datos.

    Al realizar el procedimiento anterior nos debe mostrar una ventana

    como la que se muestra en la figura del lado. En la cual solamente

    debemos seleccionar la variable de la cual deseamos obtener los

    estadsticos, y adems note que tenemos la libertad de elegir cules

    estadsticos son las que deseamos calcular.

    5) Otros grficos (Diagramas de cajas).Finalmente si lo que deseamos es obtener los diagramas de

    cajas, el procedimiento es el siguiente. En el Men Grficas

    seleccionamos la opcin Diagrama de caja, y luego finalmente

    le indicamos a qu variable debe graficar, tal y como se

    muestra en la figura a la derecha.

  • 5/26/2018 CURSO R-2012.pdf

    70/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 09-Anlisis de una variable bidimensional categrica.Usando la interfaz grfica (R-Commander)

    Pgina 1de 8

    Para ilustrar como realizar un anlisis estadstico bivariado usando la interfaz grfica de R, se

    utilizar la informacin contenda el archivo demo.sav; el cual contiene informacin de variables

    cualitativas y cuantitativas. Se ilustrar en este documento como realizar un anlisis estadstico

    bivariado cuando las dos variables son cualitativas.

    1. CUALITATIVA VR CUALITATIVA.1) Activa tu directorio de trabajo.

    getwd()setwd("C:/Curso R2012")

    2) Lectura del conjunto de datos.

    El procedimiento para cargar el conjunto de datos es el que se ha venido mencionando. Lo primero

    que debemos hacer es elegir la opcin Importar datos del Men Datos. y dentro de ste elegir la

    opcin desde datos SPSS tal y como se muestra en la figura. Debemos simplemente elegir el

    archivo demo.sav.

    Se trabajar con la variable marital, que representa la situacin marital de las personas (solamente se

    distinguen entre Casadas y no Casadas); y con la variable inccat, la cual representa la categora del

    ingreso en miles de dlares.

  • 5/26/2018 CURSO R-2012.pdf

    71/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 09-Anlisis de una variable bidimensional categrica.Usando la interfaz grfica (R-Commander)

    Pgina 2de 8

    3) Crea una tabla de contigencia o de doble entrada.

    El procedimiento para realizar una tabla de contingencia en la interfaz grfica es el siguiente: en Men

    Estadsticos se elige la opcin Tablas de contingencia, y dentro de este se selecciona Tabla de doble

    entrada. Tal y como se ilustra en la siguiente figura.

    Al realizar el procedimiento descrito anteriormente

    deber aparecernos el cuadro de dialogo que semuestra en la figura de la derecha. En el solamente

    debemos seleccionar las dos variables que se desean

    analizar; note adems que en el mismo cuadro

    presenta la opcin de mostrar la tabla de contingencia

    con totales por fila, por columna o totales generales. Y

    adems permite elegir el contraste Chi-Cuadrado de

    independencia.

    4) Grficos de barras para tabla de contingencia.

    TENGA EN CUENTA QUE LA INTERFAZ GRFICA TIENE MUCHAS LIMITANTES. NO ESPOSIBLE REALIZAR UN GRFICO DE BARRAS A UNA TABLA DE CONTIGENCIA, SI SEDESEA HACERLO DEBE UTILIZARSE EL CDIGO CORRESPONDIENTE A LA FUNCINBARPLOT.

  • 5/26/2018 CURSO R-2012.pdf

    72/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 09-Anlisis de una variable bidimensional categrica.Usando la interfaz grfica (R-Commander)

    Pgina 3de 8

    2. CUALITATIVA VR CUANTITATIVA.Para ilustrar como realizar un anlisis estadstico bidimensional entre una variable cualitativa y una

    cuantitativa se trabajar con la variable marital, que representa la situacin marital de las personas

    (solamente se distinguen entre Casadas y no Casadas); y con la variable income, la cual representa

    el ingreso econmico.

    1) Dibuja un grfico horizontal de puntos para los tres procesos.

    Podemos realizar un grfico de puntos, en el cual podemos observar grficamente si la variable

    income se comporta de manera diferente en cada uno de los niveles de la variable marital. Elprocedimiento para realizar el grfico es el siguiente. En el Men Grficas seleccionar la opcin

    Diagrama de puntos, tal y como se muestra en la figura siguiente.

    2) Muestra un resumen estadstico para los estados maritales.

    El procedimiento es como sigue: en el Men Estadsticos seleccionar la opcin Resmenes, y dentro

    del sub Men que aparecer seleccionar la opcin Resmenes numricos. Tal y como se muestra en

    la figura siguiente.

  • 5/26/2018 CURSO R-2012.pdf

    73/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 09-Anlisis de una variable bidimensional categrica.Usando la interfaz grfica (R-Commander)

    Pgina 4de 8

    Al realizar este proceso deber el cuadro que se

    muestra a la derecha. En solamente debemos

    seleccionar la variable income (la cual es cuantitativa),

    luego dar clic en la casilla Resumir por grupos y

    seleccionar en la ventana que se presente la variable

    marital (la cual es cualitativa). Y con esto se nos

    mostrar un resumen estadstico de la variable income

    para cada nivel de la variable marital.

    3) Dibuja un grfico de cajas (box-plot) para los estado maritales.

    Para realizar un diagrama de caja de una variable cuantitativa en los diferentes niveles de una

    segunda variable la cual es cualitativa, el procedimiento es como sigue. En el Men Grficas

    seleccionamos la opcin Diagrama de cajas, tal y como se muestra en la siguiente figura.

    Al realizar el procedimiento anterior deber aparecernos un

    cuadro de dialogo como el de la figura de la derecha. En el

    nicamente seleccionamos la variable income (cuantitativa),

    posteriormente damos clic en la casilla Grfica por grupos

    (situada encima del botn Aceptar), y en la ventana que se

    mostrar debemos elegir la variable marital (la cual es

    cualitativa)

  • 5/26/2018 CURSO R-2012.pdf

    74/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 09-Anlisis de una variable bidimensional categrica.Usando la interfaz grfica (R-Commander)

    Pgina 5de 8

    4) Grficas de medias.Tambin en algunos casos es til realizar el grfico de las medias, el cual nos da mayor informacin

    a los diagramas de puntos. Para obtenerlo el procedimiento es: en el Men Grficas seleccionamos la

    opcin Grficas de las medias, tal y como se muestra en la figura. Al realizar este procedimiento

    deber aparecernos una ventana en la cual debemos especificar la variable explicativa income

    (nuestra variable cuantitativa), y los factores, es decir, la variable marital (la cual es cualitativa).

    5) Prueba de comparacin de medias (asumiendo normalidad).

    Se utiliza para contrastar las siguientes hiptesis:0 : A BH = , no existe diferencias de los ingresos para los estados maritales.

    1 : A BH , si existe diferencia.

    El procedimiento para llevar a cabo tal contraste de hiptesis es mediante la prueba t; en el Men

    Estadsticos seleccionamos la opcin Medias, y dentro de este seleccionamos la opcin Test t para

    muestras independientes, tal y como se muestra en la siguiente figura. En el cuadro resultante

    nicamente debemos verificar si explicativa income (que es cuantitativa) y el factor marital (que es

    cualitativa); definimos el tipo de prueba (una o dos colas), y especificamos si las varianzas son o no

    iguales.

  • 5/26/2018 CURSO R-2012.pdf

    75/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 09-Anlisis de una variable bidimensional categrica.Usando la interfaz grfica (R-Commander)

    Pgina 6de 8

    3. CUANTITATIVA VR CUALITATIVA.Se usar el conjunto de datos estatura.dat el cual contiene la informacin sobre la estatura y peso de

    estudiantes universitarios, y la altura de sus respectivos padres. Las variables son las siguientes:

    V1 : estatura del estudiante en cm V2 : peso del estudiante en gramos V3 : sexo del estudiantes 1 mujer, 0 hombre V4 : altura de la madre en cm V5 : altura del padre en cm

    Datos tomado del libro Regresin y Diseo de Experimentos de Daniel Pea. Analizaremos si es

    posible construir un modelo que relaciona la estura de un estudiante (variable dependiente) enfuncin de la de su padre (variable explicativa).

    1) Lectura de datos.

    La lectura de los datos se hace de la misma manera como se ha venido haciendo en las prcticas

    anteriores, y las cuales se encuentran explicadas con mayor detalle en la prctica 4.

    2) Muestra un resumen de principales estadsticos de las variables.

    Lo primero que podra interesarnos es encontrar la matriz de correlaciones entre la estatura de un

    estudiante y la de su padre. El procedimiento para obtenerla es el siguiente; en el Men Estadsticoseleccionamos la opcin Resmenes y dentro de ste la opcin Matriz de correlaciones, tal y como

    se muestra en la figura siguiente (izquierda). Posteriormente solo debemos seleccionar las variables

    en la ventana que se mostrar. Tambin podemos obtener los principales estadsticos para ambas

    variables de manera conjunta; el procedimiento es como sigue: en el Men Estadsticos

    seleccionamos la opcin Resmenes y dentro de ste la opcin Resmenes numricos, en el cuadro

    que se mostrar nicamente debemos elegir las variables correspondientes, tal y como se muestra en

    la siguiente figura (derecha).

  • 5/26/2018 CURSO R-2012.pdf

    76/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 09-Anlisis de una variable bidimensional categrica.Usando la interfaz grfica (R-Commander)

    Pgina 7de 8

    3) Elabora un grfico de dispersin para analizar alguna relacin entre las variables.

    Para elaborar un diagrama de dispersin, el procedimiento es: en el Men Grficas seleccionamos la

    opcin Diagrama de dispersin (del mismo modo podra seleccionarse la opcin Grfica XY), tal y

    como se muestra en la figura siguiente.

    Al realizar el procedimiento

    anterior nos deber mostrar uncuadro de dialogo como el que

    aparece a la derecha. En el debemos

    especificar la variable explicativa

    (bajo la opcin de variable x), y la

    variable dependiente (bajo la opcin

    de variable y). Note que tambin

    permite la opcin de incorporar la

    recta de regresin estimada por

    mnimos cuadrados, y adems la

    opcin de identificar puntos en elgrfico. Y muchas otras opciones

    que pueden ser tiles para dar una

    mayor presentacin a los

    resultados.

  • 5/26/2018 CURSO R-2012.pdf

    77/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 09-Anlisis de una variable bidimensional categrica.Usando la interfaz grfica (R-Commander)

    Pgina 8de 8

    4) Aplica la funcin lm() para encontrar el modelo lineal que se ajusta a los datos.El procedimiento es el siguiente: en el Men Estadsticos seleccionamos la opcin Ajuste de modelos,

    y dentro de ste, elegimos Regresin lineal. Tal y como se muestra en la siguiente figura.

    Posteriormente de realizarlo nos mostrar un cuadro de dialogo en el cual nicamente debemos

    especificar la variables dependiente (V1 estatura del estudiante) y la explicativa (V5 estatura del

    padre). Mostrando automticamente la estimacin de los parmetros y las principales medidas de

    resumen del modelo.

    5) Efecta una anlisis de variabilidad del modelo o descomposicin de la varianza.

    Para poder visualizar la tabla ANOVA del modelo y evaluar el ajuste global, el procedimiento sera el

    siguiente: en el Men Modelos elegimos la opcin Test de hiptesis y dentro de ste seleccionamos la

    opcin Tabla ANOVA, tal y como se muestra en la figura siguiente.

  • 5/26/2018 CURSO R-2012.pdf

    78/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 12- Recodificacin y Clculo de nuevas variables.Mediante la interfaz grfica (R-Commander)

    Pgina 1de 3

    1. RECODIFICACIN DE VARIABLES.Para poder ilustrar como realizar una recodificacin, se utilizar la informacin disponible en elarchivo Densidad_poblacional.xls; el cual contiene la poblacin total (desagregada tambin a nivelde gnero) y la extensin territorial de cada uno de los municipios del pas.

    Lo que deseamos es crear una nueva variable, llamada Departamento, con la cual se identifique eldepartamento de cada uno de los municipios; teniendo en cuenta nicamente el nmero demunicipios en cada municipio, el orden en el cual se encuentra en los datos y el nmero asignado con

    la variable COD.MUNICIPIO. El procedimiento, podra ser:

    1) Lectura del archivo la hoja de datos.El procedimiento de lectura ya fue descrito anteriormente.

    2) Hacer la recodificacin.Para realizar la recodificacin de la variable el procedimiento sera el siguiente. En el Men Datos,elegir la opcin Modificar variables del conjunto de datos activos, y dentro de ste. Elegir la opcin

    Recodificar variables. Tal y como se muestra en la siguiente figura.

  • 5/26/2018 CURSO R-2012.pdf

    79/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 12- Recodificacin y Clculo de nuevas variables.Mediante la interfaz grfica (R-Commander)

    Pgina 2de 3

    Al realizar el procedimiento anterior, debermostrarnos el cuadro que se muestra a laderecha. Lo primero que debemos hacer eselegir la variable a recodificar(COD.MUNICIPIO), dar el nombre para lanueva variable (Departamento); finalmenteintroducir los criterios de codificacin, paraesto puede copiar la instruccin

    correspondiente y separar cada valor por unsalto de lnea, tenga en cuenta que la nicadiferencia de hacerlo mediante cdigo es que sereemplazan las comillas simples por lascomillas dobles. El procedimiento se ilustra enla figura de alado.

    2.

    CLCULO DE NUEVAS VARIABLES.

    En ocasiones tambin ser necesario realizar el clculo de nuevas variables sobre el conjunto devariables ya existentes.

    1) Calcularemos la densidad poblacional de cada uno de los municipios, se define como poblacintotal entre superficie en kilmetros.

    El procedimiento para crear una variable

    es el siguiente. En el Men Datos,elegimos la opcin Modificar variables delconjunto de datos activos, y dentro desta, se elige la opcin Calcular nuevavariable. Tal y como se muestra en lafigura de la derecha.

  • 5/26/2018 CURSO R-2012.pdf

    80/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 2: Prctica 12- Recodificacin y Clculo de nuevas variables.Mediante la interfaz grfica (R-Commander)

    Pgina 3de 3

    Al realizar el procedimiento anterior,deber mostrarnos un cuadro dedialogo como el que se muestra a laderecha. Simplemente debemos digitarel nombre que le daremos a la nuevavariable. Como la variable que sedesea calcular es la divisin de dosvariables ya existente, lo que debemoshacer es lo siguiente: damos doble clic

    a la variable POBLACIN.TOTAL yautomticamente se mostrar abajo delrotulo Expresin a calcular, luego digitamos / , con el cual indicamos que realizar la divisin entredos variables. Y finalmente damos doble clic en la variable AREA. Tal y como se muestra en la figura.

    De una manera similar podramos calcular el ndice de masculinidad para el conjunto de municipios.

  • 5/26/2018 CURSO R-2012.pdf

    81/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 3: Prctica 13 - Espacios muestrales

    Pgina 1de 4

    GENERACIN DE ESPACIOS MUESTRALES Y DE MUESTRAS ALEATORIAS.

    La funcin sample(): permite seleccionar una muestra aleatoria de tamao n , especificado el vector x

    desde el cual tomar la muestra (normalmente es un vector de caracteres aunque no es indispensable),

    la seleccin puede ser con o sin reemplazo. La sintaxis general de esta funcin es:

    sample(X, size, replace = FALSE, prob = NULL)

    donde

    X: es el vector del cual se seleccionan la muestra (podra decirse que representa el marcomuestral).

    size: es el tamao de la muestra. replace = FALSE indica que la muestra en sin reposicin, si fuera TRUE sera con reposicin. prob: vector de pesos o probabilidad de obtener los elementos del vector X que est siendo

    muestreado (en caso de que los elementos tengan distintas probabilidades).

    1) Activa tu directorio de trabajogetwd()

    setwd("C:/Curso R2012")

    2) Crea un nuevo Script y llmale "Script13-Probabilidades1"

    3) Simular 10 lanzamientos de una moneda

    # vector del cual se tomar la muestra

    moneda

  • 5/26/2018 CURSO R-2012.pdf

    82/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 3: Prctica 13 - Espacios muestrales

    Pgina 2de 4

    espacio

  • 5/26/2018 CURSO R-2012.pdf

    83/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 3: Prctica 13 - Espacios muestrales

    Pgina 3de 4

    # con la instruccin rep(c("A", 2:10, "J", "Q", "K"), 4) se crea un vector de caracteres, el primerelemento es A, los elementos de segundo al undcimo son nmero del 2 al 10, los siguientes

    elementos son J, Q y K; y los elementos se repiten en este orden cuatro veces.

    # con la funcin paste se crea un vector en el que sus elementos son: un elemento del vector

    rep(c("A", 2:10, "J", "Q", "K"), 4) concatenado con uno del vector c("OROS","COPAS", "BASTOS",

    "ESPADAS").

    El primer elemento de rep(c("A", 2:10, "J", "Q", "K"), 4) con el primero dec("OROS","COPAS", "BASTOS", "ESPADAS").

    El segundo elemento de rep(c("A", 2:10, "J", "Q", "K"), 4) con el segundo dec("OROS","COPAS", "BASTOS", "ESPADAS").

    El tercer elemento de rep(c("A", 2:10, "J", "Q", "K"), 4) con el tercero dec("OROS","COPAS", "BASTOS", "ESPADAS").

    Y as sucesivamente.

    # se define el tamao de la muestran

  • 5/26/2018 CURSO R-2012.pdf

    84/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 3: Prctica 13 - Espacios muestrales

    Pgina 4de 4

    8) Escriba una funcin que reciba los nmeros enteros entre 1 y 500 inclusive, la funcin retornar elespacio formado por los nmeros divisibles entre 7. Despus de llamar a esta funcin se extraer

    aleatoriamente 12 de estos nmeros, con reemplazo.

    # definiendo la funcin que generar el espacio formado

    espacio

  • 5/26/2018 CURSO R-2012.pdf

    85/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 3: Prctica 14 - Distribuciones de probabilidad discreta

    Pgina 1de 8

    1. INTRODUCCIN A LAS DISTRIBUCIONES DE PROBABILIDAD.

    La teora de la probabilidad y de variable aleatoria van a permitir establecer un amplio catlogo de

    modelos tericos, tanto discretos como continuos, con los cuales se van a poder asimilar muchas de las

    situaciones de la vida real. El estudio de los modelos tericos, incluyendo la caracterizacin a travs

    de sus parmetros, el clculo de probabilidades en sus distintos formatos y la generacin de nmeros

    aleatorios, van a facilitar enormemente el anlisis de estas situaciones reales, algunos ejemplos de

    estos fenmenos son:

    Si se contesta al azar un examen tipo test de 10 preguntas, donde cada una de ellas tiene 4posibilidades siendo slo una de ellas la correcta, qu nmero de aciertos es ms probable?

    Se sabe que las bombillas de bajo consumo de 14 w tienen una vida media til de 10,000 horas,mientras que las bombillas clsicas por incandescencia de 60 w tienen una vida media til de

    1,000 horas. Si cada da se encienden unas 4 horas cul es la probabilidad de que despus de

    un ao estn funcionando las dos?, ninguna de las dos?, al menos una de las dos?

    El primer problema a resolver ser la eleccin del modelo terico apropiado para cada caso en estudio.

    Para tener un buen manejo matemtico de las distintas situaciones que se puedan plantear dada la

    distinta naturaleza y la diversidad de los resultados que proporcionan los experimentos, se necesita

    realizar una abstraccin cuantificada del experimento. Esto lleva a una primera gran clasificacinentre modelos de probabilidad discretos y continuos.

    Las probabilidades asociadas a cada uno de los valores de la variable aleatoria pueden ser

    organizadas como una distribucin de probabilidad, expresndose mediante una tabla, una grfica o

    una frmula, denominndose en este ltimo caso, a la regla de correspondencia valores

    probabilidades, funcin de probabilidad.

    Como sabemos, los nmeros aleatorios son descritos por una distribucin. Esto es, alguna funcin la

    cual especifica la probabilidad que un nmero aleatorio este en algn rango, por ejemplo

    ( )P a X b< < . Frecuentemente es dada por una densidad de probabilidad (en el caso continuo) o por

    una funcin masa de probabilidad ( ) ( )P X x p x= = en el caso discreto. Con R podemos obtener

    nmeros seleccionados aleatoriamente de diferentes distribuciones, para ello slo tenemos que

    familiarizarnos con los parmetros que hay que dar a las funciones tal como la media, o una

    proporcin, etc (dependiendo de la distribucin que se est considerando y de lo que se est

    analizando).

  • 5/26/2018 CURSO R-2012.pdf

    86/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 3: Prctica 14 - Distribuciones de probabilidad discreta

    Pgina 2de 8

    2 DISTRIBUCIONES DISCRETASDISTRIBUCIN PARMETROS SINTASIS EN R

    Binomial

    x= nmero de xitos

    size=nmero de ensayos

    p=proporcin de xitos

    lower.tail= TRUE ( )P X x

    lower.tail= FALSE ( )P X x

    n= tamao de la muestra

    dbinom(x, size, prob, log = FALSE) pbinom(x, size, prob, lower.tail =

    TRUE, log.p = FALSE)

    qbinom(p, size, prob, lower.tail =TRUE, log.p = FALSE)

    rbinom(n, size, prob)

    Geomtrica

    x =ensayos necesarios paraobtener el primer xito

    p=proporcin de xitos

    lower.tail=TRUE ( )P X x

    lower.tail= FALSE ( )P X x

    n= tamao de la muestra

    dgeom(x, prob, log = FALSE) pgeom(x, prob, lower.tail = TRUE,

    log.p = FALSE)

    qgeom(p, prob, lower.tail = TRUE,log.p = FALSE)

    rgeom(n, prob)

    Hipergeomtrica

    x=objetos seleccionados tipo m

    (primer tipo)

    m=total de objetos (primer tipo)

    n= total de objetos (segundo

    tipo)

    y= el nmero total de objetos

    seleccionados primer tipo y

    segundo tipo

    size=tamao de la muestra

    dhyper(x, m, n, y, log = FALSE) phyper(x, m, n, y, lower.tail = TRUE,

    log.p = FALSE)

    qhyper(p, m, n, y, lower.tail = TRUE,log.p = FALSE)

    rhyper(size, n, m, n,y)

    Poisson

    x = valor cualqueira

    p=probabilidadlambda=media de la

    distribucin

    n= tamao de la muestra

    dpois(x, lambda, log = FALSE)

    ppois(x, lambda, lower.tail = TRUE,log.p = FALSE)

    qpois(p, lambda, lower.tail = TRUE,log.p = FALSE)

    rpois(n, lambda)

  • 5/26/2018 CURSO R-2012.pdf

    87/208

    UNIVERSIDAD DE EL SALVADOR.FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE

    DEPARTAMENTO DE MATEMTICA.

    UNIDAD 3: Prctica 14 - Dist