profa. suzi [email protected] euler.mat.ufrgs.br/~camey

24
R Profa. Suzi [email protected] http://euler.mat.ufrgs.br/ ~camey/

Upload: deiondre

Post on 05-Jan-2016

31 views

Category:

Documents


0 download

DESCRIPTION

R. Profa. Suzi [email protected] http://euler.mat.ufrgs.br/~camey/. Aula 02/05/08 Maiores detalhes: http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/. Dados no R Entrando com dados diretamento no R Lendo dados de um arquivo texto Importando dados de outros programas - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Profa. Suzi camey@mat.ufrgs.br euler.mat.ufrgs.br/~camey

R

Profa. Suzi

[email protected]

http://euler.mat.ufrgs.br/~camey/

Page 2: Profa. Suzi camey@mat.ufrgs.br euler.mat.ufrgs.br/~camey

Aula 02/05/08Maiores detalhes: http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/

Dados no R Entrando com dados diretamento no R Lendo dados de um arquivo texto Importando dados de outros programas Carregando dados já disponíveis no R Acesso a planilhas e bancos de dados relacionais

Análise descritiva Descrição univariada Descrevendo o conjunto de dados “milsa” de Bussab & Morettin Uma demonstração de recursos gráficos do R Exercícios

Page 3: Profa. Suzi camey@mat.ufrgs.br euler.mat.ufrgs.br/~camey

Dados no R: Entrando com dados diretamente no R

Definindo vetores: como já vimos!

> a2 <- c(23, 56, 34, 23, 12, 56) > a3 <- 1:10 > a4 <- (1:10) * 10 > a5 <- rep(3, 5) > a6 <- rep(c(5, 8), 3) > a7 <- rep(c(5, 8), each = 3)

Page 4: Profa. Suzi camey@mat.ufrgs.br euler.mat.ufrgs.br/~camey

Dados no R: Entrando com dados diretamente no R

Usando a função scan()y <- scan()   #1: 11   #2: 24   #3: 35   #4: 29   #5: 39   #6: 47   #7:   #Read 6 items

Page 5: Profa. Suzi camey@mat.ufrgs.br euler.mat.ufrgs.br/~camey

Dados no R: Entrando com dados diretamente no R

Usando a função edit()

a8 <- edit(data.frame())

Page 6: Profa. Suzi camey@mat.ufrgs.br euler.mat.ufrgs.br/~camey

Dados no R: Entrando com dados diretamente no R

Corrigindo e/ou alterando dados

> y[3] <- 25

> y[y >= 30] <- 30

Page 7: Profa. Suzi camey@mat.ufrgs.br euler.mat.ufrgs.br/~camey

Dados no R: Lendo dados de um arquivo texto

Primeiro mudar o diretório.

> ex01 <- read.table("gam01.txt")

> ex02 <- read.table("exemplo02.txt", head=T)

> ex03 <- read.table("dadosfic.csv", head=T, sep=":",dec=",")

> read.table("http://www.mat.ufrgs.br/~camey/R/gam01.txt")

Page 8: Profa. Suzi camey@mat.ufrgs.br euler.mat.ufrgs.br/~camey

Dados no R: Importando dados de outros programas Primeiro carregar o pacote “foreign”:

> require(foreign)

read.dbf() para arquivos DBASE read.epiinfo() para arquivos .REC do Epi-Info read.mtp() para arquivos "Minitab Portable Worksheet" read.S() para arquivos do S-PLUS restore.data() para "dumps"do S-PLUS read.spss() para dados do SPSS read.systat() read.dta() para dados do STATA read.octave() para dados do OCTAVE (um clone do MATLAB) Para dados do SAS há ao menos duas alternativas:

O pacote foreign disponibiliza read.xport() para ler do formato TRANSPORT do SAS e read.ssd() pode escrever dados permanentes do SAS (.ssd ou .sas7bdat) no formato TRANSPORT, se o SAS estiver disponível no seu sistema e depois usa internamente read.xport() para ler os dados no R.

O pacote Hmisc disponibiliza sas.get() que também requer o SAS no sistema.

Page 9: Profa. Suzi camey@mat.ufrgs.br euler.mat.ufrgs.br/~camey

Dados no R: Carregando dados já disponíveis no R

O R disponibiliza diversos bancos de dados. Para listá-los use os comandos:

>data()

>data(“pacote”)

Exemplos:> data(mtcars)

> head(mtcars)

> require(MASS)

> data(topo)

> head(topo)

Page 10: Profa. Suzi camey@mat.ufrgs.br euler.mat.ufrgs.br/~camey

Dados no R: Acesso a planilhas e bancos de dados relacionais

> require(RODBC)

> xlscon <- odbcConnectExcel(“Siga.xls”)

> dados1 <- sqlFetch(xlscon,“Plan1”)

> odbcClose(xlscon)

> head(dados1)

Page 11: Profa. Suzi camey@mat.ufrgs.br euler.mat.ufrgs.br/~camey

Análise descritiva: Descrevendo o conjunto de dados “milsa” de Bussab & Morettin

Dados:

http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/Rembrapase9.html#x10-530009.2

entrar com os dados fazer uma análise descritiva

Page 12: Profa. Suzi camey@mat.ufrgs.br euler.mat.ufrgs.br/~camey

Análise descritiva: Descrevendo o conjunto de dados “milsa” de Bussab & Morettin

Criar o banco:> milsa <- edit(data.frame())

> milsa

Alterar o banco:> fix(milsa)

Page 13: Profa. Suzi camey@mat.ufrgs.br euler.mat.ufrgs.br/~camey

Análise descritiva: Descrevendo o conjunto de dados “milsa” de Bussab & Morettin

 Dar nome as categorias:>milsa$civil<-factor(milsa$civil,label=c("solteiro","casado"),levels=1:2)

>milsa$instrucao<-factor(milsa$instrucao,label=c("1oGrau","2oGrau","Superior"),lev=1:3,ord=T)

>milsa$regiao<-factor(milsa$regiao,label=c("capital","interior","outro"),lev=c(2,1,3))

> head(milsa)

Page 14: Profa. Suzi camey@mat.ufrgs.br euler.mat.ufrgs.br/~camey

Análise descritiva: Descrevendo o conjunto de dados “milsa” de Bussab & Morettin

 Criar variáveis:> milsa<-transform(milsa,idade=ano+mes/12)

ou

> milsa$idade<-milsa$ano+milsa$mes/12

Para simplificar a digitação:> attach(milsa)

Page 15: Profa. Suzi camey@mat.ufrgs.br euler.mat.ufrgs.br/~camey

Análise descritiva: Descrição univariada

Variável Qualitativa Nominal > civil

> is.factor(civil)

> civil.tb<-table(civil)

> 100 * table(civil)/length(civil)

> prop.table(civil.tb)

> pie(table(civil))

> civil.mo<-names(civil.tb)[civil.tb == max(civil.tb)]

Page 16: Profa. Suzi camey@mat.ufrgs.br euler.mat.ufrgs.br/~camey

Análise descritiva: Descrição univariada

Variável Qualitativa Ordinal > instrucao

> is.factor(instrucao)

> instrucao.tb <- table(instrucao)

> prop.table(instrucao.tb)

> barplot(instrucao.tb)

> instrucao.mo<-names(instrucao.tb)[instrucao.tb==max(instrucao.tb)]

> median(as.numeric(instrucao))

> levels(milsa$instrucao)[median(as.numeric(milsa$instrucao))]

Page 17: Profa. Suzi camey@mat.ufrgs.br euler.mat.ufrgs.br/~camey

Análise descritiva: Descrição univariada

Variável quantitativa discreta: gráficos> filhos > is.factor(filhos) > is.numeric(filhos)> filhos.tb <- table(filhos) > filhos.tbr <- prop.table(filhos.tb)

> plot(filhos.tb) > plot(filhos.tbr)> filhos.fac <- cumsum(filhos.tbr)> plot(filhos.fac, type = "S")

Page 18: Profa. Suzi camey@mat.ufrgs.br euler.mat.ufrgs.br/~camey

Análise descritiva: Descrição univariada

Variável quantitativa discreta: medidas de locação

> filhos.mo <- names(filhos.tb)[filhos.tb == max(filhos.tb)]

> filhos.md <- median(filhos, na.rm = T)

> filhos.me <- mean(filhos, na.rm = T)

> filhos.me <- mean(filhos, trim = 0.1, na.rm = T)

> filhos.qt <- quantile(filhos, na.rm = T)

trim=0.1: elimina 10% das maiores e menores observações

na.rm=T: necessário pois existem missings

Page 19: Profa. Suzi camey@mat.ufrgs.br euler.mat.ufrgs.br/~camey

Análise descritiva: Descrição univariada

Variável quantitativa discreta: medidas de dispersão > range(filhos, na.rm = T) > filhos.A <- diff(range(filhos, na.rm = T))> var(filhos, na.rm = T) > filhos.dp <- sd(filhos, na.rm = T)> filhos.cv <- 100 * filhos.dp/filhos.me> filhos.qt <- quantile(filhos, na.rm = T) > filhos.ai <- filhos.qt[4] - filhos.qt[2]

> summary(filhos)

Page 20: Profa. Suzi camey@mat.ufrgs.br euler.mat.ufrgs.br/~camey

Análise descritiva: Descrição univariada

Variável quantitativa Contínua:> salario > is.factor(salario) > is.numeric(salario)> range(salario)> nclass.Sturges(salario)> args(cut) > args(cut.default)> salario.tb <- table(cut(salario, seq(3.5, 23.5, l = 8))) > prop.table(salario.tb)

Page 21: Profa. Suzi camey@mat.ufrgs.br euler.mat.ufrgs.br/~camey

Análise descritiva: Descrição univariada

Variável quantitativa Contínua: gráficos

> hist(salario)

> boxplot(salario)

> stem(salario)

Page 22: Profa. Suzi camey@mat.ufrgs.br euler.mat.ufrgs.br/~camey

Análise descritiva: Descrição univariada

Variável quantitativa Contínua: medidas de localização e

dispersão como no caso discreto

Page 23: Profa. Suzi camey@mat.ufrgs.br euler.mat.ufrgs.br/~camey

Análise descritiva: Uma demonstração de recursos gráficos do R

> demo(graphics)

> file.show(system.file("demo/graphics.R",package="graphics"))  

Page 24: Profa. Suzi camey@mat.ufrgs.br euler.mat.ufrgs.br/~camey

Análise descritiva: Exercícios

http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/Rembrapase9.html#x10-660009.6