comandos básicos

2
Comandos básicos Vocabulário básico objeto – as coisas que você cria e manipula no R vetor – uma lista de dados em uma dimensão. P. ex., “2, 3, 3, 5, 987”. dataframe – um conjunto de dados em duas dimensões (colunas e linhas), planilha. matriz – o mesmo que dataframe, mas com apenas um tipo de dado (quantitativo ou categórico). observação – normalmente, são as linhas do dataframe variável – normalmente, sãso as colunas do dataframe Aritmética soma: 4+4 subtração 234-132 divisão: 25/5 multiplicação: 3332*543 potenciação: 3^6 raiz quadrada: sqrt(16) demais raízes: 9^1/3 Não esqueça: para expressões complexas, use parênteses: (4+4)-((78*6)/15) Básicos <- - atribuir P. ex.: x <- 4+5 x<-c(1,3,7) - cria um vetor chamado x, com os números indicados ?comando - ajuda Não esqueça: no console usa-se enter após o comando, no editor usa-se ctrl+R Criação de dados d<-c(1,2,3) – cria um vetor com os números indicados d<-1:45 - cria um vetor de 1 a 45 d<-seq(1,45) – também cria um vetor de 1 a 45 d<-rep(5,10) – gera um vetor de dez números 5 d<-data.frame(v1,v2) – cria um dataframe com os vetores v1 e v2 d<-rbind(dados, v1) – insere v1 como uma nova linha d<-cbind(dados, v1) – insere v1 como uma nova coluna Manipulação dos dados dim(dados) – mostra o número de linhas e colunas do dataframe names(dados) – mostra o nome das colunas dados$nomedavariavel – para se referir a determinada variável do dataframe length(vetor) – mostra o tamanho table(dados$variavel) sort(vetor) – ordena os dados de um vetor em ordem crescente rev(vetor) – ordena os dados de um vetor em ordem decrescente levels(dados$variavel) str(dados) – mostra o tipo das variáveis attach(dados) – torna determinado conjunto de dados o principal, serve para se referir a determinada variável sem precisar do “dados$”. detach(dados) – faz o conjunto de dados deixar de ser o principal Subselecionar no conjunto de dados vetor[n] – retorna o elemento da posição n do vetor vetor[-n] – retorna tudo menos o elemento da posição n do vetor vetor[1:n] – retorna os primeiros n elementos do vetor vetor[c(2,3,6,18)] – retorna os elementos das posições indicadas vetor[vetor > 3] – retorna os elementos maiores do que três vetor[vetor > 3 & vetor < 56] dados[3,7] – retorna o elemento da linha 3 coluna 7 dados[3,]- retorna todas as colunas da linha 3 dados[,9]- dados[2:5, 1:3] – retorna as linhas 2 a 5 das colunas 1 a 3 do dataframe dados1<-subset(dados, dados$variavel>50) – cria outro conjunto de dados selecionando um subconjunto do primeiro Estatítica max(vetor) – valor máximo do vetor min(vetor) - valor mínimo do vetor mean(vetor) - valor médio do vetor median(vetor) – valor mediano do vetor sum(vetor) – somatório de todos os valores do vetor var(vetor) – variância do vetor sd(vetor) – desvio padrão do vetor cor(vetor1, vetor2) – correlação entre dois vetores table(vetor) – conta as observações em cada nível da variável table(vetor1, vetor2) – cria uma tabela de contingência sort() - ordena os dados round(vetor, 2) – arredonda os dados do vetor para 2 casas decimais summary(dados) – resumo estatístico dos dados

Upload: carlos-carlos

Post on 17-Feb-2016

214 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: comandos básicos

Comandos básicos

Vocabulário básicoobjeto – as coisas que você cria e manipula no Rvetor – uma lista de dados em uma dimensão. P. ex., “2, 3, 3, 5, 987”.dataframe – um conjunto de dados em duas dimensões (colunas e linhas), planilha.matriz – o mesmo que dataframe, mas com apenas um tipo de dado (quantitativo ou categórico).observação – normalmente, são as linhas do dataframe variável – normalmente, sãso as colunas do dataframe

Aritméticasoma: 4+4subtração 234-132divisão: 25/5multiplicação: 3332*543potenciação: 3^6raiz quadrada: sqrt(16)demais raízes: 9^1/3

Não esqueça: para expressões complexas, use parênteses: (4+4)-((78*6)/15)

Básicos<- - atribuir P. ex.: x <- 4+5x<-c(1,3,7) - cria um vetor chamado x, com os números indicados?comando - ajuda

Não esqueça: no console usa-se enter após o comando, no editor usa-se ctrl+R

Criação de dadosd<-c(1,2,3) – cria um vetor com os números indicadosd<-1:45 - cria um vetor de 1 a 45d<-seq(1,45) – também cria um vetor de 1 a 45d<-rep(5,10) – gera um vetor de dez números 5d<-data.frame(v1,v2) – cria um dataframe com os vetores v1 e v2d<-rbind(dados, v1) – insere v1 como uma nova linhad<-cbind(dados, v1) – insere v1 como uma nova coluna

Manipulação dos dadosdim(dados) – mostra o número de linhas e colunas do dataframenames(dados) – mostra o nome das colunasdados$nomedavariavel – para se referir a determinada variável do dataframe length(vetor) – mostra o tamanhotable(dados$variavel)sort(vetor) – ordena os dados de um vetor em ordem crescenterev(vetor) – ordena os dados de um vetor em ordem decrescentelevels(dados$variavel)str(dados) – mostra o tipo das variáveis

attach(dados) – torna determinado conjunto de dados o principal, serve para se referir a determinadavariável sem precisar do “dados$”.detach(dados) – faz o conjunto de dados deixar de ser o principal

Subselecionar no conjunto de dadosvetor[n] – retorna o elemento da posição n do vetorvetor[-n] – retorna tudo menos o elemento da posição n do vetorvetor[1:n] – retorna os primeiros n elementos do vetorvetor[c(2,3,6,18)] – retorna os elementos das posições indicadasvetor[vetor > 3] – retorna os elementos maiores do que trêsvetor[vetor > 3 & vetor < 56]dados[3,7] – retorna o elemento da linha 3 coluna 7dados[3,]- retorna todas as colunas da linha 3dados[,9]- dados[2:5, 1:3] – retorna as linhas 2 a 5 das colunas 1 a 3 do dataframe dados1<-subset(dados, dados$variavel>50) – cria outro conjunto de dados selecionando um subconjunto do primeiro Estatíticamax(vetor) – valor máximo do vetormin(vetor) - valor mínimo do vetormean(vetor) - valor médio do vetormedian(vetor) – valor mediano do vetorsum(vetor) – somatório de todos os valores do vetorvar(vetor) – variância do vetorsd(vetor) – desvio padrão do vetorcor(vetor1, vetor2) – correlação entre dois vetores table(vetor) – conta as observações em cada nível da variáveltable(vetor1, vetor2) – cria uma tabela de contingênciasort() - ordena os dadosround(vetor, 2) – arredonda os dados do vetor para 2 casas decimaissummary(dados) – resumo estatístico dos dados

Page 2: comandos básicos

Gráficosbarplot(x) – gráfico de barrasboxplot(x) - boxplothist(x) - histograma plot(x,y) - diagrama de dispersão plot(dados) – matriz de diagrama de dispersão com todas as variáveis

Modelagemmodelo<-lm(y~x) – cria um modelo linear usando regressão simplesmodelo<-lm(y~x1+x2) – cria um modelo linear usando regressão múltiplasummary(modelo) – mostra as informações do modelo (coeficientes, estatísticas t e F, valor-p, R2)

Ler e salvar dadosdados<-read.table(“clipboard”, h=T) - ler dados copiados com ctrl+CNão esqueça: o argumento h=T ou h=F indica se a primeira linha deve ser considerada como título das variáveis

dados<-read.table(“nomedoarquivo.txt”, h=T) – ler dados de arquivos txtNão esqueça: não se esqueça de definir o diretório

getwd() - indica o diretório atualsetwd("C:/Users/Perfil/dados") - define o diretório. Pode ser feito com shift+ctrl+HNão esqueça: as barras de endereço usadas no R têm direção de diferente do Windows: assim /, e não \

dados<-read.csv(“nomedoarquivo.csv”, h=T) write.table(dados, “nomedoarquivo.txt”) - salva o objeto como txtwrite.csv(dados, “nomedoarquivo.csv”) - salva o objeto como csv

Pacotesinstall.packages(“nomedopacote”) - instala um pacotelibrary(nomedopacote) – ativa um pacote

Atalhos

TAB - completa comandos e endereços no editor ctrl+shift+N – novo scriptctrl+shift+H – definir diretório de trabalhocrtl+Z – desfaz algo no editorcrtl+shift+Z -refaz algo no editor ctrl+1 – muda o cursor para o editorctrl+2 - muda o cursor para o consolectrl+shift+PgUp – próximo gráficoctrl+L – limpa o console