apostila software estatistico r

Download Apostila Software Estatistico R

Post on 24-Nov-2015

13 views

Category:

Documents

0 download

Embed Size (px)

TRANSCRIPT

  • Minicurso de Estatstica Bsica:Minicurso de Estatstica Bsica:Introduo ao software R

    http://www.ufsm.br/pet-ee

    Programa de Educao Tutorial - Engenharia EltricaUniversidade Federal de Santa Maria

    Santa Maria, Abril de 2009

    Ministrantes:Bruno Fontana da SilvaJean DinizMatias Amrico Bortoluzzi

    Nome: _______________

  • Sumrio

    1 Prefcio 51.1 O Projeto R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.2 Programa de Educao Tutorial - Engenharia Eltrica (UFSM) . . . . . . 6

    2 Introduo 72.1 Apresentando o R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72.2 Interface do R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72.3 Sintaxe do R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82.4 Tinn-R Editor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82.5 Tipos de Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92.6 Comandos Bsicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

    2.6.1 Utilizando Ajuda . . . . . . . . . . . . . . . . . . . . . . . . . . 112.6.2 Atribuio de Valores . . . . . . . . . . . . . . . . . . . . . . . 112.6.3 Comandos Auxiliares . . . . . . . . . . . . . . . . . . . . . . . . 122.6.4 Operaes matemticas simples . . . . . . . . . . . . . . . . . . 132.6.5 Funes matemticas simples . . . . . . . . . . . . . . . . . . . 132.6.6 Nmeros complexos . . . . . . . . . . . . . . . . . . . . . . . . 14

    2.7 Vetores e Matrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.7.1 Definio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.7.2 Declarao de vetores . . . . . . . . . . . . . . . . . . . . . . . 152.7.3 Arrays e Matrizes - Definio e Declarao . . . . . . . . . . . . 162.7.4 Operaes e funes com Matrizes . . . . . . . . . . . . . . . . 17

    2.8 Entrada de Arquivos Externos . . . . . . . . . . . . . . . . . . . . . . . 192.9 Arquivos provenientes da internet . . . . . . . . . . . . . . . . . . . . . 21

    3 Grficos 223.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

    3.1.1 Comandos Bsicos . . . . . . . . . . . . . . . . . . . . . . . . . 223.1.2 Criando Novas Janelas Grficas e Salvando Grficos . . . . . . . 243.1.3 Outras Funcionalidades . . . . . . . . . . . . . . . . . . . . . . 25

    3.2 Grficos de Anlise Descritiva . . . . . . . . . . . . . . . . . . . . . . . 273.2.1 Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273.2.2 Barplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293.2.3 Boxplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303.2.4 Grfico de Ramo e Folhas . . . . . . . . . . . . . . . . . . . . . 323.2.5 Grfico de Pizza . . . . . . . . . . . . . . . . . . . . . . . . . . 33

    4 Estatstica Descritiva 344.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344.2 Medidas de Posio . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

    2

  • 4.2.1 Mdia Aritmtica X . . . . . . . . . . . . . . . . . . . . . . . . 344.2.2 Mediana Md . . . . . . . . . . . . . . . . . . . . . . . . . . . 354.2.3 Moda Mo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 364.2.4 Quartis (Q) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374.2.5 Percentis (P) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384.2.6 Decis (D) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

    4.3 Medidas de Disperso . . . . . . . . . . . . . . . . . . . . . . . . . . . 404.3.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 404.3.2 Amplitude Total (A) . . . . . . . . . . . . . . . . . . . . . . . . 404.3.3 Varincia (2) . . . . . . . . . . . . . . . . . . . . . . . . . . . 414.3.4 Desvio-padro () . . . . . . . . . . . . . . . . . . . . . . . . . 424.3.5 Coeficiente de Variao (CV) . . . . . . . . . . . . . . . . . . . 43

    4.4 Exemplo Aplicado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

    5 Probabilidade 465.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 465.2 Probabilidade - Definio . . . . . . . . . . . . . . . . . . . . . . . . . 465.3 Axiomas da Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . 49

    6 Variveis Aleatrias 506.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 506.2 Variveis Aleatrias Discretas . . . . . . . . . . . . . . . . . . . . . . . 50

    6.2.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 506.2.2 Distribuio Binomial - X b(n,p) . . . . . . . . . . . . . . . . 506.2.3 Distribuio De Poisson - X P() . . . . . . . . . . . . . . . . 53

    6.3 Variveis Aleatrias Contnuas . . . . . . . . . . . . . . . . . . . . . . . 556.3.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 556.3.2 Distribuio Normal ou Gaussiana - X N(,2) . . . . . . . . 556.3.3 Distribuio de Weibull - X W(,) . . . . . . . . . . . . . . 586.3.4 Distribuies no R . . . . . . . . . . . . . . . . . . . . . . . . . 60

    7 Inferncia Estatstica 617.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

    7.1.1 Hipteses Unilaterais e Bilaterais . . . . . . . . . . . . . . . . . 617.2 Testes de Hiptese - Uma amostra . . . . . . . . . . . . . . . . . . . . 62

    7.2.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 627.2.2 Teste para a Mdia . . . . . . . . . . . . . . . . . . . . . . . . 627.2.3 Teste para a Varincia de uma populao normal . . . . . . . . . 647.2.4 Teste para uma Proporo Binomial . . . . . . . . . . . . . . . . 67

    7.3 Testes de Hiptese - Duas amostras . . . . . . . . . . . . . . . . . . . . 687.3.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 687.3.2 Teste para a mdia . . . . . . . . . . . . . . . . . . . . . . . . . 687.3.3 Teste para as varincias de duas populaes normais . . . . . . . 727.3.4 Teste para duas propores . . . . . . . . . . . . . . . . . . . . 74

    8 Regresso e Correlao Linear Simples 778.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 778.2 Determinando a Equao Linear (Regresso) . . . . . . . . . . . . . . . 788.3 Coeficiente de Correlao (r) . . . . . . . . . . . . . . . . . . . . . . . 81

    3

  • 8.4 Coeficiente de Determinao (r2) . . . . . . . . . . . . . . . . . . . . . 828.5 Exemplo Aplicado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

    9 Programao em Linguagem R 869.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 869.2 Interao com o Usurio . . . . . . . . . . . . . . . . . . . . . . . . . . 869.3 Estruturas de Controle da Linguagem R . . . . . . . . . . . . . . . . . . 87

    9.3.1 Instrues Condicionais . . . . . . . . . . . . . . . . . . . . . . 879.3.2 Instrues Iterativas . . . . . . . . . . . . . . . . . . . . . . . . 89

    10 Referncias Bibliogrficas 95

    4

  • Estatstica Bsica: Introduo ao R Captulo 1. Prefcio

    1Prefcio

    1.1 O Projeto RR uma linguagem e ambiente para computao estatstica e grficos. Faz parte da

    filosofia do Projeto GNU e est disponvel como Software Livre sob os termos da LicenaPblica Geral do GNU da Fundao do Software Livre (Free Software FoundationsGNU General Public License) na forma de cdigo fonte. Ele compila e roda sobre umalarga variedade de plataformas UNIX e sistemas similares (incluindo FreeBSB e Linux),Windows e MacOS.

    R uma srie integrada de instalaes de softwares para manipulao de dados,clculo e exibio grfica. Dentre outras coisas, possui:

    uma manipulao de dados eficaz e facilidade de armazenamento; uma srie de operadores para clculos com arranjos, especialmente matrizes; uma extensa, coerente e integrada coleo de ferramentas intermedirias para

    anlise de dados;

    instalaes grficas para anlises de dados e exibio tanto direta no computadorquanto para cpia permanente (impresses);

    uma bem desenvolvida, simples e eficaz linguagem de programao (chamada S) aqual inclui condies, loops, funes recursivas definidas pelo usurio e instalaesde entradas e saidas (de fato, a maioria das funes providas no sistema sopropriamente escritas na linguagem S).

    R mais um veculo para novos mtodos em desenvolvimento de anlise de dados.Tem se desenvolvido rapidamente e tem sido estendido por uma extensa coleo depacotes. Entretanto, muitos programas escritos em R so essencialmente passageiros,escritos para uma pequena parte de anlise de dados.

    Vrias pessoas utilizam o R como um sistema estatstico. Porm, o fato que o Rproporciona um ambiente interior com vrias tcnicas estatsticas, clssicas e modernas,que foram implementadas dentro do software. Algumas esto compiladas dentro dabase do ambiente R, mas vrias so disponibilizadas como pacotes. H em torno de 25pacotes disponveis com R (chamados pacotes/packages padres/standards e recomen-dados/recommended) e muitos outros disnponveis atravs da famlia CRAN em sitesda Internet (via http://CRAN.R-project.org), dentre outros. Voc pode buscar estespacotes e sua documentao de acordo com a necessidade e avano na utilizao do R.

    5

  • Estatstica Bsica: Introduo ao R Captulo 1. Prefcio

    1.2 Programa de Educao Tutorial - Engenharia Eltrica(UFSM)

    Esta apostila foi elaborada pelo grupo PET Engenharia Eltrica (PET-EE) da Univer-sidade Federal de Santa Maria (UFSM) com o objetivo de fornecer um guia de introduoao software R e sua aplicao bsica na rea de estatstica. Esta documentao dedistribuio livre para qualquer pessoa que obter acesso a mesma, podendo ser editada,modificada e redistribuda da forma que o usurio bem entender.

    O Programa de Educao Tutorial (PET) foi criado para apoiar atividades acadmicasque integram ensino, pesquisa e extenso. Formado por grupos tutoriais de aprendiza-gem, o PET propicia aos alunos participantes, sob a orientao de um