capítulo 2 - coleta e modelagem dos dados de entrada

Upload: graziela-cerqueira

Post on 31-Oct-2015

137 views

Category:

Documents


0 download

TRANSCRIPT

  • Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)Slide * de 30Prof. Afonso C. MedinaProf. Leonardo ChwifColeta e Modelagem dos Dados de EntradaCaptulo 2Pginas 24-52

    Este material disponibilizado para uso exclusivo de docentes que adotam o livro Modelagem e Simulao de Eventos Discretos em suas disciplinas. O material pode (e deve) ser editado pelo professor. Pedimos apenas que seja sempre citada a fonte original de consulta.Verso 0.2 30/09/06Modificado em 2012

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30ColetaTratamentoInfernciaTrs Etapas

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Escolha adequada da varivel de estudo;O tamanho da amostra deve estar entre 100 e 200 observaes. Amostras com menos de 100 observaes podem comprometer a identificao do melhor modelo probabilstico, e amostras com mais de 200 observaes no trazem ganhos significativos ao estudo;Coleta dos Dados

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Coletar e anotar as observaes na mesma ordem em que o fenmeno ocorre para permitir a anlise de correlao;Se existir alguma suspeita de que os dados mudam em funo do horrio ou do dia da coleta, a coleta deve ser refeita em outros horrios e dias. Na modelagem de dados, vale a regra: toda suspeita deve ser comprovada ou descartada estatisticamente.Coleta dos Dados

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Exemplo 2.1: Filas em um SupermercadoUm gerente de supermercado est preocupado com as filas formadas nos caixas de pagamento durante um dos turnos de operao. Quais seriam as variveis de estudo para coleta de dados?

    ( ) O nmero de prateleiras no supermercado

    ( ) Os tempos de atendimento nos caixas

    ( ) O nmero de clientes em fila

    ( ) O tempo de permanncia dos clientes no supermercado

    ( ) Os tempos entre chegadas sucessivas de clientes nos caixas de pagamento

    N

    S

    N

    N

    S

    Dado de sada!

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Exemplo 2.1: Coleta de DadosIntervalo entre chegadas de pessoas nos caixas do supermercado (100 medidas). Tempos em minutos:

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Exemplo 2.1: Medidas de Posio e Disperso O valor 728 um outlier?

    Medidas de posioMdia10,44Mediana5Moda3Mnimo0Mximo728Medidas de dispersoAmplitude728Desvio padro51,42Varincia da amostra2.643,81Coeficiente de Variao493%Coeficiente Assimetria13,80

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Outliers (Valores Discrepantes) Erro na coleta de dados. Este tipo de outlier o mais comum, principalmente quando o levantamento de dados feito por meio manual. Eventos raros. Nada impede que situaes totalmente atpicas ocorram na nossa coleta de dados. Alguns exemplos: Um dia de temperatura negativa no vero da cidade do Rio de Janeiro; Um tempo de execuo de um operador ser muito curto em relao aos melhores desempenhos obtidos naquela tarefa; Um tempo de viagem de um caminho de entregas na cidade de So Paulo, durante o horrio de rush, muito menor do que fora deste horrio.

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Exemplo 2.1: Influncia dos Outliers

    Dadoscom o outliersem o outlierMdia10,446,83Mediana55Varincia da amostra2.643,8143,60

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Identificao de Outliers: Box-plot

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Anlise de CorrelaoO diagrama de disperso dos tempos de atendimento do exemplo do supermercado mostra que no h correlao entre as observaes da amostra.

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Anlise de CorrelaoDiagrama de disperso de um exemplo hipottico em que existe correlao entre os dados que compem a amostra.

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Exemplo 2.1: Construo do Histograma 1. Definir o nmero de classes:O histograma utilizado para identificar qual a distribuio a ser ajustada aos dados coletados ou utilizado diretamente dentro do modelo de simulao. 2. Definir o tamanho do intervalo:3. Construir a tabela de freqncias4. Construir o histograma

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Exemplo 2.1: Histograma

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Exemplo 2.1: InfernciaQual o melhor modelo probabilstico ou distribuio estatstica para representar a amostra coletada?Exponencial?Normal?Triangular?Lognormal?

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Testes de Aderncia (no paramtricos)Testa a validade (ou no) da hiptese de aderncia (ou hiptese nula) em confronto com a hiptese alternativa: H0: o modelo adequado para representar a distribuio da populao. Ha: o modelo no adequado para representar a distribuio da populao.Se a um dado nvel de significncia (100)% rejeitarmos H0, o modelo testado no adequado para representar a distribuio da populao. O nvel de significncia equivale probabilidade de rejeitarmos a hiptese nula H0, dado que ela est correta. Testes usuais: Qui-quadrado Kolmogorov-Smirnov

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Teste do Qui-quadrado

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30P-valueParmetro usual fornecido pelos softwares de estatstica.

    ValorCritriop-value < 0,01Evidncia forte contra a hiptese de aderncia0,01 p-value < 0,05Evidncia moderada contra a hiptese de aderncia0,05 p-value < 0,10Evidncia potencial contra a hiptese de aderncia0,10 p-valueEvidncia fraca ou inexistente contra a hiptese de aderncia

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Distribuies discretas: Binomial

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Distribuies discretas: Poisson

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Distribuies contnuas: Beta00,51xf(x)=2 =1=3 =2=4 =4=2 =3=1,5 =5=6 =2=2 =1

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Distribuies contnuas: Erlang

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Distribuies contnuas: Exponencial

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Distribuies contnuas: Gamaxf(x)=0=1=2

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Distribuies contnuas: Lognormalxf(x) =1 =1=1 =0,5

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Distribuies contnuas: Normalf(x)

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Distribuies contnuas: Uniformeba1/(b-a)xf(x)

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Distribuies contnuas: Triangularxf(x)abm

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Distribuies contnuas: Weibullxf(x)=0,5 =1=1 =1=2 =1=3 =1=3 =2

    Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

    Slide * de 30Modelagem de dados... sem dados!

    DistribuioParmetrosCaractersticasAplicabilidadeExponencialMdiaVarincia altaCauda para direitaGrande variabilidade dos valoresIndependncia entre um valor e outroMuitos valores baixos e poucos valores altosUtilizada para representar o tempo entre chegadas sucessivas e o tempo entre falhas sucessivasTriangularMenor valor, moda e maior valorSimtrica ou noQuando se conhece ou se tem um bom chute sobre a moda (valor que mais ocorre), o menor valor e o maior valor que podem ocorrerNormalMdia e desvio padroSimtricaForma de sinoVariabilidade controlada pelo desvio-padroQuando a probabilidade de ocorrncia de valores acima da mdia a mesma que valores abaixo da mdiaQuando o tempo de um processo pode ser considerado a soma de diversos tempos de sub-processosUniformeMaior valor e menor valorTodos os valores no intervalo possuem a mesma probabilidade de ocorrnciaQuando no se tem nenhuma informao sobre o processo ou apenas os valores limites (simulao do pior caso)DiscretaValores e sua probabilidade de ocorrnciaApenas assume os valores fornecidos pelo analistaUtilizada para a escolha de parmetros das entidades (por exemplo: em uma certa loja, 30% dos clientes realizam suas compras no balco e 70% nas prateleiras) Quando se conhecem apenas valores intermedirios da distribuio ou a porcentagem de ocorrncia de alguns valores discretos

    *