análise de dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/aulas/5101 a13... · do sistema real,...
TRANSCRIPT
![Page 1: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/1.jpg)
Análise e Tratamento de Dados para Simulação de Sistemas
Prof. Paulo José de Freitas Filho, Dr. Eng.Universidade Federal de Santa Catarina
Dep. Informática e Estatí[email protected]
![Page 2: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/2.jpg)
2
Tópicos
Introdução;Processo de Amostragem e Coleta dos dados;Tratamento dos Dados;Identificação da distribuição estatística;Estimação dos parâmetros;Testes de aderência;Ajuste de Distribuições com o Arena Input Analyzer
![Page 3: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/3.jpg)
3
Introdução
Modelar computacionalmente um sistema do mundo real significa criar uma espécie de analogia digital deste sistema, que possua a capacidade de se comportar de
maneira semelhante ao sistema original de tal forma que, ao interagir com o usuário, permita a este a realização de experimentos com a intenção final de um maior entendimento e compreensão do sistema real
por meio da inferência estatística.
![Page 4: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/4.jpg)
4
Introdução
Para que um modelo possa criar uma história artificialdo sistema real, é fundamental que este traga consigo a
possibilidade de apresentar até mesmo um comportamento estocástico, à semelhança da
grande maioria dos sistemas.
Em modelos voltados à simulação, este objetivo éalcançado pela utilização de distribuições de probabilidades como forma de representar a
multiplicidade de ocorrências de eventos aleatórios
![Page 5: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/5.jpg)
5
Introdução
Quando se faz uso de distribuições de probabilidades para representar o comportamento de variáveis aleatórias presentes nos sistemas a serem modelados, é preciso considerar os seguintes pontos:
8 os possíveis valores que a variável poderá assumir estarão dentro da amplitude coberta pela distribuição;
8 a probabilidade de ocorrência de qualquer valor no intervalo é determinada pelo perfil da distribuição.
![Page 6: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/6.jpg)
6
Dados Determinísticos vs. RandômicosDeterminísticos: valores fixos
8 Numero de unidades de um recurso8 Tempo de transferência de uma entidade 8 Tempos entre chegadas e tempos de processamento8 Dados que não apresentam variações
Estocásticos: modelagem com base em distribuições de probabilidades, de onde os valores são obtidos (sorteios) para dirigir a simulação
8 Transferências, chegadas, processamentos, tempos, temperatura, eventos 8 Que distribuição? Que parâmetros?8 Implica em resultados também randômicos.
![Page 7: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/7.jpg)
7
Processo de Amostragem e Coleta de Dados
Procedimento inicial para identificar a distribuição de probabilidade mais adequada.Este costuma ser, também, o marco inicial dos problemas que se enfrenta na modelagem de sistemas.
8 Os dados estão disponíveis? 8 De que maneira estão disponíveis? 8 Como coletá-los? 8 Como analisá-los?
![Page 8: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/8.jpg)
8
Uso de Dados:Alternativas e discussões
Usando dados “diretamente” na simulação
8 Os dados são lidos de arquivos e usados diretamente no modelo (chegadas, serviços, tipos de entidades, tempos, temperaturas, etc.);
8 Todos os valores serão “reais”;8 Não haverão elementos diferentes dos já observados;8 Poderá haver falta de dados para muitas ou longas
simulações;8 Perda de desempenho computacional (leitura de arquivos).
![Page 9: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/9.jpg)
9
Uso de Dados (cont...)
Uso de distribuições de probabilidades:
8 Os dados serão gerados de acordo com a distribuiçãoadotada;
8 Os possíveis valores que a variável poderá assumir estarão dentro da amplitude coberta pela distribuição;
8Outros valores além dos observados poderão ser empregados (bom ou ruim ?);
8 A probabilidade de ocorrência de qualquer valor no intervalo édeterminada pelo perfil da distribuição
8 O processo de aderência pode não ser perfeito ou adequado (problema de validação).
![Page 10: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/10.jpg)
10
Coletando Dados
Geralmente difícil, caro e chato8 Sistema pode não existir;8 Os dados disponíveis podem não ser os desejados. 8 Podem haver mudanças no modelo em função do que se dispõe;8 Incompletos;8 Muitos dados.
Sensibilidade dos resultados às incertezas nos dados;Modele o nível de detalhes de acordo com a qualidade dos dados;Capture a variabilidade nos dados - validaçãoGarbage In, Garbage Out (Entra Lixo, Sai Lixo)Custos devem ser orçados no projeto;
![Page 11: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/11.jpg)
11
Fontes de Dados
Na maioria dos casos e, dependendo das circunstâncias, as fontes de dados podem ser:
8 arquivos históricos (mostrando o comportamento, resultados, etc.) do sistema;
8 provenientes de observações do sistema sob estudo;8 oriundos de sistemas similares;8 determinados com base em estimativas de operadores;8 determinados com base em afirmações de vendedores de
máquinas, equipamentos, etc.;8 estimativas de projetistas de sistemas, ou mesmo;8 considerações teóricas sobre o sistema.
![Page 12: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/12.jpg)
12
Amostragem
Planejamento e Observação Preliminar. 8 Planejamento. Pré-observação da situação. Coletar dados
enquanto observa. Como coletar? Circunstâncias não usuais?Utilidade dos Dados Coletados. 8 São adequados para as distribuições? São úteis? Não existe
necessidade de se coletar dados supérfluos.
Conjuntos Homogêneos de Dados.8 Combinar dados em conjuntos homogêneos.
Relacionamento entre Variáveis8 Diagrama de dispersão.
Independência das Observações. 8 Considerar a possibilidade de autocorrelação
![Page 13: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/13.jpg)
13
Estudo de Caso
![Page 14: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/14.jpg)
14
Estudo de Caso...
Pontos importantes na busca dos dados:
8 Identificação de entidades (tipos de clientes);8 Identificação de seus processos (atividades com os
recursos do banco);8 Identificação dos recursos utilizados (caixas).
A partir destes elementos, buscar identificar os parâmetros
8 Tempos de ocorrências de eventos• Evento chegada de cliente• Evento fim de processos (dependente da duração das
atividades)
![Page 15: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/15.jpg)
15
Estudo de Caso...
Verificar a questão da homogeneidade dos dados amostrados.
8 Neste caso, existe um processo de Poisson não-estacionário associado as chegadas de clientes no banco.
8 Existe também uma espécie de sazonalidade ao longo dos dias da semana e do mês
Verificar a questão do tamanho das amostras.
8 Ver exemplo dos dados;8 Ver exemplo dos tempos entre chegadas (TEC)
![Page 16: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/16.jpg)
16
Amostra - Homogeneidade dos Dados
O exemplo considera os clientes que se dirigem aos caixas.Períodos críticos (mais congestionados).Dias considerados normais (terças, quartas e quintas-feiras), com três níveis de demanda: 8 A, acima da média; B, na média e C, abaixo da média. As
distribuições destas demandas durante o horário comercial, das 10:00 às 16:00 horas, ocorrem de acordo com a tabela 1.1.
Período Tipo de Demanda10:00 às 11:00 A11:00 às 13:30 C13:30 às 14:30 B14:30 às 15:30 C15:30 às 16:00 A
![Page 17: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/17.jpg)
17
Processo de Amostragem
Nas segundas-feiras e sextas-feiras, o perfil da demanda ésemelhante, mas os níveis de demanda se modificam, conforme pode ser observado na tabela 1.2.
Período Tipo de Demanda10:00 às 11:00 A* 1,311:00 às 13:30 B13:30 às 14:30 A14:30 às 15:30 B15:30 às 16:00 A* 1,2
Além disso, qualquer dia de meio de semana que seja o último do mês tem demanda semelhante a da tabela 1.2. Se o último dia do mês for uma sexta-feira ou o primeiro dia do mês for uma segunda-feira, o perfil da demanda segue a tabela 1.2, acrescida de 20%.
![Page 18: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/18.jpg)
18
Processo de Amostragem
As informações passadas pela gerência facilitam, sobremaneira, o processo de coleta de dados
Os valores dos parâmetros A, B e C, resumem o perfil da demanda para os diversos períodos relativos ao cliente tradicional (caixas internos).
Nem sempre existe tal possibilidade, exigindo que se realizem coletas de amostras sobre os inúmeros períodos de diversidade da demanda.
![Page 19: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/19.jpg)
19
Tamanho da Amostra
Definidos os períodos em que a coleta será realizada, o próximo passo no planejamento é a determinação do tamanho das amostras.
A palavra chave nas questões de amostragem (tamanho da amostra) é “representatividade”.
Qual deve ser o tamanho das amostras a serem coletadas durante os períodos já definidos?
Esta questão da representação da amostra pode ser exemplificada através do experimento de lançar um dado. 8 Quantas vezes devemos lançar um dado, para que possamos
afirmar que os seus possíveis resultados {1, 2, 3, 4, 5 e 6}, tem todos a mesma probabilidade de ocorrerem?
![Page 20: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/20.jpg)
20
Tamanho da Amostra
Experimento de lançamento de um dado;
Use o modelo
“Amostra do Dado.DOE”para experimentar.
Tendência da amostra a uma maior
representatividade na medida em que cresce
o número de observações
0
1
2
3
4
5
6
1 2 3 4 5 6012345678
1 2 3 4 5 6Gráfico 1.1a: 12 observações Gráfico 1.1b: 24 observações
0
2
4
6
8
10
1 2 3 4 5 60
2
4
6
8
10
12
1 2 3 4 5 6Gráfico 1.1c: 36 observações Gráfico 1.1d: 48 observações
02468
101214
1 2 3 4 5 6
0
5
10
15
20
25
30
1 2 3 4 5 6
Gráfico 1.1e: 60 observações Gráfico 1.1f: 120 observações
![Page 21: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/21.jpg)
21
Relação entre Tamanho da Amostra e a Variável Tempos Entre Chegadas (TECc)
Vamos imaginar, que o verdadeiro valor de variável TECc no período das 10:00 às 11:00 horas seja perfeitamente descrito por uma distribuição Exponencial de média 2. Vejamos o que acontece quando coletamos amostras com tamanhos que variam de 10 a 100 elementos
Experimento Tam. da Amostra Valor do Parâmetro1 10 EXPO(2,45)2 20 EXPO(2,78)3 30 EXPO(2,26)4 40 EXPO(2,13)5 50 EXPO(1,98)6 100 EXPO(2,01)
![Page 22: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/22.jpg)
22
Importância de um Bom Ajuste
Veja o exemplo do emprego de uma distribuição Exponencial.Amostras com 500 valores.
ExperimentoParâmetroUtilizado
ParâmetroInferido
Valor Máx.na Amostra
1 2,0 2,03 10,52 2,2 1,97 14,43 2,4 2,44 14,84 2,6 2,56 23,95 2,8 2,81 24,6
![Page 23: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/23.jpg)
23
Tratamento de Dados
Buscar a Representação Gráfica --> Histogramas
Dados brutos - Identificar os limites (6, 114)
46 52 39 43 69 31 53 52 68 176 64 25 88 67 85 57 60 76 6058 96 67 94 60 73 68 66 41 6011 38 70 82 40 94 8 86 105 6579 65 88 54 51 114 59 93 64 3166 68 37 109 67 59 60 62 41 5078 97 78 55 74 67 22 40 100 2720 44 62 72 49 82 54 73 68 3874 75 57 86 31 82 69 51 53 6349 70 62 46 26 36 65 83 78 19
![Page 24: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/24.jpg)
24
Representação Gráfica
Tabela de distribuição de freqüências
Classes(defeitos
reportados)
Ponto Médioxi
FreqüênciaAbsoluta
0 - 9 4,5 210 - 19 14,5 320 - 29 24,5 430 - 39 34,5 640 - 49 44,5 1050 - 59 54,5 1560 - 69 64,5 2770 - 79 74,5 1380 - 89 84,5 990 - 99 94,5 5
100 - 109 104,5 3110 - 119 114,5 1
Total = 100
![Page 25: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/25.jpg)
25
Representação Gráfica
Histograma
0
5
10
15
20
25
30
00 |--- 09 10 |--- 19 20 |--- 29 30 |--- 39 40 |--- 49 50 |--- 59 60 |--- 69 70 |--- 79 80 |--- 89 90 |--- 99 100 |-- 109 110 |-- 119
Classes
Freq
üênc
ia
![Page 26: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/26.jpg)
26
Representação Gráfica
Exemplo de um histograma para os dados abaixo.
15.8 26.4 17.3 11.2 23.9 24.8 18.7 13.9 9.0 13.222.7 9.8 6.2 14.7 17.5 26.1 12.8 28.6 17.6 23.726.8 22.7 18.0 20.5 11.0 20.9 15.5 19.4 16.7 10.719.1 15.2 22.9 26.6 20.4 21.4 19.2 21.6 16.9 19.018.5 23.0 24.6 20.1 16.2 18.0 7.7 13.5 23.5 14.514.4 29.6 19.4 17.0 20.8 24.3 22.5 24.6 18.4 18.18.3 21.9 12.3 22.3 13.3 11.8 19.3 20.0 25.7 31.8
25.9 10.5 15.9 27.5 18.1 17.9 9.4 24.1 20.1 28.5
![Page 27: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/27.jpg)
27
Representação Gráfica
Distribuição de Freqüências
Classes Freqüências ( f j )5.0 |--- 8.0 28.0 |--- 11.0 7
11.0 |--- 14.0 814.0 |--- 17.0 1117.0 |--- 20.0 1820.0 |--- 23.0 1523.0 |--- 26.0 1026.0 |--- 29.0 729.0 |--- 32.0 2
Total 80
![Page 28: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/28.jpg)
28
Representação Gráfica
Histogramas
02468
1 01 21 41 61 82 0
5 .0 | - - -8 .0
8 .0 |- - -1 1 .0
1 1 .0 |- - -1 4 .0
1 4 .0 | - - -1 7 .0
1 7 .0 |- - -2 0 .0
2 0 .0 | - - -2 3 .0
2 3 .0 |- - -2 6 .0
2 6 .0 |- - -2 9 .0
2 9 .0 |- - -3 2 .0
ClassesFr
eqüê
ncia
05
101520253035
05|-----11 11|-----17 17|-----23 23|-----29 29|-----35
Classes
Freq
üênc
ias
0
24
6
8
06|--
0708
|--09
10|--
1112
|--13
14|--
1516
|--17
18|--
1920
|--21
22|--
2324
|--25
26|--
2728
|--29
30|--
31
Classes
Freq
üênc
ia
![Page 29: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/29.jpg)
29
Medidas Descritivas e Medidas de Dispersão
Dados não Agrupados
Média Variância
Dados Agrupados
Média Variância
n
xX
n
ii∑
== 1
11
22
2
−
−=
∑=
n
xnxS
n
ii
n
xfX
k
jjj∑
== 1
11
22
2
−
−=
∑=
n
XnxfS
k
jjj
![Page 30: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/30.jpg)
30
Identificação da Distribuição Teórica de Probabilidades
O terceiro passo no processo de análise dos dados coletados é a identificação de uma distribuição teórica de probabilidades
A utilização de gráficos, tais como um histograma, são muito úteis para a identificação ou delineamento da distribuição teórica de probabilidades.
A construção de um histograma permite dar inicio ao processo de inferência sobre uma distribuição teórica de probabilidades.
As hipóteses sobre qual distribuição adotar devem estar baseadas no contexto do assunto investigado e no perfil do histograma obtido
![Page 31: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/31.jpg)
31
Principais Distribuições Contínuas
NormalUniformeTriangularLognormalErlangGammaBetaWeibull
![Page 32: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/32.jpg)
32
Principais Distribuições Discretas
PoissonUniforme discreta
![Page 33: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/33.jpg)
33
Estimação de Parâmetros
Passo seguinte ao delineamento distribuição de probabilidades feito por meio do histograma dos dados coletados.
Inicia com a determinação das
8 medidas descritivas: média, a moda e/ou mediana;8 medidas de dispersão: variância e o desvio-padrão amostral.
Tais medidas são a base das estimativas para os parâmetros das distribuições sob hipótese.
Para aquelas distribuições que não possuem parâmetros de forma e escala, tais como a normal e a exponencial, por exemplo a média e a variância amostral são bons estimadores.
![Page 34: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/34.jpg)
34
Estimação de Parâmetros
No caso das distribuições Gama, Erlang e Beta, que necessitam dos parâmetros de forma (α) e de escala (β), as referências sugerem que é possível também realizar uma estimação destes elementos com utilização da média e da variância amostral
No caso das distribuições Uniforme e Triangular, os valores de mínimo e de máximo são obtidos diretamente dos valores amostrais. O valor modal da distribuição Triangular pode ser estimado por:
µσβσµα / )/( 22 ==
)(3 maxmin xxxMo +−=
![Page 35: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/35.jpg)
35
Estimação de Parâmetros
Distribuição Parâmetros Estimadores Uniforme: UNIF (a, b) a = xmin ; b = xmax Exponencial EXPO (β) β = X Normal NORM ( µ , σ )
µ = X ; σ = 21 Sn
n −
Triangular TRIA (a, b, c) a = xmin; b = Moda; c = xmax onde: −= xModa 3 ( xmin + xmax)
Uniforme Discreta UNIF DISC (i, j) i = xmin ; j = xmax Poisson POIS (λ) λ = X
![Page 36: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/36.jpg)
36
Testes de Aderência
O objetivo dos testes de aderência é a verificação da qualidade na escolha da distribuição que se acredita melhor represente os dados da população.
Assim como grande parte das etapas da análise de dados, os testes de aderência também podem ser realizados com auxílio computacional.
Convém, no entanto, enfatizar uma vez mais que, mesmo adotando tal procedimento (plenamente recomendável), é fundamental que o analista entenda o significado da aplicação do teste e os seus resultados.
![Page 37: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/37.jpg)
37
Testes de Aderência
Usualmente, os testes de aderência empregam métodos gráficos e/ou teóricos (estatísticos).
8 Graficamente, a qualidade é medida de forma visual, isto é, de acordo com a proximidade ou “aderência” entre o desenho da distribuição teórica e aquele referente aos dados coletados. Quanto menor a diferença entre eles melhor a aderência entre os dados e a determinada distribuição.
8 Teoricamente, procura-se provar a hipótese (teste de hipóteses) de que o conjunto de dados amostrais não diferem, de maneira significativa, daqueles esperados de uma distribuição teórica especificada.
![Page 38: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/38.jpg)
38
Testes de Aderência
Os dois principais métodos teóricos são:Chi-quadrado e Kolmogorov-Smirnov (K-S).
Medir e avaliam os desvios entre a distribuição amostral e a teórica. A decisão de quando aplicar um ou outro teste baseia-se no tamanho da amostra disponível e na natureza da distribuição. 8 O teste K-S é valido apenas para distribuições contínuas8 Chi-quadrado pode ser aplicado a contínuas e discretas. 8 Não é recomendável a aplicação do teste Chi-quadrado a
pequenas amostras. 8 Geralmente, a aplicação deste teste exige amostras com pelo menos
100 valores8 O teste K-S, é aplicável à pequenas amostras.
![Page 39: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/39.jpg)
39
Teste Chi-quadrado
Procedimentos8 Arranjo das n observações em um conjunto de k classes de intervalos;8 Cálculo do teste estatístico dado pela seguinte fórmula:
8 Se = 0, então as duas distribuições estão “casando” perfeitamente, isto é, não existem diferenças entre a distribuição de teórica e a observada.
8 Quanto maior o valor de , maior a discrepância entre as duas distribuições.
e
ke
f
ff∑ −=
20
2)(
χ
∑=
==
=
k
effk
classes as todasde somatórioclasses nas esperada frequência
classes nas observada frequênciaintervalosou classes de número
onde
0
2χ
2χ
![Page 40: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/40.jpg)
40
Teste Chi-quadrado...
Deve-se demonstrar que segue, aproximadamente, a distribuição Chi-quadrado com = k-1-p graus de liberdade, onde p é o número de parâmetros da distribuição sob hipótese.
As hipóteses a serem testadas são as seguintes:
8 H0: a variável aleatória X, segue a distribuição sob hipótese com o(s) parâmetro(s) estimado(s);
8 H1 a variável aleatória X, não segue a distribuição sob hipótese com o(s) parâmetro(s) estimado(s).
Compara-se o valor calculado de com os valores críticos de α, k-1-p.
Os valores críticos são fornecidos pela tabela da distribuição Chi-quadrado. A hipótese nula H0 é rejeitada se > α, k-1-p.
υ
2χ
2χ2χ
2χ 2χ
![Page 41: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/41.jpg)
41
Teste Chi-quadrado - Exemplo
Com a intenção de monitorar o tráfego chamadas telefônicas sobre uma central, o seguinte experimento foi realizado. 8 A cada intervalo de cinco minutos, foi registrado o
número de chamadas ocorridas. 8 Os valores esperados são: 0, 1, 2, . . . , 13 para o número
de chamadas em cada intervalo. 8 Um total de 400 intervalos são registrados. 8 As freqüências relativas aos valores observados foram:
3, 15, 47, 76, 68, 74, 46, 39, 15, 9, 5, 2, 0 e 1, respectivamente.
A hipótese relativa ao experimento é verificar a aderênciados dados com relação a uma distribuição de Poisson, com λ = 4,6.
![Page 42: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/42.jpg)
42
Teste Chi-quadrado - Exemplo
Distribuições das freqüências observadas e esperadasNúmero
deChamadas
FreqüênciasObservadas
Probabilidadesde Poisson
FreqüênciasEsperadas
0 3 0,010 4,01 15 0,046 18,42 47 0,107 42,83 76 0,163 65,24 68 0,187 74,85 74 0,173 69,26 46 0,132 52,87 39 0,087 34,88 15 0,050 20,09 9 0,025 10,0
10 5 0,012 4,811 2 0,005 2,012 0 0,002 0,813 1 0,001 0,4
400 400,0
![Page 43: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/43.jpg)
43
Teste Chi-quadrado - Exemplo
Teste de aderência visual
0
10
2030
40
50
60
70
80
Freqüências
FreqüênciaObservada
FreqüênciaEsperada
![Page 44: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/44.jpg)
44
Teste Chi-quadrado - Exemplo
Teste de Hipóteses8 H0: A variável aleatória possui distribuição de Poisson com λ=4,6;
8 H1: A variável aleatória não possui distribuição de Poisson com λ=4,6
Comparando8 Valor calculado de , logo8 Valor crítico de α, k-1-p. 8 Os valores críticos fornecidos pela tabela da distribuição Chi-
quadrado para α = 5% e = 10−1−1 = 8 é igual 15,5.8 Como 6,749 < 15,5 não se pode rejeitar a hipótese de que com 95%
de confiança, os dados da amostra seguem uma distribuição Poisson com parâmetro λ = 4,6.
2χ2χ
υ
749,60,8
)0,88(...8,42
)8,4247(4,22
)4,2218( 2222 =
−++
−+
−=χ
![Page 45: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/45.jpg)
45
Teste Kolmogorov-Smirnov
Aplica-se com a mesma intenção que o Chi-quadrado, isto é, testar se uma distribuição amostral segue uma determinada distribuição teórica contínua.
O teste baseia-se na comparação das probabilidades acumuladas das duas distribuições (observada e teórica).
Para a consulta em uma tabela de valores críticos, toma-se a o maior valor K-S observado, isto é, o que corresponde ao maior desvioentre as duas distribuições
![Page 46: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/46.jpg)
46
Teste Kolmogorov-Smirnov - Exemplo
Avaliar o conjunto de dados e verificar sua aderência a uma distribuição Uniforme com α= 5%
17,38 18,09 22,47 15,29 10,33 28,98 14,70 11,26 27,49 15,90 13,47 14,4323,73 18,09 19,09 29,29 22,12 11,86 28,31 15,79 17,48 27,78 10,27 11,9411,77 11,72 10,72 22,20 12,05 24,28 17,33 10.42 28,78 10,16 13,63 17,3121,56 12,61 11,76 18,37 27,00 11,86 19,90 23,92 18,61 17,38 12,66 28,2923,17 22,28 25,24 17,58 14,66 14,41 28,59 21,72 10,56 12,48 13,02 27,84
![Page 47: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/47.jpg)
47
Teste Kolmogorov-Smirnov - Exemplo
Tabela de Distribuição de Freqüências
LimitesDas Classes
Inf. Sup.
FreqüênciaAbsoluta
Observada
FreqüênciaRelativa
Observada
FreqüênciaAcumuladaObservada
FreqüênciaAcumulada
Teórica
DiferençasFreqüênciaAcumulada
10,00 |−− 12,00 13 0.2167 0.2167 0.1 0.116712,00 |−− 14,00 7 0.1167 0.3334 0.2 0.133414,00 |−− 16,00 7 0.1167 0.4501 0.3 0.1501*16,00 |−− 18,00 6 0.1000 0.5501 0.4 0.1501*18,00 |−− 20,00 6 0.1000 0.6501 0.5 0.1501*20,00 |−− 22,00 2 0.0333 0.6834 0.6 0.083422,00 |−− 24,00 7 0.1167 0.8001 0.7 0.100124,00 |−− 26,00 2 0.0333 0.8334 0.8 0.033426,00 |−− 28,00 4 0.0666 0.9000 0.9 0.000028,00 |−− 30,00 6 0.1000 1.0000 1.0 0.0000
![Page 48: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/48.jpg)
48
Teste Kolmogorov-Smirnov - Exemplo
As maiores diferenças são observadas nas classes que iniciam em 14,00 e vão até 20,00.
O valor da diferença é de 0.1501.
Compara-se este valor com o obtido da tabela de valores críticos do teste K-S, com α =5% e υ=60 (60 valores na tabela), isto é, 0,1756.
O mesmo critério de rejeição deve ser então aplicado.
Como o valor crítico tabelado é maior que o valor calculado a partir dos dados da amostra, não se pode rejeitar a hipótese H0 de que os dados levantados seguem uma distribuição Uniforme.
![Page 49: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/49.jpg)
49
Ajuste de Distribuições com o Arena Input Analyzer
Objetivos e necessidades:8 Selecionar uma distribuição de probabilidade para ser usada na
geração de dados para o modelo de simulação;8 Possuir uma amostra de dados (IID - Independente e
Identicamente Distribuída) coletados no sistema real.Arena Input Analyzer8 Aplicação independente. 8 Também acessível via menu Tools; 8 Realiza um processo de aderência. 8 Fornece uma expressão válida no Arena passando-a diretamente
a um modelo (Copy/Paste).
![Page 50: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/50.jpg)
50
Ajuste de Distribuições com o Arena Input Analyzer (cont...)
Ajuste = decidir sobre o tipo de distribuição (exponencial, normal, empírica, etc.) e estimar seus parâmetros;8 Diferentes métodos (Max. semelhança, menores quadrados, ...)8 Realização de Testes de Hipóteses para avaliar a melhor
distribuição• H0: a distribuição escolhida representa adequadamente os
dados• testar o valor de p (maior = melhor)
Verificar ajuste entre distribuição “teórica” X empírica;Trabalha com dados de distribuições contínuas e discretas;Realiza “Best fit” entre várias distribuições.
![Page 51: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/51.jpg)
51
Arquivos de Dados para o Input Analyzer
Criar um arquivo de dados (editores, planilhas, etc...)8 Deve ser do tipo ASCII (salve ou exporte);8 Dados separados por brancos (espaços, tab., novas linhas) 8 Aceita também formato livre
Abrir arquivo a partir do Input Analyzer8 menu File/New ou8 menu File/Data File/Use Existing …8 Get histogram, basic summary of data8 Para ver dados: menu Window/Input Data
Pode gerar dados “falsos” para aprendizado ou estudos.8 menu File/Data File/Generate
![Page 52: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/52.jpg)
52
O Menu Fit
Verifica distribuições (testes de aderência);Verifica a forma de distribuições específicas8 Desenha a função densidade sobre um histograma (visual);8 Fornece a expressão exata (parâmetros) para Copy e Paste ao
modelo de simulação;8 Pode incluir limites (offset), dependendo da distribuição;8 Fornece os resultados do teste de aderência.
• Testes Chi-quadrado e Kolmogorov-Smirnov
• O mais importante: valor de p, sempre entre 0 e 1;
• p pequeno (< 0.05): aderência pobre;• O uso da distribuição ajustada pode apresentar um conjunto de
dados mais inconsistente do que o conjunto de dados da amostra, em função da probabilidade de pontos extremos.
![Page 53: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/53.jpg)
53
O Menu Fit (cont...)
Ajuste de todas as distribuições (teóricas) do Arena 8 Fit/Fit All menu ou
8 Retorna a distribuição com o mínimo square-error• Square error = soma dos quadrados das diferenças entre as
freqüências do histograma e da distribuição ajustada (teórica);
• Pode depender do nº de intervalos escolhidos: diferentes intervalos podem levar a uma solução diferente;
8 O valor de p pode indicar se o ajuste é + ou - pobre;8 Para ver o resultado de todos os testes: Window/Fit All Summary
ou então
![Page 54: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/54.jpg)
54
O Menu Fit (cont ...)
Ajusta à distribuições empíricas (contínuas ou discretas): Fit/Empirical
8 Pode interpretar resultados como dist.. contínuas ou discretas
• Discretas: toma pares (probabilidade cumulativa, valor);• Contínuas: Arena faz interpolação linear dentro dos limites dos
dados. Não gera dados fora dos limites (pode ser bom ou ruim);
8 Distribuições empíricas podem ser usadas intencionalmente ou, quando distribuições “teóricas” tem ajuste pobre.
![Page 55: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/55.jpg)
55
Alguns Comentários sobre Ajuste de Distribuições
Não se trata de uma ciência exata - não tem resposta “certa”;Considere distribuições teóricas X empíricas; Considere os limites das distribuições8 infinito de ambos os lados (ex.. normal);8 positiva (ex.. exponencial, gamma);8 limitadas (e.g., beta, uniforme);
Considere a facilidade de manipulação dos parâmetros afetando médias e variâncias;Possibilidade de realização de análise de sensibilidade;Dados multimodais, dados fora dos limites esperados, etc..
![Page 56: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/56.jpg)
56
Falta de Dados?
Acontece com + freqüência do que o esperado;Não existem boas soluções. Algumas soluções (ruins);8 Entrevistas com “experts”
• Min, Max: Uniforme• média., % erros ou erro absoluto: Uniforme• Min, Moda, Max: Triangular
– Moda pode ser diferente da Média — permite assimetria
8 Chegadas — independentes, estacionárias• Exponencial — necessita de um valor para a média;
8 Número de eventos “randômicos” num intervalo: Poisson8 Soma de elementos independentes: normal
![Page 57: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/57.jpg)
57
Processo de Chegadas Não-estacionário
Eventos externos (geralmente chegadas) cujas taxas variam ao longo do tempo;8 restaurantes tipo fast-food;8 Hora do Rush do tráfego das cidades;8 Call-centers (telefone);8 Demandas sazonais por produtos manufaturados;
Pode ser crítica a modelagem deste processo não-estacionário considerando a validação do modelo;8 Ignorar picos e vales pode mascarar o comportamento;
Um bom modelo: Processo Poisson Não-estacionário
![Page 58: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/58.jpg)
58
Processo de Chegadas Não-estacionário (cont...)
Duas questões:8 Como especificar/estimar a “função” taxa de chegada?8 Como gerar apropriadamente da função durante a simulação 8 Vários métodos8 Pequena idéia do método constante
• Dividir a “janela” de tempo em períodos sobre os quais imagina-se a taxa seja quase constante;
• Computar a taxa observada em cada subintervalo;• Seja muito cuidadoso com as unidades de tempo!
– Unidades de tempo do Modelo = minutos– Subintervalos = meia hora (= 30 minutes)– 45 chegadas na meia hora; taxa = 45/30 = 1.5 por minuto
![Page 59: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/59.jpg)
59
Dados Multivariados e Correlacionados
Usualmente assumimos que todas as observações aleatórias geradas ao longo da simulação são independentes (mesmo que de diferentes distribuições)
Algumas vezes isto não é verdade:8 Uma “peça” mais complicada poderá requerer um longo tempo
de processo em dois servidores em seqüência
8 Isto pode resultar em uma correlação positiva;
Ignorar tais relações pode invalidar o modelo
![Page 60: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/60.jpg)
60
Distribuições Multimodais
Quando dois ou mais valores são mais freqüentes que os demaisnuma mesma amostra.
Amostra perfil de consumidores (número de itens comprados em um supermercado
![Page 61: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/61.jpg)
61
Distribuições - Exercício
Usando o Input Analyzer faça o processo de ajuste ao arquivo: “dados exercício 5. txt”
![Page 62: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/62.jpg)
62
Análise do 5º Exercício
![Page 63: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/63.jpg)
63
Análise do 5º Exercício
Dif. Max-Min = 149-4 = 145;Extensão de cada classe: 145/40 = 3,625;Limite da 14ª classe: 14x3,625 = 50,75Realizar dois novos ajustes:1º Ajuste: 14 classes e dados entre 4 e 50,752º Ajuste: 27 classes e dados entre 47,125 (50,75-3,625) e 149
14ª Classe
Separação dos dados do conjunto
![Page 64: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/64.jpg)
64
Análise do 5º Exercício
![Page 65: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/65.jpg)
65
Análise do 5º Exercício
Primeiro conjunto de dadosObserve o valor de p
![Page 66: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/66.jpg)
66
Análise do 5º Exercício
Segundo conjunto de dadosObserve o valor de p
![Page 67: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/67.jpg)
67
Análise do 5º Exercício
Conclusão: O Input Analyzer não considera os dados em separado para o cálculo do valor de p.
14ª Classe
Separação dos dados do conjunto
![Page 68: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/68.jpg)
68
Análise do 5º Exercício
Mesmo exercício com a separação dos dados do conjunto original em dois conjuntos a serem
tratados individualmente.
![Page 69: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/69.jpg)
69
Análise do 5º Exercício
Analise do primeiro conjunto, com dados entre 4 e 50. O teste K-S éaceitável. O Chi-quadrado não.
![Page 70: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/70.jpg)
70
Análise do 5º Exercício
Analise do segundo conjunto, com dados entre 51e 149. novamente, o teste K-S é
aceitável. O Chi-quadrado não.
![Page 71: Análise de Dados - inf.ufsc.brfreitas/cursos/simgrad/2005-2/Aulas/5101 A13... · do sistema real, é fundamental que este traga consigo a possibilidade de apresentar até mesmo um](https://reader031.vdocuments.com.br/reader031/viewer/2022022106/5be4fab109d3f2d7048db3eb/html5/thumbnails/71.jpg)
71
Análise do 5º Exercício: Distribuição Empírica