estimação de parâmetros - unicamprafael/ia369/analise_dados.pdf · rém melhor que a anterior....
TRANSCRIPT
1Simulação de Sistemas Dinâmicos
4. Análise de Dados
Estimação de Parâmetros
Em geral, numa simulação, deseja-se conhecer quan-tidades relacionadas a v.a.'s cuja obtenção direta se-ria muito difícil ou impossível.
Exemplo: Tempo médio de sistema em regimenuma rede de filas complexa.
Em geral utilizam-se dois tipos de estimação:
•estimação pontual: quando se deseja um únicovalor correpondendo à quantidade de interêsse;
•estimação de intervalo: quando se deseja co-nhecer um intervalo no qual o parâmetro esti-mado esteja com nível de confiança dado (1−α).
As técnicas de estimação são utilizadas também paradeterminar parâmetros das distribuições de dados deentrada obtidos experimentalmente.
2Simulação de Sistemas Dinâmicos
4. Análise de Dados
Estimação Pontual
Considere-se uma série de v.a.'s correspondendoà amostragem de n valores de um espaço amostral:
X1, X2, ..., Xn
Caso mais simples: a sequência acima é i.i.d., sendo θ a média da distribuição comum.
Um estimador para θ é:
∑=
=θn
1iin X
n1ˆ
obs.: θn é uma v.a. utilizada para estimar onúmero real θ.
^
Se E[θn] = θ o estimador é dito não-polarizado^
3Simulação de Sistemas Dinâmicos
4. Análise de Dados
Se as v.a.'s são identicamente distribuídas (nãonecessariamente independentes), o estimador énão polarizado:
θ=θ==θ ∑∑==
n
1i
n
1iin n
1]X[E
n1
]ˆ[E
Se o processo estocástico é contínuo:
∫=θT
0T dt)t(X
T1ˆ
Em geral, E[θn] = θ + βn e o estimador é polarizado^
Qual a variância da v.a. θn ?^
n]ˆ[Var
2
nσ
=θ
se a sequência Xi for i.i.d. e σ2 = Var[Xi]
4Simulação de Sistemas Dinâmicos
4. Análise de Dados
Um estimador para a variância σ2 é dado por:
( )∑=
θ−−
=n
1i
2
ni2n
ˆX1n
1S
Prova-se que E[Sn2] = σ2, quando a seq. for i.i.d.
Finalmente, um estimador para Var[θn] é:^
( )∑=
θ−−
==θσn
1i
2
ni
2n
n2 ˆX
)1n(n1
nS
)ˆ(ˆ
obs.: 0)ˆ(ˆlim n2
n=θσ
∞→
5Simulação de Sistemas Dinâmicos
4. Análise de Dados
n cresce
θ θ
Densidade de probabilidade de θn:^
Teorema forte dos Grandes Números:
Se X1, X2, ..., Xn é uma sequência i.i.d. de v.a.'scom média θ finita, então:
θn → θ com probabilidade 1, quando n → ∞^
Obervações: a) assim como a não polarização, a propriedadeacima denominada "consistência forte" é desejávelem qualquer estimador.
b) um estimador pode ser fortemente consistente eao mesmo tempo não polarizado.
6Simulação de Sistemas Dinâmicos
4. Análise de Dados
comportamento típico:
θ
θn^Var[θn]
^
n
Em experimentos de simulação, é usual queas sequências de amostras não sejam i.i.d.
Este fato não interfere em geral na estimativade θn, mas afeta Sn
2.^
Alternativas: estimar correlações ou organizaros dados de saída de modo a descorrelacioná-los
7Simulação de Sistemas Dinâmicos
4. Análise de Dados
Estimação de Intervalos
Problema: Estimar um intervalo dentro do qualo parâmetro θ esteja com grau de confiança 1 − α(p.ex. 95%)
Define-se:
]ˆ[Var
]ˆ[EˆZ
n
nnn
θ
θ−θ=
No caso i.i.d.:
n]ˆ[Var
]ˆ[E2
n
n
σ=θ
θ=θ portanto:
n
ˆZ
2
nn
σ
θ−θ=
8Simulação de Sistemas Dinâmicos
4. Análise de Dados
Teorema do Limite Central:
∫∞−
τ−
∞→τ
π=Φ=
x2
nnde
21
)x()x(Flim2
Φ(x) é a distribuição normal padronizada
Duas consequências deste teorema:
•A distribuição de θn se aproxima de uma normal
•Esta normal tende à média θ e à variância σ2/n
^
Seja Fn(x) a distribuição da variável aleatória Zn
9Simulação de Sistemas Dinâmicos
4. Análise de Dados
Utilização para a estimação de intervalos:
x
2x
2
edxd −
=Φ
1 − α
2zα
2zα−
Quando n é grande: P[−zα/2 ≤ Zn ≤ zα/2] ≅ 1 − α
Equivalentemente:
P[θn − zα/2 √(σ2/n) ≤ θ ≤ θn + zα/2√(σ2/n)] ≅ 1 − α^ ^
10Simulação de Sistemas Dinâmicos
4. Análise de Dados
P[θn − zα/2 √(σ2/n) ≤ θ ≤ θn + zα/2√(σ2/n)] ≅ 1 − α^ ^
Portanto, a determinação do intervalo de confiançadepende de:
θn: estimação da média;zα/2: tabulado (dado α);σ2: variância da v.a. θn (desconhecida)
^
^
Contudo, σ2 pode ser estimado por:
( )∑=
θ−−
=n
1i
2
ni2n
ˆX1n
1S
Dado que o lim Sn2 = σ2 tem-se que teorema do
limite central vale também para a v.a.:n→∞
nS
ˆT
2n
nn
θ−θ=
11Simulação de Sistemas Dinâmicos
4. Análise de Dados
θn − zα/2 √(Sn2/n) ≤ θ ≤ θn + zα/2√(Sn
2/n)^ ^
Portanto o intervalo
fica completamente determinado.
Questão: Qual deve ser o valor de n?
Suponha que a sequência X1, X2, ..., Xn seja normal.Se isto fôsse o caso, qual seria a densidade de proba-bilidade da variável aleatória:
?
nS
ˆT
2n
nn
θ−θ=
Observe-se que tanto θn quanto Sn2 dependem
dos Xi. Esta distribuição é conhecida como distribuiçãot de Student
^
12Simulação de Sistemas Dinâmicos
4. Análise de Dados
Um dos parâmetros da distribuição t de Studenté o número de graus de liberdade.
A distribuição Tn anterior (com a hipótese de quecada Xi seja normal) tem (n − 1) graus de liberdade.
A partir de dados tabulados é possível determi-nar (em função de α e de n) o valor de tn−1,α/2tal que:
P[−tn−1,α/2 ≤ Tn ≤ tn−1,α/2 ] = 1 − α
o que leva a:
P[θn − tn−1,α/2 √(Sn2/n) ≤ θ ≤ θn + tn−1,α/2√(Sn
2/n)] ≅ 1 − α^ ^
Obs.: Esta continua sendo uma aproximação, po-rém melhor que a anterior.
Este é o cálculo implementado na maior partedos simuladores
13Simulação de Sistemas Dinâmicos
4. Análise de Dados
14Simulação de Sistemas Dinâmicos
4. Análise de Dados
Análise de Dados de Entrada
Numa simulação a determinação de modelos adequa-dos para as entradas do sistema é ao mesmo tempo:
•Fundamental para a confiabilidade dos resultadosda simulação;
•Exigente, em termo de tempo e recursos.
Etapas na determinação de modelos para os dadosde entrada:
1. Coleta de dados (nem sempre possível);
2. Identificação da distribuição de probabi-lidades do processo de entrada (usual-mente com a ajuda de histogramas);
3. Determinar parâmetros para a distribuiçãoescolhida;
4. Avaliar a distribuição resultante (grafica-mente ou através de testes estatísticos)
15Simulação de Sistemas Dinâmicos
4. Análise de Dados
Coleta de Dados
Cuidados:•Coleta precisa;•Análise apropriada;•Representatividade do ambiente.
Sugestões:
Planejamento cuidadoso; pré-observação; considera-ção de várias formas de coletar os dados; observaçãode circunstâncias não-usuais.
Análise preliminar durante a coleta; verificação daadequação dos dados; rejeição de dados supérfluos.
16Simulação de Sistemas Dinâmicos
4. Análise de Dados
Verificação de eventuais relações entre variáveis;p.ex. através da inspeção visual de diagramas deespalhamento.
Consideração da possibilidade de que uma sequên-cia de medidas aparentemente independentes possaapresentar autocorrelação.
Combinação de conjuntos de dados homogêneos;verificação da homogeneidade de dados coletadosem horários ou dias diferentes (p.ex. através de suasmédias)
Atenção à omissão de dados fora dos processos deinterêsse, porém importantes para o processo global.
17Simulação de Sistemas Dinâmicos
4. Análise de Dados
Identificação da Distribuição
10 passo: Construção de um histograma
•Dividir a faixa de valores dos dados em interva-los (usualmente iguais);
•Rotular o eixo horizontal;
•Determinar a frequência de ocorrência dentrode cada intervalo;
•Plotar as frequências no eixo vertical.
20 passo: Selecionar uma família de distribuições
Esta seleção deve ser feita com base:
•na aparência do histograma;
•na natureza do processo analisado.
18Simulação de Sistemas Dinâmicos
4. Análise de Dados
Alternativa útil quando há poucos dados:Gráficos Quantile × Quantile
Seja a v.a. X, com função de distribuição F(x); de-fine-se o q-quantile de X (0 ≤ q ≤ 1)como sendo:
γ = F−1(q)
Considere-se agora um conjunto de observações dav.a. X: {y1, y2, ..., yn}, colocados em ordem crescen-te: yj ≤ yj+1, ∀j
É interessante observar que yj é uma estimativapara o [(j − ½)/n]-quantile de X
1
F(x)
y1 y12
n = 12
(12 − ½)/12
(1 − ½)/12
y6 y9
x
19Simulação de Sistemas Dinâmicos
4. Análise de Dados
Portanto, para verificar se um conjunto de observa-ções, {y1, y2, ..., yn} tem como distribuição F(x),plota-se:
y Fj
nj versus −−
11
2
Se a distribuição for correta o resultado é aproxima-damente uma linha reta com inclinação unitária.
Se a inclinação não for unitária, trata-se da escolhacorreta da família de distribuições, porém com parâ-metros errados.
Observações:•Os valores observados nunca caem exatamente
sobre a curva;
•Devido à ordenação, há dependência, portantose um ponto cai acima da curva, o próximoprovavelmente também cairá.
•As variâncias nos extremos podem ser maiores que no resto da faixa de valores (maior lineari-dade no centro da faixa).
20Simulação de Sistemas Dinâmicos
4. Análise de Dados
Determinação de Parâmetros
As distribuições usuais tem parâmetros diretamenterelacionados à média e à variância e portanto podemser avaliados a partir de seus estimadores. Em algunscasos outros estimadores podem ser usados.
Exemplos:
Distribuição Parâmetros EstimadoresPoisson α = λt α = θn
Exponencial λ λ = 1/θn
Gama θ, β θ= 1/θn
β: tabelado a partir de MUniforme b(0,b)
Normal θ, σ2 θ = θn
σ2 = Sn2
Mn
Xn ii
n= −
=∑ln( $ ) ln( )θ
1
1
^^^
^^^
^
^^
$ [max( )]bn
nX
ii=
+1
^
21Simulação de Sistemas Dinâmicos
4. Análise de Dados
Testes de Ajuste de Distribuições
χθ
σn ii
ni
i
nz
X2 2
1
2
21
= =−
= =∑ ∑ ( )
A variável aleatória chi-quadrado com n grausde liberdade é definida como:
onde zi são variáveis normais padrão independentes
Propriedades:
22n1n
22n
21n
2nn
2n
2n
normal lim
n2][Var
n][E
+
∞→
χ=χ+χ
=χ
=χ
=χ
A propriedade de aditividade pode ser generaliza-da para um número arbitrário finito de variáveis.
22Simulação de Sistemas Dinâmicos
4. Análise de Dados
23Simulação de Sistemas Dinâmicos
4. Análise de Dados
Sejam:
Ei: frequência esperada de uma variável aleatóriaX no i-ésimo intervalo de valores: Ei = n ∆i;
Oi: frequência observada no mesmo intervalo:Oi = ni (i = 1, 2, ..., k).
f(x)
xi-ésimointervalo
{
densidade deprobabilidade
∆i = área
x
histograma
i-ésimointervalo
{
h(x)
ni
......
Considerem-se n dados observados, agrupados em kintervalos e seja f(x) a densidade que se quer testar.
24Simulação de Sistemas Dinâmicos
4. Análise de Dados
Pode-se mostrar que a variável aleatória:
( )χ0
22
0=
−
=∑
O EE
i i
ii
k
é uma distribuição chi-quadrado com p graus deliberdade, onde:•p = k − s − 1;•s é o número de parâmetros estimados a partir
da amostra.
Para verificar se o conjunto de dados coletadoscorresponde à distribuição proposta com nível designificância (α), aplica-se o teste de chi-quadrado:
Hipótese rejeitada se: χ χα02 2> ,p
onde: P p p[ ],χ χ αα2 2> =
P[rejeitar hip. | hip. é verdadeira] = α
25Simulação de Sistemas Dinâmicos
4. Análise de Dados
Observações:
a) Se o número de observações é muito pequeno, difi-cilmente algum candidato é rejeitado; se é grande, to-do candidato é facilmente é rejeitado.
b) É recomendável que a frequência esperada em cadaintervalo (Ei) seja > 5. Caso isso não aconteça deve-se agrupar intervalos adjacentes. O parâmetro k deve sernesse caso, adequadamente reduzido.
c) Sugere-se que o número de intervalos para variáveiscontínuas obedeça a seguinte tabela:
20 não usar o chi-quadrado
50 5 a 10
100 10 a 20
>100 nn
a 5
tamanho da número de intervalos (k)amostra (n)
26Simulação de Sistemas Dinâmicos
4. Análise de Dados
Exemplo:
Durante 100 dias úteis observou-se o número de auto-móveis passantes num certo ponto de uma estrada noperíodo entre 7h00 e 7h05. Os número obtidos foram:
n0 de autos: 0 1 2 3 4 5 6 7 8 9 10 11
freq. obs.: 12 10 19 17 10 8 7 5 5 3 3 1
Pergunta: É uma distribuição de Poisson ?
p xex
x
( )!
;=−α
α λα
= t; x = 0, 1, 2, K
10 passo: α = θn = 3,64 ^ ^
20 passo: Ei = n p(xi) = 100 p(xi); xi = 0, 1, ..., 11
n0 de autos: 0 1 2 3 4 5 6 7 8 9 10 11
freq. esper.: 2,6 9,6 17,4 21,1 19,2 14,0 8,5 4,4 2,0 0,8 0,3 0,1
27Simulação de Sistemas Dinâmicos
4. Análise de Dados
30 passo: calcular( )
χ02
2
0=
−
=∑
O EE
i i
ii
k
n0 de autos: 0 1 2 3 4 5 6 7 8 9 10 11
Oi: 12 10 19 17 10 8 7 5 5 3 3 1
n0 de autos: 0 1 2 3 4 5 6 7 8 9 10 11
Ei: 2,6 9,6 17,4 21,1 19,2 14,0 8,5 4,4 2,0 0,8 0,3 0,1
22 17
12,2 7,6
( )O EE
i i
ii
k −=
=∑
2
027 68,portanto:
40 passo: p = k − s − 1 = 7 − 1 − 1 = 5; α = 0,05
χ0 01 52 111 27 68, ; , ,= < rejeitar hipótese
28Simulação de Sistemas Dinâmicos
4. Análise de Dados
Dados empíricos indisponíves:
Dados técnicos:Alguns dispositivos simulados podemapresentar informações do fabricantedo tipo: tempo médio entre falhas, taxade produção média, etc..
Opinião de especialistas:Especialistas no processo em simulaçãopodem estimar piores e melhores casospara uma variável, variabilidade de umavariável, fonte de variabilidade, etc..
Limitações físicas e convencionais:A taxa em regime de processos em cas-cata não pode exceder a taxa do compo-nente mais lento; políticas de uma em-prêsa podem limitar durações, etc..
Natureza do processo:As distribuições usuais estão associadasa alguma hipótese, muitas vezes identifi-cável.
29Simulação de Sistemas Dinâmicos
4. Análise de Dados
Dependência entre variáveis:
Modelos multivariáveis:Quando há um número fixo e finito devariáveis aleatórias
Séries Temporais:Sequência de variáveis aleatórias re-lacionadas
Dadas duas v.a.'s, X1 e X2, respectivamente commédias µ1 e µ2, e variâncias σ1 e σ2 define-se:
cov(X1,X2) = E[(X1 − µ1)(X2 − µ2)] = E[X1X2] − µ1µ2
ρ = corr(X1,X2) = cov(X1,X2)/(σ1 σ2)
−1 ≤ ρ ≤ +1
30Simulação de Sistemas Dinâmicos
4. Análise de Dados
Se X1 e X2 são duas variáveis aleatórias normaisdependentes, a distribuição conjunta é completa-mente caracterizada por:
•médias: µ1 e µ2;•variâncias: σ1
2 e σ22
•covariância: cov(X1, X2)
Suas estimativas, a partir de n pares de dados{(X11, X21), (X12, X22), ..., (X1n, X2n)}são relacio-nadas por:
c$ov( , ) ( $ ) ( $ )
$ $
X Xn
X X
nX X n
j jj
n
j jj
n
1 2 1 1 2 21
1 21
1 2
11
11
=−
− ⋅ − =
−⋅
− ⋅ ⋅
=
=
∑
∑
µ µ
µ µ
21
21
ˆˆ)X,Xv(ocˆ
σσ=ρ
onde os estimadores de média e de variânciasão idênticos aos considerados anteriormente.
Modelos multivariáveis:
31Simulação de Sistemas Dinâmicos
4. Análise de Dados
Séries Temporais:
Seja {X1, X2, ...} uma sequência de v.a.'s identica-mente distribuídas, dependentes e com covariânciaestacionária. Alguns modelos são possíveis paradescrever este tipo de processo.
Exemplo:
t1tt )X(X ε+µ−⋅φ+µ= −
t = 2, 3, ...ε2, ε3, ... são v.a.'s normais i.i.d. com média nula evariância σ2
−1 < φ < 1
Se X1 é definida com distribuição normal, média µe variância σε
2/(1 − φ2), então as v.a.'s X2, X3, ...tem a mesma distribuição e ainda:
ρh = corr(Xt, Xt+h) = φh
A estimação do parâmetro φ pode ser obtida de:
φ = ρ1 = corr(Xt, Xt+1)
32Simulação de Sistemas Dinâmicos
4. Análise de Dados
Exemplo:
Xt = φ Xt−1; com probabilidade φφ Xt−1 + εt ; com probabilidade (1 − φ){
t = 2, 3, ...ε2, ε3, ... são v.a.'s exponenciais i.i.d. com média 1/λ0 < φ < 1
Se X1 é definida com distribuição exponencial, média1/λ, então as v.a.'s X2, X3, ... tem a mesma distribuiçãoe ainda:
ρh = corr(Xt, Xt+h) = φh
Como anteriormente, a estimação do parâmetro φpode ser obtida de:
φ = ρ1 = corr(Xt, Xt+1)
33Simulação de Sistemas Dinâmicos
4. Análise de Dados
Verificação e Validação
•Reproduzir o comportamento do sistema modeladoo mais realisticamente possível;
•Aumentar a credibilidade do simulador, inclusive frente aos usuários finais;
•Processo pelo qual se adquire confiança de que aanálise de saídas leva a inferências válidas.
Verificação
"Construir o modelo corretamente"
•Comparação entre um modelo conceitual e um modelooperacional, representável em computador;
•O modelo está implementado corretamente nocomputador?
•Os parâmetros de entrada e a estrutura lógica estãocorretamente representados?
34Simulação de Sistemas Dinâmicos
4. Análise de Dados
Validação
"Construir o modelo correto"
•A representação em computador é um modelo preciso?
•Usualmente atingida via calibração do modelo:
•Calibração: Processo iterativo de comparação entreos comportamentos do modelo e do sis-tema; correção até que se atinja a preci-são desejada.
Etapas na construção de um modelo
A - Observação e questionamento:
•Observação do comportamento geral;•Observação da interação entre os componentes;•Coleta de dados;•Questionamento de pessoas familiares com o sistema(operadores, técnicos, pessoal de manutenção, enge-nheiros, supervisores, gerentes, etc.).
•Esta etapa deve ser revisitada à medida que o desen-volvimento do modelo avança.
35Simulação de Sistemas Dinâmicos
4. Análise de Dados
B - Construção de um modelo conceitual:
•Coleção de hipóteses sobre os componentes eestrutura do sistema;
•Hipóteses relativas aos valores dos parâmetrosdas entradas do modelo;
•Abstrações e simplificações;•A validação conceitual é a comparação do sis-tema real com o modelo conceitual.
C - Tradução do modelo conceitual para ummodelo operacional:
•O modelo operacional é reconhecível pelalinguagem de simulação - "forma computa-dorizada"
Todas estas etapas devem ser revisitadas perma-nentemente, inclusive nos processos de verifica-ção e validação.
36Simulação de Sistemas Dinâmicos
4. Análise de Dados
Modelo conceitual:1. Hipóteses sobre os componentes do sist.2. Hipóteses sobre a estrutura, que definem
as interações entre os componentes3. Parâmetros de entrada e hipóteses sobre
os dados
Modelo Operacional(representação com-
putadorizada)
SistemaReal
calibraçãoe validação
validaçãoconceitual
verificaçãodo modelo
37Simulação de Sistemas Dinâmicos
4. Análise de Dados
Verificação
•Garantir que o modelo conceitual está adquadamen-te representado no modelo operacional;
•É um procedimento dificilmente formalizável;
•As sugestões a seguir derivam da experiência e bom-senso e se aplicam a qualquer construção de software:
1 - Garantir que a representação computadorizada sejaverificada por alguém além do programador;
2 - Construir um fluxograma com todas asações logica-mente possíveis decorrentes da ocorrência de um evento;
3 - Examinar se as saídas do sistema são razoáveis parauma grande variedade de entradas - imprimir muitasestatísticas de saída;
4 - Imprimir os parâmetros de entrada ao fim da simula-ção para detectar mudanças inadvertidas;
38Simulação de Sistemas Dinâmicos
4. Análise de Dados
5 - Documentar a representação computadorizadada maneira mais completa possível; definir as vari-áveis precisamente; comentar a função de trechosrelevantes de código;
6 - Se há animação, verificar a compatibilidade como sistema real (p. ex. AGV's que se superpõem);
7 - Usar, se houver, um "Controlador de ExecuçãoInterativo" (Interactive Run Controller - IRC oudebugger);
8 - Interfaces gráficas facilitam o processo de vali-dação e verificação (constituem uma forma de do-cumentação - vide Extend)
9 - Uma técnica mais sofisticada é o traço de umsimulador.
39Simulação de Sistemas Dinâmicos
4. Análise de Dados
Validação e Calibração
Validação: Processo global de comparação entreos comportamentos do sistema e do modelo.
Calibração: Processo iterativo de comparação e ajustes
Modelo inicial
1a revisãodo modelo
2a revisãodo modelo
M
comparação
comparação
comparação
SistemaReal
40Simulação de Sistemas Dinâmicos
4. Análise de Dados
O processo de comparaçãopode ser feito por testes:
subjetivos: envolvem es-pecialistas e seus julga-mentos sobre o modelo e suas saídas.
objetivos: envolvem dadosdo sistema e do modelo;revisões até a precisão de-sejada.
Crítica: Validação realizada sobre um único conjuntode dados.
Alternativa: Novo conjunto de dados para uma fase finalde validação.
Se discrepâncias muito grandes forem detectadas:revisão do modelo
41Simulação de Sistemas Dinâmicos
4. Análise de Dados
•Validação não é um processo com fronteira clara;
•Nenhum modelo representa completamente umsistema.
•Há portanto um compromisso:precisão custo
Sugestões:
1. Construir um modelo com boa"validade de rosto";
2. Validar as hipóteses do modelo;
3. Comparar as transformações entrada-saída do mode-lo com as transformações entrada-saída do sistema.
42Simulação de Sistemas Dinâmicos
4. Análise de Dados
"Validade de rosto":
Qualidade de "parecer razoável" do ponto de vistados usuários e dos conhecedores do sistema;
Os potenciais usuários devem preferencialmenteestar envolvidos desde a conceitualização até aimplementação do modelo;
Usuários e conhecedores podem também ajudar aidentificar deficiências no modelo;
A credibilidade final do simulador é essencial parabasear tomadas de decisão;
Teste: Análise de SensibilidadeSe variáveis de entrada forem alteradas, as saídasvariam conformemente ?(aspecto importante: seleção das relações entrada-saídaa serem testadas)
43Simulação de Sistemas Dinâmicos
4. Análise de Dados
Validação das hipóteses do modelo:
Hipóteses do modelo:Estruturais
Dados
Estruturais:
•Envolvem simplificações e abstrações da realidade;
•Verificadas por observação do sistema nos períodosapropriados e com conhecedores do sistema.
Dados:
•As hipóteses sobre os dados devem ser baseadas emcoleta de dados confiáveis e análise estatística correta;
•Deve-se tomar cuidado para garantir a não-correlaçãodos dados tratados;
•Os procedimentos para fundamentar e analisar as hi-póteses sobre os dados foram tratados anteriormente.
44Simulação de Sistemas Dinâmicos
4. Análise de Dados
Validação das transformações Entrada-Saída
•Nesta fase o modelo é visto como uma transformaçãoentrada-saída.
•Técnica: predição do passadoUsar dados passados (diferentes daqueles usados paracalibrar o sistema) ao fazer uma validação final.
1a alternativa:
•Coletar dados de entrada e calcular as respectivas saídas;
•Gerar, via modelo, dados de entrada e obter saídas;
•Comparar estatisticamente as saídas reais com as saídassimuladas (testes de hipótese).
45Simulação de Sistemas Dinâmicos
4. Análise de Dados
Exemplo:
entradasobservadas Sistema Real saídas
(Intervalos entre chegadas;Tempos de Serviço;)
(E[S];r = utilização do servidor
entradasgeradas Modelo saídas
Teste de hipótese: as saídas calculadas (p. ex. E[S])e as saídas obtidas pelo modelo tem a mesmadistribuição?
46Simulação de Sistemas Dinâmicos
4. Análise de Dados
2a alternativa:
•Utilizar os dados observados como entradas domodelo e calcular as saídas;
•Comparar estatisticamente (teste de hipótese)com as respectivas saídas calculadas no sistemareal.
3a alternativa:
Teste de Turing: Comparação, por conhecedoresdo sistema, de resultados reais × resultados simulados
Exemplo:
10 relatórios usuais:(embaralhados)
5 simulações
5 reais
Se um especialista reconhecer um número significa-tivo de relatórios obtidos via simulação:
rever o modelo
47Simulação de Sistemas Dinâmicos
4. Análise de Dados
Análise de Dados de Saída
Um aspecto fundamental para a análise estatítica dedados é que os valores sejam independentes.
Numa sequência: Y1, Y2, ..., Yk, ..., Yn, se:
cov[Yi, Yi+p] = E[(Yi − Y) (Yi+p − Y)] ≠ 0
então a estimativa da variânciaserá polarizada.
−
−= ∑
=
n
1k
2k )YY(
1n1
Se cov > 0 variância sub-estimada (pior caso)
Se cov < 0 variância sobre-estimada (+seguro)
48Simulação de Sistemas Dinâmicos
4. Análise de Dados
Em geral, as simulações podem ser divididas em:
a) Simulações terminantes:
Simulações que tem uma finalização bem definida:
tempoeventoestado
b) Simulações não-terminantes:
Simulações sem final definido, estando o interêsseem analisar o funcionamento em regime do sistema.Deseja-se por exemplo estimar parâmetros de distri-buições estacionárias.
Dificuldades:condições iniciais
regra de paradanão há regrasrigorosas
Usualmente, quanto mais longa a simulação, melhor.
49Simulação de Sistemas Dinâmicos
4. Análise de Dados
Simulações terminantes
Sejam X1, X2, ..., Xk, ..., XM, medidas de algumparâmetro de interêsse numa simulação.
Em geral, esta sequência não é i.i.d. e uma estimativa(p. ex. da média) da sequência seria polarizada.
Pode-se estar interessado numa função de M medi-das L(X1, X2, ..., Xk, ..., XM). Esta função pode in-clusive ser a média.
A pergunta é: como estimar L ?
Uma técnica usual são as "replicações independentes"
50Simulação de Sistemas Dinâmicos
4. Análise de Dados
Calcula-se L(X1, X2, ..., Xk, ..., XM) para N simula-ções diferentes:
mesmas condições iniciais;diferentes sequências de v.a.'s(variam-se aleatoriamente as sementes)
Obtém-se uma sequência: L1, L2, ..., LN
Estas sequências são praticamente i.i.d.
É possível p. ex. estimar um intervalo de confiançapara a estimativa da média:
∑=
=N
1jjL
N1
L
51Simulação de Sistemas Dinâmicos
4. Análise de Dados
Simulações não-terminantes
Nesse caso, em geral, deseja-se conhecer algum pa-râmetro referente ao comportamento de alguma se-quência em regime (se o regime existir).
X1, X2, ..., Xk, ...
Quanto maior o número de amostras, melhor o resul-tado, contudo o número deve ser finito.
Uma técnica para melhorar a análise deste tipo desaída é eliminar dados no início da simulação:
X1, X2, ..., Xr, Xr+1, ..., Xm
ignorar considerar
Warm-up (aquecimento)ou
Deleção de dados iniciais
52Simulação de Sistemas Dinâmicos
4. Análise de Dados
Procede-se então como no caso já analisado, fazendovárias (n) replicações:
Xi,j
Xr,j
r mi
eliminado
M
M(j-ésima simulação)
n,,1j ;Xrm
1L
m
1rij,ij L=
−= ∑
+=
∑=
=θn
1jjL
n1ˆ
53Simulação de Sistemas Dinâmicos
4. Análise de Dados
Média de bateladas
(técnica mais simples, porém menos segura)
Uma única simulação (mais longa) é realizada esomente um período de "warm-up" é considerado;as estimativas de Lj são obtidas de dados sequenciais.
eliminado bat_1 bat_2 bat_n... i
Xi
n,,1j ;Xm1
Ljmr
1m)1j(riij L== ∑
+
+−+=
∑=
=θn
1jjL
n1ˆ