previsão de consumos
Post on 11-Jan-2016
45 Views
Preview:
DESCRIPTION
TRANSCRIPT
Distribuição de Energia II5º ano da LEEC - ramo de Energia
(FEUP)
Previsão de consumos
Modelos de regressão
Cláudio Monteiro
Modelos de Regressão
y = 3,0727x + 24,2
10
20
30
40
50
60
70
1 3 5 7 9 11
Y
X
Se conhecer uma relação linear entre as variáveis dependentes e independentes podemos estimar o valor de Z em cada ponto.
Valor estimado da variável dependenteZ
Variáveis independentes Vi, no ponto PjPjViX ,
Parâmetros da regressão para a variável ViVi
Variável dependente para o ponto PjPiZ
kVkVV XXXZ 12110ˆ
PiViPi XZ ,;
A estimativa da variável dependente, com base na regressão, terá um erro (resíduo):
kPiVkPiVPiVPiPiPiPi XXXZZZ ,1,21,10ˆ
Pi
Modelos de RegressãoMínimos quadrados
3
2
1
P
P
P
Z
Z
Z
Z
Consideremos um problema com 3 pontos P1,P2 e P3 e 2 variáveis independentes V1 e V2.
3,23,1
2,22,1
1,21,1
1
1
1
PVPV
PVPV
PVPV
XX
XX
XX
X
2
1
0
V
V
XZ
Para encontrar os parâmetros usamos o método dos mínimos quadrados, que consiste em minimizar o quadrado dos resíduos.
233
2
22
2
1123
22
21
ˆˆˆPPPPPP ZZZZZZL
223,213,1032
22,212,1022
21,211,101 PVPVPPVPVPPVPVP XXZXXZXXZL
XZXZL t
Vi
Modelos de RegressãoMínimos quadrados
02
XZXL t
A derivada parcial em ordem a cada um dos parâmetros será:
Resolvendo o sistema de equações temos:
ZXXX tt 1
Exemplo: DE2_A3_MQ.xls
XZXZL t
Modelos de regressãoComo escolher variáveis1. Seleccionar uma grande lista de variáveis
Com base na experiência escolher variáveis que estão relacionadas com a grandeza a prever
2. Decompondo o modelo em vários Decompor por tipo de consumidor (industrial, doméstico,
comercial, etc.) Decompor por sazonalidade (por trimestre, por dia da
semana, por hora do dia , etc.)
3. Estruturar os modelos Analisar as dependências entre as variáveis e recalcular as
séries de forma que as dependências sejam mais evidentes (ex. prever o consumo per-capita em vez de prever o consumo global)
Analisar dependências temporais entre as variáveis (desfasamentos temporais, médias móveis, etc.)
Modelos de regressãoComo escolher variáveis4. Visualizar gráficos ZXi
Observar a relação entre as variável dependente e independente, se não existir relação elimine a variável
5. Visualizar gráficos XiXj Observar a relação entre as variáveis explicadoras,
eliminar variáveis em pares altamente correlacionadas evitando colinearidade
6. Testes de significância Fazer a regressão, observar estatísticas e significâncias (R,
t-teste, F-teste), excluir variáveis sem significância.
7. NOTA: Existem métodos formais implementados em software para a escolha das variáveis (ex. “subset regression”, “stepwise regression”, etc.)
Modelos de regressãoFerramentas úteis
Gráficos “scaterplot” ZXi e XiXj.
Fornece informação visual sobre as correlações entre as várias variáveis independentes XiXj e entre estas e a variável dependente ZXi.
Também é possível observar estas relações por classes (na figura vemos diferentes cores para cada trimestre)
Modelos de regressãoFerramentas úteis
Gráficos CCF (Cross-correlation funtion)
Permitem avaliar as dependências temporais (atrasos e avanços) entre a variável dependente e as variáveis explicadoras.
NOTA: é necessário ter prática e cuidado na interpretação destes gráficos.
Modelos de regressãoFerramentas úteis
totaisdesvios
explicados desviosˆ
2
2
2
PiPi
PiPi
ZZ
ZZR
Coeficiente de determinação R2
y = 3,0727x + 24,2
10
20
30
40
50
60
70
1 3 5 7 9 11
Y
X
Desvio explicado
Desvio não explicado
Desvio total
Z
Z
R2 representa a proporção da variável dependente Z que pode ser explicada pela regressão (valor entre 0 e 1 em que valores mais elevados correspondem a melhores regressões).
R2 ajustadoé o valor ajustado de R2 tendo em conta o nº de pontos e o número de variáveis independentes
Modelos de regressãoFerramentas úteis
11 2
2
knR
kRF
F - testeÉ a razão entre a variância devida à regressão e a variância devida ao erro. Já tem em conta o número de pontos n e o número de variáveis k.
F deve ser elevado e a significância de F deve ser inferior a 0.05 (teste de hipótese: probabilidade dos parâmetros da regressão serem 0).
ANOVA (ANalysis Of VAriance)Analisa a variância verificando a aceitabilidade do modelo do ponto de vista estatístico
Modelos de regressãoFerramentas úteis
t - testePermite avaliar a importância de cada variável independente no conjunto de variáveis do modelo.
Cada coeficiente de regressão tem uma variância associada É com base nesta variância que é calculado t
A significância de t é uma medida da importância (<0.05) relativa da variável (teste de hipótese: probabilidade desse parâmetro ser 0)
)(SE)( Vi
ViVi SEt
Análise de colinearidade
% não explicável por outras variáveis
Modelos de regressãoFerramentas úteisTransformações de funções não lineares em lineares
Modelos de regressãoMedidas de erro
Erro médio (ME)
n
ttt FY
nME
1
1
Erro médio absoluto (MAE)
Erro médio quadrático (MSE)
Erro médio percentual (MPE)
Erro médio absoluto percentual (MPE)
n
ttt FY
nMAE
1
1
n
ttt FY
nMSE
1
21
n
t t
tt
Y
FY
nMPE
1
1
n
t t
tt
Y
FY
nMAPE
1
1
top related