series temporais rn

7
RECONSTRUÇÃO DE SÉRIES METEOROLÓGICAS VIA REDES NEURAIS ARTIFICIAIS. P. S. Lucio * ,2 1 , F. C. Conde 2 , I. F. A. Cavalcanti 3 , A. M. Ramos 2 , A. O. Cardoso 3 RESUMO: Usuários de registros climatológicos, freqüentemente, requerem dados temporais de localizações geográficas onde não fora observada qualquer medida direta de atributos meteorológicos. Condições climatológicas das áreas ou pontos de interesse têm que ser calculados interpolando observações no tempo de estações vizinhas e de indicadores “proxy” climáticos. Um dos objetivos de se avaliar a consistência no espaço de uma série temporal é esboçar as áreas para as quais a série seja capaz de fornecer informação climatológica suficientemente precisa, i.e. onde os erros ou resíduos da interpolação não excedam um valor “aceitável” pelo usuário. O objetivo deste trabalho é a reconstrução das séries climatológicas de precipitação mensal acumulada, cuja ilustração é feita para estações meteorológicas localizadas no Rio Grande do Sul - Brasil, estimando os valores faltantes através de uma interpolação espaço-temporal. Dentre as mais diversas técnicas adequadas a este tipo de aplicação, destacam-se os modelos de redes neurais artificiais, como uma alternativa interessante na construção de tecnologias de suporte à decisão. Redes neurais artificiais apresentam características específicas, intrínsecas à sua formulação, que possibilitam a aproximação de qualquer função contínua, inclusive funções não lineares complexas, e também podem generalizar os resultados obtidos para dados previamente desconhecidos. ABSTRACT: Climatological records’ users, frequently, request time series from geographical locations where there is no observed meteorological attributes. Climatological conditions of the areas or points of interest have to be calculated interpolating observations in the time of neighboring stations and climate proxy. The aim of the present work is the application of reliable and robust procedures for monthly reconstruction of precipitation time series. Time series is a special case of symbolic regression and we can use Artificial Neural Network (ANN) to explore the spatiotemporal dependence of meteorological attributes. The ANN seems to be an important tool for the propagation of the related weather information to provide practical solution of uncertainties associated with the interpolation, capturing the spatiotemporal structure of the data. In practice, one determines the embedding dimension of the time series attractor (delay time that determine how data are processed) and uses these number to define the network’s architecture. Meteorological attributes can be accurately predicted by the ANN model architecture: designing, training, validation and testing; the best generalization of new data is obtained when the mapping represents the systematic aspects of the data, rather capturing the specific details of the particular training set. Palavras-chave: correlação, precipitação, indicadores “proxy” climáticos. INTRODUÇÃO A análise da variabilidade regional de parâmetros climáticos recorre, freqüentemente, a técnicas estatísticas que produzem informações acerca do comportamento atmosférico local ou global. Os resultados da modelagem estatística fornecem indicação sobre a variabilidade climática e para tal 1 Instituto Nacional de Meteorologia (INMET) – Coordenação de Desenvolvimento e Pesquisa (CDP) Eixo Monumental Sul – Via S1 – Setor Sudoeste – 70680-900 – Brasília DF - Brasil tel: + (61) 33 44 08 34; e-mail * : [email protected] 2 Centro de Geofísica de Évora (CGE) – Portugal: [email protected] , [email protected] 3 Centro de Previsão do Tempo e Estudos Climáticos (CPTEC/INPE): [email protected] , [email protected]

Upload: intiw23

Post on 18-Nov-2015

212 views

Category:

Documents


0 download

DESCRIPTION

Series Temporais

TRANSCRIPT

  • RECONSTRUO DE SRIES METEOROLGICAS VIA REDES NEURAIS ARTIFICIAIS.

    P. S. Lucio* ,21 , F. C. Conde2, I. F. A. Cavalcanti3, A. M. Ramos2, A. O. Cardoso3 RESUMO: Usurios de registros climatolgicos, freqentemente, requerem dados temporais de localizaes geogrficas onde no fora observada qualquer medida direta de atributos meteorolgicos. Condies climatolgicas das reas ou pontos de interesse tm que ser calculados interpolando observaes no tempo de estaes vizinhas e de indicadores proxy climticos. Um dos objetivos de se avaliar a consistncia no espao de uma srie temporal esboar as reas para as quais a srie seja capaz de fornecer informao climatolgica suficientemente precisa, i.e. onde os erros ou resduos da interpolao no excedam um valor aceitvel pelo usurio. O objetivo deste trabalho a reconstruo das sries climatolgicas de precipitao mensal acumulada, cuja ilustrao feita para estaes meteorolgicas localizadas no Rio Grande do Sul - Brasil, estimando os valores faltantes atravs de uma interpolao espao-temporal. Dentre as mais diversas tcnicas adequadas a este tipo de aplicao, destacam-se os modelos de redes neurais artificiais, como uma alternativa interessante na construo de tecnologias de suporte deciso. Redes neurais artificiais apresentam caractersticas especficas, intrnsecas sua formulao, que possibilitam a aproximao de qualquer funo contnua, inclusive funes no lineares complexas, e tambm podem generalizar os resultados obtidos para dados previamente desconhecidos. ABSTRACT: Climatological records users, frequently, request time series from geographical locations where there is no observed meteorological attributes. Climatological conditions of the areas or points of interest have to be calculated interpolating observations in the time of neighboring stations and climate proxy. The aim of the present work is the application of reliable and robust procedures for monthly reconstruction of precipitation time series. Time series is a special case of symbolic regression and we can use Artificial Neural Network (ANN) to explore the spatiotemporal dependence of meteorological attributes. The ANN seems to be an important tool for the propagation of the related weather information to provide practical solution of uncertainties associated with the interpolation, capturing the spatiotemporal structure of the data. In practice, one determines the embedding dimension of the time series attractor (delay time that determine how data are processed) and uses these number to define the networks architecture. Meteorological attributes can be accurately predicted by the ANN model architecture: designing, training, validation and testing; the best generalization of new data is obtained when the mapping represents the systematic aspects of the data, rather capturing the specific details of the particular training set. Palavras-chave: correlao, precipitao, indicadores proxy climticos.

    INTRODUO

    A anlise da variabilidade regional de parmetros climticos recorre, freqentemente, a tcnicas

    estatsticas que produzem informaes acerca do comportamento atmosfrico local ou global. Os

    resultados da modelagem estatstica fornecem indicao sobre a variabilidade climtica e para tal

    1 Instituto Nacional de Meteorologia (INMET) Coordenao de Desenvolvimento e Pesquisa (CDP) Eixo Monumental Sul Via S1 Setor Sudoeste 70680-900 Braslia DF - Brasil tel: + (61) 33 44 08 34; e-mail*: [email protected] Centro de Geofsica de vora (CGE) Portugal: [email protected], [email protected] 3 Centro de Previso do Tempo e Estudos Climticos (CPTEC/INPE): [email protected], [email protected]

    mailto:[email protected]:[email protected]

  • necessita-se de sries climatolgicas de boa qualidade. Uma das medidas de qualidade das sries

    refere-se homogeneidade espao-temporal dos atributos meteorolgicos assim como um nmero

    reduzido de falhas (valores faltantes ou missing values). Por outro lado, os usurios de registros

    climatolgicos, comumente, necessitam de dados temporais em localizaes geogrficas onde no fora

    observada qualquer medida direta das variveis. Condies climatolgicas das reas ou pontos de

    interesse tm que ser calculados interpolando observaes no tempo de estaes vizinhas. Um dos

    objetivos de se avaliar a consistncia no espao de uma srie temporal delinear as reas para as quais

    a cadeia (rede meteorolgica) seja capaz de fornecer informaes climatolgicas suficientemente

    precisa, i.e., onde os erros ou resduos associados interpolao no tempo ou no espao no excedam

    um valor considerado aceitvel.

    O propsito deste trabalho obter sries climatolgicas homogneas a partir de uma rede de

    atributos meteorolgicos. Adotou-se um critrios de reconstruo baseado na construo de uma rede

    de inteligncia artificial (Bishop, 1995). Na verificao da coerncia da reconstruo foram utilizadas

    funes de autocorrelao. Este procedimento serviu para verificar se os valores apresentavam-se

    integrados numa estrutura espaotemporal da srie, possibilitando avaliar a estimativa do erro

    associado a cada valor estimado da nova srie. Numa primeira fase, com o objetivo de ilustrar o

    mtodo, foram selecionadas 6 estaes meteorolgicas do estado do Rio Grande do Sul Brasil (Fig.1),

    consideradas representativas da variabilidade climtica da regio, estimando e preenchendo os missing

    values nas sries de precipitao mensal acumulada. importante ressaltar que o modelo de ANN

    pode ser treinado para determinar a melhor relao matemtica entre a circulao atmosfrica (preditor)

    e o clima regional (preditando e/ou preditor), sem restries pr-definidas. Esta metodologia capaz de

    capturar algumas das relaes no-lineares entre o clima local e suas covariveis.

    Fig.1: Regio sob estudo (elipse assinalada em azul) e estaes meteorolgicas de controle (elipses assinaladas em

    vermelho) e estaes meteorolgicas com maior nmero de missing values (elipses assinaladas em preto).

    Em se tratando de sries longas de observaes meteorolgicas, o Estado do Rio Grande do Sul,

  • praticamente dispe de um nmero de estaes meteorolgicas que relativamente pequeno,

    impossibilitando estudos que envolvam a distribuio espacial da maior parte das variveis de

    caracterizao climtica. Desta forma, qualquer estudo climatolgico que envolva distribuio espacial

    (traado de campos), fica restrito a metodologias que utilizam o limitado espectro de atributos

    meteorolgicos existentes. Nada nos garante que o conjunto de dados no contenha erros ou valores

    esprios, consideramos que estes constituem o melhor acervo pluviomtrico deste estado.

    COVARIVEIS INPUTS INDICADORES PROXY CLIMTICOS MENSAIS

    Os chamados proxies climticos so entendidos como fontes naturais da variabilidade do clima

    (Andreoli e Kayano, 2005; Zorita et al., 1995; Kousky et al., 1884). H indicadores proxy da

    atividade solar, da temperatura do ar, de temperatura dos oceanos, do nvel dos oceanos, etc. No

    obstante, so tambm indicadores proxy das variveis do sistema climtico: a radiao solar, os

    componentes do balano de energia da atmosfera, os ciclos hidrolgicos, as caractersticas ocenicas e

    as mudanas nos ecossistemas. Os fsseis biolgicos, as taxas de acmulo de gelo, os sedimentos no

    leito marinho, os anis de rvores, dentre outros, so indicadores denominados proxies

    paleoclimticos. Neste trabalho utilizamos as informaes de alguns indicadores proxy climticos

    de caracterstica ocenica para a reconstruo das sries de precipitao. Estes indicadores entraram

    dentro da primeira camada da ANN ou camada de inputs: IOS - O El Nio-Oscilao Sul (ENSO),

    fenmeno acoplado do sistema oceano-atmosfera de grande escala espacial que afeta as circulaes

    atmosfricas; PDO - A Oscilao Decadal do Pacfico (PDO), um padro de temperatura da superfcie

    do mar no Pacfico com variabilidade mais longa que os episdios de El Nio e La Nia (ENSO) com

    escalas temporais mdias de 20 a 30 anos; TNI - O ndice Trans-Nio, definido como a diferena das

    anomalias padronizadas de temperatura superfcie do mar (SST) entre as regies de Nio 1+2 e Nio

    4; PNA - O PacificNorth American padro, definido como a segunda componente principal das

    anomalias de presso extratropical ao nvel do mar no hemisfrio norte; MEI - O ndice Multivariado

    de El Nio, baseia-se na construo de uma referncia usando tcnicas de Anlise Estatstica

    Multivariada, considerando seis variveis observadas sobre o Pacfico Tropical.

    VARIVEIS INPUTS ESTAES DE CONTROLE versus VARIVEIS OUTPUTS

    As estaes 83967 (Porto Alegre), 83907 (So Luiz Gonzaga), 83914 (Passo Fundo) e 83980

    (Bag) so as sries temporais que apresentam menor nmero de valores faltantes. Desta forma, optou-

    se em introduzi-las como controle da informao local, para verificar o comportamento e a

    performance da rede treinada. Observou-se, de forma anloga, que a estao 83919 (Bom Jesus)

  • apresentou um total de 95 missing values contnuos no incio da srie e que a estao 83995 (Rio

    Grande) continha um total de 49 valores faltantes intermitentes - estas sero nossos alvos.

    REDES NEURAIS ARTIFICIAIS ASPECTOS PRTICOS

    As variveis de entrada (inputs) correspondem a camadas que renem os dados meteorolgicos,

    alguns indicadores proxy climticos de interao oceano-atmosfera e variveis de periodicidade,

    enquanto que a varivel de sada (output) a srie meteorolgica mensal a ser reconstruda. Como,

    naturalmente, as sries meteorolgicas demonstram uma dependncia em relao ao ciclo sazonal (4

    entradas), adotou-se a incluso das variveis de periodicidade: vero, outono, inverno e primavera;

    assim como os meses (12 entradas). A incluso da periodicidade, nesse caso, uma informao

    importante na reduo do erro durante o prognstico gerado pela rede - para considerar o ciclo sazonal,

    no suficiente considerar apenas a climatologia mensal. Na prtica, as sries temporais so

    subdivididas em trs conjuntos: (1) Srie de Treinamento: srie temporal usada para o ajuste dos

    ponderadores da rede; (2) Srie de Validao: srie temporal usada para aperfeioar a topologia da rede

    ou parmetros da rede para diferentes ponderadores - calcula a perda de generalizao retendo a

    melhor rede; (3) Srie de Teste: srie temporal usada para testar a performance que a rede (treinada)

    executar sob a insero de novos dados. Em tarefas de predio a meta determinar um modelo e

    ento us-lo para fazer projees. A rede neural, com sua notvel habilidade para derivar significado de

    dados complicados ou imprecisos, pode ser usada para extrair padres e detectar tendncias que so

    muito complexos para serem notados pelo ser humano ou outras tcnicas computacionais.

    Mon

    th

    Seas

    on

    PDO

    SO

    I

    NIN

    O1.

    2

    NIN

    O2

    NIN

    O3

    NIN

    O3.

    4

    TNI

    PNA

    MEI

    EST-

    8391

    4

    EST-

    8396

    7

    EST-

    8390

    7

    EST-

    8398

    00

    5

    10

    15

    20

    25

    30

    35

    40

    (%)

    INPUTS

    83919

    Mon

    th

    Seas

    on

    PDO

    SO

    I

    NIN

    O1.

    2

    NIN

    O2

    NIN

    O3

    NIN

    O3.

    4

    TNI

    PNA

    MEI

    EST-

    8391

    4

    EST-

    8396

    7

    EST-

    8390

    7

    EST-

    8398

    00

    5

    10

    15

    20

    25

    30

    35

    (%)

    INPUTS

    83995

    Fig.2: Ponderadores (grau de importncia) de cada uma das variveis na reconstruo das sries temporais de precipitao,

  • via ANN4 , das estaes meteorolgicas 83919 e 83995. 83919 83995

    TRN TRN TRN TRN TRN TRN TRN TRN TRN TRN TRN TRN TRN TRN TRN0

    50

    100

    150

    200

    250

    300

    350

    400

    450

    Pre

    cipi

    ta

    o (m

    m/m

    s)

    Observado Modelado

    Treino

    TRN TRN TRN TRN TRN TRN TRN TRN TRN TRN TRN TRN TRN TRN TRN0

    50

    100

    150

    200

    250

    300

    350

    Pre

    cipi

    ta

    o (m

    m/m

    s)

    Observado Modelado

    Treino

    TST TST TST TST TST TST TST TST TST TST TST TST TST TST0

    50

    100

    150

    200

    250

    300

    350

    400

    Pre

    cipi

    ta

    o (m

    m/m

    s)

    Observado Modelado

    Teste

    TST TST TST TST TST TST TST TST TST TST TST TST TST TST TST0

    50

    100

    150

    200

    250

    300

    350

    Pre

    cipi

    ta

    o (m

    m/m

    s)

    Observado Modelado

    Teste

    VLD VLD VLD VLD VLD VLD VLD VLD VLD VLD VLD VLD VLD VLD0

    50

    100

    150

    200

    250

    300

    350

    400

    Pre

    cipi

    ta

    o (m

    m/m

    s)

    Observado Modelado

    Validao

    VLD VLD VLD VLD VLD VLD VLD VLD VLD VLD VLD VLD VLD VLD VLD0

    50

    100

    150

    200

    250

    300

    350

    Pre

    cipi

    ta

    o (m

    m/m

    s)

    Observado Modelado

    Validao

    0 50 100 150 200 250 300 350 400 450

    Observado

    0

    50

    100

    150

    200

    250

    300

    350

    400

    Mod

    elad

    o

    Observado X Modelado: R 2 = 0,71 e R = 0,84

    Grfico de Disperso (Treino+Teste+Validao)

    0 50 100 150 200 250 300 350

    Observado

    0

    50

    100

    150

    200

    250

    300

    350

    Mod

    elad

    o

    Observado X Modelado: R 2 = 0,51 e R = 0,72

    Grfico de Disperso (Treino+Teste+Validao)

    Fig.3: 83919 Arquitetura da ANN: [29-76-1], taxa de resmostragem Bottstrap: |W|=0,8% e 83995 [29-39-1], |W|=1,4%

    Tangente Hiperblica, Quick Propagation. Taxa de aprendizado 10%; taxa de momentum: 1,75; 2000 iteraes e 2 retreinamentos.

    4 Acknowledgements: Grateful thanks to Dr. Alex Grechanowski for kindly providing us the program NeuroIntelligence - Neural Network Software for Professionals. (http://www.leokrut.com/store/alyudaneurointelligence.html)

    http://www.leokrut.com/store/alyudaneurointelligence.html

  • CONCLUSO

    O desenvolvimento de modelos para a gerao de sries sintticas de dados climticos para o

    preenchimento de falhas em sries histricas de grande importncia para a avaliao de sistemas

    agronmicos, modelos de clima e simulao dos sistemas atmosfricos. Este trabalho apresenta um

    mtodo de reconstruo das sries climatolgicas, no qual a estrutura espao-temporal dos campos de

    precipitao acumulada analisada isoladamente. A aplicao desta metodologia apresentou resultados

    muito animadores demonstrando a capacidade do mtodo de interpolar dados produzindo solues

    regulares e consistentes. Fundamentado na avaliao do desempenho dos modelos, ANN parece ser um

    mtodo promissor para a gerao de sries mensais sintticas de dados climatolgicos. Podendo

    tambm ser uma tcnica muito til na gerao de previses climticas. 83919 83995

    Jun-

    68

    Feb-

    71

    Oct

    -73

    Jun-

    76

    Feb-

    79

    Oct

    -81

    Jun-

    84

    Feb-

    87

    Oct

    -89

    Jun-

    92

    Feb-

    95

    Oct

    -97

    Jun-

    00

    Feb-

    03

    Oct

    -05

    0

    100

    200

    300

    400

    500

    600

    700

    Pre

    cipi

    ta

    o (m

    m/m

    s)

    83919 srie original com missing values.

    83995 srie original com missing values.

    Jan-

    61

    Feb-

    64

    Mar

    -67

    Apr

    -70

    May

    -73

    Jun-

    76

    Jul-7

    9

    Aug

    -82

    Sep

    -85

    Oct

    -88

    Nov

    -91

    Dec

    -94

    Jan-

    98

    Feb-

    01

    Mar

    -040

    100

    200

    300

    400

    500

    600

    700

    Pre

    cipi

    ta

    o (m

    m/m

    s)

    STA-83919 STA-83919_rec

    83919 Srie reconstruda pela ANN.

    Jan-

    61

    Feb-

    64

    Mar

    -67

    Apr

    -70

    May

    -73

    Jun-

    76

    Jul-7

    9

    Aug

    -82

    Sep

    -85

    Oct

    -88

    Nov

    -91

    Dec

    -94

    Jan-

    98

    Feb-

    01

    Mar

    -040

    100

    200

    300

    400

    500

    600

    Pre

    cipi

    ta

    o (m

    m/m

    s)

    EST-83995 EST-83995_rec

    83995 Srie reconstruda pela ANN.

    Fig.4: Sries temporais de precipitao mensal: Original versus Reconstrudas.

    REFERNCIAS BIBLIOGRFICAS

    Andreoli, R. V., Kayano, M. T. 2005. ENSO-related rainfall anomalies in South America and associated circulation features during warm and cold Pacific decadal oscillation regimes. Inter. J. Climat., 25, 2017-2030. Bishop, C. M. (1995). Neural Networks for Pattern Recognition. Oxford: Oxford University Press. Kaplan, A.; Kushnir, Y., Cane, M. A. (2000). Reduced Space Optimal Interpolation of Historical Marine Sea Level Pressure: 18541992. Journal of Climate, 13, 2987-3002.

  • Kousky, V .E.; M. T. Kayano; I. F. A. Cavalcanti, 1984. A review of the Southern Oscillation: oceanic-atmospheric circulation changes and related rainfall anomalies. Tellus, 36A, 490-504. Zorita, E., Hughes, J. P., Lettemaier, D. P., von Storch, H., (1995). Stochastic characterization of regional circulation patterns for climate model diagnosis and estimation of local precipitation. J. Climate, 8, 10231042.

    INTRODUOREFERNCIAS BIBLIOGRFICAS