Transcript
  • INPE-16207-TDI/1539

    MINERACAO DE DADOS DE PADROES CLIMATICOS

    SAZONAIS USANDO A LOGICA PARACONSISTENTE

    Valdemir Silva Souza

    Dissertacao de Mestrado do Curso de Pos-Graduacao em Computacao Aplicada,

    orientada pelo Dr. Jose Demisio Simoes da Silva, aprovada em 13 de maio de 2009.

    Registro do documento original:

    INPE

    Sao Jose dos Campos

    2009

  • PUBLICADO POR:

    Instituto Nacional de Pesquisas Espaciais - INPE

    Gabinete do Diretor (GB)

    Servico de Informacao e Documentacao (SID)

    Caixa Postal 515 - CEP 12.245-970

    Sao Jose dos Campos - SP - Brasil

    Tel.:(012) 3945-6911/6923

    Fax: (012) 3945-6919

    E-mail: [email protected]

    CONSELHO DE EDITORACAO:

    Presidente:

    Dr. Gerald Jean Francis Banon - Coordenacao Observacao da Terra (OBT)

    Membros:

    Dra Maria do Carmo de Andrade Nono - Conselho de Pos-Graduacao

    Dr. Haroldo Fraga de Campos Velho - Centro de Tecnologias Especiais (CTE)

    Dra Inez Staciarini Batista - Coordenacao Ciencias Espaciais e Atmosfericas (CEA)

    Marciana Leite Ribeiro - Servico de Informacao e Documentacao (SID)

    Dr. Ralf Gielow - Centro de Previsao de Tempo e Estudos Climaticos (CPT)

    Dr. Wilson Yamaguti - Coordenacao Engenharia e Tecnologia Espacial (ETE)

    BIBLIOTECA DIGITAL:

    Dr. Gerald Jean Francis Banon - Coordenacao de Observacao da Terra (OBT)

    Marciana Leite Ribeiro - Servico de Informacao e Documentacao (SID)

    Jefferson Andrade Ancelmo - Servico de Informacao e Documentacao (SID)

    Simone A. Del-Ducca Barbedo - Servico de Informacao e Documentacao (SID)

    REVISAO E NORMALIZACAO DOCUMENTARIA:

    Marciana Leite Ribeiro - Servico de Informacao e Documentacao (SID)

    Marilucia Santos Melo Cid - Servico de Informacao e Documentacao (SID)

    Yolanda Ribeiro da Silva Souza - Servico de Informacao e Documentacao (SID)

    EDITORACAO ELETRONICA:

    Viveca SantAna Lemos - Servico de Informacao e Documentacao (SID)

  • INPE-16207-TDI/1539

    MINERACAO DE DADOS DE PADROES CLIMATICOS

    SAZONAIS USANDO A LOGICA PARACONSISTENTE

    Valdemir Silva Souza

    Dissertacao de Mestrado do Curso de Pos-Graduacao em Computacao Aplicada,

    orientada pelo Dr. Jose Demisio Simoes da Silva, aprovada em 13 de maio de 2009.

    Registro do documento original:

    INPE

    Sao Jose dos Campos

    2009

  • Dados Internacionais de Catalogacao na Publicacao (CIP)

    Souza, Valdemir Silva.So89m Mineracao de dados de padroes climaticos sazonais usando a lo-

    gica paraconsistente / Valdemir Silva Souza. Sao Jose dos Cam-pos : INPE, 2009.

    105p. ; (INPE-16207-TDI/1539)

    Dissertacao (Mestrado em Computacao Aplicada) InstitutoNacional de Pesquisas Espaciais, Sao Jose dos Campos, 2009.

    Orientador : Dr. Jose Demisio Simoes da Silva.

    1. Logica paraconsistente. 2. Rede neural artificial. 3. Padroesclimaticos. 4. Mineracao de dados. I.Ttulo.

    CDU 004.032.26

    Copyright c 2009 do MCT/INPE. Nenhuma parte desta publicacao pode ser reproduzida, arma-zenada em um sistema de recuperacao, ou transmitida sob qualquer forma ou por qualquer meio,eletronico, mecanico, fotografico, reprografico, de microfilmagem ou outros, sem a permissao es-crita do INPE, com excecao de qualquer material fornecido especificamente com o proposito de serentrado e executado num sistema computacional, para o uso exclusivo do leitor da obra.

    Copyright c 2009 by MCT/INPE. No part of this publication may be reproduced, stored in aretrieval system, or transmitted in any form or by any means, electronic, mechanical, photocopying,recording, microfilming, or otherwise, without written permission from INPE, with the exceptionof any material supplied specifically for the purpose of being entered and executed on a computersystem, for exclusive use of the reader of the work.

    ii

  • A existncia, porque humana, no pode ser muda, silenciosa, nem to pouco pode

    nutrir-se de falsas palavras, mas de palavras verdadeiras, com que os homens

    transformam o mundo. Existir, humanamente, pronunciar o mundo, modific-lo. O

    mundo pronunciado, por sua vez, se volta problematizado aos sujeitos pronunciantes, a

    exigir deles novo pronunciar. No no silncio que os homens se fazem, mas na

    palavra, no trabalho, na ao-reflexo.

    Paulo Freire Livro: Pedagogia do Oprimido

  • AGRADECIMENTOS

    Agradecer sempre faz sentido, pois o momento de valorizar os atos e aes recebidas

    por pessoas que acreditam em ns, independentemente do meio em que estamos

    envolvidos, assim, agradeo:

    a minha famlia em especial a minha esposa Roberta L. P. Souza e minha filha

    Yollanda Caroline Souza por realmente me apoiar em todos os sentidos a vencer mais

    esta empreitada intelectual;

    aos amigos de longa data e aos que conheci durante o processo para alcanar o ttulo de

    mestre;

    no posso deixar de agradecer ao meu orientador professor Dr. Jos Demisio Simes da

    Silva, pela oportunidade, fora e compreenso que me direcionou no andamento deste

    trabalho;

    por fim, aos envolvidos indiretamente, mas com decises importantes ao andamento e

    finalizao desta dissertao de mestrado que tambm tm a minha gratido.

  • RESUMO

    Esta dissertao apresenta uma tcnica no-paramtrica que utiliza a Lgica Paraconsistente na Minerao de Dados Meteorolgicos de reanlise dos histricos de informaes de cinco regies da Amrica do Sul, de um perodo de 21 anos dos ciclos sazonais ocorridos entre os anos de 1980-2000. Esses dados so as entradas de uma Rede Neural Artificial baseada na Lgica Paraconsistente, que tem como objetivo gerar um conjunto reduzido de dados para ser submetido a uma Rede de Funes de Base Radial na elaborao de um modelo de previso sazonal de clima. O processamento da rede neural paraconsistente contribui na identificao de padres, por ciclos sazonais nos dados histricos do perodo 1980-1997. Para a validao da tcnica de reduo desenvolvida, o modelo de previso obtido foi submetido aos dados extrados do perodo de 1998-2000, para as mesmas reas geogrficas. Os resultados da previso com modelo estabelecido apresentaram erros inferiores que as previses obtidas pelo modelo proposto no trabalho de Pessoa (2004), que utilizou a Teoria dos Conjuntos Aproximativos sobre os mesmos dados para diminuir a complexidade dos dados e compor um modelo de previso baseado em uma rede neural do tipo Perceptron de Mltiplas Camadas.

  • DATA MINING OF CLIMATIC PATTERNS USING THE PARACONSISTENT LOGIC

    ABSTRACT

    This work presents a non-parametric technique that uses the paraconsistent logic to develop a data mining based approach to analyze reanalysis meteorological data of five areas of South America composed of seasonal cycles, of 21 years from 1998 to 2000. The available data was used as inputs for a paraconsistent neural network to generate a reduced set to be submitted to a Radial Basis Function (RBF) network to derive a seasonal forecasting model. The paraconsistent neural network performs the identification of patterns of seasonal cycles from data extracted from 1980 to 1997. The remainder of the data (from 1998 to 2000) is used to validate the proposed RBF based forecasting method for the same geographical areas. The results produced by the proposed forecasting method were more accurate than the ones obtained in the work of Pessoa (2004) that used the Rough Sets Theory to reduce the embedded complexity of the same data set in order to construct a Multilayer Perceptron (MLP) neural network based forecasting model for seasonal cycles.

  • SUMRIO

    Pg.

    LISTA DE FIGURAS LISTA DE TABELAS LISTA DE EQUAES LISTA DE SIGLAS E ABREVIATURAS 1. INTRODUO ................................................................................................. 23 2. BASES TERICAS............................................................................................ 27 2.1 Minerao de Dados ......................................................................................... 27 2.1.1 O Processo de descoberta de conhecimento................................................... 28 2.1.2 Categorizao da Minerao de Dados ......................................................... 29 2.1.3 Tarefas da Minerao de Dados .................................................................... 30 2.1.4 Tcnicas de Minerao de Dados .................................................................. 31 2.2 Lgica Paraconsistente ..................................................................................... 31 2.2.1 As lgicas no-clssicas ................................................................................ 31 2.2.2 Aspectos histricos da Lgica Paraconsistente ............................................. 32 2.2.3 Teorias inconsistentes e teorias triviais ......................................................... 33 2.2.4 Princpios conceituais da Lgica Paraconsistente ......................................... 34 2.3 A Lgica Paraconsistente anotada de anotao com dois valores (LPAV2v) .. 35 2.4 Modelo matemtico de neurnios artificial ..................................................... 40 2.4.1 Rede Neural de Funes de Base Radial ...................................................... 43 2.4.2 Rede Neural Artificiais Paraconsistentes ...................................................... 46 3. METODOLOGIA .............................................................................................. 51 4. METEOROLOGIA E SELEO DA REA DE ESTUDO ............................ 55 5. ABORDAGEM PARA A PREVISO DE DADOS METEOROLGICOS ... 61 6. RESULTADOS .................................................................................................. 65 6.1 Previso de Precipitao .................................................................................. 67 6.2 Previso de Temperatura .................................................................................. 74 7. CONCLUSO ................................................................................................... 81 REFERNCIAS BIBLIOGRFICAS ................................................................... 83 APNDICE A - REDES NEURAIS ARTIFICIAIS PARACONSISTENTES 87

  • LISTA DE FIGURAS

    Pg. 2.1 Etapas do processo KDD 28 2.2 Reticulado finito de Hasse com LPA2v 36 2.3 Quadrado unitrio do plano cartesiano (reticula 12 posies) 39 2.4 Estrutura de um Neurnio Biolgico 41 2.5 Modelo de um neurnio no-linear 42 2.6 Funes de ativao 43 2.7 Estrutura Bsica da Radial Basis Function RBF1 44 2.8 Estrutura Bsica da Radial Basis Function RBF2 46 2.9 Clula Artificial Paraconsistente Bsica 48 3.1 Processo de busca dos registros 52 4.1 Grade 56 4.2 Grade Global de baixa resoluo 56 4.3 reas selecionadas para as anlises 59 5.1 Modelo de Rede Neural Artificial Paraconsistente 62 6.1 Imagem real A3 70 6.2 Imagens RNAP - Tipo tolerncias 1,2,3 - = 1 A3 70 6.3 Imagem real A1 71 6.4 Imagens RNAP - Tipo tolerncias 1,2,3 - = 1 A1 71 6.5 Imagem real A1 71 6.6 Imagens RNAP - Tipo tolerncias 1,2,3 - = 1 A1 71 6.7 Imagem real A2 72 6.8 Imagens RNAP - Tipo tolerncias 1,2,3 - = 1 A2 72 6.9 Imagem real A4 72 6.10 Imagens RNAP - Tipo tolerncias 1,2,3 - = 1 A4 72 6.11 Imagem real A5 73 6.12 Imagens RNAP - Tipo tolerncias 1,2,3 - = 1 A5 73 6.13 Imagem real A2 73 6.14 Imagens RNAP - Tipo tolerncias 1,2,3 - = 1 A2 73 6.15 Imagem real A3 77 6.16 Imagens RNAP - Tipo tolerncias 1,2,3 - = 1 A3 77 6.17 Imagem real A5 77 6.18 Imagens RNAP - Tipo tolerncias 1,2,3 - = 1 A5 77 6.19 Imagem real A4 78 6.20 Imagens RNAP - Tipo tolerncias 1,2,3 - = 1 A4 78 6.21 Imagem real A3 78 6.22 Imagens RNAP - Tipo tolerncias 1,2,3 - = 3 A3 78 6.23 Imagem real A1 79 6.24 Imagens RNAP - Tipo tolerncias 1,2,3 - = 1 A1 79 6.25 Imagem real A4 79 6.26 Imagens RNAP - Tipo tolerncias 1,2,3 - = 1 A4 79 6.27 Imagem real A3 80 6.28 Imagens RNAP - Tipo tolerncias 1,2,3 - = 3 A3 80 A.1 Representa a CNAPCa 91 A.2 Representa a CNAPCLsMax 92 A.3 Representa a CNAPCLsMin 93

  • A.4 Representa a CNAPCo 94 A.5 Representa a CNAPp 95 A.6 Representa a CNAPAdm 96 A.7 Representa a CNAPApm 98 A.8 Representa a CNAPRp 99 A.9 Representa a SNAPDeEv 102

    A.10 Representa a UNAPMax 103 A.11 Representa a UNAPMin 104 A.12 Representa a UNAPMax 105

  • LISTA DE TABELAS

    PG.4.1 Atributos Meteorolgicos utilizado 58 6.1 Relaciona a quantidade de padres identificados 65 6.2 Erros quadrticos mdios (Tolerncia tipo 1, Prec, =1) 68 6.3 Erros quadrticos mdios (Tolerncia tipo 2, Prec, =1) 68 6.4 Erros quadrticos mdios (Tolerncia tipo 3, Prec, =1) 68 6.5 Erros quadrticos mdios (Tolerncia tipo 1, Prec, =3) 69 6.6 Erros quadrticos mdios (Tolerncia tipo 2, Prec, =3) 69 6.7 Erros quadrticos mdios (Tolerncia tipo 3, Prec, =3) 69 6.8 Erros quadrticos mdios (Tolerncia tipo 1, Temp, =1) 74 6.9 Erros quadrticos mdios (Tolerncia tipo 2, Temp, =1) 75 6.10 Erros quadrticos mdios (Tolerncia tipo 3, Temp, =1) 75 6.11 Erros quadrticos mdios (Tolerncia tipo 1, Temp, =3) 76 6.12 Erros quadrticos mdios (Tolerncia tipo 2, Temp, =3) 76 6.13 Erros quadrticos mdios (Tolerncia tipo 3, Temp, =3) 76

  • LISTA DE EQUAES

    Pg. 2.1 Soma Ponderada 43 2.2 Sada do Neurnio 43 2.3 Centros da RBF 44 2.4 Sadas da RBF 44 2.5 Equao Estrutural Base 46 2.6 Valor Superior de Controle a Certeza 48 2.7 Valor Inferior de Controle a Certeza 48 2.8 Valor Superior de Controle a Contradio 48 2.9 Valor Inferior de Controle a Contradio 48 3.1 Clculo do grau de descrena 51 6.1 Erro Quadrtico Mdio 66 6.2 Erro Mdio Absoluto 66 6.3 Ganho ou Perda 67

  • LISTA DE SIGLAS E ABREVIATURAS

    LP Lgica Paraconsistente LPA2v Lgica Paraconsistente Anotada de Anotao de dois valores RNA Rede Neural Artificial RBF Rede de Funes de Base Radial RNAP Rede Neural Artificial Paraconsistente Prec Precipitao Temp Temperatura CNAP Clula Neural Artificial Paraconsistente UNAP Unidade Neural Artificial Paraconsistente SNAP Sistema Neural Artificial Paraconsistente DJF Dezembro, Janeiro e Fevereiro MAM Maro, Abril, Maio JJA Junho, Julho e Agosto SON Setembro, Outubro e Novembro ftC Fator de Tolerncia Certeza ftCt Fator de Tolerncia Contradio ftR Fator de Tolerncia de Reconhecimento de Padro ftA Fator de Aprendizagem evF Evidncia Favorvel evCt Evidncia Contrria CNAPCa Clula Neural Artificial Paraconsistente de Conexo Analtica

    CNAPCLsMax Clula Neural Artificial Paraconsistente de Conexo Lgica Simples de Maximizao

    CNAPCLsMin Clula Neural Artificial Paraconsistente de Conexo Lgica Simples de Minimizao

    CNAPCo Clula Neural Artificial Paraconsistente de Complementao CNAPp Clula Neural Artificial Paraconsistente de Passagem CNAPAdm Clula Neural Artificial Paraconsistente de Aprendizagem,

    Desaprendizagem e Memorizao CNAPAp Clula Neural Artificial Paraconsistente de Aprendizagem e Padro

    Memorizado CNAPRp Clula Neural Artificial Paraconsistente e Reconhecimento de Padro vscc Valor Superior de Controle a Certeza vicc Valor Inferior de Controle a Certeza vscct Valor Superior de Controle a Contradio vicct Valor Inferior de Controle a Contradio

  • 23

    1. INTRODUO

    Em meteorologia, a previso climtica uma estimativa do comportamento mdio

    atmosfrico para mdio e longo prazo. Um dos objetivos da previso climtica estimar

    o volume de precipitao, em relao mdia histrica, nos meses de chuva em uma

    determinada rea, em um determinado ciclo sazonal. (CENTRO DE PREVISO DO

    TEMPO E ESTUDOS CLIMTICOS, 2003). Este tipo de previso importante para

    diversos segmentos da sociedade, como por exemplo, para o setor de agronegcios no

    Brasil. Este segmento da sociedade tem como demanda a excelncia das safras. Para

    isso, faz-se necessrio aliar estudos de variedades de sementes, enriquecimento do solo,

    mquinas modernas, estudo do escoamento das safras, com o estudo sistemtico que

    procura entender o comportamento climtico, de forma a empreender aes que possam

    minimizar os problemas devido s anomalias do clima.

    O estudo do comportamento climtico pode ser feito atravs da anlise de informaes

    disponveis, oriundas de modelos meteorolgicos e/ou de observaes coletadas atravs

    de redes sensores terrestres, martimos ou de satlites. Esta abordagem, entretanto,

    complexa devido quantidade de informaes disponveis adquiridas dos diversos tipos

    de sensores j disponveis e, com o aumento do nmero de sensores, a complexidade

    pode aumentar ainda mais.

    Esta disponibilidade de dados requer muito poder de processamento dos computadores

    tanto para o tratamento dos dados quanto para a execuo dos modelos climticos para

    gerar prognsticos do estado futuro da atmosfera, como feito em vrios centros

    meteorolgicos no mundo.

    A quantidade de dados e a complexidade dos modelos so dois fatores complicadores

    para o estudo do comportamento do clima, que tm fomentado a busca pelo

    desenvolvimento de novas abordagens de anlise dos dados, que os minimizem.

    Entretanto, em uma escala de previso sinptica do clima, pode se perguntar se os dados

    provenientes de vrias fontes so necessrios. Ou seja, a indagao pode ser colocada

    pensando na possibilidade de uso de um subconjunto dos dados, ao invs de todos os

    dados disponveis, para a obteno dos modelos.

  • 24

    Neste sentido, esta dissertao toma a hiptese da possibilidade de uso de conjuntos

    reduzidos, para realizar uma previso sinptica de clima, sem perda de preciso.

    O trabalho baseia-se na abordagem proposta em Pessoa (2004) que props o uso de uma

    tcnica de reduo de dados usando uma abordagem baseada na teoria dos conjuntos

    aproximativos (TCA).

    Entretanto, a tcnica proposta nesta dissertao baseada nos conceitos da lgica

    paraconsistente anotada, para conceber um mtodo de reduo de dados que permita a

    obteno de um modelo de previso de clima utilizando uma rede de funes de base

    radial. Os processos de estabelecimento dos conjuntos reduzidos e de obteno dos

    modelos so realizados atravs de mtodos de aprendizagem dos modelos de redes

    neurais utilizados.

    Os resultados so generalizados para as reas selecionadas no estudo de caso testando a

    eficincia do modelo de previso. A identificao dos padres atravs da aprendizagem

    realizada pela rede neural artificial paraconsistente considerada como uma abordagem

    de minerao de dados.

    Os padres identificados, denominados centros de agrupamentos, so utilizados como

    entradas de uma rede de funes de base radial, que tem, por sua vez, suas sadas

    comparadas com os valores dos atributos reais disponibilizados.

    A lgica paraconsistente usada como base para este trabalho a lgica paraconsistente

    anotada de dois valores fundamentada por Abe (1992). Alguns exemplos de aplicaes

    que utilizam essa lgica so citados em (PRADO, 2002; SOUZA, 2005; VILA, 1996;

    DA SILVA FILHO, 2001), dentre outros. Todos esses trabalhos utilizam os princpios

    da lgica paraconsistente para tratar incertezas dadas como inconsistncias presentes

    nos dados.

    O trabalho de Prado (2002) utiliza a lgica paraconsistente no processo de descoberta de

    conhecimento em textos. O trabalho de Souza (2005) utiliza a lgica paraconsistente na

    descoberta de fraudes em Internet Banking analisando e criando perfis de clientes.

    Os experimentos realizados de minerao, obteno de modelo e de previso de clima

    apresentaram resultados com erros que so comparados queles reportados em Pessoa

    (2004), tomados como referncia para anlise de desempenho do mtodo proposto.

  • 25

    Portanto, este trabalho mostra a possibilidade da combinao da tcnica de minerao

    de dados pela lgica paraconsistente e de uma rede de funes de base radial na

    concepo de uma alternativa de modelo para a previso climtica sinptica com base

    no histrico de dados de reanlise disponvel, diversificando a informao e podendo

    servir de suporte para os processos operacionais de previso de clima.

    A principal vantagem no uso de um sistema como proposto nesta dissertao, est no

    fato de que possvel fazer prognsticos de comportamento climtico global de forma

    automtica (ou semi-automtica), utilizando conjuntos de dados reduzidos para a

    obteno dos modelos.

    Portanto, a motivao deste trabalho estudar a concepo de uma tcnica no

    paramtrica para a previso sinptica de clima em uma abordagem de minerao de

    dados.

    O Captulo 2 descreve as bases tericas utilizadas no desenvolvimento da tcnica

    proposta.

    O Captulo 3 traz uma breve descrio da metodologia aplicada em todas as etapas deste

    trabalho.

    O Captulo 4 descreve dados meteorolgicos utilizados neste trabalho e os fundamentos

    da lgica paraconsistente.

    O Captulo 5 descreve a aplicao das tcnicas abordadas os dados disponveis e

    descritos no Captulo 4.

    O Captulo 6 descreve os resultados obtidos e uma anlise dos erros obtidos.

    O Captulo 7 apresenta as concluses e sugestes de futuros trabalhos.

    O Apndice A descreve algumas aplicaes da Lgica Paraconsistente mostrando o

    algoritmo do Para-Analisador e os conceitos bsicos da Rede Neural Artificial

    Paraconsistente.

  • 26

  • 27

    2. BASES TERICAS

    Neste captulo so descritos alguns princpios das teorias que embasam o trabalho

    desenvolvido nesta dissertao.

    2.1 Mineraes de Dados

    Minerao de Dados um conjunto de tcnicas computacionais para a extrao de

    informaes desconhecidas e potencialmente teis em grandes volumes de dados

    atravs de um resumo compacto dos mesmos. O termo Minerao de Dados

    somente um de vrios termos, incluindo extrao de conhecimento, arqueologia de

    dados, colheita de informaes ou descoberta de conhecimento em banco de dados

    (KDD - Knowledge Discovery in Databases) Chen (2001), (FAYYAD, 1996).

    As caractersticas principais do processo de Minerao de Dados so:

    O conhecimento descoberto representado por uma linguagem de alto nvel que pode ser entendido por humanos;

    As descobertas retratam o contedo de bases de dados;

    Os termos KDD e minerao de dados algumas vezes so usados com o mesmo sentido.

    Isto ocorre quando em funo da aplicao, o acrnimo KDD est diretamente

    relacionado extrao de conhecimento residente em uma base de dados, que utilizam

    sistemas gerenciadores de banco de dados. Entretanto, a Minerao de Dados, no

    pressupe a especificao do tipo da fonte de dados, nem do formato dos mesmos

    (FAYYAD, 1996).

    A pesquisa em KDD cresce com base na disseminao da tecnologia de bancos de dados

    e na premissa de que as grandes colees de dados hoje existentes podem ser fontes de

    conhecimento til, que est implicitamente representado e pode ser extrado.

    No sentido, a KDD se vale de vrias tcnicas, dentre elas algumas de inteligncia

    artificial e de estatstica, para lidar com a incerteza relacionada s descobertas.

  • 28

    2.1.1 O Processo de descoberta de conhecimento

    A descoberta de conhecimento um processo que extrai conhecimento novo, til e

    interessante a partir de bases de dados. um processo que tem natureza iterativa e

    interativa e pode ser dividido em uma srie de atividades (FAYYAD, 1996).

    A minerao de dados, por sua vez, pode ser considerada um processo fundamento de

    KDD, em que so aplicados os algoritmos de extrao de padres nos dados. A Figura

    2.1 apresenta uma representao do processo de KDD.

    Base Dados(n)

    DataW arehouse

    Data/TextM in ing

    Padres(vetor)

    Perfil do C liente(V irtual M anager)

    M inerao dos Dados

    Interpretao eAprendizagem de M quina

    Transform aodos Dados

    Seleo e Integrao

    Pr-Processam ento Extrao de Inform ao Ps-Processam ento

    Recuperao de Inform ao Usurio

    Figura 2.1 Etapas do processo de KDD

    De uma forma geral as etapas da KDD resumidamente so:

    Definio da seleo dos dados e integrao: Inclui a descrio cuidadosa do problema; a avaliao da necessidade de uso da Minerao de Dados; a escolha do

    mtodo; a deciso do formato dos dados de entrada e de sada; etc. As decises

    consideram, em geral, a relao entre os custos financeiro e computacional e o

    benefcio. Nesta fase tambm se determina os dados que necessrios para o

    processo. Este um passo importante, pois se reflete diretamente nos resultados.

    Pr-Processamento: Nesta etapa do processo so eliminados rudos e dados errados. Tambm so estabelecidos: procedimentos para verificao da falta de

    dados; convenes para nomeao; e outros passos para tornar a base de dados

    consistente. Nesta etapa os dados devem ser normalizados e uma anlise realizada

  • 29

    para determinar e selecionar alguns atributos que podem ser descartados, bem como

    a necessidade de converso dos dados para outro formato. Essa a etapa mais lenta

    do processo, demandando cerca de 50-80% do tempo total de desenvolvimento de

    um processo de preparao de dados para minerao de dados.

    Transformao dos dados: Esse passo realizado em funo da necessidade, para auxiliar as demais etapas de KDD. A transformao pode incluir, por exemplo,

    a reduo e a compresso de dados; a transformao de atributos no-categricos

    em atributos categricos; discretizao de atributos contnuos; etc.

    Minerao de Dados: Esse passo consiste da aplicao dos algoritmos para descoberta de padres nos dados. Esta etapa pode envolver a seleo de mtodos,

    tcnicas e modelos que sejam mais adequados para realizar a anlise desejada,

    podendo demandar grande poder computacional em funo da quantidade de dados

    disponvel.

    Interpretao: Consiste na visualizao dos resultados obtidos pelo processo de Minerao de Dados, para utilizao como suporte tomada de deciso pelo

    usurio. Este dever avaliar a adequao dos padres identificados pelo processo no

    tocante extrao de conhecimento desejado.

    Vale ressaltar que aps a obteno do conhecimento, caso os resultados no sejam

    considerados satisfatrios o processo pode ser retomado a partir do ponto considerado

    mais oportuno para tal anlise.

    2.1.2 Categorizao da Minerao de Dados

    Existem muitos modos de categorizar ou classificar a minerao de dados. Um modo

    classificar a minerao de dado de acordo com os seus objetivos. Neste caso duas

    categorias so propostas na literatura:

    Descritiva: Especializada na procura de padres que so interpretveis e descritos nos dados. Este tipo de minerao de dado descreve as caractersticas

    existentes nos dados (HOLSHEIMER, 1994).

    Preditiva: Envolve usar variveis para predizer valores desconhecidos e futuros de outras variveis de interesse (WEISS, 1998).

  • 30

    2.1.3 Tarefas da Minerao de Dados

    As tarefas ou funcionalidades da Minerao de Dados esto relacionadas com o

    domnio da aplicao e o interesse do usurio, indicando o tipo de conhecimento que

    deve ser descoberto. As tarefas resumidamente so:

    Caracterizao: O objetivo da caracterizao generalizar, resumir e possivelmente comparar caractersticas dos dados. Por exemplo, um tipo de

    caracterizao saber qual tipo de pessoas so tpicas compradoras de imveis na

    cidade X, para casas novas com valor mnimo de $500.000,00 (CHEN, 2001).

    Associao: Tambm chamado de Market Basket Analysis (d-se esse nome porque os dados consistem em um conjunto de atributos binrios chamados itens)

    ou anlise de afinidades em aplicaes de negcios, a associao a descoberta de

    relaes entre vrios atributos ou transaes. Por exemplo, considera-se como

    associao a anlise que fornece informaes para o gerente de uma vdeo-locadora

    como conhecer quais filmes sempre so alugados juntos ou se existe alguma relao

    entre alugar determinados gneros de filmes e comprar pipoca ou refrigerante.

    Classificao: Freqentemente h interessados em classificar dados de acordo com valores em atributo classificador, tambm conhecido como meta ou objetivo.

    Nesta tarefa, que a mais empregada em descoberta de conhecimento, cada registro

    pertence a uma classe. O princpio da classificao descobrir algum tipo de

    relacionamento entre os atributos preditivos (WEISS, 1998) e o atributo objetivo, o

    que envolve uma funo que mapeie os dados nas classes pr-definidas. Por

    exemplo, classificao identificar que tipos de clientes seriam eventuais

    compradores de um livro de culinria, baseado em um banco de dados contento

    dados sobre os clientes da editora nos pases onde o livro foi publicado.

    Regresso: Envolve aprender uma funo que mapeie os dados para predio de uma varivel contnua. Esta tarefa conceitualmente similar classificao. A

    maior diferena que na regresso o atributo meta contnuo, enquanto que na

    classificao em geral do tipo discreto.

    Segmentao: Segmentao ou Clustering consiste em agrupar os dados em novas classes. Isto o que as pessoas fazem intuitivamente quando visualizam o

  • 31

    mundo e segmentam em grupos discretos, por exemplo, tipos de animais, plantas,

    veculos, etc. Nesta tarefa o algoritmo deve criar classes atravs da partio dos

    dados com valores de atributos semelhantes, ou seja, reunir em uma mesma classe

    as propriedades de interesse comum.

    2.1.4 Tcnicas de Minerao de Dados

    Existem inmeras tcnicas que so empregadas na Minerao de Dados, sendo algumas

    delas (KOMOROWSKI, 1999), (CHEN, 2001), (ABE, 2008):

    Teoria dos Conjuntos Aproximativos (Rough Sets Theory);

    Conjuntos Nebulosos (Fuzzy Sets);

    Redes Neurais Artificiais;

    Lgica Paraconsistente;

    Induo de regras;

    rvores de deciso;

    Dentre as tcnicas citadas acima, duas delas, a lgica paraconsistente e as redes neurais

    artificiais (especificamente uma rede de funes de base radial RBF) sero utilizadas

    para a minerao de dados no-similares sobre os atributos de entrada (precipitao e

    temperatura).

    2.2 Lgica Paraconsistente

    A lgica paraconsistente considerada uma lgica no-clssica capaz de desafiar as leis

    bsicas da lgica clssica de valores binrios, verdadeiro ou falso. A cincia lgica a

    base e o fundamento da matemtica. Ao que tudo indica, foi com os trabalhos do

    filsofo Aristteles (384-322 a.C.) que houve o incio dos estudos da lgica. A idia era

    estabelecer um conjunto de regras rgidas, para que as concluses pudessem ser aceitas

    como logicamente vlidas. Trata-se de uma linha de raciocnio lgico baseado em

    premissas e concluses, do tipo: Todo ser vivo mortal (premissa 1), e em seguida

    constatado que O leo um ser vivo (premissa 2), tem-se que O leo mortal

    (concluso) (DA SILVA FILHO, 2008).

  • 32

    Com isso o raciocnio lgico clssico fundamentado em quatro princpios bsicos:

    Princpio da Identidade = : Toda proposio ou objeto idntico a si mesmo.

    Princpio da identidade proposicional, : Toda proposio implica ela mesma.

    Princpio do terceiro excludo, : De duas proposies contraditrias, isto , uma nega a outra, uma delas verdadeira.

    Princpio da no-contradio, ( ): Entre duas proposies contraditrias, uma delas falsa.

    Dentro desse raciocnio a lgica clssica binria; portanto, uma declarao falsa ou

    verdadeira, no admitindo ser ao mesmo tempo parcialmente verdadeira e falsa.

    2.2.1 As lgicas no-clssicas

    Os estudos de tomadas de deciso para aplicaes prticas demandam outros tipos de

    lgicas no fundamentadas nas regras da lgica clssica, que so denominadas lgicas

    no clssicas. Assim, estas lgicas violam as propriedades da lgica clssica que no

    admite indefinies, ambigidades e contradies.

    As lgicas no-clssicas estabelecem os conceitos de dualidade, sendo algo que pode e

    deve coexistir com seu oposto para se obter melhor preciso nas concluses para a

    tomada de deciso. Sem muito rigor elas compem dois grupos:

    As que complementam o escopo da lgica clssica;

    As que rivalizam com a lgica clssica.

    As lgicas que pertencem primeira categoria so chamadas de complementares da

    clssica, pois, possuem seus aspectos nos itens que a lgica clssica no capaz de

    expressar. Exemplos de lgicas nessa categoria so: as lgicas epistmicas, as lgicas

    modais tradicionais, as lgicas intencionais, as lgicas de ao, as lgicas de aes

    fsicas, as lgicas combinatrias, as lgicas condicionais, entre outras.

    As lgicas que pertencem a segunda categoria so aquelas que derrogam os princpios

    fundamentais das lgicas clssicas (heterodoxas), por meio da restrio ou modificao.

  • 33

    Motivados principalmente pelos avanos experimentados, sobretudo, da Inteligncia

    Artificial, foram propostos vrios sistemas lgicos para melhor representar

    conhecimento necessrio para resolver problemas prticos. Alguns exemplos so: as

    lgicas intuicionistas, as lgicas no-monotnicas, as lgicas multivaloradas (ou lgicas

    polivalentes), a lgica de Lukasiewicz, a lgica de Post, a lgica de Godel, a lgica de

    Kleene, a lgica de Bochvar.

    Por fim, com estudos de importncia filosfica e uma matemtica construda, surgem a

    teoria dos conjuntos aproximativos, lgicas paracompletas (que restringem o princpio

    do terceiro excludo), lgicas paraconsistentes (que restringem o princpio da no-

    contradio: sistemas Cn, lgicas anotadas, lgicas do paradoxo, lgicas discursivas,

    lgicas dialticas, entre outras), lgicas no-alticas ( que so simultaneamente

    paracompletas e paraconsistentes), lgicas livres e outras (DA SILVA FILHO, 2008).

    2.2.2 Aspectos histricos da Lgica Paraconsistente

    Os precursores da lgica paraconsistente foram o lgico polons J. Lukasiewicz e o

    filsofo russo N. A. Vasilv, que por volta de 1910, de maneira independente, sugeriram

    a possibilidade de uma lgica que restringiria, por exemplo, o princpio de contradio.

    Vasilv chegou a articular determinada lgica, que ele batizou de lgica imaginria (DA

    SILVA FILHO, 2008).

    O primeiro lgico a estruturar um clculo proposicional paraconsistente foi o polons S.

    Jaskowiski, discpulo de Lukasiewicz, que em 1948 publicou suas idias sobre lgica e

    contradio, mostrando como se poderia construir um clculo sentencial paraconsistente

    tendo motivao conveniente.

    O sistema de Jaskowiski, por ele chamado de lgica discursiva, desenvolveu-se

    posteriormente (a partir de 1968) em virtude das obras de autores como J. Kota, L.

    Furmanowiski, L. Dubikajtis, N. C. A. da Costa e C. Pinter. Assim, chegou-se a

    construir uma verdadeira lgica discursiva, englobando um clculo de predicados de

    primeira ordem e uma lgica de ordem superior.

    Os sistemas iniciais de lgica paraconsistente, contendo todos os nveis lgicos,

    envolvendo clculos proposicionais, de predicados e de descries bem como lgicas de

    ordem superior, devem-se a N.C.A. da Costa (1954 em diante). Isto se realizou de

    maneira independente dos trabalhos dos autores mencionados como precursores.

  • 34

    Atualmente existem, inclusive, sistemas paraconsistentes de teorias de conjuntos

    estritamente mais fortes do que os clssicos, considerados subsistemas estritos e

    matemticos paraconsistentes. As primeiras verses algbricas dos sistemas

    paraconsistentes surgiram por volta de 1965 e so conhecidos como lgebras de Curry,

    em homenagem ao lgico americano H. Curry. As semnticas iniciais dos sistemas

    paraconsistentes foram investigadas por volta de 1976 e so conhecidas como semntica

    de valoraes.

    A expresso lgica paraconsistente foi cunhada por Francisco Quesada, numa

    conferncia pronunciada durante III Simpsio Latino-Americano de Lgica matemtica,

    realizado na Universidade Estadual de Campinas SP. Literalmente paraconsistente

    significa ao lado da consistncia.

    2.2.3 Teorias inconsistentes e teorias triviais

    A mais importante razo da considerao da lgica paraconsistente foi obter teorias nas

    quais inconsistncias sejam permitidas sem o perigo da trivializao. Em lgicas que

    no distingam convenientemente da lgica clssica, por exemplo, com respeito ao

    conceito de negao, em geral vlido o esquema A(AB) (em que A e B so frmulas, A a negao de A e o smbolo de implicao: de uma contradio, toda frmula pode ser deduzida ou seja, toda frmula passa a ser

    verdadeira.

    Admitindo como premissas frmulas contraditrias A e A.

    Assim, se A (A B) constitui um esquema vlido. Levando-se em conta as premissas apresentadas pela regra de deduo Modus Ponens ( de A e de A B deduz B) tem-se AB arbitrria. Aplicando novamente a regra de Modus Ponens a essa ltima frmula obtemos B. Porm, a frmula B arbitrria. Assim, de frmulas

    contraditrias pode-se deduzir qualquer afirmao. Esse o fenmeno da trivializao

    (DA SILVA FILHO, 2008).

    2.2.4 Princpios conceituais da Lgica Paraconsistente

    A seguir tem-se um resumo dos princpios tericos da lgica paraconsistente como

    apresentado em (DA COSTA, 1999).

  • 35

    Seja T uma teoria fundada sobre uma lgica L, e suponha-se que a linguagem de T e de

    L contenha um smbolo para a negao se houver mais de uma negao, uma delas

    deve ser escolhida, pelas suas caractersticas lgicas formais. A teoria T inconsistente

    se ela possuir teoremas contraditrios; isto , um a negao do outro; caso contrrio, T

    consistente. A teoria T trivial se todas as frmulas da lgica L ou todas as frmulas

    fechadas de L forem teoremas de T; em hiptese contrria, T no-trivial.

    Analogamente, a mesma definio aplica-se a sistemas de proposies, conjunto de

    informaes, etc. (levando-se em conta, naturalmente, o conjunto de suas

    conseqncias). Na lgica clssica e em muitas categorias de lgica, a consistncia

    desempenha papel importante. Com efeito, na maioria dos sistemas lgicos usuais, se

    uma teoria T trivial, ento T inconsistente e reciprocamente. Em outras palavras,

    lgicas como essas no separam os conceitos de inconsistncias e de trivialidade.

    Uma lgica L chama-se Paraconsistente se puder servir de base para teorias

    inconsistentes, mas no-triviais, ou como diz, uma Lgica Paraconsistente tem a

    capacidade de manipular sistemas inconsistentes de informaes sem torna-se trivial.

    Uma lgica L chama-se Paracompleta se ela puder ser a lgica subjacente as teorias nas

    quais se infringe a lei do terceiro excludo na seguinte forma: de duas proposies

    contraditrias uma delas verdadeira.

    Chama-se uma lgica No-Altica quando esta for Paracompleta e Paraconsistente

    simultaneamente.

    2.3 A Lgica Paraconsistente anotada de anotao com dois valores (LPA2v)

    A anotao pode ser composta por 1,2..n valores. Portanto, pode-se obter maior poder

    de representao sobre as anotaes, ou evidncias, expressam o conhecimento sobre a

    proposio p se a representao da anotao, em vez de ser feita por um nico smbolo,

    for formada por dois smbolos que so representados por dois valores. Sendo o

    conjunto de pares ordenados de valores de grau de crena e grau de descrena que

    podem ser atribudos a uma mesma proposio (Figura 2.2). Desse modo, pode-se

    utilizar um reticulado formado por pares ordenados, tal que = {(1, 2)| 1, 2 [0,1]}

    R (DA SILVA FILHO, 2008).

  • 36

    L-se: H um conjunto que possui os valores dos graus de crena e descrena, tal que,

    os graus de crena e descrena pertenam ao intervalo fechado [0,1] contido no

    conjunto dos nmeros reais.

    Nesse caso, tambm fixado uma operao ~:|| || em que o operador (~) constitui o smbolo lgico de negao do sistema considerado. Os outros valores do reticulado

    so:

    indica o mnimo de = (0,0)

    indica o mximo de = (1,1)

    sup indica a operao de supremo

    inf indica a operao de nfimo supremo

    Um reticulado de quatro vrtices associado Lgica Paraconsistente Anotada de

    Anotao com dois valores (LPA2v) pode ser representado no quadrado unitrio no

    plano cartesiano, conforme a Figura 2.2.

    Figura 2.2 Reticulado finito de Hasse com anotao da LPA2v

    = Inconsistente = p (1,1)

    F = Falso = p (0,1)

    V = Verdadeiro = p (1,0)

    = Indeterminado = p (0,0)

  • 37

    O primeiro elemento do par ordenado p(1, 2), (1) representa o grau de crena em

    que sustenta a proposio p, e o segundo elemento (2) representa o grau de descrena

    que nega ou rejeita a proposio p. Nos limites tem-se:

    (1, 2) = (1,1) indica existncia de grau de crena e descrena total

    (1, 2) = (0,1) indica existncia de grau de crena nula e descrena total

    (1, 2) = (1,0) indica existncia de grau de crena total e descrena nula

    (1, 2) = (0,0) indica existncia de grau de crena e descrena nula

    a) Consideraes sobre o reticulado associado Lgica Paraconsistente anotada de anotao com dois valores (LPA2v)

    Uma das interpretaes vlidas da Lgica Paraconsistente descrita em (DA COSTA,

    1999) e est resumida a descrita em (DA COSTA, 1999) e est resumida a seguir:

    Se p um smbolo proposicional e 1 uma constante de anotao, ento p1 uma frmula (atmica).

    Se p um smbolo proposicional e 2 uma constante de anotao, ento p2 uma frmula (atmica).

    Se A e B so frmulas quaisquer, ento (A), (AB), (AB) e (AB) so frmulas.

    Uma expresso da forma p(1, 2) interpretada como: Cr-se em p com grau de

    crena at 1 e grau de descrena at 2. As frmulas: (A) interpretada como a

    negao ou negao fraca; (AB) interpretada como a conjuno de A e B; (AB) interpretada como disjuno de A e B; e, (AB) interpretada como a implicao de B por A.

    Assim sendo, tem-se: Seja ento o reticulado de Hasse com anotao de dois valores,

    onde = {(1, 2)| 1, 2 [0,1] R}. Se p uma frmula bsica, o operador ~:| | ||, definido agora como ~(1, 2)= (2, 1), onde 1, 2 [0,1] R e considera-se (2, 1) uma anotao de p.

  • 38

    Uma interpretao para a Lgica Paraconsistente Anotada de Dois Valores (LPA2v)

    apresentada em (DA COSTA, 1999). Sejam P um conjunto de smbolos proposicionais

    e F o conjunto de frmulas, uma interpretao para LPA2v uma funo I:P ||. Dada como uma interpretao de I pode-se associar a uma valorao VI: F {0,1} assim definida, onde F uma frmula dos pares ordenados (0,1).

    Se p P e ||, ento:

    VI(p) = 1 se e somente se I(p) >= e

    VI(p) = 0 se e somente se no o caso que I(p) >= ;

    Pela condio acima se tem que VI (p) = 1 se e somente se I(p) >= , ou seja, p

    verdadeira, segundo a interpretao I se a interpretao dada a p, I(p), for maior ou igual

    ao valor de crena com respeito proposio p. Ela falsa, caso contrrio.

    Se puder demonstrar que h interpretaes I e proposies p, tais que VI (p) =1 e VI

    (p) =1, ou seja, tem contradies verdadeiras nesta lgica. Isto intuitivo se

    considerar proposies do tipo p (0,5; 0,5). Sua negao p (0,5; 0,5) equivale a p~(0,5;

    0,5) que tambm p (0,5; 0,5). Ora, se p (0,5; 0,5) for verdadeira, ento claro que sua

    negao tambm verdadeira. Se ela for falsa, sua negao tambm falsa.

    b) Representao grfica no plano cartesiano do reticulado de 12 posies da Lgica Paraconsistente anotada de anotao com dois valores (LPAv2)

    A representao dada na Figura 2.2, contm informaes do desenvolvimento de um

    algoritmo bsico para a utilizao da Lgica Paraconsistente (DA COSTA, 1999), pois a

    partir desse possvel a criao de novos algoritmos, cujo, sua finalidade analisar e

    retornar os valores de certeza e contradio (Evidncia Favorvel e Contrria). Sua base

    descrever a Lgica Paraconsistente definindo assim, a Clula Neural Artificial

    Paraconsistente, como base para descrever todas as clulas criadas para a formao da

    Rede Neural Artificial Paraconsistente (DA SILVA FILHO, 2001).

    A Figura 2.3, apresenta um grfico com as vrias subdivises e interpretaes para o

    reticulado 12 da Lgica Paraconsistente, no Quadrado Unitrio do Plano Cartesiano

    (QUPC).

  • 39

    Figura 2.3 - Quadrado unitrio do plano cartesiano (reticulado 12 posies)

    FONTE: DA COSTA (1999)

    No QUPC os segmentos determinados pelos pares ordenados B= (0,1) e D= (1,0),

    simbolizando por segmento de reta BD denomina-se uma linha perfeitamente definida

    (DA COSTA, 1999), significa que os valores de incidente so iguais aos valores

    determinados na matriz em anlise, e pelos pares A= (0,0) e C (1,1), simbolizado por

    segmento de reta AC, que se denomina como uma linha perfeitamente indefinida, isto

    significa que para todos os valores dos graus de crena existe um correspondente

    idntico no grau de descrena.

    Os eixos 1 e 2 representam os graus de crena e descrena. Os valores dos pontos dos

    pares cartesianos em seus estados esto subdivididos em:

    Definies dos Estados Extremos

    V = Verdadeiro;

    F = Falso;

    = Inconsistente;

    = Indeterminado.

  • 40

    Definies dos Estados no-Extremos

    Qf = Quase falso tendendo ao Inconsistente Qf = Quase falso tendendo ao Indeterminado

    V = Inconsistente tendendo ao Verdadeiro

    F = Inconsistente tendendo ao Falso Qv = Quase verdade tendendo ao Inconsistente Qv = Quase verdade tendendo ao Indeterminado

    V = Indeterminado tendendo ao Verdadeiro

    F = Indeterminado tendendo ao Falso

    As posies utilizadas na abordagem paraconsistente deste trabalho no QUPC (Figura,

    2.3) so todos os valores extremos e apenas dois valores no-extremos, descrito como:

    Inconsistente tendendo a Verdadeiro e Quase verdade tendendo a Inconsistente.

    2.4 Modelo matemtico do neurnio artificial

    As Redes Neurais Artificiais (RNAs) so inspiradas no funcionamento do crebro,

    tentando assim imit-lo por meio de tcnicas computacionais com o fim de adquirir,

    armazenar e utilizar o conhecimento.

    Algumas definies bsicas sobre as redes neurais artificiais so:

    Haykin (1994) define uma Rede Neural como sistemas distribudos massivamente paralelos que tem uma propenso natural para armazenar o

    conhecimento experimental e disponibiliz-lo para uso. Sendo que, em dois

    aspectos lembram o crebro humano:

    o O conhecimento adquirido pela rede atravs de um processo de aprendizado;

    o Conexes entre os neurnios, conhecidos como pesos sinpticos, so usadas para armazenar o conhecimento.

  • 41

    Segundo Kohonen (1972), as RNAs so definidas como redes massivamente paralelas e interconectadas, de elementos simples. Esses elementos devem

    interagir como dados do mundo real, assim como o sistema nervoso biolgico.

    Os neurnios so as unidades fundamentais que compem o crebro. Cada neurnio

    constitudo de um corpo celular, ou soma que o ncleo da clula; partindo do ncleo

    existem vrios filamentos, chamados de dendritos e um mais longo denominado de

    axnio. A juno entre dois neurnios d-se o nome de sinapse por os sinais se

    propagam de um neurnio para outro.

    Substncias qumicas transmissoras so liberadas pelas sinapses e entram nos dendritos,

    aumentando ou baixando o potencial eltrico da clula. Quando o potencial alcana um

    limiar, um pulso eltrico, chamado de potencial de ao, enviado pelo axnio. As

    sinapses que aumentam o potencial eltrico so chamadas de excitatrias, e as que

    baixam inibitrias (RUSSELL e NORVIG, 1995). A caricatura da estrutura de um

    neurnio biolgico pode se observado na Figura 2.4.

    Figura 2.4 - Estrutura de um Neurnio Biolgico

    Assim como nos sistemas biolgicos, as redes neurais artificiais, tambm tm como

    unidade principal o neurnio, que so conectados por ligaes denominadas conexes

    sinpticos. Cada conexo age de maneira ponderada sobre sua entrada, formando um

    peso sinptico.

    As RNAs apresentam como principais vantagens, suas caractersticas de adaptabilidade,

    generalizao e tolerncia a rudos (HAYKIN, 1994). Essas caractersticas so de

    extrema importncia na aplicao das redes neurais em diferentes tipos de problemas.

  • 42

    Existe uma grande diversidade de modelos de redes neurais, entretanto qualquer modelo

    de RNA pode ser descrito pela especificao dos seguintes componentes bsicos:

    Modelo do neurnio;

    Estrutura da rede;

    Algoritmo de Aprendizado.

    Um neurnio uma unidade de processamento de informaes fundamentais para

    operao de uma Rede Neural (HAYKIN, 1994).

    So trs elementos bsicos que constituem um neurnio:

    Um conjunto de sinapses, que so caracterizadas por pesos.

    Um somador dos sinais de entrada, ponderados pelas suas respectivas sinapses.

    Uma funo de ativao para limitar a amplitude do sinal de sada do neurnio. Tipicamente os sinais de sada so normalizados nos intervalos [0, 1] ou [-1, 1].

    Na Figura 2.5 mostrado um modelo de neurnio que possui, alm dos elementos

    acima, um limiar bk, que tem o efeito de subtrair a entrada uk da funo de ativao.

    Figura 2.5 - Modelo de um neurnio no-linear

  • 43

    Matematicamente um neurnio k pode ser descrito como:

    =

    =p

    jkjkjk bxwv

    1

    (2.1)

    f(.) = )( kk vy = (2.2) em que x1, x2,, xp so sinais de entrada; wk1, wk2,, wkp so pesos sinpticos do

    neurnio k; vk a diferena entre a combinao linear dos sinais de entrada ponderadas

    pelos sinpticos e bk o limiar do neurnio; f (.) a funo de ativao e yk o sinal de

    sada do neurnio.

    Existem diversas funes de ativao que podem ser aplicadas nas redes neurais

    artificiais, as mais comuns esto representadas na Figura 2.6.

    Funo Linear

    xxf =)( Funo Sigmoidal

    xexf += 1

    1)(

    Funo tangente hiperblica

    x

    x

    eexf

    +=

    11)(

    Figura 2.6 Funes de ativao

    2.4.1 Rede Neural de Funes de Base Radial

    A construo de uma Rede Neural de Funes de Base Radial - RBF em sua forma mais

    bsica envolve duas camadas, conforme mostra a Figura 2.7. Os ns da camada de sada

    calculam a combinao linear das funes de base radial. As funes de base radial na

    camada escondida produzem uma resposta localizada para o estmulo (padro) de

    entrada, isto , eles produzem uma resposta significativamente diferente de zero,

    somente quando o padro de entrada est dentro de uma regio pequena localizada no

    espao de entrada. Por esta razo, tal rede neural algumas vezes referenciada na

    literatura como redes de campos receptivos localizados (HAYKIN, 2001). Para o

    funcionamento da RBF so necessrios os centrides e uma funo de ativao

    relacionada com uma funo de distribuio probabilstica, por exemplo, gaussiana.

  • 44

    Dado um vetor de entrada, a sada de um n simples ser (Eq. 2.4):

    Figura 2.7 - Estrutura bsica da Rede de Funes Radiais RBF1

    Dados N-vetores X (dados de entrada) de p-exemplares, representando p-classes (p

    classes dos meses no intervalo de tempo de 1980-1997), a rede iniciada com o

    conhecimento dos centros representados na matriz C (Eq. 2.3).

    TckccC ]...21[=

    (2.3)

    em que c1, c2, ..., ck representam o k centros, dos k vetores encontrados com centros. A

    camada de sada realiza a soma ponderada das sadas da camada escondida. Quando

    apresentando um vetor de entrada para a rede dado por:

    ( )CXfWy = .

    (2.4)

    em que f representa o vetor de sada funcional da camada escondida; X o vetor de

    entrada; C a matriz de centros; W a matriz de pesos; e y a sada da rede (a sada

    ser um vetor se existirem mltiplas sadas).

    O aprendizado na camada intermediria executado usando tipicamente um algoritmo

    de "cluster", ou um algoritmo supervisionado para achar os centros (ns c na camada

    escondida). Neste trabalho utilizada uma RNAP para determinar os centros (que so as

    conexes entre a camada de entrada e a camada intermediria).

    A rede RBF e a rede perceptron de mltipas camadas (MLP) so exemplos de redes

    neurais (feedforward) no-lineares. Ambas so aproximadores universais de funes,

    podendo uma rede RBF substituir uma MLP especfica, ou vice-versa (HAYKIN, 2001).

    Contudo, estas duas redes diferem uma da outra em alguns importantes aspectos, como:

  • 45

    Uma RBF (na sua forma mais bsica) tem apenas uma camada intermediria, enquanto uma MLP pode ter uma ou mais camadas intermedirias;

    Os clculos feitos nos ns de uma MLP localizados na camada intermediria ou na camada de sada diferem do clculo dos nodos nas camadas escondida e de

    sada de uma RBF;

    A camada intermediria na RBF no linear, enquanto que a camada de sada linear. J na MLP, usada como um classificador, as camadas intermedirias e de

    sada pem ser no-linear; contudo, quando a MLP usada para resolver

    problemas de regresso no-linear, uma camada linear na sada geralmente a

    escolhida;

    A RBF utiliza clculo da distncia Euclidiana entre o vetor de entrada e o vetor que representa o centro de cada unidade na camada intermediria, enquanto que

    a MLP faz uso do clculo utilizando o produto interno do vetor de entrada e o

    vetor peso sinptico daquela unidade.

    A MLP no processo de treinamento na maioria das vezes lenta, dependendo do algoritmo de treinamento, sendo que os requisitos de memria so pequenos e o

    tempo de classificao rpido. Por sua vez, a RBF no processo de treinamento

    rpida e o requisito de memria relativamente alto com tempo de

    classificao mdio;

    Finalmente, a MLP constri aproximadores globais para mapas de entrada-sada no-lineares. Conseqentemente, eles so capazes de generalizar em regies do

    espao de entrada onde os dados de treinamento esto disponveis. Por outro

    lado, RBF usando no-linearidade local com decrscimo exponencial, como o

    caso da funo de gaussiana, constri aproximaes locais para mapas de

    entrada-sada. Neste sentido, as RBFs so capazes de aprender mais rpido e tm

    sensibilidade reduzida com respeito ordem de apresentao dos dados de

    treinamento.

    Foram utilizadas duas RBFs, a primeira (RBF1) descrita na Figura 2.7 que possui vrios

    vetores de sadas, a segunda (RBF2) possui como entradas o treinamento da RBF1 e os

    dados dos vetores ao qual se deseja efetuar a previso, esta ltima considerada como

  • 46

    centros, com apenas um vetor de sada que so os valores preditos, como descrita na

    Figura 2.8.

    Figura 2.8 - Estrutura bsica da Rede de Funes Radiais RBF2

    No contexto deste trabalho, a RBF foi escolhida por apresentar a possibilidade de usar

    os vetores encontrados pela rede neural paraconsistente, como centros de clusters

    associados aos padres presentes nos dados analisados.

    2.4.2 Rede Neural Artificial Paraconsistente

    O modelo de Rede Neural Artificial Paraconsistente (RNAP) tem a finalidade de

    possibilitar a construo de unidades artificiais utilizando modelos mais prximos dos

    neurnios biolgicos.

    Uma RNAP utiliza a Equao Estrutural Bsica (EEB), descrita como:

    2121 += r (2.5)

    L-se r = grau resultante, 1 = grau de crena e 2 = grau de descrena. A finalidade da EEB gerar um sinal normalizado que implica na suavizao desses valores como

    resultados da rede.

    Na RNAP necessrio computar os sinais de graus resultantes (graus de crena e

    descrena), que so valorados no intervalo fechado de nmeros reais [0,1]. Esses sinais

    so transmitidos por valores equacionados pela EEB atravs de clulas (mtodos)

    descritas com base na Lgica Paraconsistente (Apndice A).

  • 47

    Quando o valor do grau de crena 1 considera-se como uma confirmao da

    proposio ou do padro aplicado na entrada; se o grau de crena 0 (zero) considera-se

    como uma negao lgica da proposio ou do padro aplicado na entrada, ou se o grau

    de crena (meio) considera-se como uma indefinio lgica da proposio ou do

    padro aplicado na entrada.

    As equaes so muito simples nas Clulas Neurais Artificiais Paraconsistentes, que so

    os fundamentos lgicos da rede neural paraconsistente, elas utilizam a EEB para

    equacionar os sinais e, a partir do resultado obtido, sugestiona uma tomada de deciso

    que transmitida em forma de grau resultante para outras Clulas Paraconsistentes. A

    conexo entre as clulas so consideradas sinapses e o seu conjunto forma as Unidades

    Neurais Artificiais Paraconsistentes que em alguns casos so consideradas como Para-

    Perceptrons, isto quando h pelo menos uma Clula Paraconsistente de Conexo

    Analtica e uma Clula Paraconsistente de Aprendizagem conectadas.

    As interligaes que recebem o nome de conexes sinpticas entre os Para-

    Perceptrons, formam uma rede por onde trafegam sinais representativos de proposies

    ou padres que aps as anlises sero convertidos em aes, as quais so subentendidas

    como evidncia favorvel ou contrria ao resultado da anlise desejada.

    a) Clulas Neurais Artificiais Paraconsistentes

    A Clula Neural Artificial Paraconsistente Bsica (Apndice A) uma representao do

    Algoritmo Para-Analisador (ABE, 1999), possuindo como base apenas duas equaes

    que determinam os Graus de Evidncia Favorvel e Contrrio representados na

    descrio do reticulado 12 da Lgica Paraconsistente.

    O processamento dos sinais com as equaes do algoritmo para-analisador permite

    descobrir com que medida ou grau de evidncia pode-se afirmar que uma proposio

    lgica seja falsa, verdadeiro, inconsistente ou indeterminada. A representao grfica

    desta clula encontra-se na Figura 2.9 a seguir:

  • 48

    Figura 2.9 Clula Artificial Paraconsistente Bsica

    Com a Clula Neural Artificial Paraconsistente Bsica CNAPb cria-se um conjunto de

    Clulas Neurais Artificiais Paraconsistentes, que tem como caracterstica a

    normalizao das sadas, pois, a sada pode representar o grau de evidncia favorvel

    dada pelo grau de certeza (Gc = 1 2) e/ou o grau de evidncia contrria dada pelo

    grau de contradio (Gct = 1 + 2 - 1) pertencente ao intervalo real [-1, 1], ambos no

    podem ser utilizados como entradas de uma prxima clula.

    O fator de tolerncia certeza, ftC, e o fator de tolerncia contradio, ftCt, servem

    para simplificar o funcionamento dessa clula sendo utilizados diretamente para calcular

    os seguintes limites: vscc Valor Superior de Controle a Certeza; vicc Valor Inferior

    de Controle a Certeza; vscct Valor Superior de Controle a Contradio; e, vicct

    Valor Inferior de Controle a Contradio;

    21 ftCvscc += (2.6)

    21 ftCvicc = (2.7)

    21 ftCtvscct += (2.8)

    21 ftCtvicct = (2.9)

    b) Fatores de Tolerncias

    Na RNAP existem alguns fatores importantes para a faixa de atuao da Rede Neural,

    que se definem como:

  • 49

    Fator de tolerncia contradio (ftCt): Define-se a tolerncia ao grau de contradio atravs de um valor normalizado: 0 < ftCt < 1. A partir disto, se |Gct| <

    ftCt, ento, r = (1-2+1) /2, e ainda o sinal de resposta contradio rct = 0;

    caso contrrio, r = e rct = Gct.

    Fator de tolerncia certeza (ftC): Da mesma forma pode-se definir o fator de tolerncia certeza: 0 < ftC< 1. A partir disto se |Gc| > ftC ento r = (1-2+1) /2,

    caso contrrio r = .

    Fator de tolerncia de reconhecimento de padro (ftR): Dado por um valor numrico de 0 a 1. A similaridade (sm) entre dois elementos ser calculada por xn

    dividido por kn, sendo Xn o elemento n do vetor X que est sendo comparado com o

    elemento kn, elemento n do vetor K. Caso todas as similaridades sm(n) (com n

    variando de 0 a 1) calculadas sejam superiores ao fator de reconhecimento de

    padro (ftR), diz-se que o vetor X similar ao vetor K, com fator de similaridade

    mnima e ftR. Outra forma de se calcular o reconhecimento por similaridade

    calcular a similaridade total (sm(t)), dada pela somatria de todas as similaridades

    sm(n) entre os elementos, dividida pelo nmero de elementos do vetor.

    Caso sm(t) = ftR, diz-se que o vetor foi reconhecido com fator de similaridade sm(t),

    caso contrrio, no se considera como reconhecido.

    Fator de aprendizagem (ftA): Esse fator ajustado em seu valor fsico para a configurao do aplicativo podendo sofrer alteraes, assim, novos valores lgicos

    so determinados durante a execuo da RNAP. Esse valor determinado no

    intervalo fechado [0,1] como um valor real.

    c) Evidncia Favorvel e Contrria

    Os valores dos graus de evidncia favorvel e contrria tm seus valores dados no

    intervalo [-1,1]. Esses so utilizados para resultar melhores dados de anlises, onde se

    tenta uma semelhana na forma humana de analisar e encontrar as solues dos

    problemas.

  • 50

  • 51

    3. METODOLOGIA

    Esta dissertao tem como objetivo conceber um mtodo de reduo de dados

    climticos de reanlises para obteno de um modelo de previso sinptica de clima.

    Nos pargrafos seguintes so descritos os diferentes passos adotados para desenvolver o

    trabalho.

    Na seleo de dados adotou-se a mesma base de dados utilizada por Pessoa (2004) que

    coletou os dados da base de dados de reanlise do NCEP/NCAR (National Centers for

    Environmental Prediction / The National Center for Atmospheric Research)

    [http://www.cdc.noaa.gov/data/reanalysis/reanalysis.shtml/] para o perodo de janeiro de

    1980 a dezembro de 2000, em uma rea contida entre as latitudes [10 N, 35 S] e

    longitudes [80 W, 30 W], referente Amrica do Sul, com resoluo espacial, em

    ambas as dimenses (x, y), de 2.5 e resoluo temporal (t) de 1 ms.

    Para a realizao dos experimentos os dados dos anos de 1980-1997 foram selecionados

    para a criao dos perfis meteorolgicos, enquanto que os dados dos anos de 1998-2000

    foram utilizados para validar os modelos de previso obtidos.

    Para seguir com a abordagem de minerao de dados, os dados foram transformados

    para um espao adimensional, ou seja, cada varivel foi mapeada para o intervalo [0,1].

    Os valores que correspondem posio geogrfica dos dados foram mantidos com seus

    valores originais.

    O algoritmo aplicado na transformao dos dados considera a necessidade do algoritmo

    baseado na lgica paraconsistente para a determinao dos padres.

    A tcnica utilizada caracteriza-se por ter a possibilidade de utilizar dois valores. O

    primeiro valor o grau de crena e o segundo grau de descrena calculado pela

    Equao 3.1. Estes valores so caractersticas da tcnica baseada na lgica

    paraconsistente.

    112 = (3.1)Os dados transformados so submetidos a um processo de aprendizado e memorizao

    de longa durao dos histricos dos dados meteorolgicos. A memorizao acontece

  • 52

    com o armazenamento dos dados, discriminado no processamento da rede neural

    artificial paraconsistente.

    A identificao dos padres est relacionada com a classificao dos valores em grupos,

    por sua no-similaridade. Os registros que no possuem similaridades de acordo com os

    valores estimados das tolerncias a Certeza (Crena) e Contradio (Descrena) so

    identificados como padres para um determinado trimestre e automaticamente incluem

    os ciclos sazonais existentes para todas as regies selecionadas e localizadas fisicamente

    por sua longitude e latitude.

    O processo de identificao dos padres realizado da seguinte forma:

    Identificam-se os padres de um histrico conforme Figura 3.1.

    Para minimizar o tempo de procura os registros idnticos foram desprezados, com isso

    houve um ganho nas buscas de aproximadamente 37,5% do tempo total.

    Figura 3.1 Processo de busca dos registros

    Quanto maior os fatores de tolerncias (Certeza e Contradio) mais registros so

    identificados por no similaridades. Os valores que possuem similaridades aceitveis

    so descartados na composio dos dados de identificao dos padres.

    Aps a identificao dos padres, estes formam os centros da RBF. Essa rede ter como

    entradas os sinais produzidos para a previso de um ou trs ciclos sazonais adiante. O

    treinamento da camada de sada da RBF realizado para produzir a previso dos

    atributos temperatura e precipitao.

  • 53

    As entradas da RBF so comparadas com os centros das funes de base radial pelo

    clculo da distncia euclidiana que submetida, em seguida, funo de base radial.

    Nos experimentos conduzidos optou-se pela funo Gaussiana com desvio padro igual

    a 1.

    O incio da previso ocorre no ms de Maro, Abril e Maio de 1998 e sucessivamente

    para cada ciclo sazonal, assim, faz-se necessrio o deslocamento dos dados para que

    sejam submetidos RNAP na etapa de aprendizado e desta forma posso gerar novos

    centros.

    Aps o treinamento, foi realizada a validao dos modelos obtidos com os dados

    existentes no histrico dos anos 1998-2000. As sadas da rede RBF, tomada como

    previses so comparadas com os valores reais existentes nos dados.

    Para ser possvel a previso de forma eficaz foram estabelecidas duas regras dadas por:

    Na entrada da RBF necessrio identificar os valores do atributo que se deseja fazer a previso.

    O resultado da RBF um valor de previso que necessita ser desnormalizado.

  • 54

  • 55

    4. METEOROLOGIA E SELEO DA REA DE ESTUDO

    A meteorologia definida como a cincia que estuda os fenmenos que ocorrem na

    atmosfera, e est relacionado ao estado fsico, dinmico, qumico atmosfrico e as

    interaes entre elas e a superfcie terrestre subjacente (INMET, 2003).

    Em meteorologia h uma distino entre tempo e clima que so conceitos usados para se

    entender o comportamento da atmosfera em diferentes "intervalos de tempo". O tempo

    o estado da atmosfera em um determinado momento e lugar ou, o estado da atmosfera

    com relao aos seus efeitos sobre a vida e as atividades humanas. J o clima se refere

    s caractersticas da atmosfera inferidas por observaes contnuas durante um longo

    perodo, como por exemplo, 30 anos (normal climatolgica). O clima abrange um maior

    nmero de dados do que as condies do tempo para uma determinada rea. Ele inclui

    consideraes dos desvios em relao s mdias, variabilidade, condies extremas e

    freqncia de ocorrncia de determinada condio de tempo. Assim, o clima representa

    uma generalizao, enquanto o tempo lida com eventos especficos.

    O clima tem influncia direta sobre diversas atividades, tais como agricultura, a pesca, a

    gerao e distribuio de energia eltrica, defesa civil, dentre outras. Por tantas tarefas

    dependerem do comportamento atmosfrico, tanto a curto como em longo prazo,

    importante entender os fenmenos naturais e assim se antecipar as possveis

    calamidades que possam vir a ocorrer em casos de um clima atpico. A meteorologia

    est em contnuo aperfeioamento para cada vez tornar mais confiveis e aumentar o

    prazo de previso climtica e do tempo. Entre as tcnicas para a realizao da previso

    de tempo e clima so utilizados, pelos centros de previso em todo o mundo os modelos

    numricos.

    Outro ponto importante que uma regio em anlise representada por uma grade, ou

    malha e a interseco das linhas verticais e horizontais um ponto da grade em questo,

    como mostra Figura 4.1.

  • 56

    (x1,y1)

    Figura 4.1 Grade

    Considera-se um breve relato de algumas tcnicas utilizadas para a previso do tempo

    ou clima em alguns centros de pesquisas meteorolgicas dadas por:

    a) Tipos de Modelo Numrico

    Para previso do clima e tempo existem os modelos numricos, que o nome dado

    tcnica que simula o estado da atmosfera, por meio de modelos fsico-matemticos

    resolvidos numericamente, atravs de tcnicas computacionais. O prazo de previso est

    diretamente relacionado com a resoluo temporal (amostragem das variveis de

    entrada, podendo ser em: minutos, horas, meses, etc.) e espacial (distncia entre os

    pontos de grade) das variveis. Em geral, modelos que trabalham com alta resoluo

    (exemplo: 1 km) requerem um passo de integrao menor, limitando o alcance de

    previso em poucos dias. J os modelos que operam com baixas resolues (250 km,

    ver Figura 4.2), o alcance operacional da previso pode chegar a ser mensal ou anual

    (GUTIRREZ, 2003).

    Figura 4.2 Grade Global de baixa resoluo

  • 57

    b) Previso Climtica

    A previso climtica uma estimativa do comportamento mdio da atmosfera com

    alguns meses de antecedncia. Por exemplo, pode-se prever se o prximo vero ser

    mais quente ou mais frio que o normal, ou ainda, mais ou menos chuvoso. Todavia, tal

    estimativa no pode dizer exatamente quais sero a quantidade de chuvas ou quantos

    graus a temperatura estar mais ou menos elevada.

    Para previso climtica, no CPTEC so utilizados modelos numricos, alguns em

    carter experimental, pois no Brasil e no mundo, essa uma rea que est em constante

    evoluo com o propsito de torn-la mais confivel (CPTEC, 2003).

    Neste trabalho so utilizados dados de reanlise que podem ser encontrados no endereo

    [http://www.cdc.noaa.gov/data/reanalysis/reanalysis.shtml/] oriundos do NCEP/NCAR

    (National Centers for Environmental Prediction / The National Center for Atmospheric

    Research) para o perodo de janeiro de 1980 a dezembro de 2000.

    Estima-se que os dados de reanlise so o mais prximo dos fenmenos reais

    observados no ambiente estudado. A Tabela 4.1 descreve cada varivel selecionada para

    o desenvolvimento do trabalho (seguindo o que foi proposto em Pessoa (2004)).

    Tabela 4.1 Atributos Meteorolgicos utilizados

    Atributos Descrio Unidades de medida

    1 ms Ms Inteiro 2 ciclo Ciclo Sazonal inteiro 3 lon Longitude C 4 lat Latitude C 5 temp Temperatura Temperatura da Superfcie do Solo e a

    para as faixas continentais a interpolao com a Temperatura de Superfcie do Mar.

    C

    6 u850 Vento Zonal (850 hPa) Componente do vento horizontal superfcie do planeta representado por u, positivo no sentido de oeste para leste com direo (graus) vertical perpendicular a superfcie no nvel de presso 850 hectoPascal, neste caso.

    m/s

    7 u500 Vento Zonal (500 hPa) m/s 8 u300 Vento Zonal (300 hPa) m/s 9 v850 Vento Meridional (850 hPa) - positivo no sentido de

    sul para norte. m/s

    10 v500 Vento Meridional (500 hPa) m/s continua

  • 58

    Tabela 4.1 - Concluso 11 v300 Vento Meridional (300 hPa) m/s 12 shum Umidade Especfica Medida acima 2m da superfcie

    do solo, a relao entre a massa de vapor de gua e a massa de ar mido em que o vapor de gua est contido.

    kg/kg

    13 spres Presso atmosfrica Resulta da ao do ar atmosfrico sobre os corpos nele inseridos.

    mb

    14 div Divergncia Movimento do vento associado ao fluxo horizontal do ar para fora de uma regio especfica. Estando relacionado s variaes de movimento vertical do vento e presso atmosfrica.

    1/s

    15 prec Precipitao Quantidade de chuva acumulada na superfcie do solo.

    mm/dia

    As reas escolhidas para o estudo esto apresentadas na Figura 4.3 e compreendem as

    coordenadas:

    rea Total (Brasil): lon = 280W, 330W; lat = -35S, 10S;

    rea 1: lon = 15.5W, 25.5W; lat = -7.5S, 0;

    rea 2: lon = 45W, 35W; lat = -7.5S, 0;

    rea 3: lon = 50.5W, 60W; lat = -22.5S, -15S;

    rea 4: lon = 62.5W, 52.5W; lat = -27S,.5 -20S;

    rea 5: lon = 50W, 60W; lat = -35S, -27.5S;

  • 59

    Figura 4.3 reas selecionadas para as anlises

    Dos 21 anos de dados armazenados na base de dados, 72% foram reservados para

    treinamento, enquanto os outros 28% foram utilizados para validao, ou seja, para

    testar a abordagem de previso climtica desenvolvida neste estudo e verificar sua

    generalizao.

    As temperaturas da superfcie do solo so interpolados com os dados de temperatura da

    superfcie do mar (TSM ou do ingls SST) somente para as faixas continentais

    (longitudes que avanam ao mar), de modo a formar um s atributo denominado

    temperatura.

    Foram incorporadas para as anlises as componentes espaciais e temporais (longitude,

    latitude e tempo) mais os atributos de deciso (temperatura e precipitao),

    adicionalmente s variveis mostradas na Tabela 4.1.

  • 60

  • 61

    5. ABORDAGEM PARA A PREVISO DE DADOS METEOROLGICOS

    Os dados so apresentados ao sistema de rede neural paraconsistente para a

    identificao dos centros existentes na base de dados no perodo entre os 1980-1997.

    Os dados foram transformados para o intervalo fechado [0,1]. Essa transformao

    tambm aplicada sobre dados de validao compreendidos entre os anos 1980-2000.

    A aprendizagem ocorre sobre os dados dos anos entre 1980-1997. Essas informaes

    formam uma matriz com os vetores que representam os perfis das aes climticas.

    Esses vetores so aprendidos e memorizados por uma rede neural artificial

    paraconsistente, tendo como sadas a identificao dos padres.

    A validao da tcnica de predio ocorre com os dados selecionados entre os anos

    1998-2000, que no foram usados no treinamento das redes neurais. Nesse caso os

    dados da predio do trimestre desejado sero as entradas de uma RBF, que ter como

    retorno um valor que seja a predio dos atributos de deciso temperatura e

    precipitao.

    As regras descritas abaixo so as bases para a abordagem e utilizao do algoritmo da

    Rede Neural Paraconsistente para a identificao dos padres necessrios, que

    comportaro os centros dos histricos trimestrais, e so dada por:

    H um total de 15 atributos que formam um registro das identificaes dos dados meteorolgicos conforme Tabela 4.1, sendo que, somente do quinto

    atributo ao ltimo so vlidos ao processamento da RBF, pois do primeiro ao

    quarto so atributos de posies das reas selecionadas e a identificao do ciclo

    sazonal em questo;

    No reconhecimento processado pela RNAP, tem-se com retorno as evidncias favorveis e seu valor deve ser maior ou igual ao valor das evidncias contrrias

    somente para os atributos de deciso;

    A soma de cada valor dos atributos reconhecidos por similaridades no pode ser maior que a soma dos valores dos atributos reconhecidos por no similaridades

    com exceo dos atributos de deciso;

  • 62

    Cada atributo reconhecido por similaridade marcado por um nico valor, que somado em um contador, o total dessa soma refere-se quantidade de atributos

    que foram encontrados por similaridades de cada registro, esse valor no pode

    ser maior que o total de atributos que foram reconhecidos por no similaridade;

    A previso de temperatura e precipitao pode ocorrer ao mesmo tempo para cada rea selecionada por sua localizao (longitude e latitude) e o trimestre ou

    ciclo sazonal que se deseja fazer a previso.

    A utilizao da lgica paraconsistente tem em seu ncleo o tratamento intrnseco das

    incertezas, e tambm possui algoritmos simples que tendem a execues rpidas, que

    reflete diretamente no desenvolvimento e futuras manutenes.

    O modelo de RNAP utilizado dado na Figura 5.1.

    Figura 5.1 Modelo de Rede Neural Artificial Paraconsistente

    O modelo de RNAP apresentado na Figura 5.1 como uma nova tcnica de minerao e

    dados no apresenta a necessidade de uma rede diferente para anlise de cada rea.

    A ftA denominado Fator de Aprendizagem, esse valor controla o tempo de

    aprendizado e a forma de aprendizado (especfica ou genrica), sendo que, quanto mais

    prximo de 1 (um) mais lento o processo e mais especfica torna-se a RNAP. O ftR

  • 63

    denominado Fator de Reconhecimento de Padro que controla o reconhecimento ou a

    identificao dos padres por similaridades, se o valor for muito prximo de 1 o

    reconhecimento torna-se mais idntico. O ftCt denominado Fator de Tolerncia a

    Contradio, nesse caso no h contradies explcitas devido ao tipo de ambiente ser

    determinstico. Esse fator determina o limite de contradio suportado entre os dois

    sinais aplicados. O ftC denominado Fator de Tolerncia a Certeza e utilizado para

    controlar as aes da CNAP.

    No Apndice A encontram-se as descries dos algoritmos das Clulas Neurais

    Paraconsistentes e a estrutura da Rede Neural Paraconsistente juntamente com as

    Unidades e os Sistemas Neurais Paraconsistentes formadas.

    O primeiro bloco descrito como SNAPDeEv um Sistema Neural Artificial

    Paraconsistente de Descobertas de Evidncias que nesse caso recebe dois valores

    explcitos de entrada, sendo 1 o grau de crena dado pelos valores dos histricos

    meteorolgicos e 2 o grau de descrena. Esses valores de entrada sero confrontados a

    fim de encontrar as no similaridades dos padres desejados de acordo com os valores

    limites calculados em funo dos valores de tolerncias estabelecidos.

    Assim, a sada da RNAP um conjunto de registros que dispem de pouca similaridade

    entre si, esses so considerados como centros, que sero as bases para o mapeamento de

    todos os registros do histrico de 1980-1997.

    A cada ciclo sazonal predito necessrio, o deslocamento para a incluso desse

    trimestre para uma nova previso de outro ciclo sazonal e um melhor mapeamento da

    RBF, obviamente aps os dados reais serem apresentados ao ms de previso. Tambm

    possa ser necessrio um novo processamento da RNAP para um novo mapeamento de

    imediato ou a RBF para encontrar novos centros.

    Os valores de tolerncia so ajustados externamente RNAP e so estticos na

    abordagem deste trabalho, mas em outras situaes eles podem ser dinmicos.

    So apresentados os resultados com os diferentes valores de tolerncia. As redes neurais

    paraconsistente e a RBF, utilizadas nessa dissertao, requereram muito tempo de

    processamento em funo do tamanho da base de dados.

  • 64

  • 65

    6. RESULTADOS

    A Rede Neural Paraconsistente foi treinada para todos os trimestres. A apresentao dos

    resultados grficos foi limitada para efeito de comparao com os resultados do trabalho

    de Pessoa (2004).

    A previso foi realizada para dois perodos: para um ciclo sazonal, por exemplo, com os

    dados do trimestre MAM98 (Outono de 1998) foi feita a previso para o trimestre de

    JJA98 (Inverno de 1998); e para trs ciclos sazonais frente.

    Para a obteno dos resultados de previso necessrio estabelecer alguns parmetros

    bsicos que so utilizados no controle da CNAP:

    O Fator de Tolerncia Certeza ajustado com valor alto (prximo de 1). Nessa condio a CNAP tem alta tolerncia aos valores dos graus de crena resultantes

    e, portanto admite, como sada, valores de resultantes baixos. Caso contrrio

    admite sadas com valores resultantes altos e rejeita os valores baixos;

    O Fator de Tolerncia Contradio serve para impor um limite de contradio suportvel. Toda vez que o grau de contradio for maior que o limiar de ftCt a

    sada gerar um estado lgico Indefinido ou Inconsistente e o grau resultante

    indefinido. Um valor baixo para o limiar de ftCt no contexto desse trabalho

    ocasionou um maior nmero de reconhecimento por similaridade.

    Quanto maiores os fatores de tolerncias, mais vetores deixaram de ser identificados

    como similares, aumentando o nmero de agrupamentos (clusters) no similares. A

    Tabela 6.1 mostra trs situaes com limites para as tolerncias mencionadas,

    relacionando os respectivos totais de padres identificados pela Rede Neural

    Paraconsistente de acordo com os valores de tolerncias utilizados.

    Tabela 6.1 Relaciona a quantidade de padres identificados

    Tipo ftC ftCt ftR ftA A1 A2 A3 A4 A5 1 0.65 0.15 0,35 0,92 553 550 498 452 524 2 0.65 0.55 0,35 0,92 757 625 632 741 697 3 0.85 0.60 0,35 0,92 861 890 875 913 976

  • 66

    Na Tabela 6.1 a coluna Tipo identifica os conjuntos de tolerncias; ftC o Fator de

    Tolerncia Certeza; ftCt o Fator de Tolerncia Contradio; ftR o Fator de

    Reconhecimento de Padro; ftA o Fator de Tolerncia Aprendizagem; A1 a rea de

    estudo 1; A2 rea de estudo 2; A3 rea de estudo 3; A4 a rea de estudo 4; e A5

    a rea de estudo 5.

    Para a previso dos atributos de deciso foi utilizada uma rede RBF que recebe os dados

    de cada rea como entradas que so comparadas com os padres encontrados pela rede

    neural RNAP, em seguida gera uma sada de acordo com o treinamento realizado.

    Os resultados esto representados graficamente em imagens e tambm a comparao

    dos valores dos erros quadrticos mdios obtidos apresentada em tabelas, mostrando o

    desempenho do mtodo proposto em comparao com os resultados de Pessoa (2004).

    O desempenho do mtodo medido pelo clculo dos erros que seguem:

    O erro quadrtico mdio (EQM) dado por:

    =

    =Q

    kkk

    QEQM

    1

    2))(y)(t(1 (6.1)

    O erro absoluto mdio (EAM) dado por:

    =

    =Q

    kkk

    QEAM

    1)(y)(t1

    (6.2)

    , em que Q o nmero de padres de entrada, )(kt o k-simo vetor desejado e )(ky

    a k-sima sada da rede.

    No trabalho foram realizadas previses para a precipitao e para a temperatura para 1

    ciclo e 3 ciclos sazonais.

  • 67

    6.1 Previso de Precipitao

    As Tabelas 6.2 e 6.4 mostram resultados de previso de precipitao e foram adaptadas

    do trabalho de Pessoa (2004) para incluir os resultados encontrados neste trabalho. Elas

    possuem em comum o mesmo alcance de um ciclo sazonal adiante sob a situao de

    tolerncias do tipo 1 (Tabela 6.1). As colunas Rede1-Na, Rede2-Na e Rede3-Na

    representam os resultados obtidos por Pessoa (2004). Na coluna RNAP encontram-se os

    valores calculados com a tcnica que utiliza a Lgica Paraconsistente. Na Coluna

    Ganho ou Perda so apresentados os valores percentuais de comparao com os

    resultados de Pessoa (2004), dados por:

    GP = (RedeX_Na - RNAP)/RedeX_Na

    (6.3)

    , se GP > 0 ento a um ganho, caso contrrio h uma perda.

    Na ltima coluna encontram-se os valores dos erros absolutos mdios.

    Na Tabela 6.2 nota-se na coluna RNAP, para uma tolerncia do tipo 1, que o valor do

    erro foi superior somente para o tipo de Rede3-Na, para a rea 4, significando uma

    diferena percentual de 3 % a maior. Nessa tabela, os valores em destaque representam

    os menores valores encontrados no trabalho de Pessoa (2004) para efeito de

    comparao.

    Na Tabela 6.3, somente nas reas 4 e 5 a RNAP apresentou erros maiores. Nessa tabela

    se est considerando o processamento da RNAP com tolerncia tipo 2.

    Na Tabela 6.4, para a rea 5 houve uma diferena a maior de 31% em relao ao menor

    valor encontrado por Pessoa (2004), da sada produzida pela Rede3-Na. O valor

    produzido pela RNAP considerou a tolerncia tipo 3.

  • 68

    Tabela 6.2 Erros quadrticos mdios

    (Tolerncia tipo 1, Prec, =1) =1 Ganho/

    Perda Erro

    Mdio reas Rede1-Na Rede2-Na Rede3-Na RNAP (%) Absoluto

    1 1,37 1.42 1.39 1,37 0,00 0,54 2 1,70 1.78 1.90 1,37 19,00 0,59 3 1,18 1.62 1.46 1,17 1,00 0,50 4 1,22 1.20 1.17 1,20 -3,00 0,62 5 1,36 1.30 1.17 0,92 21,00 0,57

    Tabela 6.3 Erros quadrticos mdios

    (Tolerncia Tipo 2, Prec, =1) =1 Ganho/

    Perda Erro

    Mdio reas Rede1-Na Rede2-Na Rede3-Na RNAP (%) Absoluto

    1 1,37 1.42 1.39 1,18 14,00 0,52 2 1,70 1.78 1.90 0,77 55,00 0,50 3 1,18 1.62 1.46 0,89 25,00 0,46 4 1,22 1.20 1.17 1,21 -3,00 0,57 5 1,36 1.30 1.17 1,42 -21,00 0,62

    Tabela 6.4 Erros quadrticos mdios

    (Tolerncia tipo 3, Prec, =1) =1 Ganho/

    Perda Erro

    Mdio reas Rede1-Na Rede2-Na Rede3-Na RNAP (%) Absoluto

    1 1,37 1.42 1.39 1,31 4,00 0,55 2 1,70 1.78 1.90 1,66 2,00 0,60 3 1,18 1.62 1.46 0,93 21,00 0,48 4 1,22 1.20 1.17 1,15 2,00 0,62 5 1,36 1.30 1.17 1,53 -31,00 0,58

    As Tabelas 6.5 a 6.7, tambm adaptadas do trabalho de Pessoa (2004), relacionam os

    erros quadrticos mdios encontrados para a previso de trs ciclos sazonais adiante.

    Observa-se que na Tabela 6.5 observa-se que o mtodo proposto nesta dissertao

    produziu resultados superiores aos encontrados em Pessoa (2004) em todas as regies

    relacionadas considerando uma tolerncia do tipo 1.

    Na Tabela 6.6, para a tolerncia tipo 2, observa-se que na rea 5 a RNAP produziu

    sadas com erro superior aos encontrados por Pessoa (2004). J nas demais reas houve

  • 69

    uma diferena significativa, como pode ser visto pelos valores de erros menores

    produzidos pela RNAP.

    Na Tabela 6.7, para a tolerncia do tipo 3, nota-se que a RNAP apresentou valores de

    erros superiores queles encontrados por Pessoa (2004) em 4 das reas analisadas.

    Tabela 6.5 Erros quadrticos mdios

    (Tolerncia tipo 1, Prec, =3) =3 Ganho/

    Perda Erro

    Mdio reas Rede1-Na Rede2-Na Rede3-Na RNAP (%) Absoluto

    1 1,46 1,36 1,33 1,10 17,00 0,43 2 2,00 1,86 2,01 0,72 61,00 0,47 3 1,09 1,27 1,01 0,94 7,00 0,40 4 1,25 1,23 1,24 0,96 22,00 0,50 5 1,11 1,04 1,09 0,74 29,00 0,46

    Tabela 6.6 Erros quadrticos mdios

    (Tolerncia tipo 2, Prec, =3) =3 Ganho/

    Perda Erro

    Mdio reas Rede1-Na Rede2-Na Rede3-Na RNAP (%) Absoluto

    1 1,46 1,36 1,33 0,95 29,00 0,41 2 2,00 1,86 2,01 0,70 62,00 0,45 3 1,09 1,27 1,01 0,71 30,00 0,37 4 1,25 1,23 1,24 1,00 19,00 0,50 5 1,11 1,04 1,09 1,18 -13,00 0,44

    Tabela 6.7 Erros quadrticos mdios

    (Tolerncia tipo 3, Prec, =3) =3 Ganho/

    Perda Erro

    Mdio reas Rede1-Na Rede2-Na Rede3-Na RNAP (%) Absoluto

    1 1,46 1,36 1,33 1,55 -17,00 0,48 2 2,00 1,86 2,01 1,94 -4,00 0,57 3 1,09 1,27 1,01 1,02 -1,00 0,48 4 1,25 1,23 1,24 1,02 17,00 0,66 5 1,11 1,04 1,09 1,70 -63,00 0,59

  • 70

    As figuras que se seguem apresentam as previses de precipitao, associados com a

    identificao de seus respectivos tipos de tolerncias.

    Na Figura 6.2 dada pelos valores tipo de tolerncias 1, 2, 3, a RNAP apresenta uma

    normalidade em suas distribuies de precipitao quando comparada Figura 6.1, que

    possui os dados reais. Os padres apresentados abaixo representam a mdia dos valores

    das precipitaes ocorridas na rea 3 nos meses de DJF98/99 para previso de um ciclo

    sazonal adiante.

    Na Figura 6.4 os padres estimados esto muito prximos do real apresentado na Figura

    6.3. A figura apresenta as mdias dos valores das precipitaes ocorridas na rea 1 nos

    meses de JJA98 para previso de um ciclo sazonal adiante.

    Nota-se uma superestimao dos valores na precipitao no intervalo de [10, 12]

    mm/dia nos padres apresentados utilizando as tolerncias 2, 3. Para essa previso,

    utilizando todas as tolerncias apresenta uma normalidade em suas distribuies quando

    comparada Figura 6.3, que possui os dados reais.

    Imagens da rea 3 DJF9


Top Related