relatório parcial 2 daniel

Upload: daniel-de-souza

Post on 03-Mar-2016

214 views

Category:

Documents


0 download

DESCRIPTION

hihihi

TRANSCRIPT

  • 1 OBJETIVOS1.1 OBJETIVOS GERAIS DA PESQUISA

    Facilitar e permitir o mapeamento da proliferao da dengue na cidade do Gama em

    tempo real, sem a necessidade da ida constante de agentes in loco;

    Desenvolver recursos no mapserver que permita tal feito atravs da utilizao de

    Redes Neurais Artificiais;

    Desenvolver uma pgina de publicao de tais dados.

    Atravs dos tpicos acima desenvolvidos, ser possvel fazer a construo da

    topologia de uma rede neural artificial que permita o recebimento de dados formatados

    conforme a Lgica Fuzzy pertinentes pesquisa, de maneira que a mesma possa fazer o

    pr-processamento dos dados essas etapas se referem aprendizagem da rede para

    que se possa inserir esses dados processados dentro do sistema de informao

    georreferenciada, para que se possa mapear os pontos crticos da cidade, de forma a

    facilitar tomadas de decises essa facilitao se dar atravs da publicao em tempo real

    desses dados.

    1.2 OBJETIVOS ESPECFICOS DA PESQUISA

    Desenvolvimento de uma topologia especfica de RNA, que permita ser treinada

    para fazer o mapeamento do mapa do Gama, especificamente;

    Construo do mapa com os dados j processados. Aps sua construo,

    esperado algo semelhante imagem a seguir:

    Sugesto de tomadas de decises, especficas para cada rea.

    Alcanar os objetivos supracitados permitir o estudo avanado do caso de

    proliferao da dengue no Gama, alm de permitir o extravasamento da pesquisa para

    outras regies. Trabalhar com uma topologia especfica para cada regio permitir a

    Figura 1 Imagem de um mapa classificado por uma RNA, obtido da dissertao de doutorado REDES NEURAIS ARTIFICIAIS APLICADAS NA IDENTIFICAO AUTOMTICA DE REAS CAFEEIRAS EM IMAGENS DE SATLITE, de Lvia Naiara Andrade.

  • obteno de resultados precisos, o que d mais credibilidade ferramenta quando os

    resultados forem divulgados. Alm disso, ser necessria uma pesquisa in loco ou a

    obteno dos resultados de alguma que j tenha sido realizada para que se possa fazer a

    comparao dos resultados.

    2 - ETAPAS DO DESENVOLVIMENTO DA PESQUISA2.1 DEFINIO DAS REAS DE ESTUDOS

    O primeiro fator relevante para a pesquisa a definio de reas de estudo, j que

    atravs desta definio que as variveis a serem consideradas para o aprendizado da RNA

    se tornaro de fato relevantes. Os primeiros dados devem ser coletados em uma

    determinada regio, de forma que seja possvel fazer o mapeamento de toda a regio

    atravs da coleta de dados de uma pequena frao desta. Sendo assim, as variveis

    consideradas, a princpio, relevantes so:

    Densidade demogrfica;

    Milimetragem de chuva nas ltimas duas semanas;

    Porcentagem de regies agrcolas (Determinamos essa porcentagem dividindo a

    rea agrcola pela soma da rea agrcola com a rea urbana);

    Porcentagem de rea urbana;

    temperatura mdia nos ltimos 15 dias;

    Umidade relativa.

    Novas variveis podem acabar aparecendo, ou algumas das supracitadas podem se

    fragmentar em duas. Todos os dados acima podem ser adquiridos atravs de dados oficiais

    de rgos do governo, facilitando assim o estudo. Ouras variveis de entrada sero a

    latitude e a longitude (e talvez a altitude tambm).

    As principais reas de estudo sero setores do Gama (Gama Norte, Sul, Leste e

    Oeste), dessa forma os dados coletados sero dessas regies.

    2.2 DEFINIO DAS IMAGENS DE SATLITE UTILIZADASSo vrias as possibilidades de se conseguir imagens de satlite, sendo uma

    possvel primeira tentativa os mapas fornecidos pelos satlites da Google. Mas existem

    outras possveis fontes (Como por exemplo, possveis imagens da NASA, ou do Instituto

    Nacional de Pesquisas Espaciais INPE). No entanto, a nitidez e a qualidade da imagem,

    para o presente trabalho, no de extrema importncia j que o objetivo apenas ilustrar

    com cores as regies de maior e menor densidade de casos por rea de forma que pouco

    importa os detalhes que so perdidos devido qualidade da foto.

    Alm disso, outro fato que leva escolha das imagens dos satlites da Google o

    fato quase todas as plataformas de Sistema de Informao Geogrfica terem sincronizao

    direta com os mapas da referida empresa.

  • Imagens como a imagem acima sero editadas, para que mostrem regies de mais

    ou menos incidncia de casos da Dengue, e outras informaes adicionais que por ventura

    acabaro sendo necessrias.

    2.3 DEFINIO DAS FERRAMENTAS COMPUTACIONAIS UTILIZADASA seguir, so listados as ferramentas de apoio para que se alcance os objetivos

    almejados, ressaltando a possvel necessidade do acrscimo de alguns. No entanto, um dos

    maiores objetivos do presente trabalho a utilizao de softwares livres, de forma que o

    custo se reduza o mximo possvel.

    2.2.1 MapServerMapServer um software livre que serve como ambiente de desenvolvimento para

    construo de aplicativos espaciais na internet. MapServer no um SIG completo, e no

    deseja ser. Ao invs disso, MapServer se sobressai na apresentao de dados espaciais

    (mapas, imagens e dados vetoriais) na web. [2]

    Alm de permitir visualizar dados de SIGs, MapServer permite que voc crie imagens

    de mapas geogrficos, mapas que podem direcionar usurios a outros contedos.

    MapServer foi originalmente desenvolvido pelo projeto ForNet da Universidade de

    Minnesota (UMN) em cooperao com a NASA e o Departamento de Recursos Naturais de

    Minnesota (MNDNR). Atualmente o projeto MapServer abrigado pelo projeto TerraSip, um

    projeto patrocinado conjuntamente pela NASA, UMN e um consrcio de interesses de

    gerenciamento da terra.

    O software mantido por um nmero crescente de desenvolvedores (cerca de 20) de

    vrios lugares do mundo, e patrocinado por um grupo de organizaes que custeia

    Figura 2 Mapa do Setor Gama obtido pelo Google Earth.

  • melhorias e a manuteno.

    2.2.2 TerrSet Desenvolvido em colaborao com as principais instituies voltadas para o

    desenvolvimento sustentvel e de conservao ambiental, O TerrSet fornece ferramentas

    inovadoras para a anlise e monitoramento da dinmica de eventos terrestres.

    TerrSet = Espao + Tempo = Um Sistema

    As ferramentas de anlise GIS do Idrisi (IDRISI GIS Analysis); os algortmos deprocessamento de imagens (IDRISI Image Processing); os j conhecidos mdulos LCM(Land Change Modeler) e o ETM (Earth Trends Modeler). Alm disso, o TerrSET amplia asopes de trabalho a partir de aplicativos verticais com os seguintes novos mdulos:

    - GeOSIRIS: mdulo especfico para estudos de reduo de emisses por desmatamento edegradao de florestas (REDD);

    - CCAM: apresenta aplicao voltada para estudos de variaes climticas.

    - ESM: mdulo destinado ao estudo e monitoramento de ecosistemas.

    - HBM: fornece ferramentas para avaliao de habitat, anlise de padres de paisagem emodelagem da biodiversidade.

    2.4 DEFINIO DOS PROCEDIMENTOS METODOLGICOS2.4.1 Pr-processamento dos dados

    Para a realizao da classificao, os dados de sensoriamento remoto sero

    submetidos aos pr-processamentos necessrios para que a RNA seja capaz de reconhecer

    as mesmas classes nas imagens multiespectrais.

    Figura 3 Imagens do software utilizando um simulador de RNA

  • 2.4.2 Classificao das imagens pela RNA2.4.2.1 Uma Viso Geral das Redes Neurais Artificiais

    Redes Neurais Artificiais (RNAs) so processadores massivamente distribudos em

    paralelo que possuem uma propenso natural para armazenar conhecimento adquirido

    experimentalmente e torn-lo disponvel para uso, Haykin (1994). As RNAs podem prover

    solues adequadas para problemas geralmente caracterizados por alta no-linearidade,

    alta dimensionalidade, complexos, imperfeitos, imprecisos, sujeitos a erros de medio, e

    para os quais, falta uma soluo matemtica ou algoritmo claramente afirmados. Um

    benefcio evidente do uso de RNAs que um modelo para o sistema pode ser construdo

    apenas a partir de dados.

    As RNAs so comumente utilizadas para classificao de dados e reconhecimento

    de padres, obtendo considervel desempenho, Bishop (1995). Foram criadas com

    inspirao no funcionamento do crebro humano e buscam imitar as suas principais

    caractersticas. O crebro humano capaz de processar informaes mais rpido que

    qualquer outro processador conhecido, constitudo de aproximadamente 10 bilhes de

    neurnios (clulas nervosas) responsveis pela transmisso de informaes relacionadas a

    todas as funes e movimentos do organismo. A comunicao entre os neurnios feita

    atravs de sinapses que transmitem estmulos atravs de diferentes concentraes de scio

    e potssio. Os neurnios juntos formam uma enorme rede chamada rede neural que

    proporciona uma fabulosa capacidade de processamento e armazenamento de informaes.

    De maneira semelhante ao crebro humano, as RNAs so formadas por pequenas

    unidades de processamento (aqui chamadas de neurnios artificiais) interconectadas por

    sinapses e so capazes de processar informaes paralelamente e, com isso, aprender

    muitas coisas como reconhecer padres em grandes conjuntos de dados complexos e

    multidimensionais. As aplicaes para redes neurais so diversas e se estendem por

    diferentes campos do conhecimento como modelagem, anlise de sries temporais,

    reconhecimento de padres, processamento de sinais, e controles. Esse potencial de ser

    usada em diferentes aplicaes se d devido capacidade de aprender a partir de dados de

    entrada com ou sem superviso, ou seja, conhecendo-se ou no os resultados esperados.

    Existem diferentes arquiteturas para as RNAs, talvez a mais comum envolva a

    utilizao de Redes de Mltiplas Camadas. Ao fazer uso de RNAs h dois parmetros

    iniciais que devem ser determinados: o nmero de camadas e o nmero de neurnios em

    cada camada. O aumento do nmero de camadas, em geral, melhora o desempenho da

    rede aumentando sua capacidade de aprendizagem, mas exige maior capacidade de

    processamento. Na prtica, no comum o uso de muitas camadas escondidas. Parte disso

    ocorre em funo do teorema de Kolmogorov (Hecht e Nielsen, 1991) o qual afirma que uma

  • nica camada escondida suficiente para calcular uma funo arbitrria qualquer a partir

    dos dados fornecidos.

    2.4.2.1 Implementao da rede para classificao de dadosPara cada pixel de cada uma das imagens selecionadas para o treinamento sero

    processadas as informaes de sua vizinhana e delas extradas os padres de entrada

    para a rede neural. Estes padres sero definidos conforme as variveis escolhidas para a

    avaliao dos padres de distribuio do vrus

    Uma vez definidas as variveis que sero inseridas para definir a distribuio da

    doena, a mdia e o desvio padro so calculados somente para os pixels da vizinhana

    que possuem valor de refletividade, com exceo do pixel a ser classificado. A mudana de

    SPIN, ou simplesmente SPIN a porcentagem de pixels, que possuem valores derefletividade, cuja diferena (em valor absoluto) em relao ao valor do pixel adjacente

    direita excede 2 dBZ. No trabalho de Lakshmanan (2007), o SPIN computado a partir dos

    dados em coordenadas polares.

    Quanto topologia das RNAs, pretende-se utilizar uma rede neural de trs camadas,

    com cinco ns (neurnios) na camada de entrada, dez ns na camada escondida, e um n

    na camada de sada. Esses valores foram escolhidos pelo fato de a imensa maioria dostrabalhos de processamento de imagens para SIG usarem essa topologia. Para cadapesquisa parmetros mais significativos para o caso em questo foram utilizados. A figura a

    seguir mostra o esquema da Rede Neural com mltiplas camadas do tipo feedforward

    proposta neste trabalho.