relatório parcial 2 daniel
DESCRIPTION
hihihiTRANSCRIPT
-
1 OBJETIVOS1.1 OBJETIVOS GERAIS DA PESQUISA
Facilitar e permitir o mapeamento da proliferao da dengue na cidade do Gama em
tempo real, sem a necessidade da ida constante de agentes in loco;
Desenvolver recursos no mapserver que permita tal feito atravs da utilizao de
Redes Neurais Artificiais;
Desenvolver uma pgina de publicao de tais dados.
Atravs dos tpicos acima desenvolvidos, ser possvel fazer a construo da
topologia de uma rede neural artificial que permita o recebimento de dados formatados
conforme a Lgica Fuzzy pertinentes pesquisa, de maneira que a mesma possa fazer o
pr-processamento dos dados essas etapas se referem aprendizagem da rede para
que se possa inserir esses dados processados dentro do sistema de informao
georreferenciada, para que se possa mapear os pontos crticos da cidade, de forma a
facilitar tomadas de decises essa facilitao se dar atravs da publicao em tempo real
desses dados.
1.2 OBJETIVOS ESPECFICOS DA PESQUISA
Desenvolvimento de uma topologia especfica de RNA, que permita ser treinada
para fazer o mapeamento do mapa do Gama, especificamente;
Construo do mapa com os dados j processados. Aps sua construo,
esperado algo semelhante imagem a seguir:
Sugesto de tomadas de decises, especficas para cada rea.
Alcanar os objetivos supracitados permitir o estudo avanado do caso de
proliferao da dengue no Gama, alm de permitir o extravasamento da pesquisa para
outras regies. Trabalhar com uma topologia especfica para cada regio permitir a
Figura 1 Imagem de um mapa classificado por uma RNA, obtido da dissertao de doutorado REDES NEURAIS ARTIFICIAIS APLICADAS NA IDENTIFICAO AUTOMTICA DE REAS CAFEEIRAS EM IMAGENS DE SATLITE, de Lvia Naiara Andrade.
-
obteno de resultados precisos, o que d mais credibilidade ferramenta quando os
resultados forem divulgados. Alm disso, ser necessria uma pesquisa in loco ou a
obteno dos resultados de alguma que j tenha sido realizada para que se possa fazer a
comparao dos resultados.
2 - ETAPAS DO DESENVOLVIMENTO DA PESQUISA2.1 DEFINIO DAS REAS DE ESTUDOS
O primeiro fator relevante para a pesquisa a definio de reas de estudo, j que
atravs desta definio que as variveis a serem consideradas para o aprendizado da RNA
se tornaro de fato relevantes. Os primeiros dados devem ser coletados em uma
determinada regio, de forma que seja possvel fazer o mapeamento de toda a regio
atravs da coleta de dados de uma pequena frao desta. Sendo assim, as variveis
consideradas, a princpio, relevantes so:
Densidade demogrfica;
Milimetragem de chuva nas ltimas duas semanas;
Porcentagem de regies agrcolas (Determinamos essa porcentagem dividindo a
rea agrcola pela soma da rea agrcola com a rea urbana);
Porcentagem de rea urbana;
temperatura mdia nos ltimos 15 dias;
Umidade relativa.
Novas variveis podem acabar aparecendo, ou algumas das supracitadas podem se
fragmentar em duas. Todos os dados acima podem ser adquiridos atravs de dados oficiais
de rgos do governo, facilitando assim o estudo. Ouras variveis de entrada sero a
latitude e a longitude (e talvez a altitude tambm).
As principais reas de estudo sero setores do Gama (Gama Norte, Sul, Leste e
Oeste), dessa forma os dados coletados sero dessas regies.
2.2 DEFINIO DAS IMAGENS DE SATLITE UTILIZADASSo vrias as possibilidades de se conseguir imagens de satlite, sendo uma
possvel primeira tentativa os mapas fornecidos pelos satlites da Google. Mas existem
outras possveis fontes (Como por exemplo, possveis imagens da NASA, ou do Instituto
Nacional de Pesquisas Espaciais INPE). No entanto, a nitidez e a qualidade da imagem,
para o presente trabalho, no de extrema importncia j que o objetivo apenas ilustrar
com cores as regies de maior e menor densidade de casos por rea de forma que pouco
importa os detalhes que so perdidos devido qualidade da foto.
Alm disso, outro fato que leva escolha das imagens dos satlites da Google o
fato quase todas as plataformas de Sistema de Informao Geogrfica terem sincronizao
direta com os mapas da referida empresa.
-
Imagens como a imagem acima sero editadas, para que mostrem regies de mais
ou menos incidncia de casos da Dengue, e outras informaes adicionais que por ventura
acabaro sendo necessrias.
2.3 DEFINIO DAS FERRAMENTAS COMPUTACIONAIS UTILIZADASA seguir, so listados as ferramentas de apoio para que se alcance os objetivos
almejados, ressaltando a possvel necessidade do acrscimo de alguns. No entanto, um dos
maiores objetivos do presente trabalho a utilizao de softwares livres, de forma que o
custo se reduza o mximo possvel.
2.2.1 MapServerMapServer um software livre que serve como ambiente de desenvolvimento para
construo de aplicativos espaciais na internet. MapServer no um SIG completo, e no
deseja ser. Ao invs disso, MapServer se sobressai na apresentao de dados espaciais
(mapas, imagens e dados vetoriais) na web. [2]
Alm de permitir visualizar dados de SIGs, MapServer permite que voc crie imagens
de mapas geogrficos, mapas que podem direcionar usurios a outros contedos.
MapServer foi originalmente desenvolvido pelo projeto ForNet da Universidade de
Minnesota (UMN) em cooperao com a NASA e o Departamento de Recursos Naturais de
Minnesota (MNDNR). Atualmente o projeto MapServer abrigado pelo projeto TerraSip, um
projeto patrocinado conjuntamente pela NASA, UMN e um consrcio de interesses de
gerenciamento da terra.
O software mantido por um nmero crescente de desenvolvedores (cerca de 20) de
vrios lugares do mundo, e patrocinado por um grupo de organizaes que custeia
Figura 2 Mapa do Setor Gama obtido pelo Google Earth.
-
melhorias e a manuteno.
2.2.2 TerrSet Desenvolvido em colaborao com as principais instituies voltadas para o
desenvolvimento sustentvel e de conservao ambiental, O TerrSet fornece ferramentas
inovadoras para a anlise e monitoramento da dinmica de eventos terrestres.
TerrSet = Espao + Tempo = Um Sistema
As ferramentas de anlise GIS do Idrisi (IDRISI GIS Analysis); os algortmos deprocessamento de imagens (IDRISI Image Processing); os j conhecidos mdulos LCM(Land Change Modeler) e o ETM (Earth Trends Modeler). Alm disso, o TerrSET amplia asopes de trabalho a partir de aplicativos verticais com os seguintes novos mdulos:
- GeOSIRIS: mdulo especfico para estudos de reduo de emisses por desmatamento edegradao de florestas (REDD);
- CCAM: apresenta aplicao voltada para estudos de variaes climticas.
- ESM: mdulo destinado ao estudo e monitoramento de ecosistemas.
- HBM: fornece ferramentas para avaliao de habitat, anlise de padres de paisagem emodelagem da biodiversidade.
2.4 DEFINIO DOS PROCEDIMENTOS METODOLGICOS2.4.1 Pr-processamento dos dados
Para a realizao da classificao, os dados de sensoriamento remoto sero
submetidos aos pr-processamentos necessrios para que a RNA seja capaz de reconhecer
as mesmas classes nas imagens multiespectrais.
Figura 3 Imagens do software utilizando um simulador de RNA
-
2.4.2 Classificao das imagens pela RNA2.4.2.1 Uma Viso Geral das Redes Neurais Artificiais
Redes Neurais Artificiais (RNAs) so processadores massivamente distribudos em
paralelo que possuem uma propenso natural para armazenar conhecimento adquirido
experimentalmente e torn-lo disponvel para uso, Haykin (1994). As RNAs podem prover
solues adequadas para problemas geralmente caracterizados por alta no-linearidade,
alta dimensionalidade, complexos, imperfeitos, imprecisos, sujeitos a erros de medio, e
para os quais, falta uma soluo matemtica ou algoritmo claramente afirmados. Um
benefcio evidente do uso de RNAs que um modelo para o sistema pode ser construdo
apenas a partir de dados.
As RNAs so comumente utilizadas para classificao de dados e reconhecimento
de padres, obtendo considervel desempenho, Bishop (1995). Foram criadas com
inspirao no funcionamento do crebro humano e buscam imitar as suas principais
caractersticas. O crebro humano capaz de processar informaes mais rpido que
qualquer outro processador conhecido, constitudo de aproximadamente 10 bilhes de
neurnios (clulas nervosas) responsveis pela transmisso de informaes relacionadas a
todas as funes e movimentos do organismo. A comunicao entre os neurnios feita
atravs de sinapses que transmitem estmulos atravs de diferentes concentraes de scio
e potssio. Os neurnios juntos formam uma enorme rede chamada rede neural que
proporciona uma fabulosa capacidade de processamento e armazenamento de informaes.
De maneira semelhante ao crebro humano, as RNAs so formadas por pequenas
unidades de processamento (aqui chamadas de neurnios artificiais) interconectadas por
sinapses e so capazes de processar informaes paralelamente e, com isso, aprender
muitas coisas como reconhecer padres em grandes conjuntos de dados complexos e
multidimensionais. As aplicaes para redes neurais so diversas e se estendem por
diferentes campos do conhecimento como modelagem, anlise de sries temporais,
reconhecimento de padres, processamento de sinais, e controles. Esse potencial de ser
usada em diferentes aplicaes se d devido capacidade de aprender a partir de dados de
entrada com ou sem superviso, ou seja, conhecendo-se ou no os resultados esperados.
Existem diferentes arquiteturas para as RNAs, talvez a mais comum envolva a
utilizao de Redes de Mltiplas Camadas. Ao fazer uso de RNAs h dois parmetros
iniciais que devem ser determinados: o nmero de camadas e o nmero de neurnios em
cada camada. O aumento do nmero de camadas, em geral, melhora o desempenho da
rede aumentando sua capacidade de aprendizagem, mas exige maior capacidade de
processamento. Na prtica, no comum o uso de muitas camadas escondidas. Parte disso
ocorre em funo do teorema de Kolmogorov (Hecht e Nielsen, 1991) o qual afirma que uma
-
nica camada escondida suficiente para calcular uma funo arbitrria qualquer a partir
dos dados fornecidos.
2.4.2.1 Implementao da rede para classificao de dadosPara cada pixel de cada uma das imagens selecionadas para o treinamento sero
processadas as informaes de sua vizinhana e delas extradas os padres de entrada
para a rede neural. Estes padres sero definidos conforme as variveis escolhidas para a
avaliao dos padres de distribuio do vrus
Uma vez definidas as variveis que sero inseridas para definir a distribuio da
doena, a mdia e o desvio padro so calculados somente para os pixels da vizinhana
que possuem valor de refletividade, com exceo do pixel a ser classificado. A mudana de
SPIN, ou simplesmente SPIN a porcentagem de pixels, que possuem valores derefletividade, cuja diferena (em valor absoluto) em relao ao valor do pixel adjacente
direita excede 2 dBZ. No trabalho de Lakshmanan (2007), o SPIN computado a partir dos
dados em coordenadas polares.
Quanto topologia das RNAs, pretende-se utilizar uma rede neural de trs camadas,
com cinco ns (neurnios) na camada de entrada, dez ns na camada escondida, e um n
na camada de sada. Esses valores foram escolhidos pelo fato de a imensa maioria dostrabalhos de processamento de imagens para SIG usarem essa topologia. Para cadapesquisa parmetros mais significativos para o caso em questo foram utilizados. A figura a
seguir mostra o esquema da Rede Neural com mltiplas camadas do tipo feedforward
proposta neste trabalho.