relatório parcial de atividades de bolsa de iniciação científica - projeto spider

7
Relat´ orio Parcial de Atividades de Bolsa de Inicia¸c˜ ao Cient´ ıfica Instituto de Inform´ atica Universidade Federal do Rio Grande do Sul Levindo Neto

Upload: levindo-gabriel-taschetto-neto

Post on 12-Apr-2017

114 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: Relatório Parcial de Atividades de Bolsa de Iniciação Científica - Projeto SPIDER

Relatorio Parcial de Atividades de Bolsa de Iniciacao Cientıfica

Instituto de Informatica

Universidade Federal do Rio Grande do Sul

Levindo Neto

Page 2: Relatório Parcial de Atividades de Bolsa de Iniciação Científica - Projeto SPIDER

Dados de Identificacao

Projeto

Tıtulo do Projeto Statistical Physics in Diverse Realizations:Networks and Text Analysis

Vigencia da Bolsa 01/08/2014 a 31/07/2015Orientador Silvio Renato Dahmen

Bolsista

Nome Levindo Gabriel Taschetto NetoBachalerado em Engenharia de ComputacaoInstituto de InformaticaUniversidade Federal do Rio Grande do Sul

CPF 019.690.790-02E-mail [email protected]

Perıodo de Atuacao 01/08/2014 a 31/07/2015Local de Realizacao Instituto de Informatica - UFRGS

1

Page 3: Relatório Parcial de Atividades de Bolsa de Iniciação Científica - Projeto SPIDER

1

1.1 Introducao

Esse relatorio descreve as atividades realizadas durante o perıodo de vigencia da bolsa de iniciacaocientıfica, a qual e de 01/08/2014 a 31/07/2015. Esse documento contem descritas todas as ativi-dades ate o momento.

No projeto estao sendo desenvolvidos alguns trabalhos que envolvem a ligacao entre a fısicaestatıstica e a computacao por meio de sistemas multiagentes.

O projeto SPIDER (Statistical Physics in Diverse Realizations: Networks and Text Analysis)tem por pilares principais a fısica estatıstica juntamente com a computacao.

Os objetivos dos trabalhos realizados sao mostrar a centralidade das linhas de metro do estadode Sao Paulo e mostrar como a geolocalizacao de determinada regiao influi nos tipos e na quantidadede escolas do estado do Rio de Janeiro.

Nesse projeto sao usadas ferramentas de plotagem de mapas e duas linguagens de programacao(Python e R) para algumas partes especıficas, alguns pacotes para R [4] tambem foram utilizados,como o OSM e Java7, alem de artigos cientıficos, como os do autor Antiqueira [2]. Alguns resultadosja foram obtidos, como a plotagem das linhas de metro de Sao Paulo, utilizando Python-Igraph, eoutros ainda estao sendo obtidos, caso da plotagem das escolas da cidade do Rio de Janeiro.

1.2 Redes Complexas

No comeco do perıodo da bolsa foi desenvolvido pesquisa na area de redes complexas.O inıcio das pesquisas em Redes Complexas foi em 1930, nas quais eram baseadas na centralidade

(o vertice mais central) e a conectividade (vertices com maior numero de conexoes), aquela epocaainda eram utilizados indivıduos nas redes, para ver qual tinha mais influencia por exemplo.

Atualmente ja sabe-se que a topologia e a evolucao das redes no mundo real apresentam pro-priedades organizacionais bastante robustas e distintas das redes aleatorias. Simplificadamente,podemos dizer que as redes complexas nao seguem um padrao regular.

Uma rede e um grafo, onde cada aresta tem uma direcao ou sentido que conecta um verticede origem ate um vertice de destino. Nem todo grafo pode ser considerado uma rede complexa.[3]Uma propriedade importante de redes complexas e o coeficiente de aglomeracao, tambem conhecidocomo fenomeno de transitividade, o qual representa de forma analoga um triangulo, no qual tresvertices estao ligados entre si.

Nessa parte da pesquisa, fatos importantes foram notados, entre eles o ”clustering”, o qual euma tecnica de “Data Mining” para fazer agrupamentos automaticos de dados segundo seu grau desemelhanca, o ”betweenness centrality”, conforme a Equacao 1.1, que e uma medida (baseada emum caminho mınimo) utilizada para identificar arestas que conectam comunidades, apresentandovalores altos para essas arestas e penalizando as arestas que conectam vertices de um mesmo sub-grafo, roteadores, na parte de trafego de pacotes, que sao responsaveis por encontrar o melhorcaminho entre os ”hosts” remetente e destinatario e encaminhar os pacotes por este caminho aolongo do tempo, alem do controle de congestionamento de pacotes, o qual e a quantidade de pacotes

2

Page 4: Relatório Parcial de Atividades de Bolsa de Iniciação Científica - Projeto SPIDER

entregues por um vertice em uma iteracao.

g(v) =∑s 6=v 6=t

σst(v)

σst(1.1)

1.3 Redes de metro

Nesse trabalho foi feita a plotagem de redes de metro do estado de Sao Paulo levando em conta aslinhas de metro e o peso do trafego nas mesmas para mostrar a centralidade das estacoes, ou seja,dos nodos das linhas do metro do estado de Sao Paulo.

O trabalho foi realizado com o auxılio de Python-Igraph (http://igraph.org/python)[1] e domapa com as linhas de metro de SP (http://www.metro.sp.gov.br/pdf/mapa-da-rede-metro.pdf)que foi encontrado no site do metro do estado.

O movimento das pessoas e das mercadorias e o reflexo das diferentes atividades que existemnuma sociedade, sendo algo determinante para a qualidade de vida das pessoas.

Por isso nessa parte do projeto SPIDER foi feito uma analise do peso do trafego dos metrosdo estado de Sao Paulo, para as pessoas terem uma visao melhor de onde esta circulando maispassageiros e poderem escolher um melhor caminho, aplicando o conceito de ”betweenness”.

1.4 Plotagem de escolas do Rio de Janeiro

Esse trabalho visa mostrar como a geolocalizacao de determinado local influi no numero de escolasparticulares e publicas de determinada regiao.

Para mostrar isso utiliza-se de plotagem de pontos (escolas em cores diferentes, com uma corpara cada tipo de escola). Sao utlizados para a plotagem escolas do tipo municipal, estadual, federale particular.

Abaixo segue uma lista de passos utilizados para a plotagem das escolas, utilizando a plataformaMy Maps do Google (https://www.google.com/mymaps).

1. Fonte de dados:a)Particulares: http://portal.educacao.rj.gov.br/escolaparticular/Pesquisa.aspb)Demais Escolas: http://www.qedu.org.br/busca (Foi usado no comeco da busca de escolas)

2. Com o site a) obtem-se as escolas particulares com seus respectivos enderecos e com o site b)obtem-se o nome da escola, tipo(municipal, estadual, federal ou particular, colocando o filtroque aparece no canto superior direito apos escolher a cidade a ser encontrada) e localizacao;

3. Com o passo 1, deve-se acessar o Google Maps(https://maps.google.com) e na aba de pesquisarcolocar o nome da escola no formato:TipoDaEscola NomeDaEscola BairroDaEscola e pressionar a tecla Enter;

4. Assim que achar achar a escola(ıcone de pingo vermelho invertido no mapa), clicar com obotao direito do mouse sobre esse ıcone vermelho;

5. Clicar na 3a opcao(What’s here);

6. Aparecera no canto superior esquerdo do mapa dois numeros(coordenadas) abaixo do enderecoda escola;

7. O primeiro numero e a Latitude e o segundo numero e a Longitude;

8. Esses numeros, para melhor organizacao, devem ser salvos em um arquivo .CSV no qualas informacoes ficam no formato abaixo(Salvar em arquivos .CSV’s separados por o tipo daescola): NomeDaEscola, ”noLatitude”, ”noLongitude”;

3

Page 5: Relatório Parcial de Atividades de Bolsa de Iniciação Científica - Projeto SPIDER

9. Depois de ter os dados necessarios, deve-se acessar a plataforma My Maps do Google(https://www.google.com/mymaps), onde pode-se fazer a importacao dos dados via arquivoformatado do tipo .CSV;

10. Assim que aberto o site, clicar na opcao ”Criar um novo mapa”;

11. Na parte superior esquerda clicar em ”Importar”, abaixo de ”Camada sem tıtulo”;

12. Clicar em ”Selecionar um arquivo do computador”(caso o arquivo esteja na maquina que estautilizando no momento) ou pode se pegar o arquivo do Google Drive na conta do Google queesta conectada no momento da utilizacao da plataforma;

13. Quando o arquivo estiver carregado, aparecera na tela a caixa com tıtulo ”Escolher colunaspara posicionar marcadores”;

14. Clicar na caixinha do primeiro numero, abaixo do nome da escola que aparece alı(que e aprimeira do .CSV) que esta no arquivo .CSV;

15. Selecionar ”Latitude” e clicar no segundo numero;;

16. Selecionar ”Longitude” e clicar em ”Continuar”;

17. Selecionar o nome da escola que aparece primeiro dentre as tres opcoes e depois concluir;

18. Na tela foram plotados os pontos correspondentes as coordenadas do arquivo .CSV importado;

19. Para melhor visualizacao pode alterar o tipo de mapa e ıcone, para alterar ıcone basta passaro mouse por cima de ”Todos os itens”(abaixo de ”Estilo uniforme) que aparecera um ıconede balde de tinta, ao clicar nele, aparecera varias opcoes de alteracao de ıcone do mapa. Paraalterar o tipo do mapa, basta clicar no triangulo invertido que esta a esquerda de ”Mapabasico” e escolher o tipo de mapa desejado;

20. Para separar os tipos de escolas deve-se ir adicionando camadas, clicando em ”Adicionarcamada”, que fica a esquerda de ”Compartilhar” e voltar no passo X ate ter plotado todos ostipos de escolas desejados;

21. O mapa pronto pode ser compartilhado, bastando clicar no botao ”Compartilhar”, colocandoum tıtulo e uma descricao para o mapa, e clicando em salvar, assim o My Maps gera um linkque pode ser acessado por qualquer pessoa com acesso a internet ou pode ser compartilhadopor meios de E-mail, Google +, Facebook e Twitter.

1.5 Resultados

Redes de metro

Nesse trabalho notou-se que se arrumada de maneira organizada as linhas de metro de um deter-minado estado(no caso Sao Paulo) com seus pesos e linhas de trafego,pode-se obter uma lista denodos ordenados por betweenness e medir a centralidade de seus nodos.

Plotagem das escolas do Rio de Janeiro

Nesse trabalho, ao longo do aumento de dados e escolas plotadas no mapa da cidade do Rio deJaneiro, notou-se que a concentracao de escolas publicas e maior nas zonas perıfericas e que ocorremaior concentracao de escolas particulares nas zonas mais nobres do estado, demonstrando comoas diferencas geograficas influem nos tipos de escola de uma regiao, o atual mapa e mostrado nafigura[1.1].

4

Page 6: Relatório Parcial de Atividades de Bolsa de Iniciação Científica - Projeto SPIDER

Figure 1.1: Plotagem atual das escolas do Rio de Janeiro

1.6 Conclusao

Esse relatorio descreveu as atividades realizadas ate o momento durante o perıodo de vigencia dabolsa de iniciacao cientıfica com seus devidos resultados. Nela trabalhou-se com redes complexaspara obter conceitos utilizados em outros trabalhos, como medidas de centralidade e ”betweennesscentrality”, plotagem de linhas de metro do estado de Sao Paulo e de escolas no estado do Rio deJaneiro.

O trabalho de redes de metro foi feito para mostrar a centralidade dos nodos das linhas de metrodo estado de Sao Paulo.

No trabalho de plotagem das escolas do Rio de Janeiro quer-se mostrar como a geolocalizacaode determinado local influi no numero de escolas e nos tipos de escolas desse lugar.

Durante o perıodo da bolsa tem-se trabalhado com fısica estatıstica ligada a computacao emetodos de plotagem de mapas com o uso de ferramentas de programacao.

A centralidade dos nodos das linhas de metro ja foi medida e a plotagem das escolas do estado doRio de Janeiro ainda esta sendo realizada, mas ja e possıvel ver a concentracao de escolas particularesem bairros nobres e de escolas publicas nas grandes periferias do estado.

5

Page 7: Relatório Parcial de Atividades de Bolsa de Iniciação Científica - Projeto SPIDER

Bibliografia

[1] Luiz Eduardo Borges. Python para desenvolvedores - aborda python 3.3. Paris, 2007.

[2] Antiqueira et al. Analyzing and modeling realworld phenomena with complex networks: Asurvey of applications. physics and society. 2005.

[3] Jean Metz. Redes complexas: conceitos e aplicacoes. In The 2nd International Workshop onEngineering Multi-Agent Systems (EMAS 2014), Paris, 2007.

[4] Luis Torgo. Linguagem R - Programacao para a analise de dados. 2009.

6