panorama de pesquisas em análise de dados na ufpb

68
Um Panorama das Pesquisas em Análise de Dados em Andamento na UFPB Alexandre Duarte alexandre[.@]ci.ufpb.br

Upload: alexandre-duarte

Post on 07-Jul-2015

189 views

Category:

Education


0 download

DESCRIPTION

Uma panorama sobre as pesquisas que estamos desenvolvendo na área de Análise de Dados na UFPB

TRANSCRIPT

Page 1: Panorama de Pesquisas em Análise de Dados na UFPB

Um Panorama das Pesquisas em Análise de Dados em Andamento na

UFPB

Alexandre Duarte

alexandre[.@]ci.ufpb.br

Page 2: Panorama de Pesquisas em Análise de Dados na UFPB
Page 3: Panorama de Pesquisas em Análise de Dados na UFPB

CiênciaFinanciamento de Pesquisa e Mérito Científico

PolíticaEleições, Eleitores e Eleitos

Page 5: Panorama de Pesquisas em Análise de Dados na UFPB

Financiamento de Pesquisa e Mérito Científico: Edital Universal

Page 6: Panorama de Pesquisas em Análise de Dados na UFPB

Financiamento de Pesquisa e Mérito Científico: Edital Universal

Fato #1: 10 dos 51 Comitês concentram 40% dos projetos aprovados

Fato #2: O Comitê da Computação foi o 9º mais contemplado em 2014 (3,2%)

Page 7: Panorama de Pesquisas em Análise de Dados na UFPB

Financiamento de Pesquisa e Mérito Científico: Edital Universal

Page 8: Panorama de Pesquisas em Análise de Dados na UFPB

Financiamento de Pesquisa e Mérito Científico: Edital Universal

Fato #3: 20 instituições concentram 52.7% de todos os projetos universais aprovados em 2014

Fato #4: 20 instituições concentram 72.7% de todos os projetos universais aprovados em 2014 na Computação

Page 9: Panorama de Pesquisas em Análise de Dados na UFPB

Financiamento de Pesquisa e Mérito Científico: Bolsas de Produtividade

0%

1%

2%

3%

4%

5%

6%

7%

Pe

rce

ntu

al d

e B

ols

as e

m A

nd

ame

nto

Área

Distribuição das Bolsas de Produtividade em Pesquisa por Área

Page 10: Panorama de Pesquisas em Análise de Dados na UFPB

Financiamento de Pesquisa e Mérito Científico: Bolsas de Produtividade

0%

1%

2%

3%

4%

5%

6%

7%

Pe

rce

ntu

al d

e B

ols

as e

m A

nd

ame

nto

Área

Distribuição das Bolsas de Produtividade em Pesquisa por Área

35%

Fato #5: 10 (das 105) áreas concentram 35% das bolsas de produtividade em pesquisa do CNPq

Page 11: Panorama de Pesquisas em Análise de Dados na UFPB

0.00%

2.00%

4.00%

6.00%

8.00%

10.00%

12.00%

14.00%

16.00%

18.00%

Pe

rce

ntu

al d

e B

ols

as e

m A

nd

ame

nto

Instituição

Distribuição das Bolsas de Produtividade em Pesquisa por Instituição

Financiamento de Pesquisa e Mérito Científico: Bolsas de Produtividade

Page 12: Panorama de Pesquisas em Análise de Dados na UFPB

0.00%

2.00%

4.00%

6.00%

8.00%

10.00%

12.00%

14.00%

16.00%

18.00%

Pe

rce

ntu

al d

e B

ols

as e

m A

nd

ame

nto

Instituição

Distribuição das Bolsas de Produtividade em Pesquisa por Instituição

Financiamento de Pesquisa e Mérito Científico: Bolsas de Produtividade

Fato #6: 10 (das 334) instituições contempladas concentram 52% dos bolsistas de produtividade em pesquisa do CNPq

52%

Page 13: Panorama de Pesquisas em Análise de Dados na UFPB

0.0%

2.0%

4.0%

6.0%

8.0%

10.0%

12.0%

Pe

rce

ntu

al d

e B

ols

as e

m A

nd

ame

nto

Instituição

Distribuição das Bolsas de Produtividade em Pesquisa da área de Computação por Instituição

Financiamento de Pesquisa e Mérito Científico: Bolsas de Produtividade

Page 14: Panorama de Pesquisas em Análise de Dados na UFPB

0.0%

2.0%

4.0%

6.0%

8.0%

10.0%

12.0%

Pe

rce

ntu

al d

e B

ols

as e

m A

nd

ame

nto

Instituição

Distribuição das Bolsas de Produtividade em Pesquisa da área de Computação por Instituição

Financiamento de Pesquisa e Mérito Científico: Bolsas de Produtividade

Fato #7: 7 (das 63) instituições contempladas concentram 50% dos bolsistas de produtividade em pesquisa do CNPq na área da Computação

50%

Page 15: Panorama de Pesquisas em Análise de Dados na UFPB

COMO EXPLICAR QUANTITATIVAMENTE TAIS CONCENTRAÇÕES?

Motivação

Page 16: Panorama de Pesquisas em Análise de Dados na UFPB

“Diz-me com quem andas e dir-te-ei quem és. Saiba eu com que te ocupas e saberei também no que te poderás tornar.”

Goethe

Page 17: Panorama de Pesquisas em Análise de Dados na UFPB

Financiamento de Pesquisa e Mérito Científico: Redes de Colaboração

Profundidade 1: 70 nós e 137 arestas

Page 18: Panorama de Pesquisas em Análise de Dados na UFPB

Financiamento de Pesquisa e Mérito Científico: Redes de Colaboração

Profundidade 2: 982 nós e 2821 arestas

Page 19: Panorama de Pesquisas em Análise de Dados na UFPB

Financiamento de Pesquisa e Mérito Científico: Redes de Colaboração

Profundidade 2: 7784 nós e 25797 arestas

Page 20: Panorama de Pesquisas em Análise de Dados na UFPB

Financiamento de Pesquisa e Mérito Científico: Projetos em Andamento

• Predição do Sucesso Científico de Pesquisadores Através de Métricas de Análise de Redes Sociais (Ayslânya Wanderley)

• Contando a História da Pós-Graduação no Brasil (Luiz Carlos)

• Quem sou eu no Mundo Acadêmico: Um Sistema para Visualização Comparativa de Produção Científica (José Leandro)

Page 21: Panorama de Pesquisas em Análise de Dados na UFPB

É POSSÍVEL PREVER O DESEMPENHO DE UM PESQUISADOR POR MEIO DE SUA INTERAÇÃO EM UMA REDE DE COLABORAÇÃO CIENTÍFICA?

Predição do Sucesso Científico de Pesquisadores Através de Métricas deAnálise de Redes Sociais

Page 22: Panorama de Pesquisas em Análise de Dados na UFPB

Predição do Sucesso Científico de Pesquisadores Através de Métricas de Análise de Redes Sociais: Metodologia

Page 23: Panorama de Pesquisas em Análise de Dados na UFPB

Predição do Sucesso Científico de Pesquisadores Através de Métricas de Análise de Redes Sociais: Modelo Preditivo

Matriz de Confusão a

Observado

Status_Pesquisador = 0 Status_Pesquisador = 1

Predito

Status_Pesquisador = 0 193 (TN) 58 (FN)

Status_Pesquisador = 1 74 (FP) 209 (TP)

Desempenho %

Sensibilidade 78,3

Especificidade 72,3

VPP 73,9

VPN 76,9

Acurácia 75,3

Estimativa Desvio Padrão Teste de Wald P-Valor Limite Inferior Limite Superior

Intercepto 2,944618 0,763316674 3,857662275 0,0001 1,448544747 4,440691128

Authority -6,73936 2,407871902 -2,79888634 0,0051 -11,45870198 -2,020017567

Degree_Centrality 0,017243 0,007735031 2,229224744 0,0258 0,00208274 0,032403506

PageRank -4,83117 1,681259247 -2,873540896 0,0041 -8,126374773 -1,535959629

Clustering_Coefficient -4,29246 1,218407018 -3,523010611 0,0004 -6,680494725 -1,904426979

a O ponto de corte é 0,5

Page 24: Panorama de Pesquisas em Análise de Dados na UFPB

COMO EVOLUÍRAM OS PROGRAMAS DE PÓS-GRADUAÇÃO NO BRASIL AO LONGO DOS ANOS?

Contando a História da Pós-Graduação no Brasil

Page 25: Panorama de Pesquisas em Análise de Dados na UFPB

Contando a História da Pós-Graduação no Brasil

A network framework of cultural historyMaximilian Schich, Chaoming Song, Yong-Yeol Ahn, Alexander Mirsky, Mauro Martino, Albert-László Barabási, Dirk Helbing

Science 1 August 2014: vol. 345 no. 6196 pp. 558-562 DOI: 10.1126/science.1240064

Page 26: Panorama de Pesquisas em Análise de Dados na UFPB

Contando a História da Pós-Graduação no Brasil

• Caracterizar a evolução histórica da formação de pesquisadores e dos programas de pós-graduação no Brasil

• Identificar os centros de influência nas diferentes área de pesquisa no País

• Fazer uma análise da correlação entre o local/período de formação dos pesquisadores e o conceito dos programas de pós-graduação onde estes pesquisadores atuam

• Status: • Baixamos o Lattes! (3.9 milhões de currículos em XML)• Começando a extração (e normalização) dos dados

Page 27: Panorama de Pesquisas em Análise de Dados na UFPB

Contando a História da Pós-Graduação no Brasil

Page 28: Panorama de Pesquisas em Análise de Dados na UFPB

UM SISTEMA PARA VISUALIZAÇÃO COMPARATIVA DE PRODUÇÃO CIENTÍFICA

Quem sou eu no Mundo Acadêmico

Page 29: Panorama de Pesquisas em Análise de Dados na UFPB

Quem sou eu no mundo acadêmico?

• Desenvolvimento de uma ferramenta para comparação visual de currículos lattes

• Permitir diferentes tipos de análises (visuais) a partir de conjuntos de currículos lattes• Detecção de tendências

• Detecção de outliers

• Superposição de currículos

• Possíveis sub-conjuntos de interesse• Bolsistas de Produtividade

• Pesquisadores de uma determinada área/idade/instituição/programa de pós

• Status• Começando a extração dos dados

Page 30: Panorama de Pesquisas em Análise de Dados na UFPB

CiênciaFinanciamento de Pesquisa e Mérito Científico

PolíticaEleições, Eleitores e Eleitos

Page 36: Panorama de Pesquisas em Análise de Dados na UFPB

Não vote nos Parentes

• Somos pobres, subdesenvolvidos e analfabetos porque alimentamos as oligarquias

• Alimentamos as oligarquias porque somos pobres, subdesenvolvidos e analfabetos

• Correlação não implica em causalidade

Page 48: Panorama de Pesquisas em Análise de Dados na UFPB

Política + Religião = ?

Se com um crescimento de 1.76% no número de candidatos líderes religiosos de 2006 para 2010 o número de eleitos nesta área aumentou em 91.7%, o que vai acontecer em 2014, com um contingente 34.73% maior de líderes religiosos disputando cargos eletivos ?

Page 50: Panorama de Pesquisas em Análise de Dados na UFPB

Eleições, Eleitores e Eleitos: Projetos em Andamento

• Coesão Parlamentar: Uma ferramenta para analisar mudanças na coesão entre parlamentares em votações nominais (Vitor Baptista)

• Infografia Interativa utilizando Dados Eleitorais (Lucas Lacerda, Filipe Araújo e Ed Porto)

• Um Mapeamento da Genealogia Política no Brasil (Maria Clara)

Page 51: Panorama de Pesquisas em Análise de Dados na UFPB

É POSSÍVEL IDENTIFICAR EVENTOS POLÍTICOS SIGNIFICATIVOS ATRAVÉS DO MONITORAMENTO DA COESÃO PARLAMENTAR ?

Coesão Parlamentar: Uma ferramenta para analisar mudanças na coesão entre parlamentares em votações nominais

Page 52: Panorama de Pesquisas em Análise de Dados na UFPB

Coesão Parlamentar: Questões de pesquisa

• É possível identificar mudanças na coesão parlamentar baseando-se nos resultados das votações da Câmara?

• Escândalos, manifestações populares e eventos históricos impactam, de alguma forma, a coesão parlamentar?

Page 53: Panorama de Pesquisas em Análise de Dados na UFPB

Coesão Parlamentar: Metodologia

• Extração e mineração de dados através de uma API da página da Câmara dos Deputados

• Criação de API própria para otimizar coleta de dados relevantes

• Criação de um grafo não direcional com arestas ponderadas pelo Índice de Rice

• Criação de uma ferramenta de visualização para os dados

Page 54: Panorama de Pesquisas em Análise de Dados na UFPB

Coesão Parlamentar: Estudo de caso -Mensalão

Page 55: Panorama de Pesquisas em Análise de Dados na UFPB

Coesão Parlamentar: Estudo de caso -Mensalão

2001

Page 56: Panorama de Pesquisas em Análise de Dados na UFPB

Coesão Parlamentar: Estudo de caso -Mensalão

2002

Page 57: Panorama de Pesquisas em Análise de Dados na UFPB

Coesão Parlamentar: Estudo de caso -Mensalão

2003

Page 58: Panorama de Pesquisas em Análise de Dados na UFPB

INFORMAÇÃO É LEGAL! INFORMAÇÃO INTERATIVA É AINDA MAIS LEGAL!

Infografia Interativa utilizando Dados Eleitorais

Page 59: Panorama de Pesquisas em Análise de Dados na UFPB

Infografia Interativa utilizando Dados Eleitorais

Page 60: Panorama de Pesquisas em Análise de Dados na UFPB

Infografia Interativa utilizando Dados Eleitorais

Page 61: Panorama de Pesquisas em Análise de Dados na UFPB

Infografia Interativa utilizando Dados Eleitorais

Page 62: Panorama de Pesquisas em Análise de Dados na UFPB

Infografia Interativa utilizando Dados Eleitorais

Page 63: Panorama de Pesquisas em Análise de Dados na UFPB

DESCOBRINDO A REDE GENEALÓGICA DOS POLÍTICOS BRASILEIROS

Um Mapeamento da Genealogia Política no Brasil

Page 64: Panorama de Pesquisas em Análise de Dados na UFPB

Um Mapeamento da Genealogia Política no Brasil

?

Crowdsourcing!

Page 65: Panorama de Pesquisas em Análise de Dados na UFPB

Um Mapeamento da Genealogia Política no Brasil

Page 66: Panorama de Pesquisas em Análise de Dados na UFPB

LABORATÓRIO DE TRANSPARÊNCIA PÚBLICA E BUSINESS ANALYTICS

Page 67: Panorama de Pesquisas em Análise de Dados na UFPB

Laboratório de Transparência Pública e Business Analytics

• LABTRANSP (Nome em construção!)

– 21/11/2014

• Parceria da UFPB (Departamento de Tecnologia em Gestão, Departamento de Finanças e Contabilidade+ Centro de Informática) com a OnCase

• Treinamento Pentaho e seleção de bolsistas em Dezembro/2014 e Janeiro/2015

Page 68: Panorama de Pesquisas em Análise de Dados na UFPB

Obrigado!

[email protected]