anÁlise de mÉtricas de currÍculos lattes por grupos...
TRANSCRIPT
ANÁLISE DE MÉTRICAS DE CURRÍCULOS LATTES POR
GRUPOS
Lucas Oses Cavazzani Andrade
Projeto de Graduação apresentado ao Curso
de Engenharia Eletrônica e de Computação
da Escola Politécnica, Universidade Federal
do Rio de Janeiro, como parte dos requisi-
tos necessários à obtenção do título de Enge-
nheiro.Orientador: Flávio Luís de Mello
Rio de Janeiro
7 de setembro de 2018
UNIVERSIDADE FEDERAL DO RIO DE JANEIRO
Escola Politécnica - Departamento de Eletrônica e de Computação
Centro de Tecnologia, bloco H, sala H-217, Cidade Universitária
Rio de Janeiro - RJ CEP 21949-900
Este exemplar é de propriedade da Universidade Federal do Rio de Janeiro, que
poderá incluí-lo em base de dados, armazenar em computador, micro�lmar ou adotar
qualquer forma de arquivamento.
É permitida a menção, reprodução parcial ou integral e a transmissão entre bibli-
otecas deste trabalho, sem modi�cação de seu texto, em qualquer meio que esteja
ou venha a ser �xado, para pesquisa acadêmica, comentários e citações, desde que
sem �nalidade comercial e que seja feita a referência bibliográ�ca completa.
Os conceitos expressos neste trabalho são de responsabilidade do(s) autor(es).
iv
DEDICATÓRIA
Dedico este projeto aos meus pais, Mônica Oses Cavazzani e Sérgio Alexandre
Cavazzani de Andrade, por todo apoio e esforço que �zeram para que eu conseguisse
chegar até aqui.
v
AGRADECIMENTO
Em primeiro lugar gostaria de agradecer meus pais, Mônica Oses Cavazzani e Sér-
gio Alexandre Cavazzani de Andrade, meu irmão, Luigi Oses Cavazzani Andrade,
e minha namorada, Carolina D'Ornellas Teixeira por todo apoio incondicional du-
rante essa etapa da minha vida. Pensei diversas vezes em desistir, mas não desisti
por vocês. Obrigado por todo carinho e amor mesmo durante os períodos mais
desgastantes.
Gostaria de agradecer também meu orientador Flávio Luís de Mello pela parti-
cipação constante durante todo o projeto, exercendo o papel de um orientador de
forma brilhante.
Por �m, não poderia esquecer daqueles que vi praticamente todos os dias du-
rante essa graduação, seja na sala de aula, no Burguesão tomando um café ou até
por Skype quando virávamos noites terminando trabalhos e estudando para provas:
Gabriel Lima, Helio Machado, Luís Fernando Almeida, Marcelo Hryniewicz, Ro-
dolfo Albuquerque, Vinicius Allemand e William Tostes, obrigado pela companhia
e amizade. Contem sempre comigo.
vi
RESUMO
O tema deste projeto é a automação da comparação de coleções contendo currícu-
los Lattes a �m de prover métricas de avaliação pro�ssional de grupos de indivíduos.
Desta forma, o problema a ser resolvido é implementar um software capaz de com-
parar dois grupos de currículos Lattes, situados em diretórios locais e especi�cados,
através de cálculos de suas principais métricas. O projeto cita alguns exemplos de
programas existentes acoplados ao Lattes e compara suas funcionalidades com as
do projeto, explicando o porquê do desenvolvimento do programa. O programa é
detalhado durante o trabalho, sendo explicitadas todas as funções que são utilizadas
e qual é a metodologia adotada para o desenvolvimento das mesmas. Por �m, o pro-
grama é testado comparando dois grupos da UFRJ: Poli e COPPE e seus conjuntos.
Palavras-Chave: Lattes, média, pesquisa, ensino, Perl, UFRJ, Poli, COPPE.
vii
ABSTRACT
The theme of this project is the automation of the comparison of Lattes curricula's
content in order to provide professional assessment metrics for groups of individuals.
Thus, the problem to be solved is to implement a software capable of comparing two
groups of Lattes curricula, located in local and speci�ed directories, by calculating
their main metrics. The project comprises some examples of existing programs
coupled with Lattes and compares their functionality with those of the project,
explaining why the program is developed.The program engineering is detailed during
the project, explaining all the functions that are used and what is the methodology
adopted for their development. Finally, the program is tested by comparing two
groups of UFRJ: Poli and COPPE and their sets.
Key words: Lattes, mean, research, teaching, Perl, UFRJ, Poli, COPPE.
viii
Sumário
1 Introdução 1
1.1 Tema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Delimitação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.3 Justi�cativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.4 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.5 Metodologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.6 Organização do Texto . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2 Sistemas existentes acoplados à Plataforma Lattes 4
2.1 scriptLattes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.2 Semantic Lattes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3 Lattes Miner - Plataforma Sucupira . . . . . . . . . . . . . . . . . . . 10
2.4 Plataforma OntoLattes . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3 Materiais e Métodos 12
3.1 Descrição do problema . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.2 Engenharia de software . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.2.1 Requisitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.2.2 Diagrama de entidades relacionais . . . . . . . . . . . . . . . . 13
3.2.3 Diagrama de caso de uso . . . . . . . . . . . . . . . . . . . . . 13
3.2.4 Arquitetura . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
4 Testes e Resultados 31
4.1 Descrição do espaço amostral . . . . . . . . . . . . . . . . . . . . . . 31
4.2 Testes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.3 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
ix
5 Conclusão 36
Bibliogra�a 37
A Tabela com as funções do programa 39
B Tabelas com os pesquisadores analisados 52
C Resultados complementares 64
x
Lista de Figuras
2.1 Diagrama com os módulos do sistema scriptLattes. Modi�cado de [1] 5
2.2 Grafo de colaboração sem peso. Extraído de [2] . . . . . . . . . . . . 7
2.3 Grafo de colaboração com pesos. Extraído de [2] . . . . . . . . . . . . 8
2.4 Grafo de colaboração com pesos normalizado. Extraído de [2] . . . . 8
3.1 Diagrama de entidades. . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.2 Diagrama de caso de uso. . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.3 Diagrama de caso de uso. . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.4 Estrutura do programa. . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.5 Arquivo de con�guração. . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.6 Arquivo de saída. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.7 Arquivo de saída após modi�cações. . . . . . . . . . . . . . . . . . . . 30
4.1 Diagrama de Venn representando os pesquisadores da Poli e da COPPE. 32
4.2 Diretório inexistente. . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.3 Caracteres não numéricos. . . . . . . . . . . . . . . . . . . . . . . . . 33
4.4 Diretório vazio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.5 Média e desvio padrão de artigos publicados. . . . . . . . . . . . . . . 34
4.6 Média e desvio padrão de orientações em graduação. . . . . . . . . . 35
C.1 Média e desvio padrão de trabalho em outras instituições. . . . . . . 77
C.2 Média e desvio padrão de projetos de pesquisa. . . . . . . . . . . . . 77
C.3 Média e desvio padrão de projetos de desenvolvimento. . . . . . . . . 77
C.4 Média e desvio padrão de participações como membro do corpo editorial. 78
C.5 Média e desvio padrão de participações como revisor de periódicos. . 78
C.6 Média e desvio padrão de títulos e prêmios. . . . . . . . . . . . . . . 78
C.7 Média e desvio padrão de artigos publicados. . . . . . . . . . . . . . . 79
xi
C.8 Média e desvio padrão de livros publicados. . . . . . . . . . . . . . . 79
C.9 Média e desvio padrão de capítulos publicados. . . . . . . . . . . . . . 79
C.10 Média e desvio padrão de textos publicados. . . . . . . . . . . . . . . 80
C.11 Média e desvio padrão de trabalhos publicados. . . . . . . . . . . . . 80
C.12 Média e desvio padrão de resumos publicados. . . . . . . . . . . . . . 80
C.13 Média e desvio padrão de resumos expandidos publicados. . . . . . . 81
C.14 Média e desvio padrão de outras publicações. . . . . . . . . . . . . . . 81
C.15 Média e desvio padrão de participações em bancas de mestrado. . . . 81
C.16 Média e desvio padrão de participações em teses de doutorado. . . . . 82
C.17 Média e desvio padrão de participações em bancas de doutorado. . . . 82
C.18 Média e desvio padrão de participações em monogra�as de cursos de
especialização. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
C.19 Média e desvio padrão de participações em bancas de graduação. . . . 83
C.20 Média e desvio padrão de participações em bancas de concurso publico. 83
C.21 Média e desvio padrão de participações em bancas de outros concursos. 83
C.22 Média e desvio padrão de participações em congressos. . . . . . . . . 84
C.23 Média e desvio padrão de participações em simpósios. . . . . . . . . . 84
C.24 Média e desvio padrão de participações em seminários. . . . . . . . . 84
C.25 Média e desvio padrão de de participações em encontros. . . . . . . . 85
C.26 Média e desvio padrão de participações em o�cinas. . . . . . . . . . . 85
C.27 Média e desvio padrão de participações em outros eventos. . . . . . . 85
C.28 Média e desvio padrão de organização de eventos. . . . . . . . . . . . 86
C.29 Média e desvio padrão de orientações em mestrado. . . . . . . . . . . 86
C.30 Média e desvio padrão de orientações em doutorado. . . . . . . . . . 87
C.31 Média e desvio padrão de orientações em monogra�as de conclusão
de cursos de aperfeiçoamento/especialização. . . . . . . . . . . . . . . 87
C.32 Média e desvio padrão de orientações em graduação. . . . . . . . . . 88
C.33 Média e desvio padrão de orientações de iniciação cientí�ca. . . . . . 88
xii
Lista de Tabelas
3.1 UC1 - Fazer download do currículo. . . . . . . . . . . . . . . . . . . . 15
3.2 UC2 - Organizar currículos em grupos. . . . . . . . . . . . . . . . . . 15
3.3 UC3 - De�nir os parâmetros do arquivo de con�guração. . . . . . . . 16
3.4 UC4 - Realizar a aquisição dos dados. . . . . . . . . . . . . . . . . . . 17
3.5 UC5 - Realizar o processamento dos dados. . . . . . . . . . . . . . . . 17
3.6 UC6 - Realizar a persistência dos dados. . . . . . . . . . . . . . . . . 18
3.7 UC7 - Gerar os grá�cos e tabelas. . . . . . . . . . . . . . . . . . . . . 18
A.1 Tabela com as funções do programa . . . . . . . . . . . . . . . . . . . 39
B.1 Pesquisadores da Poli . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
B.2 Pesquisadores da COPPE . . . . . . . . . . . . . . . . . . . . . . . . 56
B.3 Pesquisadores da COPPE e Poli . . . . . . . . . . . . . . . . . . . . . 61
C.1 Resultados COPPE e Poli . . . . . . . . . . . . . . . . . . . . . . . . 64
C.2 Resultados - (COPPE-Poli) e (Poli-COPPE) . . . . . . . . . . . . . . 68
C.3 Resultados COPPE & Poli . . . . . . . . . . . . . . . . . . . . . . . . 72
xiii
Capítulo 1
Introdução
1.1 Tema
O tema deste trabalho é a automação da comparação de coleções contendo currícu-
los Lattes a �m de prover métricas de avaliação pro�ssional de grupos de indivíduos.
Desta forma, o problema a ser resolvido é implementar um software, chamado Com-
pLattes, capaz de comparar dois grupos de currículos Lattes, situados em diretórios
locais e especi�cados, através de cálculos de suas principais métricas.
1.2 Delimitação
O programa é desenvolvido em um sistema operacional Linux sendo executado
através de linha de comando, utilizando a linguagem Perl. Sua principal restrição é
a necessidade do download dos arquivos no formato XML fornecidos pelo portal do
Lattes, para serem utilizados como entradas do programa.
1.3 Justi�cativa
Atualmente existem cerca de sessenta mil mestres e noventa mil doutores cadas-
trados na plataforma Lattes no Brasil [3] ,o que leva a uma grande di�culdade para
mapear as informações e produções de grupos de pesquisadores já que não existem
ferramentas capazes de auxiliar a comparação das principais métricas dos currículos
por grupos. Dessa forma �ca inviável uma análise sobre o comportamento dos mes-
1
mos o que impossibilita uma visão mais clara sobre a situação do principal tripé de
uma universidade: ensino, pesquisa e extensão.
Assim, o trabalho desenvolvido pode auxiliar consultores a entender sobre o com-
portamento de diversos grupos de pesquisadores de universidades do Brasil para que
consigam tomar decisões melhor fundamentadas. Com os três pilares bem estabele-
cidos, as universidades brasileiras poderão formar pro�ssionais mais bem preparados
para o mercado de trabalho e o meio acadêmico.
1.4 Objetivo
O principal objetivo do trabalho é gerar um relatório para facilitar as análises
de conjuntos de pesquisadores. E tem-se como objetivos especí�cos: (1) mapear as
principais métricas de um currículo Lattes,(2) calcular as médias e desvios padrão
de todas as métricas mapeadas, quando aplicavél, e (3) de�nir uma padronização
para o arquivo de saída de forma a tornar o arquivo manipulável para trabalhos
futuros.
1.5 Metodologia
O programa é desenvolvido na linguagem Perl em um sistema operacional Linux
sendo executado através de linha de comando. Ele é armazenado localmente e
utiliza como entradas arquivos do formato XML, disponibilizados de forma gratuita
pela plataforma Lattes, que precisam ser baixados e armazenados em dois diretórios
especí�cos, de acordo com a necessidade de comparação do usuário, durante um
período também informado pelo usuário.
A análise de texto é baseada nas métricas fornecidas pelo portal e o programa
contabiliza as mais relevantes. Ao terminar a sua execução, o programa gera um
relatório local em formato CSV com todas as estatísticas pertinentes a comparação
dos grupos dos currículos.
2
Posteriormente, é implementado em Python um código que lê o arquivo de saída
e plota os grá�cos com as métricas e seus desvios padrão. Para isso se faz necessário
o uso de um compilador de Python e o Jupyter Notebook. A ferramenta mais fácil
para ser instalada e que conta com ambas aplicações é a Anaconda Distribution.
1.6 Organização do Texto
No capítulo 2 são mapeados alguns programas que utilizam a plataforma Lattes
como base e transformam seus dados em informações.
O capítulo 3 apresenta com detalhes os materiais e métodos necessários para
implementação do programa. É descrito de forma sucinta o diagrama de caso de
uso do programa, suas principais funções e qual foi a metodologia utilizada para
implementação delas.
Os testes e resultados são apresentados no capítulo 4.
Por �m, o capítulo 5 conclui o projeto.
3
Capítulo 2
Sistemas existentes acoplados à
Plataforma Lattes
Atualmente existem cerca de sessenta mil mestres e noventa mil doutores cadas-
trados na plataforma Lattes no Brasil [3], o que leva a uma grande di�culdade para
mapear as informações e produções de grupos de pesquisadores já que a comparação
de currículos é feita de forma manual. Já existem alguns programas que possuem
uma interface com a plataforma Lattes. Os mais relevantes serão mapeados e ex-
plorados neste capítulo.
2.1 scriptLattes
O programa scriptLattes [1] é um sistema open-source e foi desenvolvido por
Jesús P. Mena-Chalco e Roberto M. Cesar-Jr com o objetivo de criar relatórios au-
tomáticos de produção bibliográ�ca dos professores do Departamento de Ciência
da Computação do Instituto Militar de Engenharia. Dessa forma seriam dispensa-
das as informações redundantes e se tornaria mais fácil o mapeamento das áreas
correlacionadas e grupos de pesquisas de interesse.
Sua primeira versão foi disponibilizada em 2005 sendo executado em um terminal
de texto de um sistema operacional Linux, utilizando funções modulares Perl e estru-
turas básicas de programação. O sistema foi validado após ser testado com sucesso
em mais de trezentos grupos de pesquisa de instituições brasileiras. Recentemente
4
o script foi re-programado utilizando a linguagem Python.
Os parâmetros de entrada do sistema devem ser informados através de um arquivo
no formato de texto com os seguintes campos separados por vírgulas: o código de
16 dígitos que o CNPQ utiliza como ID único para cada currículo LATTES, o nome
do pesquisador, o período desejado para busca e o identi�cador do pesquisador,
informando se ele é professor,colaborador ou aluno. Apenas os campos com o ID e
o identi�cador são obrigatórios. O nome serve apenas como referência e é extraído
do próprio currículo Lattes e caso não seja informada a data, todas as produções
daquele pesquisador serão consideradas.
O sistema é dividido em seis módulos: seleção de dados, pré-processamento de
dados, tratamento de redundância, geração do grafo de colaboração, geração do
mapa geo-localização e criação dos relatórios de saída. Conforme Figura 1.1.
Figura 2.1: Diagrama com os módulos do sistema scriptLattes. Modi�cado de [1]
O módulo de seleção de dados permite que o download dos currículos Lattes seja
feito no formato HTML.
No módulo de pré-processamento de dados o HTML é tratado para fornecer as
informações relevantes para a comparação. Por exemplo: endereço pro�ssional, lista
de publicações, supervisões e entre outros.
5
As publicações só serão validadas para a próxima etapa se estiverem dentro do
período de tempo informado pelo usuário no arquivo de entrada fornecido no início
da execução do programa.
O módulo de tratamento de redundância é responsável por remover as publica-
ções duplicadas. Normalmente os artigos cientí�cos são produzidos por diversos
colaboradores, desse modo a mesma publicação aparece em vários currículos. Para
cada autor, o módulo executa um algoritmo que �ltra as publicações pelos títu-
los semelhantes, desde que tenha sido publicado no mesmo ano, evitando assim a
redundância.
Além disso o módulo salva em uma matriz o número de publicações que cada
pesquisador tem com os outros membros da plataforma, assim pode-se considerar
que os autores são colaboradores.
Através da matriz mencionada anteriormente, são gerados, nos relatórios, três
grafos de colaboração entre os pesquisadores: Grafo de colaborações sem pesos,
grafo de colaborações com pesos e grafo de colaborações com pesos normalizados.
Cada pesquisador é representado por um nó e as arestas representam as ligações
de colaboração entre eles. O grafo de colaboração sem pesos exibe apenas as liga-
ções de trabalho colaborativo; o grafo de colaboração com pesos informa em cada
aresta o número de produções acadêmicas entre os dois pesquisadores; o grafo de co-
laboração com pesos normalizados, indica em cada aresta o número proporcional de
publicações entre dois pesquisadores normalizados pela quantidade total de produ-
ções acadêmicas feitas em colaboração. Conforme �guras 1.2, 1.3 e 1.4.
6
Figura 2.2: Grafo de colaboração sem peso. Extraído de [2]
7
Figura 2.3: Grafo de colaboração com pesos. Extraído de [2]
Figura 2.4: Grafo de colaboração com pesos normalizado. Extraído de [2]
8
Outro resultado fornecido nos relatórios ao �nal da execução do programa é o
mapa de geolocalização. Ele é implementado utilizando a plataforma online do Go-
ogle Maps para obter de forma automática as coordenadas geográ�cas dos endereços
pro�ssionais de cada pesquisador fornecido pela plataforma Lattes. Assim é possível
visualizar a distância entre todos os colaboradores.
Um conjunto de relatórios, em formato HTML, representam a saída do sistema
e são separados por tipos que exibem as seguintes informações: produções biblio-
grá�cas, técnicas e artísticas; orientações em andamento e concluídas; projetos de
pesquisa e prêmios e títulos. Além disso, são gerados uma lista de pesquisadores,
com todas as informações individuais de cada um, grafos de colaboração e o mapa
de geolocalização.
Dentre os programas listados o scriptLattes é um dos mais completos e próximos
ao programa que será desenvolvido nesse projeto, o CompLattes. Como principal
diferença temos o resultado de análise dos currículos e comparação de métricas entre
grupos.
2.2 Semantic Lattes
O principal objetivo do Semantic Lattes [4] é realizar as importações de currículos
e listá-los em ontologias. O Semantic Lattes obtém acesso aos dados dos currículos
Lattes através do sistema Qualis, um sistema brasileiro de avaliação de periódicos,
mantido pela CAPES. Ele relaciona e classi�ca as produções intelectuais dos pro-
gramas de pós-graduação stricto sensu (mestrado e doutorado), quanto ao âmbito
da circulação (local, nacional ou internacional) e a qualidade (A, B, C), por área de
avaliação.
O programa possui dois módulos principais: Server e Web. O módulo Server é
responsável pela persistência dos dados, consultas e inferências, utilizando a lingua-
gem JRuby, o framework Jena e o motor de inferências Pellet. Já o módulo Web
é responsável pela apresentação dos resultados, conversão do currículo no formato
XML para instâncias OWL e interpretação das perguntas para consultas SPARQL.
9
Foi utilizada para implementação a linguagem Ruby e o framework Sinatra.
A interface com o usuário é feita através de um campo para informar um texto e
um botão de busca. O usuário entra com uma pergunta e o programa identi�ca as
palavras-chave através de expressões regulares, reconhece a pergunta e faz a consulta.
Dentre os programas listados, o Semantic Lattes se destacou em prover uma
interface simples e clara ao usuário, abstraindo a complexidade de operar utilizando
linhas de comando. Além disto, faz consultas combinando informações de duas
ontologias (Qualis e Lattes).
Não existem muitas semelhanças entre o Semantic Lattes e o CompLattes. O
primeiro tem como principal objetivo o tratamento semântico do texto através de
simples perguntas realizadas em uma interface bem simpli�cada e clara para o usuá-
rio. Já o CompLattes tem como principal objetivo fornecer relatórios por grupos de
pesquisadores.
2.3 Lattes Miner - Plataforma Sucupira
A plataforma Sucupira [5] utiliza um sistema, LattesMiner, desenvolvido pelo
mesmo grupo para importar de forma automática todos os dados da plataforma
Lattes. O LattesMiner é uma linguagem de domínio especí�co para extração auto-
mática de informações de currículos Lattes.
A plataforma tem como principal objetivo identi�car redes sociais acadêmicas,
utilizando a extração de informações da plataforma Lattes. Com o programa é
possível gerenciar uma lista de pesquisadores de�nida pelo usuário, assim, o usuário
pode realizar consultas pelo nome do pesquisador e solicitar ao sistema a importação
dos dados do seu currículo na plataforma Lattes.
Após a importação dos dados a plataforma gera um mapa contendo a localização
do endereço pro�ssional dos pesquisadores, um grá�co com o número de publicações
por ano e tipo e um grafo relacionando os pesquisadores a outros colaboradores.
10
Existem algumas semelhanças entre o Lattes Miner, utilizado pela plataforma Su-
cupira, e o CompLattes. Ambos fornecem relatórios com métricas por grupos de
pesquisadores, porém a plataforma Sucupira possui acesso restrito, sendo acessível
somente a pró-reitores, coordenadores de programas, coordenadores de área e ges-
tores DEV/CAPPES enquanto o CompLattes é open-source e livre para qualquer
usuário.
2.4 Plataforma OntoLattes
A plataforma OntoLattes [5] tem como principal objetivo construir uma ontologia
para suportar os dados da plataforma Lattes. Em um primeiro momento ela identi-
�ca as classes, subclasses e propriedades. Para ser mais completa a plataforma cria
outras classes como , por exemplo, Unidade Federativa (UF) para armazenar dados
sobre os estados brasileiros.
O sistema utiliza uma ferramenta de conversão de currículo em formato XML para
o formato BibTex, formato utilizado pela LATEX para facilitar o uso de referências
bibliográ�cas. A importação do arquivo da plataforma Lattes é feita de forma
manual e durante a conversão do arquivo XML em BibTex são feitas validações
para evitar incoerências.
Não existem muitas semelhanças entre a plataforma OntoLattes e o CompLat-
tes. A primeira é voltada para consultas utilizando uma linguagem natural e dados
estruturados em ontologias, já o CompLattes tem como principal objetivo fornecer
relatórios completos por grupos de pesquisadores.
11
Capítulo 3
Materiais e Métodos
Este capítulo abordará a metodologia e as técnicas utilizadas para desenvolvi-
mento do programa.
3.1 Descrição do problema
Conforme mencionado no capítulo anterior, existem diversos programas que trans-
formam os dados dos currículos Lattes em informações. Porém, nenhum deles é
capaz de analisar dois grupos distintos e compará-los. O sistema proposto deve
ser capaz de mapear diversas métricas curriculares, calcular as médias, seus desvios
padrão por grupos e comparar os resultados. Caso um grupo tenha apenas um
currículo, o programa pode compará-lo com todos os outros, mapeando se aquele
pesquisador em especí�co está dentro dá média daquele grupo ou da universidade
como um todo. Para complementar e facilitar a análise do relatório gerado, foi
utilizado o Jupyter Notebook, um projeto que permite que páginas locais misturem
texto, código executado em Python, imagens, �guras entre outros. Esse recurso foi
utilizado para gerar grá�cos e ilustrar os dados gerados pelo relatório.
3.2 Engenharia de software
3.2.1 Requisitos
Para execução do programa em sistema operacional Linux não se faz necessária
nenhuma instalação, visto que a maioria das distribuições modernas do Linux já
12
contam com uma versão recente do compilador de Perl instalado. Para complemen-
tar e facilitar a análise do relatório gerado, é necessário a instalação do compila-
dor de Python e o Jupyter Notebook. A ferramenta mais fácil para ser instalada
e que conta com ambas aplicações é a Anaconda Distribution através do website
https://www.anaconda.com/download/.
Caso o usuário tenha preferência por sistema operacional Windows, é obrigatório
a instalação de um compilador de Perl como o ActivePerl ou semelhante. Assim
como o Linux, é necessário também a instalação da Anaconda Distribution através
do mesmo website citado anteriormente.
3.2.2 Diagrama de entidades relacionais
A seguir é exibido o diagrama de caso de entidades relacionais, �gura 3.1.
Figura 3.1: Diagrama de entidades.
3.2.3 Diagrama de caso de uso
A seguir é exibido o diagrama de caso de uso conforme �gura 3.2. O sistema foi
dividido em 7 casos de uso sendo detalhados de forma resumida nas tabelas de 3.1 a
13
3.7. Os casos de uso do programa principal podem ser observados na imagem pela
delimitação da linha pontilhada; ele conta com 44 funções que foram aglutinadas
por estarem um nível de granularidade muito alto e tornariam o diagrama poluído
visualmente.
Figura 3.2: Diagrama de caso de uso.
Tabela 3.1: UC1 - Fazer download do currículo.Caso de uso: Fazer download do currículo
Visão Geral: O usuário precisa realizar o download dos currículos no formato XML
através da plataforma Lattes de forma manual e unitária.
Fluxo Principal:
1 - Entrar no site http://buscatextual.cnpq.br/buscatextual/busca.do?metodo=apresentar.
2 - Inserir o nome do pesquisador.
3 - Digitar o código de acesso.
4 - Selecionar a opção de download do XML
5 - Digtar o código de acesso.
Fluxo Alternativo: �
Exceções: �
14
Tabela 3.2: UC2 - Organizar currículos em grupos.Caso de uso: Organizar currículos em grupos.
Visão Geral: O usuário precisa de�nir quais grupos serão comparados para inserir os cur-
rículos nos diretórios correspondentes. São realizadas comparações de dois grupos.
Fluxo Principal:
1 - Descomprimir o arquivo.
2 - Inserir o nome do pesquisador como nome do arquivo.
3 - Copiar o currículo para o diretório desejado.
Fluxo Alternativo: 3 - Caso o diretório desejado não exista, criar o diretório com o nome
do grupo que será analisado.
Exceções: �
Tabela 3.3: UC3 - De�nir os parâmetros do arquivo de con�guração.
Caso de uso: De�nir os parâmetros do arquivo de con�guração
Visão Geral: O usuário precisa de�nir quais parâmetros serão lidos pelo programa,
como quais os caminhos dos diretórios serão analisados, qual o período que será
realizada a busca, qual o ano atual e quando foi realizado o download dos currículos.
Fluxo Principal:
1 - Abrir o arquivo de con�guração (con�g.txt)
2 - Inserir o caminho completo do primeiro diretório analisado após o parâmetro
"DIRECTORY1="
3 - Inserir o caminho completo do segundo diretório analisado após o parâmetro
"DIRECTORY2="
4 - Inserir o período que deseja analisar após o parâmetro "PERIOD="
5 - Inserir o ano atual após o parâmetro "CURRENT_YEAR="
6 - Inserir a data de download dos currículos após o parâmetro "LAST_UPDATE="
Fluxo Alternativo: �
Exceções: (2-6) Caso algum dos parâmetros não existam o programa é encerrado
15
Tabela 3.4: UC4 - Realizar a aquisição dos dados.
Caso de uso: Realizar a aquisição dos dados
Visão Geral: A primeira etapa do programa consiste em adquirir os dados
informados pelo arquivo de con�guração e por varrer os dois diretórios que serão
comparados armazenando os nomes de todos os arquivos que estão presentes neles.
Fluxo Principal:
1 - Executar o programa principal.
2 - O programa abre o arquivo de con�guração.
3 - O programa varre as informações do arquivo e armazena em um vetor.
4 - O programa através dos dados armazenados na etapa anterior, varre os diretórios
informados e armazena os nomes dos currículos em outro vetor.
Fluxo Alternativo: �
Exceções:
2 - Caso o programa não consiga abrir o arquivo de con�guração, ele é encerrado.
3 - Caso o programa não encontre os parâmetros esperados no arquivo de con�gu-
ração, ele é encerrado.
4 - Caso o programa não encontre arquivos no formato XML no diretório, ele é
encerrado.
Tabela 3.5: UC5 - Realizar o processamento dos dados.
Caso de uso: Realizar o processamento dos dados
Visão Geral: A segunda etapa do programa consiste em calcular todas as métricas
solicitadas.
Fluxo Principal:
1 - São criadas diversas variáveis para armazenar os resultados das funções
2 - As funções de processamento são executadas.
3 - As funções retornam com as métricas esperadas.
Fluxo Alternativo: �
Exceções: �
16
Tabela 3.6: UC6 - Realizar a persistência dos dados.
Caso de uso: Realizar a persistência dos dados
Visão Geral: A terceira etapa do programa consiste em armazenar todas
as métricas calculadas em um arquivo no formato CSV.
Fluxo Principal:
1 - É criado um arquivo de saída (output.csv).
2 - É escrito no arquivo a quantidade de currículos, data de atualização e
quais foram os diretórios analisados.
3 - Todas as métricas são escritas no arquivo
Fluxo Alternativo: �
Exceções: 1 - Caso o programa não consiga criar o arquivo, o mesmo
é encerrado.
Tabela 3.7: UC7 - Gerar os grá�cos e tabelas.
Caso de uso: Gerar os grá�cos e tabelas
Visão Geral: Para facilitar a leitura dos dados e agregar mais valor às
métricas calculadas, são gerados uma tabela e grá�cos comparando os
dois diretórios
Fluxo Principal:
1 - É aberto o Jupyter Notebook.
2 - É executado o programa com o arquivo output.csv como arquivo
de entrada.
3 - As tabelas e os grá�cos são gerados.
Fluxo Alternativo: �
Exceções: �
17
3.2.4 Arquitetura
Segundo [7],"Perl (Practical Extraction and Report Language) é uma linguagem de
programação extremamente poderosa, com milhares de usuários no mundo inteiro.
Tornou-se a linguagem escolhida para desenvolvimento na Web, processamento de
texto, serviços para Internet, administração de sistemas, acesso a diversos bancos de
dados e muitas outras tarefas que requiram soluções multiplataforma e desenvolvi-
mento rápido."Por atender a demanda de processamento de texto e possibilitar uma
automatização futura através de desenvolvimento na Web e serviços para Internet,
Perl, foi a linguagem adotada para realização do projeto.
Foi adotado como ambiente de desenvolvimento o programa Eclipse com uma
API especí�ca para o Perl. Assim, o código foi desenvolvido e compilado utilizando
o mesmo software. Com isso os ambientes de produção e desenvolvimento foram
praticamente os mesmos.
O programa foi dividido em três grandes blocos, conforme ilustrado na �gura 3.2:
aquisição de dados, processamento e persistência. Os dois primeiros blocos foram
modularizados em quarenta e quatro funções, sendo as duas primeiras responsáveis
por ler o arquivo de con�guração e mapear o nome de todos os arquivos (aquisição de
dados) e as outras por calcular as métricas que são exibidas ao término do programa
em um relatório no formato CSV (processamento de dados). O bloco de persistência
por utilizar funções simples pré-de�nidas no Perl, como escrita em arquivo, acabou
�cando dentro do programa principal. A tabela A.1, localizada no Apêndice A,
mostra todas as funções do programa, detalhando quais são as entradas, saídas e
objetivos de cada função.
O arquivo de con�guração (con�g.txt), utilizado pela primeira função do pro-
grama, deve �car localizado no mesmo diretório do programa. É através deste
arquivo que o usuário interage com o programa, fornecendo qual o caminho dos
diretórios em que foram armazenados os currículos, informando qual o período de-
sejado para a busca, qual o ano atual e quando foi feito o download dos currículos.
A �gura 3.3 demonstra os parâmetros utilizados para a execução dos testes.
18
Figura 3.3: Estrutura do programa.
Figura 3.4: Arquivo de con�guração.
19
A estrutura das funções do bloco de processamento é bem de�nida e não varia
muito de acordo com as funções. Para todo o bloco existem apenas três tipos de
variações: média de contagem de métricas, média de anos e média de datas e seus
desvios padrão. Todas utilizam um laço de iteração para varrer todo o vetor com os
nomes dos arquivos do diretório passado como parâmetro de entrada para a função.
Após o arquivo ser aberto é realizada uma de�nição de término de linha. Para a
função artigos, que tem como objetivo contabilizar a média de artigos publicados
no período de tempo informado, foi estabelecido que o término de cada linha seria
a string localizada na linha 6, conforme pode ser observado a seguir.
1 sub a r t i g o s {
2 my $d i r = s h i f t ; my $count=0; my @array = @_; my $media = 0 ;
3 f o r (my $ i =0; $ i <= s c a l a r (@array−1) ; $ i++){
4 my $var = $d i r . "\/" . $array [ $ i ] ;
5 open (INPUTFILE, $var ) or d i e "Unable to open $var \n" ;
6 $/ = "</ARTIGO−PUBLICADO>" ;
7 whi l e (my $chunk = <INPUTFILE>){
8 $chunk =~ s/ ' ' //g ;
9 i f ( $chunk =~ m'<ARTIGO−PUBLICADO' ) {
10 my ( $a r t i g o ) = $chunk =~ m'TITULO−DO−ARTIGO=(.∗?) ANO−DO−
ARTIGO' ;
11 my ( $ano ) = $chunk =~ m'ANO−DO−ARTIGO=( [ 0 − 9 ] . . . . ) PAIS−DE−
PUBLICACAO' ;
12 un l e s s ( de f ined ( $a r t i g o )&&de f ined ( $ano ) ) {
13 next ;
14 }
15 i f ( $ con f i g [2] > $con f i g [3]− $ano ) {
16 $ a r t i g o s [ $k ]++;
17 }
18 }
19 }
20 c l o s e (INPUTFILE) ;
21 $k++;
22 }
23 f o r (my $ j =0; $ j <= s c a l a r (@array−1) ; $ j++){
20
24 i f ( ! d e f ined ( $ a r t i g o s [ $ j ] ) )
25 { $ a r t i g o s [ $ j ]=0;}
26 $sum = $sum + $a r t i g o s [ $ j ] ;
27 }
28 $media = $sum/( s c a l a r ( @array ) ) ;
29 my $desv io =0;
30 my $sum_desvio = 0 ;
31 f o r (my $ j =0; $ j <= s c a l a r (@array−1) ; $ j++){
32 $sum_desvio = $sum_desvio + ( ( $ a r t i g o s [ $ j ] − $media ) ∗∗2) ;
33 }
34 $desv io = sq r t ( $sum_desvio /( s c a l a r @array ) ) ;
35 re turn ( $media , $desv io ) ;
36 }
Essa de�nição é essencial para o mapeamento de métricas em um arquivo XML
que conta apenas com uma linha e diversos elementos (tags) repetidos, ou seja, para
mapear diferentes métricas, cada função precisa ter seu término de linha especí�co.
Sem a mudança do parâmetro, a busca pela expressão regular iria retornar apenas
a primeira ocorrência, impossibilitando os cálculos de média e desvio padrão.
A partir da de�nição acima, são realizadas buscas por expressões regulares, loca-
lizadas entre atributos de�nidos pelo template do XML, conforme pode-se observar
nas linhas 10 e 11. A variável artigo foi atribuída com o valor após o atributo
'TITULO-DO-ARTIGO=' até o atributo 'ANO-DO-ARTIGO', sendo possível ser
atribuído qualquer caracter em qualquer quantidade. Já a variável ano, foi atri-
buída com o valor entre 'ANO-DO-ARTIGO=' e 'PAIS-DE-PUBLICACAO', sendo
limitada a apenas quatro números entre zero e nove.
Por �m, é realizada uma veri�cação se as variáveis foram de�nidas para então
veri�car se o ano da publicação está dentro do período solicitado pelo usuário no
arquivo de con�guração (linha 15). Caso esteja, o valor é contabilizado para o cálculo
da média e do desvio padrão e ambos são retornados pela função.
21
A seguir são exibidas as outras duas variações: média de anos, com a função
media_ano_pos_doc que tem como objetivo calcular a média de anos de pós-
doutorado de todos os currículos e média de datas, com a função media_atualizacao
que tem como objetivo calcular a média das datas de atualização de todos os currí-
culos.
1 sub media_ano_pos_doc{
2 my $d i r = s h i f t ;my @array = @_;my $media = 0 ;my $k=0;my $anos =0;
my @ano=(0) ;my $sum=0;
3 f o r (my $ i =0; $ i <= s c a l a r (@array−1) ; $ i++){
4 my $var = $d i r . "\/" . $array [ $ i ] ;
5 open (INPUTFILE, $var ) or d i e "Unable to open $var \n" ;
6 $/ = "</POS−DOUTORADO>" ;
7 whi l e (my $chunk = <INPUTFILE>){
8 $chunk =~ s/ ' ' //g ;
9 i f ( $chunk =~ m'</DOUTORADO><POS−DOUTORADO.∗ ' ) {
10 my ( $anos ) = $chunk =~ m'<POS−DOUTORADO.∗ANO−DE−CONCLUSAO
=( [ 0 − 9 ] . . . . )ANO−DE−OBTENCAO−DO−TITULO ' ;
11 un l e s s ( de f ined ( $anos ) ) {
12 next ;
13 }
14 $anos =~ s /\ s // ;
15 i f ( $anos != 0) {
16 $ano [ $k]=$anos ;
17 $k++
18 }
19 }
20 }
21 c l o s e (INPUTFILE) ;
22 }
23 f o r (my $ j =0; $ j <= s c a l a r (@ano−1) ; $ j++){
24 $sum = $sum + $ano [ $ j ] ;
25 }
26 $media = $sum/ s c a l a r (@ano) ;
27 my $desv io =0;
22
28 my $sum_desvio = 0 ;
29 f o r (my $ j =0; $ j <= s c a l a r (@ano−1) ; $ j++){
30 $sum_desvio = $sum_desvio + ( ( $ano [ $ j ] − $media ) ∗∗2) ;
31 }
32 $desv io = sq r t ( $sum_desvio /( s c a l a r @ano) ) ;
33 re turn ( ( i n t $media ) , $desv io ) ;
34 }
Como pode ser observado, a estrutura da função é bem semelhante a anterior,
com uma de�nição de término de linha especí�ca,conforme a linha 6. A principal
diferença aparece a partir da linha 15, no qual são armazenados todos os anos de
pós-doutorado em um vetor para o cálculo da média posteriormente.
1 sub media_atual izacao {
2 my $d i r = s h i f t ;my @array = @_;my $media = 0 ;my $k=0;my @dia=(0)
;my @mes=(0) ;my @ano=(0) ;my $sum_ano=0;my $sum_mes=0;my
$sum_dia=0;
3 f o r (my $ i =0; $ i <= s c a l a r (@array−1) ; $ i++){
4 my $var = $d i r . "\/" . $array [ $ i ] ;
5 open (INPUTFILE, $var ) or d i e "Unable to open $var \n" ;
6 $/ = "CURRICULO−VITAE" ;
7 whi l e (my $chunk = <INPUTFILE>){
8 $chunk =~ s/ ' ' //g ;
9 my ( $date )=$chunk =~ m'DATA−ATUALIZACAO=(.∗?)HORA−ATUALIZACAO=
' ;
10 un l e s s ( de f ined ( $date ) ) {
11 next ;
12 }
13 my $day =0; my $month = 0 ; my $year = 0 ;
14 $day = subs t r $date , 0 , 2 ;
15 $month = subs t r $date , 2 , 2 ;
16 $year = subs t r $date , 4 , 4 ;
17 $day =~ s /\ s // ;
18 $month =~ s /\ s // ;
23
19 $year =~ s /\ s // ;
20 i f ( $day && $month && $year != 0) {
21 $ano [ $k]= $year ;
22 $mes [ $k]= $month ;
23 $dia [ $k]= $day ;
24 $k++;
25 }
26 }
27 c l o s e (INPUTFILE) ;
28 }
29 f o r (my $ j =0; $ j <= s c a l a r (@ano−1) ; $ j++){
30 $sum_ano = $sum_ano + $ano [ $ j ] ;
31 $sum_mes = $sum_mes + $mes [ $ j ] ;
32 $sum_dia = $sum_dia + $dia [ $ j ] ;
33 }
34 $sum_ano= $sum_ano ∗365 ;
35 $sum_mes= $sum_mes ∗30 ;
36 $sum_dia= $sum_dia+$sum_mes+$sum_ano ;
37 my $media_desvio = $sum_dia/ s c a l a r ( @array ) ;
38 my $sum_desvio = 0 ;
39 f o r (my $ j =0; $ j <= s c a l a r (@ano−1) ; $ j++){
40 $sum_desvio = $sum_desvio + ( ( $desv io_dias [ $ j ] − $media_desvio )
∗∗2) ;
41 }
42 my $desv io = sq r t ( $sum_desvio /( s c a l a r @ano) ) ;
43 my $media_dia = in t ( $sum_dia/ s c a l a r (@ano) ) ;
44 my $media_ano = in t ( $media_dia /365) ;
45 my $media_mes ;
46 i f ( i n t ( ( $media_dia%365) == 0) ) {
47 $media_mes = 1 ;
48 }
49 e l s e {
50 $media_mes = in t ( ( $media_dia%365) /30) ;
51 }
24
52 my $media_dia_final ;
53 i f ( i n t ( ( $media_dia%365)%30) == 0) {
54 $media_dia_final = 1 ;
55 }
56 e l s e {
57 $media_dia_final = in t ( ( $media_dia%365)%30) ;
58 }
59 $media = "$media_dia_final\−$media_mes\−$media_ano" ;
60 re turn ( $media , $desv io ) ;
61 }
A função media_atualizacao segue uma estrutura semelhante à função anterior,
com vetores para armazenamento de dias, meses e anos, conforme linhas 21, 22 e
23. Em seguida todos os anos e meses são convertidos em dias e somados (linhas 34,
35 e 36) para assim ser calculada uma média de dias (linha 37). Só então o valor é
convertido para o formato de data e passado como parâmetro de saída da função.
Para o cálculo do desvio padrão foram considerados os valores em dias, antes da
conversão em formato de data.
Após a chamada de todas as funções, o programa escreve todas as métricas retor-
nadas das funções em um arquivo CSV. A seguir, é exibido trechos do código com
algumas chamadas das funções e exemplos de escrita no arquivo.
1 read_con f i g_f i l e ( ) ;
2 my @f i l es_1 = ge t_ f i l e s_d i r ( $ con f i g [ 0 ] ) ;
3 my @f i l es_2 = ge t_ f i l e s_d i r ( $ con f i g [ 1 ] ) ;
4 (my $ar t i go s1 , my$desvio_art igos1 )=a r t i g o s ( $ con f i g [ 0 ] , @f i l es_1 ) ;
5 (my $ar t i go s2 , my$desvio_art igos2 )=a r t i g o s ( $ con f i g [ 1 ] , @f i l es_2 ) ;
6 (my $media_ano_pos_doc1 , my$desvio_ano_pos_doc1 )=media_ano_pos_doc
( $ con f i g [ 0 ] , @f i l e s_1 ) ;
7 (my $media_ano_pos_doc2 , my$desvio_ano_pos_doc2 )=media_ano_pos_doc
( $ con f i g [ 1 ] , @f i l e s_2 ) ;
8 (my $media_atual izacao1 , my$desvio_atual izacao1 )=media_atual izacao
( $ con f i g [ 0 ] , @f i l e s_1 ) ;
25
9 (my $media_atual izacao2 , my$desvio_atual izacao2 )=media_atual izacao
( $ con f i g [ 1 ] , @f i l e s_2 ) ;
10 #i n i c i o da e s c r i t a no arquivo
11 my $output = ' output . csv ' ;
12 open (OUTPUT, '> ' . $output ) or d i e " Impos s ive l c r i a r o arquivo de
sa ida : $output . \ n" ;
13 p r i n t OUTPUT"DATA DE DOWLOAD DOS CURRICULOS; $ con f i g [ 4 ] \ n" ;
14 p r i n t OUTPUT"REPOSITORIO;MEDIA−$con f i g [ 0 ] ; DESVIO−$con f i g [ 0 ] ;MEDIA
−$con f i g [ 1 ] ; DESVIO−$con f i g [ 1 ] \ n" ;
15 p r i n t OUTPUT"QUANTIDADE DE CURRICULOS AVALIADOS; " ; p r i n t OUTPUT
s c a l a r ( @f i l e s_1 ) ; p r i n t OUTPUT" ; " ; p r i n t OUTPUT" ; " ; p r i n t OUTPUT
s c a l a r ( @f i l e s_2 ) ; p r i n t OUTPUT" ;\ n" ;
16 p r i n t OUTPUT"MEDIA ARTIGOS PUBLICADOS; $a r t i g o s 1 ; $desv io_art igos1 ;
$ a r t i g o s 2 ; $desv io_art igos2 \n" ;
17 ANO POS−DOUTORADO; $media_ano_pos_doc1 ; $desvio_ano_pos_doc1 ;
$media_ano_pos_doc2 ; $desvio_ano_pos_doc2\n" ;
18 p r i n t OUTPUT"MEDIA DA ULTIMA ATUALIZACAO DOS CURRICULOS;
$media_atual izacao1 ; $desv io_atua l i zacao1 ; $media_atual izacao2 ;
$desv io_atua l i zacao2 \n" ;
São exibidas nas linhas 1 e 2, a chamada das funções do bloco de aquisição de
dados; da linha 3 até a linha 9, aparecem as chamadas das funções de processamento
e a partir da linha 11 começa o bloco de persistência com a criação do arquivo (out-
put.csv) e escrita de todas as métricas calculadas. A seguir, é exibido um exemplo
do arquivo de saída.
Figura 3.5: Arquivo de saída.
Para melhorar a exibição e facilitar a análise de todas as métricas foi utilizado o
Jupyter Notebook, uma aplicação web, aberta que permite que o usuário gere grá�cos
26
e transforme os dados em informações relevantes. O código desenvolvido em Python
é bem simples:
1 import numpy as np
2 import pandas as pd
3 import matp lo t l i b . pyplot as p l t
4 i npu t_ f i l e = "output . csv "
5 mydata = pd . read_csv ( input_f i l e , header=None , names=[ 'METRICA' , '
VAL1 ' , 'VAL2 ' , 'VAL3 ' , 'VAL4 ' ] , d e l im i t e r=" ; " )
6 #Drop the f i r s t l i n e
7 mydata . drop (mydata . index [ : 1 ] , i np l a c e=True )
8 f e a tu r e_s ta r t =11
9 feature_end = 44
10 f o r l i n e in range ( f ea ture_star t , feature_end ) :
11 my_value1 = round ( f l o a t (mydata . i l o c [ l i n e ] [ 'VAL1 ' ] ) , 2 )
12 my_value2 =round ( f l o a t (mydata . i l o c [ l i n e ] [ 'VAL2 ' ] ) , 2 )
13 my_value3 = round ( f l o a t (mydata . i l o c [ l i n e ] [ 'VAL3 ' ] ) , 2 )
14 my_value4 =round ( f l o a t (mydata . i l o c [ l i n e ] [ 'VAL4 ' ] ) , 2 )
15 (mydata . i l o c [ l i n e ] [ 'VAL1 ' ] ) = my_value1
16 (mydata . i l o c [ l i n e ] [ 'VAL2 ' ] ) = my_value2
17 (mydata . i l o c [ l i n e ] [ 'VAL3 ' ] ) = my_value3
18 (mydata . i l o c [ l i n e ] [ 'VAL4 ' ] ) = my_value4
19 mydata
20 # Def ine a func t i on f o r a bar p l o t
21 de f barp lo t ( x_data , y_data , error_data , x_label , y_label , t i t l e ) :
22 _, ax = p l t . subp lo t s ( )
23 # Draw bars , p o s i t i o n them in the cente r o f the t i c k mark on the
x−ax i s
24 ax . bar ( x_data , y_data , c o l o r = '#539 ca f ' , a l i g n = ' cen te r ' )
25 # Draw e r r o r bars to show standard dev iat ion , s e t l s to ' none '
26 # to remove l i n e between po in t s
27 ax . e r r o rba r ( x_data , y_data , ye r r = error_data , c o l o r = '#297083 ' ,
l s = ' none ' , lw = 2 , capth ick = 2)
28 ax . s e t_y labe l ( y_label )
29 ax . s e t_x labe l ( x_label )
27
30 ax . s e t_ t i t l e ( t i t l e )
31
32 # Cal l the func t i on to c r e a t e p l o t
33
34 f ea tu r e_s ta r t = 11
35 feature_end = 44
36 p l t . rcParams . update ({ ' f i g u r e . max_open_warning ' : 0})
37 f o r l i n e in range ( f ea ture_star t , feature_end ) :
38 my_values = [ round ( f l o a t (mydata . i l o c [ l i n e ] [ 'VAL1 ' ] ) , 2 ) , round (
f l o a t (mydata . i l o c [ l i n e ] [ 'VAL3 ' ] ) , 2 ) ]
39 barp lo t ( x_data = (mydata . i l o c [ 0 ] [ 'VAL1 ' ] , mydata . i l o c [ 0 ] [ 'VAL3 ' ] )
40 , y_data = [ round ( f l o a t (mydata . i l o c [ l i n e ] [ 'VAL1 ' ] ) , 2 ) , round (
f l o a t (mydata . i l o c [ l i n e ] [ 'VAL3 ' ] ) , 2 ) ]
41 , error_data = [ round ( f l o a t (mydata . i l o c [ l i n e ] [ 'VAL2 ' ] ) , 2 ) , round (
f l o a t (mydata . i l o c [ l i n e ] [ 'VAL4 ' ] ) , 2 ) ]
42 , y_label = ' Valor '
43 , x_label = ' '
44 , t i t l e = mydata . i l o c [ l i n e ] [ 'METRICA' ] )
45 f o r i in range ( l en (my_values ) ) :
46 p l t . t ex t ( x = i −0.4 , y = my_values [ i ] ∗ 1 . 1 , s = my_values [ i ] , s i z e
= 10)
47 p l t . show ( )
O arquivo CSV é lido e convertido em uma tabela (linha 5). Em seguida os
valores reais são arredondados com duas casas decimais e retornados para a tabela
para uma melhor exibição. Então são gerados os grá�cos relevantes para a análise
dos resultados.
Como exemplo, a seguir é exibida a tabela após o tratamento.
28
Figura 3.6: Arquivo de saída após modi�cações.
29
Capítulo 4
Testes e Resultados
O capítulo a seguir aborda os testes que foram feitos para veri�cação e correção de
bugs e falhas do programa, além dos resultados obtidos após comparar os indivíduos
do Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa em Engenharia
(COPPE) com o corpo docente da Escola Politécnica da Universidade Federal do
Rio de Janeiro (Poli).
4.1 Descrição do espaço amostral
O espaço amostral utilizado referente a base de dados do site da Poli foi retirado
do site http://www.poli.ufrj.br/professoresc.php. Segundo o portal, a Es-
cola conta com 251 pesquisadores e foram encontrados 236 currículos na plataforma
Lattes, conforme tabela B.1, localizada no Apêndice B.
Já a base da COPPE foi obtida através do site http://www.coppe.ufrj.br/
pt-br/programas. Foram incluídos apenas os docentes de pós-graduação; eméri-
tos, convidados e visitantes não �zeram parte da lista. O Instituto conta com 297
pesquisadores e foram encontrados 291 currículos na plataforma Lattes, conforme
tabela B.2.
Além disso, alguns pesquisadores dos grupos acima prestam serviço para ambas
instituições, dessa forma cerca de 119 pesquisadores prestam serviço somente para a
Poli, 174 prestam serviço somente para a COPPE e 117 prestam serviço para ambas
instituições, conforme tabela B.3, e �gura 4.1.
30
Figura 4.1: Diagrama de Venn representando os pesquisadores da Poli e da COPPE.
Os currículos foram extraídos de forma manual do portal Lattes, http://buscatextual.
cnpq.br/buscatextual/busca.do?metodo=apresentar no dia 01 de julho de 2018.
4.2 Testes
Foram realizados testes de caixa preta para veri�car a saída dos dados usando
entradas de vários tipos, estas não são escolhidas conforme a estrutura do programa.
Os testes são exibidos a seguir e são enviadas mensagens ao usuário de como proceder
para que o programa funcione corretamente.
Caso o usuário entre com informações erradas no arquivo de con�guração (con-
�g.txt), como por exemplo diretório inexistente, é retornada a seguinte mensagem:
Figura 4.2: Diretório inexistente.
31
Outro erro possível ocorre quando o usuário informa algum dos parâmetros como
'PERIOD', 'CURRENT_YEAR' ou 'LAST_UPDATE' com caracteres não numé-
ricos.
Figura 4.3: Caracteres não numéricos.
Caso o usuário não insira nenhum currículo Lattes ou caso o formato dos arquivos
não seja XML, o usuário recebe a seguinte mensagem de erro:
Figura 4.4: Diretório vazio.
Não foram realizados testes de caixa branca.
32
4.3 Resultados
Foram considerados 5 grupos para realização do trabalho: pesquisadores da COPPE
(C), pesquisadores da Poli (P), as diferenças simétricas entre os dois conjuntos ((C-
P) e (P-C)) e somente a interseção entre ambos (C&P).Foi de�nido um período de
4 anos (2015 a 2018) para extração das métricas, visto que este período abrange os
anos seguintes a última alteração de critérios de avaliação dos docentes do CT. O
programa consegue mapear apenas 2 grupos por execução, para gerar os resultados
exibidos foi feita uma manipulação do arquivo de saída para facilitar a visualização.
A seguir são exibidos alguns resultados. A lista completa de resultados para todos
os indicadores encontra-se no apêndice C.
Pode-se perceber na �gura 4.5 que pesquisadores do grupo (C-P) publicam cerca
de 5,88 vezes mais artigos do que pesquisadores do grupo (P-C). Caso o pesquisa-
dor trabalhe em ambas instituições (C&P) esse número �ca ainda maior, 6,19.Uma
possível interpretação para essa diferença pode ser a atividade �m do pro�ssional, o
primeiro sendo a pesquisa, o segundo sendo o ensino.
Figura 4.5: Média e desvio padrão de artigos publicados.
Outro ponto que pode ser observado com clareza na �gura 4.6 é a alta partici-
pação de pesquisadores do grupo (P-C) em orientações de trabalhos de conclusão
33
de cursos de graduação, cerca de 3,28 vezes maior que o grupo (C-P). Esse fato se
deve pelo motivo do primeiro grupo estar voltado majoritariamente para os cursos
de graduação; já o outro está para a pós-graduação.
Figura 4.6: Média e desvio padrão de orientações em graduação.
De modo geral pode-se perceber o desvio padrão elevado em todas as métricas.
Isso se deve a uma grande hetereogeneidade dos pesquisadores analisados. Além
disso, é assumido como fundamental a indissociação entre ensino, pesquisa e extensão
em uma universidade, mas como pode-se observar nos resultados acima esta relação
é desigual e tendenciosa para um dos lados. Com pro�ssionais adequados prestando
consultorias e propondo mudanças, pode-se chegar a um equilíbrio maior os pilares
fundamentais que compõe uma universidade.
34
Capítulo 5
Conclusão
Com o programa desenvolvido, foi possível observar alguns comportamentos dos
grupos analisados, como por exemplo, o grupo da COPPE estar mais voltado para
a pesquisa e o grupo da Poli estar mais voltado para o ensino. Com relação a
extensão, o último pilar do tripé de uma universidade, nada pode-se aferir visto que
a plataforma Lattes não possui métricas voltadas especi�camente para projetos de
extensão. Com um estudo mais aprofundado por especialistas das métricas e dos
desvios padrão informados, é possível obter muito mais informações relevantes para
a compreensão da situação da universidade.
Além disso, o arquivo de saída pode servir como ponto de partida para trabalhos
futuros que podem comparar diversos grupos, promovendo uma análise temporal
baseada em incentivos para publicações, em um curto prazo de tempo. A médio
prazo pode-se utilizar o programa para fazer uma varredura por áreas de atuação de
todas regiões do país, o que trará as maiores necessidades de investimentos por áreas.
Pensando ainda em um longo prazo e com todos os currículos dos pesquisadores do
país, pode-se utilizar ferramentas de Big Data para gerar ainda mais informações
não observadas cruzando os dados com universidades de outros países.
Conclui-se então, que a escolha da ferramenta CompLates para a resolução do
problema de cálculo de métricas por grupos, assim como seu uso foram pertinentes
e podem trazer diversos benefícios para o meio acadêmico.
35
Referências Bibliográ�cas
[1] MENA-CHALCO, J. P., CESAR JUNIOR, R. M., �ScriptLattes: an open-
source knowledge extraction system from the Lattes platform�, Journal of the
Brazilian Computer Society, v. 15, pp. 31 � 39, 12 2009.
[2] MENA-CHALCO, J. P., CESAR JUNIOR,
R. M., http://scriptlattes.sourceforge.net/exemplo/teste-
02/grafoDeColaboracoes.html, 2018, (Acessado: 21-04-2018).
[3] �Painel Estatístico Lattes�, http://estatico.cnpq.br/painelLattes/
comparacao/, (Acessado: 30-04-2018).
[4] LUZ, F. F., WASSERMANN, R., Consulta a ontologias em língua portuguesa
através do português controlado. Ph.D. dissertation, Master's thesis, Computer
Science Department, University of Sao Paulo, 2012.
[5] GALEGO, E. F., Extração e consulta de informações do Currículo Lattes ba-
seada em ontologias. Ph.D. dissertation, Universidade de São Paulo, 2013.
[6] ALVES, A., YANASSE, H., SOMA, N., �LattesMiner: uma linguagem de domí-
nio especí�co para extração automática de informações da Plataforma Lattes�.
In: Workshop de Computação Aplicada, v. 12, 2012.
[7] JUNIOR, D., Guia de Conulta Rápida Perl. Novatec, 2000.
[8] �Monogra�as da Escola Politecnica�, http://monografias.poli.ufrj.br/,
(Acessado: 08-06-2018).
[9] �IM2C - Material da disciplina Metodologia da Pesquisa�, http://www.im2c.
poli.ufrj.br/members/fmello/metodologiapesq.html/, (Acessado: 09-04-
2018).
36
[10] �Jupyter Notebook �, http://http://jupyter.org//, (Acessado: 18-07-2018).
[11] �CPAN - Comprehensive Perl Archive Network �, https://www.cpan.org//,
(Acessado: 15-05-2018).
[12] �ActiveState - Active Perl �, https://www.activestate.com/activeperl//,
(Acessado: 02-06-2018).
37
Apêndice A
Tabela com as funções do programa
Tabela A.1: Tabela com as funções do programa
Nome da função Entrada Saída Objetivo
read_con�g_�le �
Vetor @con�g
[0] = Diretório 1
[1] = Diretório 2
[3] = Período
[4] = Ano atual
[5] = Ult. atualização
Ler o arquivo
de con�guração
con�g.txt
get_�les_dirValor com o
diretório
Vetor @�les com
todos os arquivos
que serão analisados
Buscar todos os
nomes dos
arquivos no
diretório
informado
qtd_graduados
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Número de
currículos com
graduação
Calcular o
número de
pesquisadores
com graduação
em cada
diretório
38
media_ano_grad
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
em anos
de conclusão
da graduação
Calcular a
média de anos
de conclusão
da graduação
qtd_mestres
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Número de
currículos com
mestrado em cada
diretório
Calcular o
número de
currículos com
mestrado em
cada diretório
media_ano_mest
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
em anos
de conclusão
do mestrado
Calcular a
média de anos
de conclusão
do mestrado
qtd_doutores
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Número de
currículos com
doutorado em cada
diretório
Calcular o
número de
currículos com
doutorado em
cada diretório
39
media_ano_dout
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
em anos
de conclusão
do doutorado
Calcular a
média de anos
de conclusão
do doutorado
media_ano_pos_doc
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
em anos
de conclusão
do pós-doutorado
Calcular a
média de anos
de conclusão
do
pós-doutorado
media_atualizacao
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
da última
atualização dos
currículos
Calcular a
média da
última
atualização dos
currículos
media_inicio_ufrj
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
de anos da 1a
atuação na UFRJ
Calcular a
média de anos
da 1a atuação
na UFRJ
40
media_outras_instituicoes
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
de trabalho em
outras instituições
dentro do período
informado
Calcular a
média de
trabalho em
outras
instituições
dentro do
período
informado
media_pesquisas
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
de projetos de
pesquisa
dentro do período
informado
Calcular a
média de
projetos de
pesquisa
dentro do
período
informado
media_desenvolvimento
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
em projetos de
desenvolvimento
dentro do período
informado
Calcular a
média dos
projetos de
desenvolvimento
dentro do
período
informado
41
media_editorial
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
do número de
participações como
membro de corpo
editorial
dentro do período
informado
Calcular a
média do
número de
participações
como membro
de corpo
editorial
dentro do
período
informado
media_revisor
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
do número de
participações como
revisor de
periódico
dentro do período
informado
Calcular a
média do
número de
participações
como revisor
de periódico
dentro do
período
informado
premiosetitulos
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
do número de
prêmios e títulos
dentro do período
informado
Calcular a
média do
número de
prêmios e
títulos
dentro do
período
informado
42
artigos
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
do número de
artigos publicados
dentro do período
informado
Calcular a
média do
número de
artigos
publicados
dentro do
período
informado
livros
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
do número de
livros publicados
dentro do período
informado
Calcular a
média do
número de
livros
publicados
dentro do
período
informado
capitulos
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
do número de
capítulos publicados
dentro do período
informado
Calcular a
média do
número de
capítulos
publicados
dentro do
período
informado
43
textos
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
do número de
textos publicados
dentro do período
informado
Calcular a
média do
número de
textos
publicados
dentro do
período
informado
trabalhos
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
do número de
trabalhos publicados
dentro do período
informado
Calcular a
média do
número de
trabalhos
publicados
dentro do
período
informado
resumos
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
do número de
resumos publicados
dentro do período
informado
Calcular a
média do
número de
resumos
publicados
dentro do
período
informado
44
expandidos
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
do número de
resumos expandidos
publicados
dentro do período
informado
Calcular a
média do
número de
resumos
expandidos
publicados
dentro do
período
informado
outras
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
do número de
outras produções
bibliográ�cas
publicadas
dentro do período
informado
Calcular a
média do
número de
outras produções
bibliográ�cas
publicadas
dentro do
período
informado
mestrados
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
de participação
em bancas de
mestrado dentro
do período
informado
Calcular a
média de
participação em
bancas de
mestrado dentro
do período
informado
45
doutorados
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
de participação
em bancas de
doutorado dentro
do período
informado
Calcular a
média de
participação em
bancas de
doutorado dentro
do período
informado
quali�c_dout
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
de participação
em bancas de
exame de
quali�cação de
doutorado dentro
do período
informado
Calcular a
média de
participação em
bancas de
exame de
quali�cação de
doutorado dentro
do período
informado
part_cursos
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
de participação
em bancas de
especialização
dentro
do período
informado
Calcular a
média de
participação
em bancas de
especialização
dentro do
período
informado
46
part_graduacao
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
de participação
em bancas de
graduação
dentro
do período
informado
Calcular a
média de
participação
em bancas de
graduação
dentro do
período
informado
part_conc_pub
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
de participação
em bancas
julgadoras de
concurso público
dentro do período
informado
Calcular a
média de
participação
em bancas
julgadoras de
concurso
público
dentro do
período
informado
part_outros_conc
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
de participação
em outras bancas
julgadoras
dentro do período
informado
Calcular a
média de
participação
em outras
bancas
julgadoras
dentro do
período
informado
47
part_congr
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
de participação
em congressos
dentro do período
informado
Calcular a
média de
participação
em congressos
dentro do
período
informado
part_simposio
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
de participação
em simpósios
dentro do período
informado
Calcular a
média de
participação
em simpósios
dentro do
período
informado
part_seminario
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
de participação
em seminários
dentro do período
informado
Calcular a
média de
participação
em seminários
dentro do
período
informado
part_encontro
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
de participação
em encontros
dentro do período
informado
Calcular a
média de
participação
em encontros
dentro do
período
informado
48
part_o�cina
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
de participação
em o�cinas
dentro do período
informado
Calcular a
média de
participação
em o�cinas
dentro do
período
informado
part_outros_eventos
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
de participação
em outros eventos
dentro do período
informado
Calcular a
média de
participação
em outros
eventos
dentro do
período
informado
org_eventos
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
de organização
de eventos
dentro do período
informado
Calcular a
média de
organização
de eventos
dentro do
período
informado
ori_mestrado
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
de orientações
de mestrado
dentro do período
informado
Calcular a
média de
orientações de
mestrado
dentro do
período
informado
49
ori_doutorado
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
de orientações
de doutorado
dentro do período
informado
Calcular a
média de
orientações de
doutorado
dentro do
período
informado
ori_aperfeicoamento
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
de orientações
de aperfeiçoamentos
ou especializações
dentro do período
informado
Calcular a
média de
orientações de
aperfeiçoamentos
ou especializações
dentro do período
informado
ori_graduacao
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
de orientações
de graduação
dentro do período
informado
Calcular a
média de
orientações de
graduação
dentro do
período
informado
ori_iniciacao
Vetor
@con�g com
os diretórios
e vetor
@�les com o
nome dos
arquivos
Valor com a média
de orientações
de iniciação
cientí�ca dentro do
período informado
Calcular a
média de
orientações de
iniciação
cientí�ca
dentro do
período
informado
50
Apêndice B
Tabelas com os pesquisadores
analisados
Tabela B.1: Pesquisadores da Poli
Achilles Junqueira Bourdot Dutra Antonio Lopes de Souza
Ademir Xavier da Silva Antonio MacDowell de Figueiredo
Adriano Proenca Antonio Petraglia
Afonso Augusto Magalhaes de Araujo Aquilino Senra Martinez
Afonso de Moraes Paiva Armando Carlos de Pina Filho
Albino Jose Kalab Leiroz Armando Celestino Goncalves Neto
Alessandra Conde de Freitas Assed Naked Haddad
Alessandro da Cruz Goncalves Atila Pantaleao Silva Freire
Alessandro Jacoud Peixoto Beatriz de Souza Leite Pires de Lima
Alexandre Teixeira de Pinho Alho Bruno Fonseca Monteiro
Amarildo da Cruz Fernandes Bruno Martins Jacovazzo
Ana Catarina Jorge Evangelista Camilo Michalka Junior
Andre Assis Salles Carl Horst Albrecht
Angela Maria Gabriella Rossi Carlos Antonio Levi da Conceicao
Antonio Carlos Marques Alvim Carlos Fernando Teodosio Soares
Antonio Carlos Moreirao de Queiroz Carlos Jose Ribas D'Avila
Antonio Carlos Siqueira de Lima Carmen Lucia Tancredo Borges
51
Carolina Palma Naveira Cotta Fernando Pereira Duda
Celio Albano da Costa Neto Fernando Rodrigues Lima
Claudia do Rosario Vaz Morgado Flavia Moll de Souza Judice
Claudia Ribeiro Eboli Flavio de Marco Filho
Claudio Alexis Rodriguez Castillo Flavio Luis de Mello
Daniel Alves Castello Floriano Carlos Martins Pires Junior
Daniel Onofre de Almeida Cruz Gilberto Bruno Ellwanger
Delson Braz Gilberto Olympio Mota Fialho
Dilson Silva dos Santos Giovani Manso Avila
Edilberto Strauss Gisele Silva Barbosa
Edison Renato Pereira da Silva Gustavo Cesar Rachid Bodstein
Eduardo Antonio Barros da Silva Helcio Rangel Barreto Orlande
Eduardo de Miranda Batista Heloisa Teixeira Firmo
Eduardo Galvao Moura Jardim Henrique Innecco Longo
Eduardo Gomes Dutra do Carmo Heraldo Luis Silveira de Almeida
Eduardo Goncalves Serra Hostilio Xavier Ratton Neto
Eduardo Linhares Qualharini Ibrahim Abd El Malik Shehata
Eduardo Vieira Leao Nunes Iene Christie Figueiredo
Elaine Garrido Vazquez Ilson Paranhos Pasqualino
Elkin Ferney Rodriguez Velandia Inaya Correa Barbosa Lima
Enrique Mariano Castrodeza Isaac Volschan Junior
Ericksson Rocha e Almendra Jean David Job Emmanuel Marie Caprace
Fabio Luiz Zamberlan Joao Carlos dos Santos Basilio
Fabricio Nogueira Correa Joao da Cruz Payao Filho
Fernando Alves Rochinha Joarez Bastos Monteiro
Fernando Antonio Pinto Baruqui Jomar Gozzi
Fernando Artur Brasil Danziger Jorge dos Santos
Fernando Augusto de Noronha Castro Pinto Jorge Henrique Alves Prodano�
Fernando Carvalho da Silva Jorge Luiz do Nascimento
Fernando Cesar Lizarralde Jose Antonio Carlos Canedo Medeiros
Fernando Gil Vianna Resende Junior Jose Antonio da Cunha Ponciano Gomes
52
Jose Arthur da Rocha Luis Guilherme Barbosa Rolim
Jose Augusto Nogueira Kamel Luis Henrique Maciel Kosmalski Costa
Jose Carlos de Oliveira Luis Marcelo Marques Tavares
Jose de Jesus Rivero Oliva Luis Otavio Cocito de Araujo
Jose Gabriel Rodriguez Carneiro Gomes Luiz Antonio Vaz Pinto
Jose Henrique Sanglard Luiz Carlos Pereira
Jose Herskovits Norman Luiz Eduardo Azambuja Sauerbronn
Jose Luis Lopes da Silveira Luiz Felipe Assis
Jose Luis Menegotto Luiz Henrique de Almeida
Jose Luiz da Silva Neto Luiz Roberto Martins de Miranda
Jose Manoel de Seixas Luiz Wagner Pereira Biscainho
Jose Marcio do Amaral Vasconcellos Manuel Ernani de Carvalho Cruz
Jose Miguel Bendrao Saldanha Marcelo Amorim Savi
Jose Orlando Gomes Marcelo Borges Mansur
Jose Renato Mendes de Sousa Marcelo de Almeida Santos Neves
Jose Roberto Ribas Marcelo Gomes Miguez
Jose Stockler Canabrava Filho Marcelo Igor Lourenco de Souza
Juan Carlos Garcia de Blas Marcelo Jose Colaco
Jules Ghislain Slama Marcelo Luiz Drumond Lanza
Juliana Braga Rodrigues Loureiro Marcelo Martins Werneck
Julio Cesar Boscher Torres Marcio Nogueira de Souza
Katia Monte Chiari Dantas Marco Antonio Bayout Alvarenga
Klitia Valeska Bicalho de Sa Marcos Barreto de Mendonca
Lavinia Maria Sanabio Alves Borges Marcos Vicente de Brito Moreira
Leandro Torres Di Gregorio Maria Alice Ferruccio da Rocha
Leonardo De Bona Becker Maria Cascao Ferreira de Almeida
Lilian Kawakami Carvalho Maria Cristina Moreira Alves
Lino Guimaraes Marujo Mariane Rembold Petraglia
Lucio Sathler Markus Vinicius Santos Lima
Luis Armando Queiroz de Araujo Marta Cecilia Tapia Reyes
Luis Felipe Magalhaes de Moraes Marysilvia Ferreira
53
Maura Lucia Montella de Carvalho Ricardo Ferreira de Mello
Mauricio Aredes Ricardo Manfredi Naveiro
Mauricio Ehrlich Ricardo Merched
Max Suell Dutra Ricardo Rhomberg Martins
Michele Schubert Pfeil Ricardo Tadeu Lopes
Miguel Elias Mitre Campista Ricardo Valeriano Alves
Milena Bodmer Richard David Schachter
Monica Maria Pena Richard Magdalena Stephan
Monica Pertel Roberto Machado Correa
Murilo Augusto Vaz Roberto Schirru
Nilson Costa Roberty Robson Francisco da Silva Dias
Nisio de Carvalho Lobo Brum Rodrigo Magalhaes de Carvalho
Oscar Rosa Mattos Roney Leon Thompson
Otto Carlos Muniz Bandeira Duarte Rosane Martins Alves
Oumar Diene Rossana Mara da Silva Moreira Thire
Paula Farencena Viero Rubens de Andrade Junior
Paula Mendes Jardim Samuel Jurkiewicz
Paulo Cesar Colonna Rosman Sandra Oda
Paulo Cesar Martins Ribeiro Sebastiao Ercules Melo de Oliveira
Paulo Couto Sergio Alvaro de Souza Camargo Junior
Paulo de Tarso Themistocles Esperanca Sergio Exel Goncalves
Paulo Emilio Valadao de Miranda Sergio Hamilton Sphaier
Paulo Fernando Ferreira Frutuoso e Melo Sergio Hampshire de Carvalho Santos
Paulo Renato Diniz Junqueira Barbosa Sergio Lima Netto
Paulo Sergio Ramirez Diniz Sergio Palma da Justa Medeiros
Protasio Dutra Martins Filho Sergio Sami Hazan
Renata Antoun Simao Severino Fonseca da Silva Neto
Renato Florido Cameira Sidney Lianza
Renato Machado Cotta Silvia Corbani
Respicio Antonio do Espirito Santo Junior Silvio Carlos Anibal de Almeida
Ricardo Eduardo Musa�r Silvio de Souza Lima
54
Su Jian Thiago Gamboa Ritto
Susana Beatriz Vinzon Vinicius Carvalho Cardoso
Suzana Gueiros Teixeira Virgilio Jose Martins Ferreira Filho
Sylvio Jose Ribeiro de Oliveira Virgilio Noronha Ribeiro da Cruz
Tarcisio Luiz Coelho de Castro Vitor Ferreira Romano
Tatiana Mariano Lessa de Assis Wallace Alves Martins
Theophilo Benedicto Ottoni Filho Walter Arno Mannheimer
Thereza Cristina Nogueira de Aquino Walter Issamu Suemitsu
Tabela B.2: Pesquisadores da COPPE
Abilio Pereira de Lucena Filho Ana Regina Cavalcanti da Rocha
Achilles Junqueira Bourdot Dutra Andre Frossard Pereira de Lucena
Ademir Xavier da Silva Andressa dos Santos Nicolau
Adriana da Cunha Rocha Angela Maria Cohen Uller
Afonso Celso Del Nero Gomes Anna Carla Monteiro de Araujo
Afonso de Moraes Paiva Anna Laura Lopes da Silva Nunes
Alberto Claudio Habert Antonio Carlos Fernandes
Albino Jose Kalab Leiroz Antonio Carlos Ferreira
Alessandra Magrini Antonio Carlos Marques Alvim
Alessandro da Cruz Goncalves Antonio Carlos Moreirao de Queiroz
Alessandro Jacoud Peixoto Antonio Carlos Siqueira de Lima
Alexandre de Assis Bento Lima Antonio Carneiro de Mesquita Filho
Alexandre Goncalves Evsuko� Antonio Giannella Neto
Alexandre Landesmann Antonio MacDowell de Figueiredo
Alexandre Salem Szklo Antonio Mauricio Ferreira Leite M. de Sa
Alexandre Visintainer Pino Antonio Petraglia
Alvaro Luiz Gayoso de A. Coutinho Aquilino Senra Martinez
Alysson Roncally Silva Carvalho Argimiro Resende Secchi
Amaro Olimpio Pereira Junior Atila Pantaleao Silva Freire
Amit Bhaya Beatriz de Souza Leite Pires de Lima
55
Bianca de Carvalho Pinheiro Edilson Fernandes de Arruda
Bluma Guenther Soares Edmundo A. de Souza e Silva
Breno Pinheiro Jacob Edson Hirokazu Watanabe
Carla Martins Cipolla Eduardo Antonio Barros da Silva
Carlos Antonio Levi da Conceicao Eduardo de Miranda Batista
Carlos Eduardo Parente Ribeiro Eduardo de Moraes Rego Fairbairn
Carlos Eduardo Pedreira Eduardo Gomes Dutra do Carmo
Carlos Fernando Teodosio Soares Eduardo Vieira Leao Nunes
Carlos Julio Tierra Criollo Elizabete Fernandes Lucas
Carlos Magluta Elton Fernandes
Carmen Lucia Tancredo Borges Emilio Lebre La Rovere
Carolina Palma Naveira Cotta Enrique Mariano Castrodeza
Celina Miraglia H. de Figueiredo Fabiano Lopes Thompsom
Celio Albano da Costa Neto Fabio Souza Toniolo
Claudia Maria Lima Werner Fabricio Nogueira Correa
Claudio Alexis Rodriguez Castillo Felipe Maia Galvao Franca
Claudio Esperanca Fernando Alves Rochinha
Claudio Fernando Mahler Fernando Antonio Pinto Baruqui
Claudio Freitas Neves Fernando Artur Brasil Danziger
Claudio Luis Amorim Fernando Augusto de N. Castro Pinto
Claudio Luiz Barauna Vieira Fernando Carvalho da Silva
Cristiano Piacsek Borges Fernando Cesar Lizarralde
Daniel Alves Castello Fernando Gil Vianna Resende Junior
Daniel Andres Rodriguez Fernando Luiz Bastos Ribeiro
Daniel Onofre de Almeida Cruz Fernando Pereira Duda
Daniel Ratton Figueiredo Flavio Fonseca Nobre
David Alves Castelo Branco Floriano Carlos Martins Pires Junior
Delson Braz Franciane Conceicao Peters
Dilson Silva dos Santos Francisco Antonio de Moraes A. Doria
Djalma Mosqueira Falcao Francisco de Rezende Lopes
Domicio Proenca Junior Francisco Jose Casanova de O. e Castro
56
Francisco Jose de Castro M. Duarte Joao Paulo Bassin
Francisco Thiago Sacramento Aragao Jorge Lopes de Souza Leao
Franklin de Lima Marquezino Jose Antonio Carlos Canedo Medeiros
Frederico Caetano J. de A. Tavares Jose Antonio da Cunha Ponciano Gomes
Frederico de Araujo Kronemberger Jose Antonio Fontes Santiago
Frederico Wanderley Tavares Jose Carlos Costa da Silva Pinto
Gabriela Ribeiro Pereira Jose Claudio de Faria Telles
Geraldo Bonorino Xexeo Jose de Jesus Rivero Oliva
Geraldo Wilson Junior Jose Ferreira de Rezende
Geraldo Zimbrao da Silva Jose Gabriel Rodriguez Gomes
Gerson Zaverucha Jose Luis Drummond Alves
Gilberto Bruno Ellwanger Jose Luis Lopes da Silveira
Glauco Nery Taranto Jose Paulo Soares de Azevedo
Glaydston Mattos Ribeiro Juan Bautista Villa Wanderley
Guilherme Horta Travassos Juan Carlos Garcia de Blas
Gustavo Cesar Rachid Bodstein Juan Pablo Cajahuanca Luna
Helcio Rangel Barreto Orlande Jules Ghislain Slama
Helen Conceicao Ferraz Juliana Braga Rodrigues Loureiro
Henrique Luiz Cukierman Julio Cesar Boscher Torres
Hostilio Xavier Ratton Neto Julio Cesar Ramalho Cyrino
Ian Schumann Marques Martins Jurandir Nadal
Ilson Paranhos Pasqualino Karen Caino de Oliveira Salim
Inaya Correa Barbosa Lima Laura Maria Goretti da Motta
Isabel Cristina P. Margarit-Mattos Laura Silvia Bahiense da Silva Leite
Jano Moreira de Souza Lavinia Maria Sanabio Alves Borges
Jean David Job E. Marie Caprace Leda dos Reis Castilho
Jerson Kelman Licinio da Silva Portugal
Joao Baptista de O. e Souza Filho Lilian Fernandes de Oliveira
Joao Carlos dos Santos Basilio Lilian Kawakami Carvalho
Joao Carlos Machado Luciana Spinelli Ferreira
Joao da Cruz Payao Filho Luciano Luporini Menegaldo
57
Lucio Guido Tapia Carpio Marcos Nicolas Gallo
Luis Felipe Magalhaes de Moraes Marcos Vicente de Brito Moreira
Luis Guilherme Barbosa Rolim Marcus Vinicius de Araujo Fonseca
Luis Henrique Maciel K. Costa Maria Aguieiras Alvarez de Freitas
Luis Marcelo Marques Tavares Maria Aparecida Cavalcanti Netto
Luis Volnei Sudati Sagrilo Maria Claudia Barbosa
Luiz Carlos Pereira Mariane Rembold Petraglia
Luiz Gallisa Guimaraes Mario Cesar Rodriguez Vidal
Luiz Henrique de Almeida Mario Jorge Ferreira de Oliveira
Luiz Landau Mario Roberto Folhadela Benevides
Luiz Wagner Pereira Biscainho Marta Lima de Queiros Mattoso
Manuel Ernani de Carvalho Cruz Marysilvia Ferreira
Marcelino Aurelio Vieira da Silva Mauricio Aredes
Marcelo Amorim Savi Mauricio Cagy
Marcelo Borges Mansur Mauricio Ehrlich
Marcelo de Almeida Santos Neves Mauricio Tiomno Tolmasquim
Marcelo Gomes Miguez Max Suell Dutra
Marcelo Igor Lourenco de Souza Michele Schubert Pfeil
Marcelo Jose Colaco Miguel Elias Mitre Campista
Marcelo Martins Werneck Murilo Augusto Vaz
Marcia Helena Costa Fampa Nair Maria Maia de Abreu
Marcia Rosana Cerioli Nelson Francisco Favilla Ebecken
Marcia Walquiria de Carvalho Dezotti Nelson Violante de Carvalho
Marcio de Almeida D'Agosto Nestor Alberto Zouain Pereira
Marcio de Souza Soares de Almeida Nilson Costa Roberty
Marcio Nele de Souza Nisio de Carvalho Lobo Brum
Marcio Nogueira de Souza Oscar Rosa Mattos
Marco Antonio von Kruger Otto Carlos Muniz Bandeira Duarte
Marco Aurelio dos Santos Otto Correa Rotunno Filho
Marcos Aurelio V. de Freitas Oumar Diene
Marcos do Couto B. Cavalcanti Papa Matar Ndiaye
58
Paula Mendes Jardim Robson Francisco da Silva Dias
Paulo Augusto Veloso Rodrigo Magalhaes de Carvalho
Paulo Cesar Colonna Rosman Romildo Dias Toledo Filho
Paulo Cezar Martins Ribeiro Romulo Dante Orrico Filho
Paulo Couto Ronaldo Balassiano
Paulo de Tarso T. Esperanca Roney Leon Thompson
Paulo Emilio Valadao de Miranda Rosa Maria Meri Leao
Paulo Fernando Ferreira F. e Melo Rosimary Terezinha de Almeida
Paulo Laranjeira da Cunha Lage Rossana Mara da Silva Moreira Thire
Paulo Roma Cavalcanti Rubem Pinto Mondaini
Jose Manoel de Seixas Rubens de Andrade Junior
Paulo Sergio Ramirez Diniz Samuel Jurkiewicz
Pedro Bracannot Velloso Segen Farid Estefen
Priamo Albuquerque Melo Junior Sergio Alvaro de Souza Camargo Jr.
Raad Yahya Qassim Sergio Lima Netto
Rafaella Martins Ribeiro Su Jian
Ramon Romankevicius Costa Sulamita Klein
Renan Moritz Varnier R. de Almeida Susana Beatriz Vinzon
Renata Antoun Simao Susana Scheimberg de Makler
Renato Machado Cotta Suzana Kahn Ribeiro
Renato Nascimento Elias Tatiana Mariano Lessa de Assis
Ricardo Eduardo Musa�r Theodoro Antoun Netto
Ricardo Guerra Marroquim Thiago Gamboa Ritto
Ricardo Manfredi Naveiro Tiago Albertini Balbino
Ricardo Merched Tito Livio Moitinho Alves
Ricardo Tadeu Lopes Toacy Cavalcante de Oliveira
Richard Magdalena Stephan Valmir Carneiro Barbosa
Roberto dos Santos B. Junior Vera Maria Martins Salim
Roberto Macoto Ichinose Victor Luis dos Santos T. da Silva
Roberto Schae�er Virgilio Jose Martins Ferreira Filho
Roberto Schirru Wagner Coelho de A. Pereira
59
Wallace Alves Martins Webe Joao Mansur
Walter I. Suemitsu
Tabela B.3: Pesquisadores da COPPE e Poli
Achilles Junqueira Bourdot Dutra Eduardo Gomes Dutra do Carmo
Ademir Xavier da Silva Eduardo Vieira Leao Nunes
Afonso de Moraes Paiva Enrique Mariano Castrodeza
Albino Jose Kalab Leiroz Fabricio Nogueira Correa
Alessandro da Cruz Goncalves Fernando Alves Rochinha
Alessandro Jacoud Peixoto Fernando Antonio Pinto Baruqui
Antonio Carlos Marques Alvim Fernando Artur Brasil Danziger
Antonio Carlos Moreirao de Queiroz Fernando Augusto de N. Castro Pinto
Antonio Carlos Siqueira de Lima Fernando Carvalho da Silva
Antonio MacDowell de Figueiredo Fernando Cesar Lizarralde
Antonio Petraglia Fernando Gil Vianna Resende Junior
Aquilino Senra Martinez Fernando Pereira Duda
Atila Pantaleao Silva Freire Floriano Carlos Martins Pires Junior
Beatriz de Souza Leite P.de Lima Gilberto Bruno Ellwanger
Carlos Antonio Levi da Conceicao Gustavo Cesar Rachid Bodstein
Carlos Fernando Teodosio Soares Helcio Rangel Barreto Orlande
Carmen Lucia Tancredo Borges Hostilio Xavier Ratton Neto
Carolina Palma Naveira Cotta Ilson Paranhos Pasqualino
Celio Albano da Costa Neto Inaya Correa Barbosa Lima
Claudio Alexis Rodriguez Castillo Jean David Job E. Marie Caprace
Daniel Alves Castello Joao Carlos dos Santos Basilio
Daniel Onofre de Almeida Cruz Joao da Cruz Payao Filho
Delson Braz Jose Antonio Carlos C. Medeiros
Dilson Silva dos Santos Jose Antonio da Cunha P. Gomes
Eduardo Antonio Barros da Silva Jose de Jesus Rivero Oliva
Eduardo de Miranda Batista Jose Luis Lopes da Silveira
60
Jose Manoel de Seixas Murilo Augusto Vaz
Juan Carlos Garcia de Blas Nilson Costa Roberty
Jules Ghislain Slama Nisio de Carvalho Lobo Brum
Juliana Braga Rodrigues Loureiro Oscar Rosa Mattos
Julio Cesar Boscher Torres Otto Carlos Muniz Bandeira Duarte
Lavinia Maria Sanabio Alves Borges Oumar Diene
Lilian Kawakami Carvalho Paula Mendes Jardim
Luis Felipe Magalhaes de Moraes Paulo Cesar Colonna Rosman
Luis Guilherme Barbosa Rolim Paulo Couto
Luis Henrique Maciel K. Costa Paulo de Tarso T. Esperanca
Luis Marcelo Marques Tavares Paulo Emilio Valadao de Miranda
Luiz Carlos Pereira Paulo Fernando Ferreira F. e Melo
Luiz Henrique de Almeida Paulo Sergio Ramirez Diniz
Luiz Wagner Pereira Biscainho Renata Antoun Simao
Manuel Ernani de Carvalho Cruz Renato Machado Cotta
Marcelo Amorim Savi Ricardo Eduardo Musa�r
Marcelo Borges Mansur Ricardo Manfredi Naveiro
Marcelo de Almeida Santos Neves Ricardo Merched
Marcelo Gomes Miguez Ricardo Tadeu Lopes
Marcelo Igor Lourenco de Souza Richard Magdalena Stephan
Marcelo Jose Colaco Roberto Schirru
Marcelo Martins Werneck Robson Francisco da Silva Dias
Marcio Nogueira de Souza Rodrigo Magalhaes de Carvalho
Marcos Vicente de Brito Moreira Roney Leon Thompson
Mariane Rembold Petraglia Rossana Mara da Silva M. Thire
Marysilvia Ferreira Rubens de Andrade Junior
Mauricio Aredes Samuel Jurkiewicz
Mauricio Ehrlich Sergio Lima Netto
Max Suell Dutra Su Jian
Michele Schubert Pfeil Susana Beatriz Vinzon
Miguel Elias Mitre Campista Tatiana Mariano Lessa de Assis
61
Thiago Gamboa Ritto Wallace Alves Martins
Virgilio Jose Martins Ferreira Filho
62
Apêndice C
Resultados complementares
Tabela C.1: Resultados COPPE e Poli
DATA DE DOWLOAD
DOS CURRICULOS01/07/2018
REPOSITÓRIOMEDIA-
./COPPE
DESVIO
./COPPE
MEDIA
./POLI
DESVIO
./POLI
QUANTIDADE DE
CURRICULOS
AVALIADOS
291 236
MEDIA DA ULTIMA
ATUALIZACAO
DOS CURRICULOS*
01/03/2018 296.65 11/07/2017 730.50
QUANTIDADE DE
PROFISSIONAIS
COM GRADUAÇÃO
290 233
QUANTIDADE DE
PROFISSIONAIS
COM MESTRADO
280 228
QUANTIDADE DE
PROFISSIONAIS
COM DOUTORADO
288 228
63
MEDIA ANO
GRADUACAO1984 10.51 1985 10.05
MEDIA ANO
MESTRADO1988 10.28 1990 9.98
MEDIA ANO
DOUTORADO1995 9.24 1997 8.87
MEDIA ANO
POS-DOUTORADO2002 8.25 2003 8.74
MEDIA ANO
INICIO UFRJ1995 11.75 1994 11.07
MEDIA TRABALHO
EM OUTRAS
INSTITUICOES
0.25 0.62 0.25 0.68
MEDIA DE
PROJETOS DE
PESQUISA
1.54 2.63 1.26 2.56
MEDIA DE
PROJETOS DE
DESENVOLVIMENTO
0.22 0.83 0.28 1.35
MEDIA DE NUMERO DE
PARTICIPACOES COMO
MEMBRO DO CORPO
EDITORIAL
0.21 0.56 0.17 0.52
MEDIA DE NUMERO DE
PARTICIPACOES COMO
REVISOR DE PERIODICO
1.39 3.42 0.99 2.56
MEDIA TITULOS
E PREMIOS1.02 1.86 0.86 1.72
MEDIA ARTIGOS
PUBLICADOS9.97 16.2 5.93 16.03
64
MEDIA LIVROS
PUBLICADOS
/ORGANIZADOS
OU EDICOES
0.57 4.79 0.17 0.53
MEDIA CAPITULOS DE
LIVROS PUBLICADOS0.8 1.6 0.56 1.31
MEDIA TEXTOS
EM JORNAIS
DE NOTICIAS/REVISTAS
0.25 1.37 0.14 1.1
MEDIA TRABALHOS
COMPLETOS PUBLICADOS
EM ANAIS DE CONGRESSOS
8.7 9.1 6.69 8.2
MEDIA RESUMOS
PUBLICADOS EM ANAIS
DE CONGRESSOS
1.25 3.97 0.68 2.45
MEDIA RESUMOS
EXPANDIDOS PUBLICADOS
EM ANAIS DE CONGRESSOS
0.83 2.56 0.34 1.57
MEDIA OUTRAS
PRODUCOES
BIBLIOGRAFICAS
0.13 0.69 0.14 0.69
MEDIA PARTICIPACAO EM
BANCAS DE MESTRADO3.73 5.14 3.33 4.94
MEDIA PARTICIPACAO EM
TESES DE DOUTORADO2.85 3.99 1.5 2.79
MEDIA PARTICIPACAO EM
BANCA DE EXAME
DE QUALIFICACAO
(DOUTORADO)
3.53 5.75 2.1 4.15
65
MEDIA PARTICIPACAO EM
MONOGRAFIAS DE CURSOS
DE APERFEICOAMENTO/
ESPECIALIZACAO
0.21 1.93 1.12 12.54
MEDIA PARTICIPACAO EM
BANCA DE GRADUACAO1.7 3.51 4.39 8.45
MEDIA PARTICIPACAO
EM BANCA
CONCURSO PUBLICO
0.33 0.68 0.42 0.82
MEDIA PARTICIPACAO EM
OUTRAS BANCAS
DE CONCURSO
0.55 2.71 0.33 2.35
MEDIA PARTICIPACAO EM
CONGRESSOS1.16 2.43 1.24 2.66
MEDIA PARTICIPACAO EM
SIMPOSIOS0.28 0.9 0.34 1.08
MEDIA PARTICIPACAO EM
SEMINARIOS0.33 1.34 0.37 1.37
MEDIA PARTICIPACAO EM
ENCONTROS0.34 1.21 0.33 1.08
MEDIA PARTICIPACAO EM
OFICINAS0.16 1.03 0.08 0.43
MEDIA PARTICIPACAO EM
OUTROS EVENTOS0.27 1.83 0.17 0.78
MEDIA ORGANIZACAO
DE EVENTOS0.84 2.36 0.56 1.86
MEDIA ORIENTACAO
DE MESTRADO4.79 4.69 3.18 3.76
MEDIA ORIENTACAO
DE DOUTORADO2.62 3.02 1.28 2.17
66
MEDIA ORIENTACAO DE
MONOGRAFIA DE
CONCLUSAO DE CURSO
DE APERFEICOAMENTO
/ESPECIALIZACAO
0.22 1.67 0.92 4.31
MEDIA ORIENTACAO DE
TRABALHO DE CONCLUSAO
DE CURSO DE GRADUACAO
2.3 3.15 4.07 5.91
MEDIA ORIENTACAO
DE INICIACAO CIENTIFICA1.86 4.93 1.89 5.02
*desvio padrão em dias
Tabela C.2: Resultados - (COPPE-Poli) e (Poli-COPPE)
DATA DE DOWLOAD
DOS CURRICULOS01/07/2018
REPOSITÓRIO
MEDIA
./COPPE
-POLI
DESVIO
./COPPE
-POLI
MEDIA
./POLI
-COPPE
DESVIO
./POLI
-COPPE
QUANTIDADE DE
CURRICULOS
AVALIADOS
174 119
MEDIA DA ULTIMA
ATUALIZACAO
DOS CURRICULOS*
28/02/2018 246.62 24/11/2016 907.35
QUANTIDADE DE
PROFISSIONAIS
COM GRADUAÇÃO
174 117
QUANTIDADE DE
PROFISSIONAIS
COM MESTRADO
167 115
67
QUANTIDADE DE
PROFISSIONAIS
COM DOUTORADO
171 111
MEDIA ANO
GRADUACAO1984 10.9 1985 10.26
MEDIA ANO
MESTRADO1987 10.74 1991 10.41
MEDIA ANO
DOUTORADO1994 9.81 1998 9.2
MEDIA ANO
POS-DOUTORADO2000 8.56 2004 10.79
MEDIA ANO
INICIO UFRJ1995 12.53 1994 11.66
MEDIA TRABALHO
EM OUTRAS
INSTITUICOES
0.3 0.66 0.34 0.79
MEDIA DE
PROJETOS DE
PESQUISA
1.45 2.36 0.87 1.99
MEDIA DE
PROJETOS DE
DESENVOLVIMENTO
0.18 0.72 0.3 1.64
MEDIA DE NUMERO DE
PARTICIPACOES COMO
MEMBRO DO CORPO
EDITORIAL
0.17 0.51 0.08 0.36
MEDIA DE NUMERO DE
PARTICIPACOES COMO
REVISOR DE PERIODICO
1.37 3.54 0.57 1.56
MEDIA TITULOS
E PREMIOS0.84 1.67 0.45 1.11
68
MEDIA ARTIGOS
PUBLICADOS9.76 10.97 1.66 2.61
MEDIA LIVROS
PUBLICADOS
/ORGANIZADOS
OU EDICOES
0.8 6.16 0.12 0.41
MEDIA CAPITULOS DE
LIVROS PUBLICADOS0.93 1.79 0.5 1.37
MEDIA TEXTOS
EM JORNAIS
DE NOTICIAS/REVISTAS
0.28 1.26 0.08 0.37
MEDIA TRABALHOS
COMPLETOS PUBLICADOS
EM ANAIS DE CONGRESSOS
7.44 8.66 2.86 4.1
MEDIA RESUMOS
PUBLICADOS EM ANAIS
DE CONGRESSOS
1.57 4.57 0.58 2.08
MEDIA RESUMOS
EXPANDIDOS PUBLICADOS
EM ANAIS DE CONGRESSOS
1.02 2.92 0.14 1.2
MEDIA OUTRAS
PRODUCOES
BIBLIOGRAFICAS
0.09 0.54 0.09 0.45
MEDIA PARTICIPACAO EM
BANCAS DE MESTRADO3.7 5.26 2.9 4.89
MEDIA PARTICIPACAO EM
TESES DE DOUTORADO3.12 4.3 0.59 1.5
MEDIA PARTICIPACAO EM
BANCA DE EXAME
DE QUALIFICACAO
(DOUTORADO)
3.67 6.07 0.9 2.07
69
MEDIA PARTICIPACAO EM
MONOGRAFIAS DE CURSOS
DE APERFEICOAMENTO/
ESPECIALIZACAO
0.29 2.44 2.14 17.59
MEDIA PARTICIPACAO EM
BANCA DE GRADUACAO0.97 2.29 5.97 10.77
MEDIA PARTICIPACAO
EM BANCA
CONCURSO PUBLICO
0.26 0.63 0.39 0.88
MEDIA PARTICIPACAO EM
OUTRAS BANCAS
DE CONCURSO
0.62 2.27 0.22 0.77
MEDIA PARTICIPACAO EM
CONGRESSOS1.07 2.21 1.17 2.58
MEDIA PARTICIPACAO EM
SIMPOSIOS0.25 0.8 0.35 1.14
MEDIA PARTICIPACAO EM
SEMINARIOS0.27 1.01 0.34 0.92
MEDIA PARTICIPACAO EM
ENCONTROS0.35 1.23 0.34 0.98
MEDIA PARTICIPACAO EM
OFICINAS0.21 1.25 0.06 0.3
MEDIA PARTICIPACAO EM
OUTROS EVENTOS0.37 2.32 0.22 0.95
MEDIA ORGANIZACAO
DE EVENTOS0.88 2.31 0.34 0.99
MEDIA ORIENTACAO
DE MESTRADO4.86 5.2 1.71 3.06
MEDIA ORIENTACAO
DE DOUTORADO2.82 3.27 0.26 0.87
70
MEDIA ORIENTACAO DE
MONOGRAFIA DE
CONCLUSAO DE CURSO
DE APERFEICOAMENTO
/ESPECIALIZACAO
0.17 1.22 1.54 5.6
MEDIA ORIENTACAO DE
TRABALHO DE CONCLUSAO
DE CURSO DE GRADUACAO
1.34 2.4 4.4 7.52
MEDIA ORIENTACAO
DE INICIACAO CIENTIFICA1.65 5.06 1.61 5.3
*desvio padrão em dias
Tabela C.3: Resultados COPPE & Poli
DATA DE DOWLOAD
DOS CURRICULOS01/07/2018
REPOSITÓRIO
MEDIA
./POLI
&COPPE
DESVIO
./POLI
&COPPE
QUANTIDADE DE
CURRICULOS
AVALIADOS
117
MEDIA DA ULTIMA
ATUALIZACAO
DOS CURRICULOS*
02/03/2018 358.35
QUANTIDADE DE
PROFISSIONAIS
COM GRADUAÇÃO
116
QUANTIDADE DE
PROFISSIONAIS
COM MESTRADO
113
71
QUANTIDADE DE
PROFISSIONAIS
COM DOUTORADO
117
MEDIA ANO
GRADUACAO1985 9.83
MEDIA ANO
MESTRADO1989 9.42
MEDIA ANO
DOUTORADO1995 8.28
MEDIA ANO
POS-DOUTORADO2003 7.49
MEDIA ANO
INICIO UFRJ1994 10.5
MEDIA TRABALHO
EM OUTRAS
INSTITUICOES
0.16 0.54
MEDIA DE
PROJETOS DE
PESQUISA
1.66 2.98
MEDIA DE
PROJETOS DE
DESENVOLVIMENTO
0.26 0.97
MEDIA DE NUMERO DE
PARTICIPACOES COMO
MEMBRO DO CORPO
EDITORIAL
0.26 0.63
MEDIA DE NUMERO DE
PARTICIPACOES COMO
REVISOR DE PERIODICO
1.42 3.22
MEDIA TITULOS
E PREMIOS1.29 2.09
72
MEDIA ARTIGOS
PUBLICADOS10.27 21.77
MEDIA LIVROS
PUBLICADOS
/ORGANIZADOS
OU EDICOES
0.22 0.63
MEDIA CAPITULOS DE
LIVROS PUBLICADOS0.61 1.24
MEDIA TEXTOS
EM JORNAIS
DE NOTICIAS/REVISTAS
0.21 1.51
MEDIA TRABALHOS
COMPLETOS PUBLICADOS
EM ANAIS DE CONGRESSOS
10.58 9.4
MEDIA RESUMOS
PUBLICADOS EM ANAIS
DE CONGRESSOS
0.78 2.77
MEDIA RESUMOS
EXPANDIDOS PUBLICADOS
EM ANAIS DE CONGRESSOS
0.55 1.85
MEDIA OUTRAS
PRODUCOES
BIBLIOGRAFICAS
0.18 0.87
MEDIA PARTICIPACAO EM
BANCAS DE MESTRADO3.78 4.95
MEDIA PARTICIPACAO EM
TESES DE DOUTORADO2.44 3.42
MEDIA PARTICIPACAO EM
BANCA DE EXAME
DE QUALIFICACAO
(DOUTORADO)
3.32 5.23
73
MEDIA PARTICIPACAO EM
MONOGRAFIAS DE CURSOS
DE APERFEICOAMENTO/
ESPECIALIZACAO
0.09 0.62
MEDIA PARTICIPACAO EM
BANCA DE GRADUACAO2.79 4.57
MEDIA PARTICIPACAO
EM BANCA
CONCURSO PUBLICO
0.44 0.74
MEDIA PARTICIPACAO EM
OUTRAS BANCAS
DE CONCURSO
0.44 3.24
MEDIA PARTICIPACAO EM
CONGRESSOS1.31 2.73
MEDIA PARTICIPACAO EM
SIMPOSIOS0.32 1.02
MEDIA PARTICIPACAO EM
SEMINARIOS0.41 1.71
MEDIA PARTICIPACAO EM
ENCONTROS0.32 1.17
MEDIA PARTICIPACAO EM
OFICINAS0.1 0.53
MEDIA PARTICIPACAO EM
OUTROS EVENTOS0.13 0.56
MEDIA ORGANIZACAO
DE EVENTOS0.78 2.42
MEDIA ORIENTACAO
DE MESTRADO4.68 3.81
MEDIA ORIENTACAO
DE DOUTORADO2.32 2.56
74
MEDIA ORIENTACAO DE
MONOGRAFIA DE
CONCLUSAO DE CURSO
DE APERFEICOAMENTO
/ESPECIALIZACAO
0.29 2.17
MEDIA ORIENTACAO DE
TRABALHO DE CONCLUSAO
DE CURSO DE GRADUACAO
3.73 3.56
MEDIA ORIENTACAO
DE INICIACAO CIENTIFICA2.16 4.71
*desvio padrão em dias
75
Figura C.1: Média e desvio padrão de trabalho em outras instituições.
Figura C.2: Média e desvio padrão de projetos de pesquisa.
Figura C.3: Média e desvio padrão de projetos de desenvolvimento.
76
Figura C.4: Média e desvio padrão de participações como membro do corpo editorial.
Figura C.5: Média e desvio padrão de participações como revisor de periódicos.
Figura C.6: Média e desvio padrão de títulos e prêmios.
77
Figura C.7: Média e desvio padrão de artigos publicados.
Figura C.8: Média e desvio padrão de livros publicados.
Figura C.9: Média e desvio padrão de capítulos publicados.
78
Figura C.10: Média e desvio padrão de textos publicados.
Figura C.11: Média e desvio padrão de trabalhos publicados.
Figura C.12: Média e desvio padrão de resumos publicados.
79
Figura C.13: Média e desvio padrão de resumos expandidos publicados.
Figura C.14: Média e desvio padrão de outras publicações.
Figura C.15: Média e desvio padrão de participações em bancas de mestrado.
80
Figura C.16: Média e desvio padrão de participações em teses de doutorado.
Figura C.17: Média e desvio padrão de participações em bancas de doutorado.
Figura C.18: Média e desvio padrão de participações em monogra�as de cursos de
especialização.
81
Figura C.19: Média e desvio padrão de participações em bancas de graduação.
Figura C.20: Média e desvio padrão de participações em bancas de concurso publico.
Figura C.21: Média e desvio padrão de participações em bancas de outros concursos.
82
Figura C.22: Média e desvio padrão de participações em congressos.
Figura C.23: Média e desvio padrão de participações em simpósios.
Figura C.24: Média e desvio padrão de participações em seminários.
83
Figura C.25: Média e desvio padrão de de participações em encontros.
Figura C.26: Média e desvio padrão de participações em o�cinas.
Figura C.27: Média e desvio padrão de participações em outros eventos.
84
Figura C.28: Média e desvio padrão de organização de eventos.
Figura C.29: Média e desvio padrão de orientações em mestrado.
85
Figura C.30: Média e desvio padrão de orientações em doutorado.
Figura C.31: Média e desvio padrão de orientações em monogra�as de conclusão de
cursos de aperfeiçoamento/especialização.
86
Figura C.32: Média e desvio padrão de orientações em graduação.
Figura C.33: Média e desvio padrão de orientações de iniciação cientí�ca.
87