modelo fuzzy com otimização gen ética para classificação de
TRANSCRIPT
MODELO FUZZY COM OTIMIZACAO GENETICA PARA
CLASSIFICACAO DE COMPATIBILIDADE ENTRE
CANDIDATOS E EMPRESAS
Rafael Lopes Conde dos Reis
Projeto de Graduacao apresentado ao Curso
de Engenharia Eletronica e de Computacao
da Escola Politecnica, Universidade Federal
do Rio de Janeiro, como parte dos requisitos
necessarios a obtencao do tıtulo de Enge-
nheiro.
Orientador: Flavio Luis de Mello
Rio de Janeiro
Marco de 2016
MODELO FUZZY COM OTIMIZACAO GENETICA PARA
CLASSIFICACAO DE COMPATIBILIDADE ENTRE
CANDIDATOS E EMPRESAS
Rafael Lopes Conde dos Reis
PROJETO DE GRADUACAO SUBMETIDO AO CORPO DOCENTE DO CURSO
DE ENGENHARIA ELETRONICA E DE COMPUTACAO DA ESCOLA PO-
LITECNICA DA UNIVERSIDADE FEDERAL DO RIO DE JANEIRO COMO
PARTE DOS REQUISITOS NECESSARIOS PARA A OBTENCAO DO GRAU
DE ENGENHEIRO ELETRONICO E DE COMPUTACAO
Autor:
Rafael Lopes Conde dos Reis
Orientador:
Prof. Flavio Luis de Mello, D.Sc.
Examinador:
Prof. Heraldo Luıs Silveira de Almeida, D.Sc.
Examinador:
Profa. Priscila Machado Vieira Lima, Ph.D.
Rio de Janeiro
Marco de 2016
ii
UNIVERSIDADE FEDERAL DO RIO DE JANEIRO
Escola Politecnica - Departamento de Eletronica e de Computacao
Centro de Tecnologia, bloco H, sala H-217, Cidade Universitaria
Rio de Janeiro - RJ CEP 21949-900
Este exemplar e de propriedade da Universidade Federal do Rio de Janeiro, que
podera incluı-lo em base de dados, armazenar em computador, microfilmar ou adotar
qualquer forma de arquivamento.
E permitida a mencao, reproducao parcial ou integral e a transmissao entre bibli-
otecas deste trabalho, sem modificacao de seu texto, em qualquer meio que esteja
ou venha a ser fixado, para pesquisa academica, comentarios e citacoes, desde que
sem finalidade comercial e que seja feita a referencia bibliografica completa.
Os conceitos expressos neste trabalho sao de responsabilidade do(s) autor(es).
iii
”Ideias, e somente ideias, podem iluminar a escuridao”
- Ludwig von Mises
iv
DEDICATORIA
Dedico este projeto a todos os gigantes os quais nos ombros fiquei de pe.
”Se vi mais longe foi por estar de pe sobre ombros de gigantes.”
- Isaac Newton
v
AGRADECIMENTO
Acima de qualquer um agradeco aos meus pais Eliane de Lourdes Lopes Conde dos
Reis e Manoel Tupiara Conde dos Reis. Por toda a dedicacao e abnegacao durante
toda a minha criacao. Ao meu pai por ser um exemplo de carater e superacao que
sempre buscarei seguir. A minha mae, por ter aberto mao de tudo para se dedicar a
funcao mais nobre que existe, de mae, me amando mais do que tudo. Tenho muito
orgulho em ser filho de voces.
Agradeco aos meus avos e minha bisavo. Por formarem, junto com meus pais,
minha famılia, que, embora pequena, e toda a famılia que sempre precisei. Obrigado
pelo mimo que so avos conseguem dar. Que eu possa chegar a idade de voces com
todo bom humor e alegria que tem.
Agradeco as meus amigos. Por serem tambem minha famılia, embora nao de
sangue, de escolha. Aos amigos do Santa Marcelina, por estarem comigo por todos
esses anos e por todos que virao. Aos amigos do CEFET, em especial aos membros
da Equipe Genesis, voces foram e continuam sendo muito especiais. Aos amigos da
UFRJ por compartilharem os meus anos mais desafiadores e aos da Queen Mary
pelo melhor ano da minha vida. A todos que passaram e ainda vao passar pela
Equipe MinervaBots, te-la fundado e o maior orgulho que tenho ate hoje. A todas
essas e outras pessoas especiais que fazem parte da minha vida.
Agradeco aos meus professores. Por transmitirem seu conhecimento e por sua
paciencia nos momentos de dificuldade, especialmente aos professores do CEFET e
da UFRJ.
Agradeco a todos da Pin People. Por me fazerem ter ”brilho nos olhos”pelo meu
trabalho e por toda colaboracao com este projeto.
Agradeco, por fim, ao meu orientador. Por me direcionar ao longo deste projeto
e por todo tempo que dedicou a revisa-lo.
vi
RESUMO
A identificacao de um perfil de cultura e valores para os candidatos e um im-
portante aspectos para a selecao de um candidato. Geralmente e realizado por
headhunters, ou durante extensos processos de entrevistas e dinamicas de grupo.
Para muitas empresas e necessario filtrar uma grande massa de candidatos, o que
e usualmente feito levando em consideracao, apenas, informacoes de competencia
tecnica. Essa pratica leva a entrevistas com candidatos que nao apresentam o perfil
da empresa, quanto a cultura e valores, e a menos tempo para avaliar candidatos
com quem a empresa e realmente compatıvel. Um modelo que possa antecipar o
perfil de cultura e valores de um candidato iria beneficiar, amplamente, tanto can-
didatos quanto empresas, por tirar subjetividade e automatizar parte do processo
seletivo.
Este projeto propoe um modelo computacional, capaz de classificar a compa-
tibilidade entre candidato e empresa, quanto a cultura e valores. O modelo foi
desenvolvido utilizando informacao provida pela empresa Pin People, extraıda de
dois questionarios apresentados para candidatos e colaboradores de empresas. A
informacao extraıda e pre-processada pelo modelo e serve como entrada para um
sistema fuzzy otimizado por algoritmo genetico. O sistema usa regras fuzzy, desen-
volvidas utilizando conhecimento especialista, a fim de retornar em qual classe de
compatibilidade um candidato e uma empresa pertencem.
Palavras-Chave: Logica Fuzzy, Algoritmo Genetico, Classificador, Recursos Hu-
manos.
vii
ABSTRACT
Identifying values and cultural profile for a candidate is an important aspect of
an employee selection process. Often, this is realized by headhunters, or by an
extensive process of interviews and group dynamics. For many organizations it
is necessary to filter down a large amount of candidates, what is usually done just
taking into consideration the technical information. This practice leads to interviews
with candidates that do not have the same profile as the company. This overhead
spent with undesirable candidates consumes time and energy that should be used
with better options. A model that could anticipate the values and cultural profile of
a candidate would largely beneficiate both companies and candidates, making the
selection process less subjective and automating part of it.
This project proposes a computer model capable of classifying the compatibility
between a candidate and a company, according to their values and culture. The
model was developed using information provided by the company Pin People, ex-
tracted from two questionnaires presented to candidate and company collaborators,
in order to extract information about values and culture. The information extracted
is pre-processed and serves as an input for a fuzzy logic system, optimized by gene-
tic algorithm. The system uses fuzzy rules, developed using specialist knowledge in
order to evaluate the class in which a candidate and a company are compatible.
Key-words: Fuzzy Logic, Genetic Algorithm, Classifier, Human Resources.
viii
SIGLAS
AG - Algoritmo Genetico
AUC - Area Under the Curve
D(0,1) - Distancia ao ponto (0, 1) no espaco ROC
DEAP - Distributed Evolutionary Algorithms in Python
MAX - Funcao que retorna lista de maximos entre duas listas
MIX - Funcao que retorna lista de mınimos entre duas listas
PD - Probabilidade de Deteccao
PDF - Probability Density Function
PF - Probabilidade de Falso Alarme
PROBOR - Probabilistic OR ou soma algebrica
PROD - Funcao que retorna lista com o produto, ponto a ponto, entre duas listas
ROC - Receiver Operating Characteristic
ix
Sumario
1 Introducao 1
1.1 Tema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Delimitacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.3 Justificativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.4 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.5 Metodologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.6 Descricao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2 Logica Fuzzy 6
2.1 Teoria de Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1.1 Definicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1.2 Pertinencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1.3 Operacoes Basicas entre Conjuntos . . . . . . . . . . . . . . . 8
2.2 Conjuntos Fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.1 Definicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.2 Operacoes com Conjuntos Fuzzy . . . . . . . . . . . . . . . . . 13
2.2.3 Exemplo de um Conjunto Fuzzy . . . . . . . . . . . . . . . . . 13
2.3 Inferencia Fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.3.1 Regras Fuzzy e Implicacao logica . . . . . . . . . . . . . . . . 16
2.3.2 Inferencia Fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3.3 Exemplo de Aplicacao de Regras . . . . . . . . . . . . . . . . 22
2.4 Agregacao e Defuzzificacao . . . . . . . . . . . . . . . . . . . . . . . . 24
3 Delimitacao do Problema 27
3.1 Descricao do Problema . . . . . . . . . . . . . . . . . . . . . . . . . . 27
x
3.2 Selecao de Variaveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.2.1 Arquetipos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.2.2 Valores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.2.3 Variaveis de Regua . . . . . . . . . . . . . . . . . . . . . . . . 34
4 Construcao do Modelo Fuzzy 36
4.1 Pre-processamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.1.1 Arquetipos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.1.2 Valores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.1.3 Variaveis de Regua . . . . . . . . . . . . . . . . . . . . . . . . 52
4.2 Sistema Fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.2.1 Definicao do Pre-processamento . . . . . . . . . . . . . . . . . 56
4.2.2 Definicao do Limiar de Corte . . . . . . . . . . . . . . . . . . 61
4.2.3 Comparacao com Modelo de Referencia . . . . . . . . . . . . . 62
5 Otimizacao por Algoritmo Genetico 64
5.1 Algoritmo Genetico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
5.2 Modelo Fuzzy Genetico . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.3 Comparacao entre Modelos . . . . . . . . . . . . . . . . . . . . . . . . 71
6 Conclusoes 73
6.1 Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
6.2 Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
Bibliografia 75
A Funcoes de Pertinencia do Modelo Fuzzy Genetico 78
xi
Lista de Figuras
2.1 Representacao grafica de A ∪B . . . . . . . . . . . . . . . . . . . . . . 9
2.2 Representacao grafica de A ∩B . . . . . . . . . . . . . . . . . . . . . . 10
2.3 Representacao grafica de A \B . . . . . . . . . . . . . . . . . . . . . . . 11
2.4 Conjunto classico x Conjunto fuzzy . . . . . . . . . . . . . . . . . . . 12
2.5 Conjuntos fuzzy para temperaturas . . . . . . . . . . . . . . . . . . . 12
2.6 Problema da gorjeta - Variaveis fuzzy . . . . . . . . . . . . . . . . . . 15
2.7 Representacao grafica de A→ B . . . . . . . . . . . . . . . . . . . . . 17
2.8 Representacao grafica de A→ B . . . . . . . . . . . . . . . . . . . . . 18
2.9 Representacao grafica da funcao de pertinencia para a regra R(s, g) . 20
2.10 Implicacao fuzzy - Funcao de pertinencia µB′(g) . . . . . . . . . . . . 22
2.11 Saıda das regras fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.12 Defuzzificacao do problema da gorjeta . . . . . . . . . . . . . . . . . 26
3.1 Representacao grafica dos arquetipos para um candidato e uma empresa . 31
4.1 Diagrama de blocos do modelo fuzzy . . . . . . . . . . . . . . . . . . . . 37
4.2 Distribuicao de Probabilidade da Correlacao entre Arquetipos . . . . . . . 38
4.3 Curva ROC da correlacao entre crquetipos . . . . . . . . . . . . . . . . . 39
4.4 Funcoes de pertinencia dos arquetipos e de sua compatibilidade . . . . . . 40
4.5 Distribuicao de probabilidade dos arquetipos . . . . . . . . . . . . . . . 41
4.6 Comparacao entre defuzzificacoes: Densidades de probabilidade do pre-
processamento dos arquetipos . . . . . . . . . . . . . . . . . . . . . . . 41
4.7 Comparacao entre defuzzificacoes: Curvas ROC do pre-processamento dos
arquetipos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.8 Melhor combinacao de funcoes de pertinencia dos Arquetipos e de sua
compatibilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
xii
4.9 Sistema fuzzy x Correlacao: Distribuicoes de probabilidade do pre-processamento
dos arquetipos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.10 Sistema fuzzy x Correlacao: Curvas ROC do pre-processamento dos arquetipos 46
4.11 Melhor combinacao de funcoes de pertinencia dos valores e de sua compa-
tibilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.12 Sistema fuzzy x Correlacao: Distribuicoes de probabilidade do pre-processamento
dos valores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.13 Sistema fuzzy x Correlacao: Curvas ROC do pre-processamento dos valores 51
4.14 Melhor combinacao de funcoes de pertinencia das variaveis de regua e de
sua compatibilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.15 Sistema Fuzzy x Correlacao: Distribuicoes de probabilidade do pre-processamento
das variaveis de regua . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.16 Sistema fuzzy x Correlacao: Curvas ROC do pre-processamento das variaveis
de regua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.17 Funcoes de pertinencia do modelo fuzzy: Correlacao como pre-processamento 58
4.18 Funcoes de pertinencia do modelo fuzzy: Pre-processamento fuzzy . . . . 59
4.19 Pre-processamento fuzzy x Correlacao como pre-processamento: Distri-
buicoes de probabilidade do modelo fuzzy . . . . . . . . . . . . . . . . . 60
4.20 Pre-processamento fuzzy x Correlacao como pre-processamento: Curvas
ROC do modelo fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.21 Conjunto de teste: Distribuicoes de Probabilidade do modelos fuzzy . . . 63
5.1 Exemplo de crossover . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
5.2 Exemplo de mutacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
5.3 Evolucao da AUC do modelo fuzzy ao longo das geracoes . . . . . . . . . 69
5.4 Distribuicao de probabilidade da saıda do modelo fuzzy genetico . . . . . 70
5.5 Curva ROC do modelo fuzzy genetico . . . . . . . . . . . . . . . . . . . 70
5.6 Distribuicao de probabilidade da saıda do modelo fuzzy genetico para o
conjunto de teste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
A.1 Funcoes de pertinencia do sistema fuzzy de pre-processamento dos arquetipos 79
A.2 Funcoes de pertinencia do sistema fuzzy de pre-processamento dos valores 79
A.3 Funcoes de pertinencia do sistema fuzzy que agrega as variaveis . . . . . . 80
xiii
Lista de Tabelas
2.1 Operacoes com conjuntos fuzzy . . . . . . . . . . . . . . . . . . . . . 13
2.2 Principais funcoes de implicacao fuzzy. . . . . . . . . . . . . . . . . . 19
3.1 Graus de compatibilidade entre candidatos e empresas. . . . . . . . . 28
3.2 Descricao dos arquetipos . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.3 Descricao dos valores . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.1 Comparacao entre defuzzificacoes: Resultado de AUC do pre-processamento
dos arquetipos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.2 Tabela verdade de regras para a presenca de um determinado arquetipo
num candidato e numa empresa . . . . . . . . . . . . . . . . . . . . . 43
4.3 Tabela verdade de regras para a presenca de um determinado arquetipo
num candidato e de um oposto numa empresa . . . . . . . . . . . . . 43
4.4 Combinacoes de Regras para os Arquetipos: Resultado de AUC do
pre-processamento dos arquetipos . . . . . . . . . . . . . . . . . . . . 44
4.5 Sistema fuzzy x Correlacao: Resultado de AUC do pre-processamento
dos arquetipos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.6 Distribuicao dos Valores em Arquetipos . . . . . . . . . . . . . . . . . 48
4.7 Sistema fuzzy x Correlacao: Resultado de AUC do pre-processamento
dos valores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.8 Variaveis de regua para candidatos e seus apelidos . . . . . . . . . . . 52
4.9 Variaveis de regua para empresas e seus apelidos . . . . . . . . . . . . 52
4.10 Sistema fuzzy x Correlacao: Resultado de AUC do pre-processamento
das variaveis de regua . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.11 Pre-processamento fuzzy x Correlacao como pre-processamentos: Re-
sultado de AUC do modelo fuzzy . . . . . . . . . . . . . . . . . . . . 61
xiv
4.12 Resultado do limiar de decisao . . . . . . . . . . . . . . . . . . . . . . 61
4.13 Comparacao com modelo de referencia . . . . . . . . . . . . . . . . . 62
5.1 Resultado do limiar de decisao para o modelo fuzzy genetico . . . . . 69
5.2 Comparacao entre o modelo fuzzy, modelo fuzzy genetico e modelo
de referencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
xv
Capıtulo 1
Introducao
1.1 Tema
O tema deste Projeto de Graduacao e o estudo da compatibilidade entre o perfil
de um candidato a uma vaga de emprego, e a cultura e valores de uma determinada
empresa. O projeto tem como desafio a concepcao de um sistema que seja capaz de
cruzar informacoes a respeito tanto de candidatos, quanto de empresas, retornando
o quanto um determinado candidato e compatıvel com a cultura e valores de uma
empresa.
1.2 Delimitacao
O objeto de estudo sao variaveis relacionadas a cultura e valores de candidatos
com nıvel superior completo ou incompleto. E desejavel tambem que os candidatos
ja possuam alguma experiencia previa de trabalho a fim de haver maior acuracia
nas respostas dadas pelos mesmos. Quanto as empresas, o objeto de estudo sao,
principalmente, pequenas e medias empresas, porem espera-se que isso nao afete a
amplitude do modelo para grandes empresas, requerendo futuros testes para este
tamanho de empresas.
O modelo computacional esta voltado para avaliacao de compatibilidade levando
em consideracao cultura e valores. Ele nao se aplica, portanto, para avaliar a com-
patibilidade tecnica de um candidato com uma determinada vaga.
1
1.3 Justificativa
Modelos computacionais sao, cada vez mais, usados para automatizar diversas
areas da industria e do comercio. Modelos que reconhecem o perfil do usuario, nessa
realidade em que grandes quantidades de dado sao armazenadas e processadas a
cada segundo, sao cada vez mais comuns. No comercio, por exemplo, lojas vir-
tuais possibilitaram um grande aumento no faturamento de empresas tradicionais.
Primeiramente por gerarem maior produtividade, uma vez que sao totalmente es-
calaveis, mas tambem por possibilitarem uma maior assertividade no processo de
vendas, ao utilizarem sistemas de recomendacao de produtos baseado nos perfis dos
clientes.
O mercado de recrutamento e selecao, por sua vez, sempre se apresentou como
um mercado mais conservador. A maioria das solucoes para recrutamento e selecao
atualmente tem por foco a atracao de candidatos, tendo como funcionalidades, no
maximo, alguns filtros relacionados a competencia tecnica dos candidatos. Algumas
solucoes mais recentes servem como forma de acompanhamento do processo seletivo,
para fornecer o controle de quais candidatos passam por cada etapa do processo.
O conhecimento relacionado a compatibilidade entre candidatos e empresas, ba-
seado em cultura e valores, ainda e utilizado de forma muito pouco automatizada
sendo tambem muito subjetivo. Normalmente e feito por meio de head-hunters,
longos processos de entrevistas ou dinamicas de grupo. Em muitas empresas, onde
e necessario filtrar uma grande massa de candidatos, isto e feito levando em consi-
deracao, apenas, informacoes de competencia tecnica. Essa pratica leva a entrevistas
com candidatos que nao apresentam o perfil da empresa, quanto a cultura e valo-
res, e, portanto, a menos tempo para avaliar candidatos com quem a empresa e
realmente compatıvel.
Caso houvesse uma forma de avaliar esse tipo de compatibilidade previamente,
seria possıvel reduzir a subjetividade neste processo e ainda ter um aumento de
produtividade na triagem de candidatos.
2
1.4 Objetivo
O objetivo geral do projeto e, entao, propor um modelo computacional capaz
de avaliar, a partir de variaveis relacionadas a cultura e valores, de candidatos
e empresas, a compatibilidade entre ambos. Desta forma, tem-se como objetivos
especıficos: (1) Selecionar, a partir das variaveis disponıveis um conjunto para ser
utilizado; (2) Definir o pre-processamento a ser aplicado as variaveis; (3) Elaborar
modelo fuzzy capaz de inferir o grau de compatibilidade entre um candidato e uma
empresa a partir das variaveis utilizadas; (4) Otimizar o modelo aplicando tecnicas
evolutivas para a definicao de seus parametros.
1.5 Metodologia
A partir da literatura a respeito da compatibilidade de cultura e valores [1] [2],
entre empresas e candidatos, a empresa Pin People (junto com a qual este projeto
esta sendo realizado) construiu dois questionarios para extrair as informacoes mais
relevantes a respeito dos candidatos e das empresas a fim de avaliar sua compatibili-
dade. Estes sao os dados utilizados para a construcao do modelo. Essa literatura foi,
tambem, utilizada como guia para a escolha de quais variaveis serao utilizadas para
a construcao deste modelo. Alem disso, para justificar essa escolha, tambem foram
utilizadas analises de correlacao entres as variaveis e o grau de compatibilidade.
Uma vez escolhidas as variaveis e definido o pre-processamento mais eficaz para
cada uma, foi construıdo um modelo computacional para a classificacao do grau de
compatibilidade. Foi escolhido o uso de logica fuzzy, mais especificamente pelo mo-
delo Mamdani [3], principalmente pela natureza do problema. Dentre os possıveis
tipos de modelos fuzzy o tipo Mamdani e o mais apropriado para capturar o co-
nhecimento de um especialista [4], sendo construıdo a partir de regras semanticas
simples, que podem ser facilmente compreendidas e validadas por um especialista
da area de recrutamento e selecao.
Para a construcao do modelo foi necessario definir o formato dos conjuntos fuzzy,
para cada variavel, e as regras fuzzy a serem utilizadas. Os formatos dos conjun-
3
tos fuzzy foram determinados inicialmente a partir da analise das distribuicoes das
variaveis. Apos a consolidacao do modelo foi feita uma otimizacao dos conjuntos
fuzzy usando Algoritmo Genetico e feita uma comparacao entre ambos. As regras
fuzzy foram determinadas a partir de conhecimento de um especialista, inicialmente,
e em seguida foi feita uma analise de relevancia das regras previamente definidas.
A empresa atualmente conta com um modelo para estimar o grau de compati-
bilidade. Este modelo foi utilizado como benchmarck para o modelo fuzzy. Os
resultados do modelo fuzzy foram entao analisados e possıveis alteracoes para a
obter uma eficiencia compatıvel com a do modelo atualmente usado pela empresa
foram propostas.
1.6 Descricao
No Capıtulo 2 e apresentado o conceito de logica fuzzy. Comecando por uma
breve introducao a teoria de conjuntos classica, seguida por uma serie de conceitos
fundamentais para logica fuzzy, como: Conjuntos fuzzy, inferencia fuzzy, agregacao
e defuzzificacao.
O Capıtulo 3 apresenta a delimitacao do modelo fuzzy. Primeiramente e apresen-
tada a descricao do problema de classificacao de compatibilidade entre candidatos
e empresas. Em seguida sao definidas as variaveis que serao usadas pelo modelo.
Aqui sao apresentados os questionarios usados para coletar os dados usados pelo
modelo e apresentada a metodologia utilizada para sua concepcao.
O Capıtulo 4 contem todo o processo de definicao do modelo fuzzy. Ele comeca
pela escolha do pre-processamento utilizado pelo sistema fuzzy, comparando duas
formas distintas. Em seguida o sistema fuzzy e definido e seu resultado e, entao
comparado a um modelo de referencia.
O Capıtulo 5 trata do processo de otimizacao por algoritmo genetico. Primei-
ramente e introduzida uma breve teoria a sobre algoritmo genetico. Em seguida
este e aplicado para otimizar as funcoes de pertinencia do modelo fuzzy. Por fim
4
sao comparados os resultados do modelo fuzzy, antes e apos a otimizacao com os
resultados do modelo de referencia.
O Capıtulo 6, finalmente, apresenta as conclusoes acerca do modelo e de sua com-
paracao com o modelo de referencia. Nele tambem sao descritos possıveis trabalhos
futuros, visando o aperfeicoamento do modelo.
5
Capıtulo 2
Logica Fuzzy
2.1 Teoria de Conjuntos
Para comecarmos a tratar de logica fuzzy e primeiro necessario uma previa in-
troducao sobre a teoria classica de conjuntos, que diz respeito ao ramo da ma-
tematica que estuda os conjuntos. Serao apenas apresentados conceitos pontuais,
apenas para possibilitar a compreensao do restante do projeto.
2.1.1 Definicao
Um conjunto e compreendido como uma colecao de objetos distintos, mas que
tambem e objeto por si so. Georg Cantor, o criador da teoria de conjuntos, definiu
um conjunto da seguinte maneira: ”Um conjunto e o ajuntamento em um todo de
objetos definidos e distintos da nossa percepcao ou imaginacao - tambem chamados
de elementos do conjunto”[5].
Exemplos de conjuntos podem ser dos mais variados tipos. Os numeros 8, 9, 4,
12, sao um conjunto de inteiros. Tal conjunto pode ser representado, pela notacao
matematica, da seguinte maneira {8, 9, 4, 12}. As letras a, q, x, t, sao um conjunto
de caracteres. Podem ser criados conjuntos de todos os tipos, funcoes, palavras, in-
divıduos e ate conjuntos de conjuntos, uma vez que, como ja foi falado, um conjunto
e um objeto per se.
6
Um conjunto e usualmente denotado por uma letra maiuscula. Os elementos sao
listados separados por vırgula e entre chaves. Como pode ser visto no exemplo
anterior a ordem dos elementos nao importa, mas e conveniente a representacao
em ordem ascendente, para facilitar a compreensao. O simbolo ∅ e usado para
representar um conjunto vazio. Sendo assim podemos representar um conjunto A
como:
A = {2, 4, 6, 8}.
Em alguns casos considera-se U , universo, a classe que contem todos os ele-
mentos que se deseja analisar. Por esta razao, tambem e conhecido como conjunto
universo. O conjunto dos inteiros Z, por exemplo, poderia ser considerado o conjunto
universo de um problema envolvendo apenas numeros inteiros.
Conjuntos sao comumente representados de forma grafica, usualmente por cırculos,
como sera visto mais adiante na Figura 2.1, Figura 2.2 e Figura 2.3.
2.1.2 Pertinencia
O conceito de pertinencia e muito importante em teoria classica de conjuntos assim
como para logica fuzzy. Os sımbolos ∈ e /∈ significam pertence a e nao pertence a,
respectivamente. Desta forma e correto de escrever
7 ∈ {2, 3, 7},
ou
7 /∈ {1, 4, 6}.
Um conjunto A pode ser representado por meio sua funcao caracterıstica. Ela
e a funcao que declara quais elementos do conjunto universo U sao elementos do
conjunto A. O conjunto A pode ser definido pela funcao caracterıstica UA, da
seguinte forma [6]:
UA(x) =
0 se x ∈ A,
1 se x /∈ A
7
Isso e, a funcao caracterıstica mapeia os elementos de X em elementos do conjunto
{0, 1}, o que e formalmente expresso por:
UA : U → {0, 1}.
Portanto, para cada x ∈ U , quando UA(x) = 1, x e considerado como pertencendo
a A. Caso UA(x) = 0, x e considerado como nao pertencendo a A.
Como sera visto mais adiante a logica fuzzy extrapola este conceito de forma que
um elemento pode pertencer ”parcialmente”a um determinado conjunto.
Caso todos os elementos de um dado conjunto A tambem sejam elementos do
conjunto B, pode-se dizer que o conjunto A e um subconjunto do conjunto B. Isso
e representado pela notacao A ⊆ B, que tambem significa A esta contido em B.
Desta forma podemos escrever o exemplo
{2, 3} ⊆ {2, 3, 4, 5}.
O conjunto vazio e um subconjunto de qualquer conjunto (∅ ⊆ A) e qualquer
conjunto e um subconjunto de si proprio (A ⊆ A). Decorre, portanto, que A = B
se, e somente, se A ⊆ B e B ⊆ A.
2.1.3 Operacoes Basicas entre Conjuntos
A uniao de dois conjuntos e o conjunto composto por todos os elementos de cada
um dos dois conjuntos. A uniao de dois conjuntos A e B pode ser denotada por
A ∪B. Portanto
{2, 3} ∪ {3, 4, 5} = {2, 3, 4, 5}.
A Figura 2.1 representa a uniao de dois conjuntos.
A uniao entre A e B pode, tambem ser representada a partir de suas funcoes
caracterısticas:
A ∪B → UA∪B(x) = UA(x) ∨ UB(x) = max[UA(x),UB(x)].
Onde ∨ representa a operacao logica OU.
8
Figura 2.1: Representacao grafica de A ∪B
A intercessao de dois conjuntos e o conjunto composto por todos os elementos
comuns a ambos os conjuntos. A intercessao de dois conjuntos A e B pode ser
denotada por A ∩B. Portanto
{2, 3} ∩ {3, 4, 5} = {3}.
A Figura 2.2 representa a intercessao de dois conjuntos.
A uniao entre A e B pode, tambem ser representada a partir de suas funcoes
caracterısticas:
A ∩B → UA∩B(x) = UA(x) ∧ UB(x) = min[UA(x),UB(x)].
Onde ∧ representa a operacao logica E.
A diferenca entre conjuntos e o conjunto composto por todos os elementos do
primeiro conjunto que nao estao contidos no segundo conjunto. A diferenca de dois
conjuntos A e B, tambem chamada de complemento relativo, pode ser denotada por
A \B. Portanto
{2, 3} \ {3, 4, 5} = {2}.
A Figura 2.3 representa a diferenca de dois conjuntos. Desta forma, considerando o
conjunto universo U , U \ A e chamado de complemento absoluto, ou apenas com-
plemento, de A, denotado por A.
9
Figura 2.2: Representacao grafica de A ∩B
O complemento de um conjunto A , tambem pode ser representada a partir de
suas funcoes caracterısticas:
A→ UA(x) = 1− UA(x).
O teorema de De Morgan relaciona essas operacoes da seguinte forma:
A ∪B = A ∩B;
A ∩B = A ∪B.
Por ultimo, o produto cartesiano entre dois conjuntos A e B, denotado por A×B,
e o conjunto de pares ordenados definidos da seguinte forma:
A×B = {(a, b) : a ∈ A ∧ b ∈ B}
2.2 Conjuntos Fuzzy
2.2.1 Definicao
Logica Fuzzy tem como base a teoria de conjuntos fuzzy, criada por Zadeh em
1965 [7], a qual e uma generalizacao da teoria classica de conjuntos. O que significa
que a teoria classica e um caso especial da teoria de conjuntos fuzzy.
10
Figura 2.3: Representacao grafica de A \B
Como foi tratado anteriormente, a funcao caracterıstica de um conjunto classico
atribui o valor 0 ou 1 a cada elemento do conjunto universo de forma a delimitar
os elementos que pertencem e os que nao pertencem ao dado conjunto classico.
Essa funcao caracterıstica pode ser generalizada de forma que os valores atribuıdos
possam estar em um intervalo (usualmente entre 0 e 1). Este valor passa a indicar o
grau de pertinencia do elemento ao conjunto. A essa generalizacao se da o nome de
funcao de pertinencia, e o conjunto definido por ela e chamado de conjunto fuzzy.
Uma funcao de pertinencia de um conjunto fuzzy A pode ser representada como:
µA : U → [0, 1].
A Figura 2.4 mostra graficamente a diferenca entre um conjunto fuzzy e um conjunto
classico.
Conjuntos fuzzy permitem a representacao de conceitos vagos de linguagem na-
tural. Por exemplo, ao tratar-se de um problema que envolve temperatura pode-se
definir um conjunto para temperaturas frias e outro para temperaturas quentes. Nao
existe, porem, um limiar definido em que um valor de temperatura seja considerado
frio e outro, um grau mais alto, seja considerado quente. O uso de conjuntos fuzzy,
para este caso, se mostra muito apropriado. Em um conjunto fuzzy para tempera-
turas quentes a temperatura 40 ◦C seria representada com um valor de pertinencia
maior do que a temperatura 15 ◦C, Figura 2.5.
11
0 2 4 6 8 10
Universo do Conjunto
0.0
0.2
0.4
0.6
0.8
1.0
1.2G
rau
dePe
rtin
enci
aConjunto Classico
Funcao Caracterıstica
0 2 4 6 8 10
Universo do Conjunto
0.0
0.2
0.4
0.6
0.8
1.0
1.2
Gra
ude
Pert
inen
cia
Conjunto FuzzyFuncao de Pertinencia
Figura 2.4: Conjunto classico x Conjunto fuzzy
0 10 20 30 40 50 60
Temperatura em ◦C
0.0
0.2
0.4
0.6
0.8
1.0
1.2
Gra
ude
Pert
inen
cia
Conjuntos Fuzzy para TemperaturasFrioQuente
Figura 2.5: Conjuntos fuzzy para temperaturas
12
2.2.2 Operacoes com Conjuntos Fuzzy
As operacoes de uniao, intercessao e complemento para conjuntos fuzzy podem
ser definidas a partir das funcoes de pertinencia dos conjuntos. A Tabela 2.1 mostra
as duas formas mais usadas para realizar estas operacoes.
Tabela 2.1: Operacoes com conjuntos fuzzy
Nome Intercessao (E):
µA∩B(x)
Uniao (OU):
µA∪B(x)
Complemento
(NAO): µA(x)
MIN/MAX min[µA(x), µB(x)] max[µA(x),UB(x)] 1− µA(x)
PROD/PROBOR µA(x)× µB(x) µA(x) + µB(x) −µA(x)× µB(x)
1− µA(x)
O teorema de De Morgan tambem continua valido para conjuntos fuzzy:
A ∪B = A ∩B;
A ∩B = A ∪B.
Dois axiomas dos conjuntos classicos, porem, nao se aplicam a conjuntos fuzzy. O
primeiro diz que a uniao entre um conjunto e seu complemento e igual ao conjunto
universo. A segunda, que a intercessao entre um conjunto e seu complemento e igual
a um conjunto vazio. Em conjuntos fuzzy esses axiomas seriam representados como
a seguir:
A ∪ A 6= U ;
A ∩ A 6= ∅.
Isso ocorre pois ha uma area de sobreposicao de A com A, o que nao ocorre com
conjuntos classicos. Ou seja, um elemento pode pertencer a A e a A ao mesmo
tempo.
2.2.3 Exemplo de um Conjunto Fuzzy
Para este projeto foi decidido utilizar a biblioteca Skikit-Fuzzy para Python. A
biblioteca possui diversas funcoes implementadas para facilitar principalmente a
13
criacao e operacao de conjuntos fuzzy assim como no processo de defuzzificacao (ver
Secao 2.4).
Para exemplificar os conceitos apresentados e introduzir a biblioteca Skikit-Fuzzy
sera utilizado o problema da gorjeta, um problema classico da logica fuzzy. Deseja-
se, baseado em uma nota para a qualidade da comida e outra para a qualidade
do servico, determinar um percentual para a gorjeta. Ao longo deste capıtulo sera
descrito um modelo para este problema. Nesta secao serao definidos os conjuntos
fuzzy.
O problema e composto por duas variaveis de entrada e uma variavel de saıda.
Define-se tres conjuntos fuzzy para cada uma das variaveis. Para a variavel qualidade
da comida, os conjuntos ruim, normal e deliciosa. Para a variavel qualidade do
servico, os conjuntos fraco, aceitavel e maravilhoso. Ja para a variavel de saıda
percentual da gorjeta, os conjuntos baixo, medio e alto. Os formatos dos conjuntos
fuzzy podem ser vistos na Figura 2.6.
Os conjuntos foram definidos no scikit-fuzzy da seguinte forma:
1 # --*- coding: utf -8 -*-
2 import numpy as np
3 import skfuzzy as fuzz
4
5 # Gerando os universos das variaveis
6 # * Qualidade da comida e servico possuem uma nota subjetiva
no intervalo [0, 10]
7 # * Percentual de gorjeta pode variar no intervalo [0, 25]
8 x_qual = np.arange(0, 10.1, 0.1)
9 x_serv = np.arange(0, 10.1, 0.1)
10 x_tip = np.arange(0, 25.1, 0.1)
11
12 # Gerando as funcoes de pertinencia dos conjuntos fuzzy
13 qual_lo = fuzz.trimf(x_qual , [0, 0, 5])
14 qual_md = fuzz.trimf(x_qual , [0, 5, 10])
15 qual_hi = fuzz.trimf(x_qual , [5, 10, 10])
16 serv_lo = fuzz.trimf(x_serv , [0, 0, 5])
17 serv_md = fuzz.trimf(x_serv , [0, 5, 10])
14
0 2 4 6 8 100.0
0.2
0.4
0.6
0.8
1.0Qualidade da Comida
RuimNormalDeliciosa
0 2 4 6 8 100.0
0.2
0.4
0.6
0.8
1.0Qualidade do Servico
FracoAceitavelMaravilhoso
0 5 10 15 20 250.0
0.2
0.4
0.6
0.8
1.0Percentual da Gorjeta
BaixoMedioAlto
Figura 2.6: Problema da gorjeta - Variaveis fuzzy
15
18 serv_hi = fuzz.trimf(x_serv , [5, 10, 10])
19 tip_lo = fuzz.trimf(x_tip , [0, 0, 13])
20 tip_md = fuzz.trimf(x_tip , [0, 13, 25])
21 tip_hi = fuzz.trimf(x_tip , [13, 25, 25])
2.3 Inferencia Fuzzy
2.3.1 Regras Fuzzy e Implicacao logica
A forma de se representar um processo decisorio em logica fuzzy se da por meio
de regras fuzzy. Essas regras tem a forma de afirmacoes do tipo se-entao:
Se x ∈ A entao y ∈ B
Onde a expressao x ∈ A e uma premissa ou proposicao de que o elemento x
pertence ao conjunto fuzzy A contido em um universo X. Ja a expressao y ∈ B e
a consequencia de que o elemento y pertence ao conjunto fuzzy B contido em um
universo Y . O primeiro passo para podermos utilizar regras fuzzy e formalizar mate-
maticamente o conceito dessas regras se-entao, tambem conhecido como inferencia
logica.
Considere dois conjuntos classicos A e B contidos no universo X, assim como duas
proposicoes
p : x ∈ A,
q : x ∈ B.
Em logica classica, a implicacao logica, simbolizada por ”→”e um operador logico
para a criacao de afirmacoes condicionais. A seguinte afirmacao p→ q pode ser lida
como se p entao q. A afirmacao significa, simplesmente, que, se a proposicao p for
verdadeira, entao a proposicao q tambem sera verdadeira. Em logica classica temos:
p→ q = ¬p ∨ q,
onde ¬ e o simbolo de negacao logica e ∨ e o sımbolo de conjuncao logica (OU
logico).
16
Figura 2.7: Representacao grafica de A→ B
Suponha que A representa o conjunto dos peixes e B o conjunto dos animais que
nadam. Suponha tambem que p e a proposicao isso e um peixe (x ∈ A) e que q e a
proposicao isso pode nadar (x ∈ B). Pode-se dizer:
SE isso e um peixe ENTAO isso pode nadar (p→ q)
Portanto, isso NAO e um peixe OU isso pode nadar (¬p ∨ q)
Ao se aplicar o operador de implicacao a dois conjuntos, por exemplo A → B,
tem-se como resultado um conjunto R em que, todos os elementos R que estiverem
contidos em A, tambem estarao contidos em B, como pode ser visto na Figura 2.7.
Portanto:
R = A→ B = A ∪B.
Representando A, B e R por meio de suas funcoes caracterısticas terıamos:
UR(x) = max[(1− UA(x)),UB(x)]
No caso em que A pertence a um universo X e B pertence a um universo Y , tem-se
que:
R = A→ B = (A× Y ) ∪ (A×B),
como pode ser observado na 2.8. Representando A, B e R por meio de suas funcoes
caracterısticas tem-se:
UR(x, y) = max[(1− UA(x)),min(UA(x),UB(y))]
17
X
B
A
Y
A x B
A x Y
A→B
Figura 2.8: Representacao grafica de A→ B
No caso em que A e B sao conjuntos fuzzy a relacao R = A→ B = A ∪ B pode
ser reescrita, de forma que a funcao de pertinencia para a implicacao R seria:
µR(x, y) = max[(1− µA(x)),min(µA(x), µB(y))]
Esta, porem, nao e a unica forma de representar a implicacao na logica fuzzy. Diver-
sas maneiras sao utilizadas e cada uma satisfaz diferentes requisitos da implicacao
logica classica [8] [9]. A Tabela 2.2 mostra algumas das principais formas de im-
plicacao fuzzy. As implicacoes de Mamdani e Larsen, apesar de nao poderem ser
consideradas como implicacoes, por nao satisfazerem a tabela verdade da implicacao
classica, conseguiram uma enorme aceitacao na pratica [10].
Pode-se agora criar uma regra fuzzy para o exemplo do problema da gorjeta,
relacionando os conjuntos fuzzy estabelecidos anteriormente. Uma possıvel regra
seria:
Se qualidade do servico e aceitavel,
entao percentual da gorjeta e medio
18
Tabela 2.2: Principais funcoes de implicacao fuzzy.
Nome Funcao
Mamdani [11] µR(x, y) = min(µA(x), µB(y))
Larsen [12] µR(x, y) = µA(x)× µB(y)
Lukasiewicz [13] µR(x, y) = min(1, 1− µA(x) + µB(y))
Kleene-Dienes [14] [15] µR(x, y) = max(1− µA(x), µB(y))
Godel [16] µR(x, y) =
1, se µA(x) ≤ µB(x);
µB(x), se µA(x) > µB(x).
Considere S e G os conjuntos universo para qualidade do servico e percentual da
gorjeta, respectivamente e variaveis s ∈ C e g ∈ G. Pode-se representar os conjuntos
fuzzy ”aceitavel”e ”medio”com A e B, respectivamente:
A = aceitavel, A ⊆ S,
B = medio, B ⊆ G
As suas funcoes de pertinencia, µA(s) e µB(g) foram representadas graficamente na
ultima secao pela Figura 2.6.
Apos estas definicoes, pode-se reescrever a regra fuzzy da seguinte forma:
R(s, g) Se s e A, entao g e B
Pode-se, entao, reduzir a regra para:
R : A→ B
Utilizando a funcao de implicacao de Mamdani neste exemplo. A funcao de per-
tinencia da relacao se da entao por:
µR(c, g) = min(µA(s), µB(g))
A Figura 2.9 mostra o resultado da funcao de pertinencia da regra usando µA(s)
e µB(g) da Figura 2.6.
19
Qualidade
doS
ervico
0
2
4
6
8
10
Percentual da Gorjeta0 5 10 15 20 25
µR
(c, g
)
0.0
0.2
0.4
0.6
0.8
1.0
Funcao de Pertinencia de uma regra fuzzy
Figura 2.9: Representacao grafica da funcao de pertinencia para a regra
R(s, g)
2.3.2 Inferencia Fuzzy
O objetivo de um sistema fuzzy e, a partir de uma serie de entradas fornecidas
ao sistema, gerar uma saıda que satisfaca determinadas condicoes (regras). Ate o
momento definimos para o exemplo da gorjeta os conjuntos fuzzy de entrada e saıda
assim como uma regra. O que e necessario agora e definir como o conjunto de saıda
sera modificado quando o valor da entrada do sistema for definido. Para tal usa-se
o que e chamado de inferencia fuzzy.
Inferencia, nada mais e do que a associacao de premissas de forma a obter uma
conclusao. A principal forma de inferencia logica que e utilizada em sistemas fuzzy
e a Modus Ponens. Essa estrutura e formada por uma premissa de implicacao de
que A → B e uma premissa de que a proposicao A e verdadeira. Desta chega-se a
conclusao de que B tambem e verdadeiro. Por exemplo:
20
Premissa 1: SE isto e um peixe ENTAO isto pode nadar. (A→ B)
Premissa 2: Isto E um peixe. (A)
Conclusao: Isto pode nadar. (B)
B pode ser definido a partir da composicao das relacoes apresentadas (Premissas 1
e 2) atraves da notacao B = A ◦ (A→ B).
A generalizacao de Modus Ponens para o exemplo da gorjeta seria a seguinte [17]:
Premissa 1: Se s ∈ A, entao g ∈ B.)
Premissa 2: s ∈ A′.Conclusao: B′.
Pode-se, entao, escrever B′ como:
B′ = A′ ◦ (A→ B) = A′ ◦R
Onde A′ e a restricao aplicada ao fuzzy set A e B′ e o novo conjunto fuzzy para a
saıda uma vez aplicada essa restricao a entrada.
Ao ser definido o valor de uma das entradas de um sistema fuzzy, este valor
primeiro sera fuzzificado. Isto, nada mais e, do que aplicar a funcao de pertinencia
ao valor. No caso do exemplo da gorjeta, tendo uma nota para a qualidade do
servico s0, o processo de fuzzificacao sera encontrar µA(s0). Em seguida a entrada
fuzzificada e aplicada ao sistema de inferencia. No sistema descrito acima tem-se
que:
A′ = s0
Para encontrar a funcao de pertinencia do conjunto de saıda apos esta restricao ser
aplicada a entrada, faz-se que [17]:
µB′(g) = s0 ◦ (µA(s)→ µB(g))
µB′(g) = µA(s0)→ µB(g)
µB′(g) = R(s0, g)
Ao aplicar a implicacao de Mamdani:
µB′(g) = min(µA(s0), µB(g))
21
0 2 4 6 8 10
Qualidade do Servico
0.0
0.2
0.4
0.6
0.8
1.0
Pert
inen
cia
Qualidade do Servico
0 5 10 15 20 25
Percentual da Gorjeta
0.0
0.2
0.4
0.6
0.8
1.0
Pert
inen
cia
Percentual da Gorjeta
Figura 2.10: Implicacao fuzzy - Funcao de pertinencia µB′(g)
Caso seja atribuıda uma nota para a qualidade do servico, por exemplo, s0 = 6,
o resultado para o conjunto fuzzy da saıda pode ser visto na Figura 2.10 e pode,
tambem, ser visualizado como um corte transversal na superfıcie da Figura 2.9.
2.3.3 Exemplo de Aplicacao de Regras
Seguindo com o exemplo da gorjeta, foi definida uma regra fuzzy relacionando a
qualidade da comida com a gorjeta. Serao definidas mais duas regras ficando com
as tres regras a seguir:
1. Se a comida e ruim ou o servico e fraco, entao percentual da gorjeta sera baixo;
2. Se servico e aceitavel, entao percentual da gorjeta e medio;
3. Se a comida e excelente ou o servico e maravilhoso, entao o percentual da
gorjeta sera alto.
Serao tambem definidos os valores da entrada:
• Qualidade do servico: 4;
• Qualidade da comida: 9.5;
A Figura 2.11 mostra cada uma das regras aplicadas.
22
A biblioteca scikit-fuzzy apresenta uma funcao para fuzzificar os valores de en-
trada. O codigo para aplicar as regras que foram definidas pode ser visto a seguir.
1 # O primeiro passo ap os definirmos as entradas 4 e 9.5 e a
fuzzificacao.
2 # A funcao interp_membership realiza esse processo retornando
o grau de pertin encia.
3 qual_level_lo = fuzz.interp_membership(x_qual , qual_lo , 4)
4 qual_level_md = fuzz.interp_membership(x_qual , qual_md , 4)
5 qual_level_hi = fuzz.interp_membership(x_qual , qual_hi , 4)
6
7 serv_level_lo = fuzz.interp_membership(x_serv , serv_lo , 9.5)
8 serv_level_md = fuzz.interp_membership(x_serv , serv_md , 9.5)
9 serv_level_hi = fuzz.interp_membership(x_serv , serv_hi , 9.5)
10
11 # Agora aplicamos as regras
12
13 # REGRA 1
14 # A regra 1 relaciona um servico ou comida ruim a uma gorjeta
baixa
15 # O operador OU e definido como o maximo dos dois
16 active_rule1 = np.fmax(qual_level_lo , serv_level_lo)
17 # A implicacao na saida e feita da mesma forma.
18 tip_activation_lo = np.fmin(active_rule1 , tip_lo) # removed
entirely to 0
19
20 # REGRA 2
21 # A regra 1 e uma implicacao de servico medio em gorjeta media
22 # Usamos o operador de implicac~ao de Mamdani que e o minimo
23 tip_activation_md = np.fmin(serv_level_md , tip_md)
24
25 # REGRA 3
26 # A regra 3 relaciona servico ou comida bons a gorjeta alta.
27 # As operacoes sao as mesmas da regra 1
28 active_rule3 = np.fmax(qual_level_hi , serv_level_hi)
29 tip_activation_hi = np.fmin(active_rule3 , tip_hi)
23
0 5 10 15 20 250.0
0.2
0.4
0.6
0.8
1.0Atividade da Funcao de Pertinencia da Saıda
Regra 1Regra 2Regra 3
Figura 2.11: Saıda das regras fuzzy
2.4 Agregacao e Defuzzificacao
A maioria dos sistemas fuzzy sao compostos por mais de uma regra. O processo
pelo qual se obtem a conclusao final a partir das diferentes regras e chamado de
agregacao. Duas formas de agregacao sao [18]:
1. Sistema de regras conjuntivas: Onde as regras devem ser mutualmente satis-
feitas. Neste caso elas sao conectadas por uma operacao E.
R = R1 ∩R2 ∩ · · · ∩Rn
2. Sistema de regras disjuntivas: Onde pelo menos uma regra deve ser satisfeita.
Neste caso elas sao conectadas por uma operacao OU.
R = R1 ∪R2 ∪ · · · ∪Rn
Defuzzificacao e o processo de conversao de uma quantidade fuzzy para uma quan-
tidade precisa, assim como a fuzzificacao e o processo converter uma quantidade pre-
cisa em uma quantidade fuzzy. Abaixo estao listados alguns dos principais metodos
de defuzzificacao [19] [20]:
24
1. Centroide (centro da area ou centro de gravidade): E uma das tecnicas mais
usadas possuindo um dos mais fortes apelos a fısica. [21].
zdefuzz =
∫µR(z).z dz∫µR(z) dz
2. Centro das Somas : E uma tecnica mais rapida do que a centroide, com o
ponto negativo de somar areas sobrepostas. Ela consiste em somar as areas de
cada funcao de pertinencia de saıda calculando, em seguida, o centroide dessa
soma.
zdefuzz =
∫z∑n
k=1 µRk(z) dz∫ ∑n
k=1 µRk(z) dz
3. Centro do Maximo, Mınimo do Maximo e Maximo do Maximo: Estas tecnicas
usam o maximo da funcao de pertinencia da saıda para calcular o valor de-
fuzzificado da saıda. Caso o maximo seja apenas um ponto as tres tecnicas
resultam no mesmo valor. Caso o maximo seja um plato elas retornaram o va-
lor referente ao seu centro, seu mınimo e seu maximo, respectivamente. Sento
a e b o menor e maior valores de z, respectivamente, a retornar o maximo de
µR(z), tem-se que:
Mınimo do Maximo: zdefuzz = a
Centro do Maximo: zdefuzz = a+b2
Maximo do Maximo: zdefuzz = b.
4. Media Ponderada: E a media dos centros de massa de cada funcao de cada
funcao de pertinencia da saıda ponderada pelo valor da funcao de transferencia
no centro de massa.
zdefuzz =
∑nk=1 µRk
(z).z∑nk=1 µRk
(z),
Onde z e o centro de massa da funcao de pertinencia.
Voltando ao exemplo da gorjeta, as funcoes de pertinencia da saıda serao agrega-
das usando a funcao de maximo como operador para o OU logico. Em seguida sera
feita defuzzificacao por centroide na funcao de pertinencia agregada. Apos estes dois
passos obtemos um valor para a gorjeta de 16,7%. O processo de defuzzificacao pode
ser visto na Figura 2.12, onde o ponto te centroide e indicado por uma linha vertical.
25
0 5 10 15 20 25
Percentual de Gorjeta
0.0
0.2
0.4
0.6
0.8
1.0
Pert
inen
cia
Funcao de Pertinencia Agregada
Figura 2.12: Defuzzificacao do problema da gorjeta
A biblioteca scikit-fuzzy possui algumas funcoes de defuzzificacao implementada. O
codigo para agregacao e defuzzificacao pode ser visto abaixo:
1 # Agrega as 3 funcoes de pertinencia da saida
2 aggregated = np.fmax(tip_activation_lo ,
3 np.fmax(tip_activation_md ,
tip_activation_hi))
4
5 # Calcula o resultado defuzzificado
6 tip = fuzz.defuzz(x_tip , aggregated , ’centroid ’)
7 tip_activation = fuzz.interp_membership(x_tip , aggregated , tip
) # for plot
26
Capıtulo 3
Delimitacao do Problema
3.1 Descricao do Problema
Na selecao de candidatos para um a vaga de emprego, a identificacao de um perfil
de cultura e valores para os candidatos e um aspecto excessivamente trabalhoso e
subjetivo. Isso pode ser feito por head hunters, ou durante extensos processos de en-
trevistas e dinamica de grupos. Este projeto tem como objetivo, o desenvolvimento
de um modelo computacional, capaz de reduzir essa subjetividade e automatizar o
processo de selecao de candidatos, no que diz respeito a compatibilidade de cultura
e valores, entre candidato e empresa.
O modelo recebe como entrada dados coletados por meio de dois questionarios
desenvolvidos pela empresa Pin People: um para candidatos e um para as empresas.
Aplica-se os devidos pre-processamentos aos dados e, em seguida, utiliza-se um
sistema de logica fuzzy para retornar um grau de compatibilidade entre o candidato
e a empresa.
O sistema fuzzy utilizado e do tipo Maidani, por ser amplamente utilizado para
capturar informacao de um especialista de maneira intuitiva [4]. As regras fuzzy
foram desenvolvidas juntamente com um especialista de recrutamento e selecao, de
forma a refletir o processo decisorio.
O grau de compatibilidade deve seguir as diretrizes para avaliacao ja utilizadas
pela Pin People, mostradas na Tabela 3.1. As variaveis utilizadas neste projeto serao
27
descritas na proxima secao, mas novas variaveis podem ser adicionadas futuramente
de forma a refinar o sistema.
Tabela 3.1: Graus de compatibilidade entre candidatos e empresas.
Classe Grau de Compatibilidada Nota
1 Compatibilidade muito baixa 0 - 2,9
2 Compatibilidade baixa 3 - 5,9
3 Compatibilidade alta 6 - 7,9
4 Compatibilidade muito alta 8 - 10
Candidatos das classes 3 e 4 de compatibilidade com uma empresa sao os consi-
derados compatıveis. Sao esses os candidatos que serao apresentados as empresas.
Vale ressaltar que a compatibilidade e dependente tanto do candidato quanto da
empresa, de forma que um candidato altamente compatıvel com uma empresa nao
necessariamente o sera com as demais, e vice versa.
O erro em classificar um candidato que deveria ser da classe 3 como sendo da
classe 2 e muito mais preocupante do que classifica-lo como sendo da classe 4, pois
este erro significa nao apresenta-lo para a empresa. Por esta razao, neste projeto,
optou-se por juntar as classe 3 e 4, como compatıvel, assim como as classes 1 e
2, como incompatıvel, reduzindo o problema para um classificador binario. Desta
maneira a eficiencia do modelo pode ser representada pela probabilidade de deteccao
(PD), que e a probabilidade de alguem classificado como compatıvel ser realmente
compatıvel, e pela probabilidade de falso alarme (PF), que e a probabilidade de
alguem classificado como compatıvel ser, na verdade, incompatıvel.
Como figuras de merito, observou-se as PDFs (Probability Density Function) [22]
da saıda para os conjuntos compatıvel e incompatıvel, assim como a curva ROC (Re-
ceiver Operating Characteristic) [23] [24]. Ela relaciona a probabilidade de deteccao
(PD) com a probabilidade de falso alarme (PF), para cada limiar de corte possıvel
em um classificador binario. Um classificador binario perfeito e aquele operando no
ponto superior direito do espaco ROC, onde PD = 1 e PF = 0. Neste ponto as
28
PDFs de cada classe nao apresentam nenhuma sobreposicao.
3.2 Selecao de Variaveis
Os dados utilizados neste projeto foram fornecidos pela empresa Pin People e
foram extraıdos das respostas de dois questionarios elaborados pela empresa. Es-
tes questionarios, tem como finalidade, mapear a Cultura Organizacional de uma
empresa, e o nıvel de compatibilidade de um candidato com essa cultura.
Ambos os questionarios foram desenvolvidos tomando como base a literatura a
respeito de cultura organizacional. Um deles e voltado para candidatos e o outro
para os colaboradores da empresa. A partir das respostas dos colaboradores, de uma
determinada area da empresa, e consolidado um perfil para aquela area. O modelo
desenvolvido, classifica o nıvel de compatibilidade do perfil de um candidato, com
uma determinada area de uma empresa.
Obteve-se acesso a apenas um numero restrito de variaveis dos questionarios,
portanto, foi necessario escolher as mais representativas para a avaliacao de com-
patibilidade. Buscou-se entao, variaveis que possuıssem uma alta correlacao com o
nıvel de compatibilidade assim como as variaveis que tivessem maior respaldo por
parte da literatura de cultura organizacional.
Uma analise, nao publica, feita pela Pin People, cruzando variaveis do questionario
com notas dadas por um especialista em recrutamento revelou duas variaveis como
sendo as mais correlacionadas com o grau de compatibilidade, sao elas: Arquetipos
e Valores. Ambas tambem possuem forte respaldo na literatura de cultura organi-
zacional.
3.2.1 Arquetipos
A variavel de arquetipo foi extraıda da metodologia Competing Values Framework
[1], desenvolvido por Kim Cameron e Robert Quinn, em 1999. Esta metodologia
permite diagnosticar uma determinada organizacao como uma composicao de quatro
arquetipos, brevemente descritos na Tabela 3.2.1. Estes arquetipos sao: Hierarchy,
29
Market, Clan, Adhocracy. Eles foram traduzidos para o questionario, respectiva-
mente, como: Estruturado, Superacao, Colaborativo, Desbravador. Eles podem ser
representados graficamente como pode ser visto na Figura 3.1. Pode-se observar,
pela figura, que existe uma relacao de oposicao entre os arquetipos Estruturado e
Desbravador, assim como entre Superacao e Colaborativo.
Tabela 3.2: Descricao dos arquetipos
Arquetipo Descricao
Estruturado Uma organizacao que preza por definir processos claros, con-
seguem direcionar o que as pessoas precisam fazer no dia a
dia.
Superacao E uma organizacao com muita orientacao para resultado. A
maior preocupacao e ter o trabalho realizado e cada vez me-
lhor. As pessoas sao competitivas e orientadas a metas. Os
lıderes sao fortes direcionadores, executores e competidores.
Colaborativo E uma empresa com um ambiente muito amigavel para se
trabalhar, as pessoas compartilham muitas informacoes sobre
elas mesmas.
Desbravador E uma empresa dinamica e oferece um ambiente com bastante
autonomia para se trabalhar. E uma organizacao incentiva
muito a liberdade e pessoas que gostam de ir atras de novos
desafios e que assumem os riscos.
Os valores para os arquetipos devem somar 100% e sao extraıdos a partir de seis
perguntas do questionario por meio da metodologia Competing Values Framework
[1]. E considerado o arquetipo da area a ser mapeada a media aritmetica das respos-
tas de cada colaborador da area. A lista contendo os valores do candidato mapeados
em arquetipos, junto com a lista da empresa serao entradas do modelo.
3.2.2 Valores
A variavel de valores consiste em uma lista de 28 variaveis selecionadas a partir
dos estudos feito por O’Reilly [25] e James Sarros [2]. O’Reilly reduziu um conjunto
30
Figura 3.1: Representacao grafica dos arquetipos para um candidato e uma
empresa
inicial de 110 valores, mais presentes em organizacoes, para 58 valores. Posterior-
mente James Sarros conseguiu, a partir destes 58, chegar numa lista de 28 valores.
A lista dos valores usados no questionario da Pin People com uma breve descricao
de cada um pode ser visto na Tabela 3.3.
Dessa lista, no questionario de candidatos, cada candidato que preenche deve
selecionar ate cinco valores que melhor o representam. Ja no questionario de em-
presas, cada colaborador da area a ser mapeada deve escolher ate cinco que melhor
representam a empresa. Os 5 valores mais marcados pelos colaboradores passam a
representar a area mapeada. Os valores do candidato e os valores da empresa serao
entradas do modelo.
31
Tabela 3.3: Descricao dos valores
Valores Descricao
Agilidade As decisoes sao tomadas rapidamente, assim como
a implementacao das atividades
Assumir responsabili-
dade individual
Trazer para si a responsabilidade pelo cumpri-
mento ou nao de determinado objetivo
Baixo conflito Pouco desentendimento a respeito de diferentes in-
teresses, sentimentos e ideias
Brilho nos olhos Forte empolgacao e entusiasmo, que chegam a ser
aparentes sob a perspectiva do outro
Cautela Agir com cuidado, olhando para os detalhes
Clara filosofia de ori-
entacao
Saber exatamente o que se quer atingir, qual ca-
minho se deve seguir
Colaboracao Ato ou efeito de colaborar, trabalhar em conjunto.
Compartilha informacoes
livremente
Ser capaz de expressar ideias sem julgamento, ou
seja, sem distincao ou percepcao de diferencas
Correr riscos/ousar Ter coragem e ousadia para realizar algo
Distincao Ser, fazer ou ter algo que nao e comum em outras
organizacoes
Enfase na qualidade Importancia para que o produto ou servico ou ati-
vidade esteja em conformidade certo padrao de ex-
celencia
Entusiasmo no trabalho Ter prazer e empolgacao no desenvolvimento das
atividades
32
Tabela 3.3 - Continuacao
Valores Descricao
Estabilidade Que age com firmeza, solidez, seguranca
Etica Princıpio moral que exige conduta justa, com res-
peito ao direito e a equidade, manifestado em ato
ou comportamento
Foco em equipes Acoes direcionadas a estimular que um conjunto
de pessoas trabalhe em prol do mesmo objetivo
Foco em pessoas Acoes direcionadas a motivacao e a maximizacao
dos resultados entregues pelas pessoas
Foco em resultados Acoes direcionadas ao resultado final
Foco na realizacao Acoes direcionadas a execucao e concretizacao
Garantia de emprego Seguranca da vaga por um determinado tempo
Inovacao Criacao e/ou implementacao de alguma novidade
Meritocracia Atribuicao de recompensa aos que fizeram por
merece-la.
Oportunidade para cres-
cimento profissional
Possibilidade para exercer atividades acima do es-
perado e obter reconhecimento
Organizacao As atividades funcionam corretamente no tempo
estipulado.
Ser calma Tranquilidade e paciencia
Ser competitiva Agir intensamente direcionado a conquista de um
objetivo
Socialmente responsavel Cumprimento dos deveres e obrigacoes dos in-
divıduos e empresas para com a sociedade em geral
Superacao Comportamento que traga resultados acima do so-
licitado/acordado
Transparencia Caracterıstica de nao ocultar informacoes perti-
nentes, se mostrando tal como e.
33
3.2.3 Variaveis de Regua
Segundo Edgar Schein [26] para haver o entendimento de cultura e necessario um
processo de entrevistas qualitativas nas organizacoes. Um processo complementar a
construcao do questionario, feito pela Pin People, foram entrevistas em profundidade
com diversos gestores de empresa e tambem com candidatos, para um entendimento
mais profundo de cultura. Durante este processo, foi coletada informacao sobre o
que um candidato gostaria de saber sobre uma empresa e sobre o que uma empresas
gostaria de saber sobre um candidato.
A partir dessa informacao foi elaborada uma secao no questionario com as pergun-
tas mais relevantes. Serao utilizadas quatro dessas perguntas do lado do candidato e
quatro do lado da empresa. Estas quatro foram escolhidas pois cada uma das quatro
do candidato possui uma correspondencia direta com uma das quatro da empresa.
As variaveis escolhidas sao:
Candidato:
• No dia a dia prefiro trabalhar sozinho?
• No dia a dia gosto de ser o meu proprio chefe e tomar decisoes?
• Quanto ter flexibilidade de horario no dia a dia do seu trabalho e importante
para voce?
• Questiono o que e padrao e executo as coisas de forma diferente?
Empresa:
• Como voce avalia o nıvel de colaboracao entre pessoas da organizacao?
• Qual o grau de autonomia que voce tem para tomar e executar as decisoes?
• Com que frequencia voce possui flexibilidade para realizar seu trabalho fora
do escritorio?
• Com que frequencia voce percebe o suporte da organizacao para que uma nova
ideia seja colocada em pratica?
34
Cada um destes itens sao avaliados com uma nota de 0 a 7. Essa nota e selecionada
ao arrastar com o mouse uma especie de regua na tela, por este motivo este grupo
de variaveis e chamado de variaveis de regua. E assim que estas variaveis serao
chamadas de agora em diante.
35
Capıtulo 4
Construcao do Modelo Fuzzy
Este capıtulo trata do desenvolvimento do modelo fuzzy. Ele e composto por um
bloco de pre-processamento para cada grupo de variaveis selecionado (Arquetipos,
Valores e Variaveis de Regua). Cada bloco utiliza a informacao do candidato e da
empresa, com relacao a um dos grupos de variaveis, e apresenta uma saıda propor-
cional a compatibilidade apenas nesse grupo de variaveis.
A saıda destes blocos servirao como entrada para um sistema fuzzy. Usando a
informacao de compatibilidade com relacao a cada um dos grupos o sistema retorna,
entao um nıvel de compatibilidade final. O candidato e a empresa sao ditos com-
patıveis quando este nıvel esta acima de um determinado limiar de decisao, que
tambem e calculado neste capıtulo. Um diagrama de blocos representando o modelo
fuzzy completo e apresentado na Figura 4.1.
4.1 Pre-processamento
Nessa secao serao descritas as tecnicas usadas para pre-processar cada um dos
grupos de variaveis (Arquetipos, Valores e Variaveis de Regua) de forma se obter
um valor de compatibilidade entre candidato e empresa para cada uma delas. O
sistema fuzzy deve receber como entrada o nıvel de compatibilidade entre candidato
e empresa fornecido pelo pre-processamento de cada um dos grupos de variaveis.
36
Pré-processamento dos Arquétipos
Pré-processamento dos Valores
Arquétipos do Candidato
Arquétipos da Empresa
Variáveis de Réguado Candidato
Grau deCompatibilidadePré-processamento
dos Valores
Valores do Candidato
Valores da Empresa
Variáveis de Réguada Empresa
SistemaFuzzy
Figura 4.1: Diagrama de blocos do modelo fuzzy
4.1.1 Arquetipos
A informacao extraıda dos questionarios e um par de vetores, um para o candidato
e outro para a empresa, contendo quatro valores cada um, referentes ao percentual
de quanto cada arquetipo esta presente. Foram testadas duas formas de extrair um
valor de compatibilidade entre esses vetores, o primeiro e por meio de um sistema
fuzzy exclusivo para este par de vetores e o segundo e pela simples correlacao entre
eles.
O valor usado para decidir entre ambos os pre-processamentos foi a area sob
a curva ROC, tambem conhecida como AUC (Area Under the Curve), que pode
variar entre 0 e 1. A AUC tambem pode ser interpretada como a probabilidade de
que o classificador de uma nota maior, para uma instancia positiva (candidato e
empresa compatıveis) aleatoriamente escolhida do que para uma instancia negativa
(candidato e empresa incompatıveis) aleatoriamente escolhida [24]. Quanto maior a
AUC menor e a sobreposicao entre as PDFs das saıdas, para as duas classes.
37
−1.0 −0.5 0.0 0.5 1.0
Correlacao
0.0
0.5
1.0
1.5
2.0
Den
sida
dede
Pro
babi
lidad
e
Correlacao Entre ArquetiposIncompatıvelCompatıvel
Figura 4.2: Distribuicao de probabilidade da correlacao entre arquetipos
Para usar a correlacao como pre-processamento fez-se uso do Coeficiente de Cor-
relacao de Pearson [27], que e uma medida de correlacao linear entre duas variaveis.
Ele consiste em um valor entre -1 e 1, onde 1 indica correlacao positiva, 0 indica
nenhuma correlacao e -1 indica correlacao negativa. Aplicando o Coeficiente de
Correlacao de Pearson como resultado para a compatibilidade entre Arquetipos aos
pares compatıveis e incompatıveis e obtida a distribuicao mostrada na Figura 4.2.
Variando o limiar de decisao entre -1 e 1 e obtida a curva ROC mostrada na Figura
4.3. O valor de AUC para a correlacao foi de 75,45%.
No caso do sistema fuzzy para os arquetipos foi feita uma primeira tentativa
usando as funcoes de pertinencia mostradas na parte superior da Figura 4.4 para
cada um dos arquetipos, tanto de candidato como de empresa. As funcoes de per-
tinencia da saıda podem ser vistas na parte inferior da Figura 4.4. Elas foram
definidas por meio da distribuicao dos valores dos arquetipos (Figura 4.5), de forma
que os pontos em que as funcoes de pertinencia comecam a decrescer ou crescer
equivalem a media da distribuicao mais ou menos um desvio padrao. As seguintes
38
0.0 0.2 0.4 0.6 0.8 1.0
Probabilidade de Falso Alarme
0.0
0.2
0.4
0.6
0.8
1.0
Pro
babi
lidad
ede
Det
ecca
o
Curvas ROC da Correlacao Entre Arquetipos
Figura 4.3: Curva ROC da correlacao entre arquetipos
regras fuzzy foram utilizadas:
• SE arquetipo colaborativo do candidato e alto E arquetipo colaborativo da em-
presa e alto, ENTAO saıda e compatıvel;
• SE arquetipo desbravador do candidato e alto E arquetipo desbravador da em-
presa e alto, ENTAO saıda e compatıvel;
• SE arquetipo estruturado do candidato e alto E arquetipo estruturado da em-
presa e alto, ENTAO saıda e compatıvel;
• SE arquetipo superacao do candidato e alto E arquetipo superacao da empresa
e alto, ENTAO saıda e compatıvel;
• SE arquetipo colaborativo do candidato e alto E arquetipo colaborativo da em-
presa e baixo, ENTAO saıda e incompatıvel;
• SE arquetipo desbravador do candidato e alto E arquetipo desbravador da em-
presa e baixo, ENTAO saıda e incompatıvel;
39
0 20 40 60 80 100
Compatibilidade
0.0
0.2
0.4
0.6
0.8
1.0
Pert
inen
cia
Arquetipos Fuzzy
BaixoAlto
0 2 4 6 8 10
Compatibilidade
0.0
0.2
0.4
0.6
0.8
1.0
Pert
inen
cia
Compatibilidade entre Arquetipos Fuzzy
IncompatıvelCompatıvel
Figura 4.4: Funcoes de pertinencia dos arquetipos e de sua compatibilidade
• SE arquetipo estruturado do candidato e alto E arquetipo estruturado da em-
presa e baixo, ENTAO saıda e incompatıvel;
• SE arquetipo superacao do candidato e alto E arquetipo superacao da empresa
e baixo, ENTAO saıda e incompatıvel;
Com essa configuracao, testou-se dois metodos de defuzzificacao: Centroide e
Centro das Somas. As distribuicoes de probabilidade podem ser vistas na Figura 4.6
e a curva ROC na Figura 4.7. Os resultados comparando a AUC de cada um podem
ser visto na Tabela 4.1. Como a defuzzificacao por Centro das Somas apresentou um
resultado ligeiramente melhor e ainda e mais rapida computacionalmente, optou-se
por usa-la no projeto.
A Tabela 4.2 e Tabela 4.3 mostram todas as possibilidade de combinacoes de regras
entre arquetipos que fazem sentido do ponto de vista de cultura e valores. As regras
da Tabela 4.2 relaciona apenas arquetipos iguais (Se colaborativo no candidato e
alto e colaborativo na empresa e alto, entao resultado e compatıvel). Ja as regras
40
0 10 20 30 40 50 60 70 80Valor do Arquétipo
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
Dens
idad
e de
Pro
babi
lidad
e
Histograma dos Arquetipos : µ=25.000, σ=8.642
Figura 4.5: Distribuicao de probabilidade dos arquetipos
2 3 4 5 6 7 8
Saıda do Modelo Fuzzy
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
Den
sida
dede
Pro
babi
lidad
e
CentroideIncompatıvelCompatıvel
2 3 4 5 6 7 8
Saıda do Modelo Fuzzy
0.0
0.2
0.4
0.6
0.8
1.0
Den
sida
dede
Pro
babi
lidad
e
Soma dos CentrosIncompatıvelCompatıvel
Figura 4.6: Comparacao entre defuzzificacoes: Densidades de probabilidade
do pre-processamento dos arquetipos
41
0.0 0.2 0.4 0.6 0.8 1.0
Probabilidade de Falso Alarme
0.0
0.2
0.4
0.6
0.8
1.0
Pro
babi
lidad
ede
Det
ecca
o
Curvas ROC - Soma dos Centros x CentroideSoma dos CentrosCentroide
Figura 4.7: Curva ROC - Comparacao entre defuzzificacoes do pre-
processamento dos arquetipos
Tabela 4.1: Comparacao entre defuzzificacoes: Resultado de AUC do pre-
processamento dos arquetipos
Defuzzificacao AUC (%)
Centroide 70,92
Soma dos Centros 72,23
da Tabela 4.3 relacionam arquetipos opostos (Se colaborativo no candidato e alto e
superacao na empresa e alto, entao resultado e incompatıvel).
Pode-se considerar que cada uma das linhas de cada tabela se referem a um grupo
de quatro regras, uma para cada arquetipo. Dessa forma as oito regras utilizadas
ate entao poderiam ser representadas pelas duas ultimas linhas da Tabela 4.2.
Foram testadas diferentes combinacoes dos grupos de regras. O resultado da
comparacao da AUC de cada uma pode ser visto na Tabela 4.4. Pode-se observar
que a principal diferenca esta entre os grupos que contem regras relacionando o
42
Tabela 4.2: Tabela verdade de regras para a presenca de um determinado arquetipo
num candidato e numa empresa
Grupo Arquetipo no Candidato Arquetipo na Empresa Resultado
Dir1 Baixo Baixo Compatıvel
Dir2 Baixo Alto Incompatıvel
Dir3 Alto Baixo Incompatıvel
Dir4 Alto Alto Compatıvel
Tabela 4.3: Tabela verdade de regras para a presenca de um determinado arquetipo
num candidato e de um oposto numa empresa
Grupo Arquetipo no Candidato Arquetipo Oposto
na Empresa
Resultado
Op1 Baixo Baixo Incompatıvel
Op2 Baixo Alto Compatıvel
Op3 Alto Baixo Compatıvel
Op4 Alto Alto Incompatıvel
mesmo arquetipo e o grupo com regras relacionando arquetipos opostos. E possıvel
supor que isso de deve ao fato de regras para arquetipos iguais serem universal-
mente validas. Ja regras envolvendo arquetipos opostos podem falhar em casos
especıficos onde um candidato ou empresa possuem como arquetipos predominan-
tes dois arquetipos que sao opostos. Por exemplo um candidato que tenha como
arquetipos predominantes, Superacao e Colaborativo seria dado como incompatıvel
tanto para uma empresa com Colaborativo quanto pra uma empresa com Superacao.
O conjunto dos quatro grupos de regras da Tabela 4.2 foi o que apresentou o
melhor resultado e portanto sera usado para o sistema de pre-processamento dos
arquetipos.
Em seguida foram testadas diferentes combinacoes para as funcoes de pertinencia
de entrada e saıda. Mais de 5000 iteracoes foram feitas e a melhor combinacao pode
43
Tabela 4.4: Combinacoes de Regras para os Arquetipos: Resultado de AUC do
pre-processamento dos arquetipos
Grupos de Regras Usados AUC (%)
Dir1 e Dir2 72,23
Dir1, Dir2, Dir3 e Dir4 73,67
Op1 e Op2 67,13
Op1, Op2, Op3 e Op4 65,71
Dir1, Dir 2, Op1 e Op2 73,20
Op1-4 e Dir1-4 72,68
ser vista na Figura 4.8. A curva ROC para a melhor combinacao e a densidade de
probabilidade da saıda sao mostradas, respectivamente, na Figura 4.10 e na Figura
4.9, ja em comparacao com os resultados da correlacao. Os resultados de AOC para
a melhor combinacao sao mostrados na Tabela 4.5, tambem em comparacao com os
resultados de AUC da correlacao.
Tabela 4.5: Sistema fuzzy x Correlacao: Resultado de AUC do pre-processamento
dos arquetipos
Pre-processamento AUC (%)
Correlacao 75,45
Sistema Fuzzy 78,26
Como pode ser visto na Tabela 4.5 os resultados usando o modelo fuzzy foram
ligeiramente superiores, porem decidiu-se testar ambos os metodos no sistema fuzzy
que ira agregar todas os blocos de variaveis e observar a diferenca.
4.1.2 Valores
A variavel de valores, como ja foi discutido, consiste em cinco opcoes de valores que
sao escolhidas em uma lista de 28. Deve-se entao definir um metodo pelo qual se pode
chegar num nıvel de compatibilidade entre os valores marcados pelo candidato e os
cinco que melhor representam a empresa. A forma mais simples de fazer isso e contar
44
0 20 40 60 80 100
Valor Classico
0.0
0.2
0.4
0.6
0.8
1.0
Pert
inen
cia
Arquetipos Fuzzy
BaixoAlto
0 2 4 6 8 10
Compatibilidade
0.0
0.2
0.4
0.6
0.8
1.0
Pert
inen
cia
Compatibilidade entre Arquetipos Fuzzy
IncompatıvelCompatıvel
Figura 4.8: Melhor combinacao de funcoes de pertinencia dos Arquetipos e
de sua compatibilidade
3 4 5 6 7 8 9
Saıda do Modelo Fuzzy
0.0
0.2
0.4
0.6
0.8
1.0
Den
sida
dede
Pro
babi
lidad
e
Sistema Fuzzy dos ArquetiposIncompatıveisCompatıveis
−1.0 −0.5 0.0 0.5 1.0
Correlacao
0.0
0.5
1.0
1.5
2.0
Den
sida
dede
Pro
babi
lidad
e
Correlacao dos ArquetipoIncompatıveisCompatıveis
Figura 4.9: Sistema fuzzy x Correlacao: Distribuicoes de probabilidade do
pre-processamento dos arquetipos
45
0.0 0.2 0.4 0.6 0.8 1.0
Probabilidade de Falso Alarme
0.0
0.2
0.4
0.6
0.8
1.0
Pro
babi
lidad
ede
Det
ecca
o
Curvas ROC - Sistema Fuzzy x CorrelacaoSistema FuzzyCorrelacao
Figura 4.10: Sistema fuzzy x Correlacao: Curvas ROC probabilidade
quais valores foram escolhidos por ambos. Este metodo porem nao leva em conta a
relacao entre diferentes valores. Valores como ”Superacao”e ”Foco em Resultado”sao
fortemente correlacionados. Ja valores como ”Meritocracia”e ”Estabilidade”teriam
uma relacao de oposicao. Alem disso o total de valores marcados pelo candidato
pode variar.
Este pode ser interpretado como um problema onde existem 28 dimensoes, entre as
quais existem fortes relacoes de correlacao. Uma possıvel solucao e reduzir o numero
de dimensoes utilizadas para se representar os valores. A propria metodologia de
Sarros [2] ja sugere um agrupamento desses valores em sete grupos, mas como ainda
seria complexo criar regras fuzzy relacionando sete grupos para candidatos a sete
grupos para empresas optou-se por tentar representar os valores usando os quatro
grupos dos arquetipos.
Para representar os valores por meio dos arquetipos foi utilizada uma base de
dados com 17000 respostas de candidatos ao questionario. Desta base foram filtrados
apenas os candidatos que tinham um arquetipo fortemente predominante, pelos
46
seguintes criterios:
• Maior arquetipo e maior que a media dos arquetipos mais um desvio padrao
(> 35.6);
• Maior arquetipo menor que 60, para evitar respostas falsas, onde o candidato
apenas arrasta o botao da resposta para o maximo;
• Segundo maior arquetipo menor que 30, para garantir a predominancia do
maior arquetipo.
Criou-se uma matriz onde cada linha corresponde a um valor e cada coluna a um
arquetipo. Para cada candidato que passou no filtro (3396 candidatos), para cada
valor que ele marcou foi adicionado uma a celula referente a esse valor e ao arquetipo
predominante do candidato. Em seguida cada coluna e normalizada pelo total de
pessoas que tem cada arquetipo como predominante. Isso foi feito, pois o numero de
pessoas que tem predominancia em um arquetipo se mostrou muito discrepante dos
outros tres (quase duas vezes mais pessoas tem o arquetipo colaborativo predomi-
nante em comparacao com todos os outros somados). Se esta normalizacao nao fosse
feita haveria a impressao de que o arquetipo colaborativo e o mais presente em todos
os valores. Finalmente, normalizou-se cada linha pelo total na linha. Desta forma o
total de cada linha passa a ser 1 e cada um de seus elementos pode ser interpretado
como o percentual de cada arquetipo para o valor referente aquela linha.
A Tabela 4.6 mostra a distribuicao de cada um do 28 valores em arquetipos.
E possıvel notar algumas caracterısticas que intuitivamente confirmam o agrupa-
mento. Valores como ”Ser competitiva”e ”Foco em resultado”tem como arquetipo
mais forte ”Superacao”. Ja valores como ”Foco em Equipes”e ”Colaboracao”tem
como arquetipo mais forte ”Colaborativo”. O mesmo pode ser observado entre
”Correr riscos/ousar”e ”Inovacao”com ”Desbravador”, assim como entre ”Cautela”e
”Estabilidade”com ”Estruturado”.
47
Tabela 4.6: Distribuicao dos Valores em Arquetipos
Valores Superacao Colaborativo Desbravador Estruturado
Agilidade 23.70% 18.26% 22.06% 35.99%
Assumir respon-
sabilidade indi-
vidual
22.53% 13.08% 35.61% 28.78%
Baixo conflito 5.57% 34.49% 26.73% 33.21%
Brilho nos olhos 27.89% 27.12% 35.42% 9.57%
Cautela 7.46% 20.86% 4.97% 66.70%
Clara filosofia de
orientacao
20.25% 20.64% 20.09% 39.02%
Colaboracao 17.99% 41.62% 20.98% 19.40%
Compartilha in-
formacoes livre-
mente
15.85% 34.06% 32.62% 17.46%
Correr ris-
cos/ousar
23.77% 13.59% 56.34% 6.30%
Distincao 9.88% 13.81% 39.50% 36.80%
Enfase na quali-
dade
24.04% 21.02% 27.33% 27.61%
Entusiasmo no
trabalho
16.68% 31.54% 31.63% 20.15%
Estabilidade 13.24% 18.90% 6.91% 60.94%
Etica 20.58% 28.53% 20.90% 29.99%
Foco em equipes 19.26% 52.08% 16.92% 11.74%
Foco em pessoas 18.83% 41.43% 22.13% 17.60%
Foco em resulta-
dos
51.65% 11.50% 12.59% 24.26%
Foco na rea-
lizacao
35.18% 14.52% 18.18% 32.12%
48
Tabela 3.3 - Continuacao
Valores Superacao Colaborativo Desbravador Estruturado
Garantia de em-
prego
10.92% 17.66% 8.09% 63.33%
Inovacao 18.70% 22.67% 44.69% 13.94%
Meritocracia 38.06% 17.65% 22.06% 22.23%
Oportunidade
para crescimento
profissional
28.33% 24.77% 21.32% 25.57%
Organizacao 13.50% 23.11% 11.95% 51.45%
Ser calma 12.31% 29.45% 24.61% 33.63%
Ser competitiva 61.07% 11.47% 14.11% 13.35%
Socialmente res-
ponsavel
9.36% 42.72% 30.73% 17.18%
Superacao 33.21% 26.42% 26.07% 14.30%
Transparencia 17.81% 32.23% 24.72% 25.24%
Um algoritmo de agrupamento, como K-means, poderia ser aplicado a fim de
separar os valores em grupos, mas optou-se por continuar a representa-los como
uma composicao dos diferentes arquetipos a fim de nao perder mais informacao.
Decidiu-se entao considerar o vetor igual a media dos vetores das distribuicoes de
cada valor como sendo o vetor a representar os valores de um dado candidato ou
empresa.
Uma vez tendo os valores mapeados em cada arquetipo decidiu-se tentar as mes-
mas formas de pre-processamento utilizada para os arquetipos, ou seja, comparar
um sistema fuzzy com a correlacao. As regras utilizadas e o metodo de defuzzi-
ficacao foram os mesmos usados para o sistema dos arquetipos. Apos iterar em
diversas combinacoes para funcoes de pertinencia chegou-se nas funcoes mostradas
na Figura 4.11. A Figura 4.12, compara as distribuicoes de probabilidade da saıda
para os pares compatıveis e nao compatıveis, tanto do sistema fuzzy quanto da cor-
49
0 20 40 60 80 100
Valor Classico
0.0
0.2
0.4
0.6
0.8
1.0
Pert
inen
cia
Valores Fuzzy
BaixoAlto
0 2 4 6 8 10
Compatibilidade
0.0
0.2
0.4
0.6
0.8
1.0
Pert
inen
cia
Compatibilidade entre Valores Fuzzy
IncompatıvelCompatıvel
Figura 4.11: Melhor combinacao de funcoes de pertinencia dos valores e de
sua compatibilidade
relacao dos valores. A Figura 4.13, compara a curva ROC do sistema fuzzy com a
da correlacao dos valores. Na Tabela 4.7 pode ser vista a comparacao dos resultados
de AUC do sistema fuzzy e da correlacao de valores.
Tabela 4.7: Sistema fuzzy x Correlacao: Resultado de AUC do pre-processamento
dos valores
Pre-processamento AUC (%)
Correlacao 72,29
Sistema Fuzzy 73,23
Mais uma vez a diferenca de AUC, como pode ser vista, e pequena, de forma
que optou-se por testar ambas as formas de pre-processamento no sistema fuzzy que
agrega todas as variaveis.
50
4.0 4.5 5.0 5.5 6.0 6.5 7.0
Saıda do Modelo Fuzzy
0.0
0.2
0.4
0.6
0.8
1.0
1.2
1.4
1.6
1.8
Den
sida
dede
Pro
babi
lidad
e
Sistema Fuzzy para os ValoresIncompatıveisCompatıveis
−1.0 −0.5 0.0 0.5 1.0
Correlacao
0.0
0.5
1.0
1.5
2.0
Den
sida
dede
Pro
babi
lidad
e
Correlacao dos ValoresIncompatıveisCompatıveis
Figura 4.12: Sistema Fuzzy x Correlacao: Distribuicoes de probabilidade do
pre-processamento dos valores
0.0 0.2 0.4 0.6 0.8 1.0
Probabilidade de Falso Alarme
0.0
0.2
0.4
0.6
0.8
1.0
Pro
babi
lidad
ede
Det
ecca
o
Curvas ROC - Sistema Fuzzy x CorrelacaoSistema FuzzyCorrelacao
Figura 4.13: Sistema Fuzzy x Correlacao: Curvas ROC do pre-processamento
dos valores
51
4.1.3 Variaveis de Regua
As chamadas variaveis de regua ja foram listadas anteriormente, mas a Tabela 4.8
e a Tabela 4.9 mostram o nome utilizado para representar cada uma das pergun-
tas. Cada uma delas recebe como resposta um numero real de 0 a 7 diretamente
proporcional a quanto a pergunta ou afirmacao reflete a realidade.
Tabela 4.8: Variaveis de regua para candidatos e seus apelidos
Apelido Pergunta ao Candidato
Flexibilidade Quanto ter flexibilidade de horario no dia a dia do seu trabalho
e importante para voce?
Inovacao Questiono o que e padrao e executo as coisas de forma dife-
rente.
Autonomia No dia a dia gosto de ser o meu proprio chefe e tomar decisoes.
Trabalhar So No dia a dia prefiro trabalhar sozinho.
Tabela 4.9: Variaveis de regua para empresas e seus apelidos
Apelido Pergunta ao Colaborador da Empresa
Flexibilidade Com que frequencia voce possui flexibilidade para realizar seu
trabalho fora do escritorio?
Inovacao Com que frequencia voce percebe o suporte da organizacao
para que uma nova ideia seja colocada em pratica?
Autonomia Qual o grau de autonomia que voce tem para tomar e executar
as decisoes?
Colaboracao Como voce avalia o nıvel de colaboracao entre pessoas da or-
ganizacao?
Como pode ser visto as quatro variaveis de candidato e empresa se referem aos
mesmos temas (”Colaboracao”e ”Trabalhar So”sao do mesmo tema embora opostos)
de forma que e possıvel fazer o teste usando correlacao entre o vetor de quatro
variaveis de candidato com o da empresa, alem, e claro, do sistema fuzzy. O sistema
52
fuzzy tambem utilizou soma dos centros como metodo de defuzzificacao e regras
fuzzy abaixo:
• SE flexibilidade para o candidato e alto E flexibilidade para a empresa e alto,
ENTAO saıda e compatıvel;
• SE inovacao para o candidato e alto E inovacao para a empresa e alto,
ENTAO saıda e compatıvel;
• SE autonomia para o candidato e alto E autonomia para a empresa e alto,
ENTAO saıda e compatıvel;
• SE trabalhar so para o candidato e alto E colaboracao para a empresa e baixo,
ENTAO saıda e compatıvel;
• SE flexibilidade para o candidato e alto E flexibilidade para a empresa e baixo,
ENTAO saıda e incompatıvel;
• SE inovacao para o candidato e alto E inovacao para a empresa e baixo,
ENTAO saıda e incompatıvel;
• SE autonomia para o candidato e alto E autonomia para a empresa e baixo,
ENTAO saıda e incompatıvel;
• SE trabalhar so para o candidato e alto E colaboracao para a empresa e alto,
ENTAO saıda e incompatıvel;
As funcoes de pertinencia para as entradas e saıda foram definidas apos iteracoes
em mais de 5000 combinacoes de funcoes de pertinencia. As funcoes de pertinencia
que resultaram no melhor desempenho estao representadas na Figura 4.14. A Figura
4.15, compara as distribuicoes de probabilidade do conjunto de pares compatıveis e
nao compatıveis, tanto do sistema fuzzy quanto da correlacao dos valores. A Figura
4.16, compara a curva ROC do sistema fuzzy com a da correlacao dos valores. Na
Tabela 4.10 pode ser vista a comparacao dos resultados da AUC do sistema fuzzy e
da correlacao de valores.
53
0 1 2 3 4 5 6 7
Valor Classico
0.0
0.2
0.4
0.6
0.8
1.0
Pert
inen
cia
Arquetipos Fuzzy
BaixoAlto
0 2 4 6 8 10
Compatibilidade
0.0
0.2
0.4
0.6
0.8
1.0
Pert
inen
cia
Compatibilidade entre Arquetipos Fuzzy
IncompatıvelCompatıvel
Figura 4.14: Melhor combinacao de funcoes de pertinencia das variaveis de
regua e de sua compatibilidade
3 4 5 6 7 8 9
Saıda do Modelo Fuzzy
0.0
0.1
0.2
0.3
0.4
0.5
Den
sida
dede
Pro
babi
lidad
e
Sistema Fuzzy para as Variaveis de ReguaIncompatıveisCompatıveis
−1.0 −0.5 0.0 0.5 1.0
Correlacao
0.0
0.2
0.4
0.6
0.8
1.0
Den
sida
dede
Pro
babi
lidad
e
Correlacao das Variaveis de ReguaIncompatıveisCompatıveis
Figura 4.15: Sistema fuzzy x Correlacao: Distribuicoes de probabilidade do
pre-processamento das variaveis de regua
54
0.0 0.2 0.4 0.6 0.8 1.0
Probabilidade de Falso Alarme
0.0
0.2
0.4
0.6
0.8
1.0
Pro
babi
lidad
ede
Det
ecca
o
Curvas ROC - Sistema Fuzzy x CorrelacaoSistema FuzzyCorrelacao
Figura 4.16: Sistema Fuzzy x Correlacao: Curvas ROC do pre-processamento
das variaveis de regua
Tabela 4.10: Sistema fuzzy x Correlacao: Resultado de AUC do pre-processamento
das variaveis de regua
Pre-processamento AUC (%)
Correlacao 54,46
Sistema Fuzzy 63,41
O resultado de AUC para a correlacao se aproxima do de uma escolha aleatoria,
onde a area e igual a 50%. A opcao da correlacao para as variaveis de regua foi,
entao, descartada. O sistema fuzzy sera testado como pre-processamento, para a
entrada variaveis de regua, no modelo final a fim de observar se ele apresenta uma
contribuicao positiva para o modelo.
Vale ressaltar que dos tres grupos de variaveis escolhidos esta era a unica que
nao apresentava uma forte correlacao com a avaliacao do especialista. E, portanto,
coerente a diferenca de eficiencia quanto a AUC quando comparado com arquetipos
ou valores. O grupo foi incluıdo no modelo por representar perguntas demandadas
55
pelos candidatos e empresas, mas pode ser retirado caso seja observada necessidade.
4.2 Sistema Fuzzy
Esta secao ira descrever o sistema fuzzy que, como ja foi citado, tem como pro-
posta, receber o grau de compatibilidade entre candidato e empresa, em diferentes
aspectos, e combina-los de forma a classifica-los como compatıveis ou incompatıveis.
4.2.1 Definicao do Pre-processamento
Como foi mostrado no capıtulo anterior foram testadas duas formas de pre-
processamento para gerar o grau de compatibilidade de cada variavel. Uma delas
e utilizando um sistema fuzzy especıfico para a variavel e a outra e pelo coeficiente
de correlacao da mesma variavel, entre o candidato e a empresa. Ambas as formas
mostraram um resultado muito proximo no caso dos arquetipos e valores. No caso
das variaveis de regua o pre-processamento por fuzzy se mostrou como a unica opcao
viavel.
Serao testadas portanto dois diferentes sistemas fuzzy. O primeiro utiliza as tres
entradas sendo pre-processadas pelos seus respectivos sistemas fuzzy especıficos. Ja
o segundo utiliza o coeficiente de correlacao como pre-processamento das variaveis
arquetipos e valores, mas continua utilizando o sistema fuzzy para pre-processar as
variaveis de regua.
Para comparar os sistemas decidiu-se, primeiro, testar diversas combinacoes de
funcoes de pertinencia para as entradas e saıda dos modelos e fazer a comparacao
dos modelos ja com as melhores funcoes de pertinencias. O metodo de defuzzificacao
utilizado foi a Soma dos Centros. As regras fuzzy escolhidas para ambos os modelos,
levando em consideracao a relevancia das variaveis para o especialista, foram as
seguintes:
• SE compatibilidade de arquetipos e alta E compatibilidade de valores e alta
E compatibilidade das variaveis de regua e alta, ENTAO compatibilidade e
muito alta;
56
• SE compatibilidade de arquetipos e alta E compatibilidade de valores e alta
E compatibilidade das variaveis de regua e baixa, ENTAO compatibilidade e
alta;
• SE compatibilidade de arquetipos e baixa OU compatibilidade de valores e
baixa, ENTAO compatibilidade e baixa;
• SE compatibilidade de arquetipos e baixa E compatibilidade de valores e baixa
E compatibilidade das variaveis de regua e baixa, ENTAO compatibilidade e
muito baixa;
Ao variar as funcoes de pertinencia das tres entradas (arquetipos, valores e variaveis
de regua), observou-se que variacoes nas funcoes de pertinencia da entrada variaveis
de regua nao causaram qualquer alteracao a eficiencia do modelo em termos de
AUC. A eficiencia tambem se manteve constante ao substituir a variavel pelo seu
valor medio ou ate mesmo ao exclui-la das regras. Isto pode ser devido ao fato de
ela ter um peso inferior as outras variaveis nas regras do sistema fuzzy. Optou-
se, portanto, remover a entrada variaveis de regra do modelo e substituir as regras
anteriores pelas seguintes:
• SE compatibilidade de arquetipos e alta E compatibilidade de valores e alta,
ENTAO compatibilidade e alta;
• SE compatibilidade de arquetipos e baixa OU compatibilidade de valores e
baixa, ENTAO compatibilidade e baixa;
Usando estas regras, atingi-se o melhor resultado com os conjuntos fuzzy da Figura
4.17, para o sistema fuzzy usando pre-processamento fuzzy e com os conjuntos fuzzy
da Figura 4.18, para o sistema fuzzy usando o coeficiente de correlacao como pre-
processamento. A Figura 4.19 compara as distribuicoes de probabilidade de ambos
e a Figura 4.20 compara suas curvas ROC. O resultado de AUC pode ser visto na
Tabela 4.11.
Optou-se por utilizar o sistema com o pre-processamento fuzzy. Primeiramente,
pelo fato de ter apresentado uma maior AUC, mas tambem pelo fato de que todas
57
−1.0 −0.5 0.0 0.5 1.0
Correlacao
0.0
0.2
0.4
0.6
0.8
1.0
Pert
inen
cia
Compatibilidade entre Arquetipos
BaixoAlto
−1.0 −0.5 0.0 0.5 1.0
Correlacao
0.0
0.2
0.4
0.6
0.8
1.0
Pert
inen
cia
Compatibilidade entre Valores
IncompatıvelCompatıvel
0 2 4 6 8 10
Compatibilidade
0.0
0.2
0.4
0.6
0.8
1.0
Pert
inen
cia
Compatibilidade da Saıda
Compatibilidade BaixaCompatibilidade Alta
Figura 4.17: Funcoes de pertinencia do modelo fuzzy: Correlacao como pre-
processamento
58
0 2 4 6 8 10
Compatibilidade
0.0
0.2
0.4
0.6
0.8
1.0
Pert
inen
cia
Compatibilidade entre Arquetipos
BaixoAlto
0 2 4 6 8 10
Compatibilidade
0.0
0.2
0.4
0.6
0.8
1.0
Pert
inen
cia
Compatibilidade entre Valores
IncompatıvelCompatıvel
0 2 4 6 8 10
Compatibilidade
0.0
0.2
0.4
0.6
0.8
1.0
Pert
inen
cia
Compatibilidade da Saıda
Compatibilidade BaixaCompatibilidade Alta
Figura 4.18: Funcoes de pertinencia do modelo fuzzy: Pre-processamento
fuzzy
59
3 4 5 6 7 8 9
Saıda do Modelo Fuzzy
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
Den
sida
dede
Pro
babi
lidad
e
Modelo Fuzzy: Pre-processamento FuzzyIncompatıveisCompatıveis
2 3 4 5 6 7 8 9
Saıda do Modelo Fuzzy
0.0
0.2
0.4
0.6
0.8
1.0
1.2
Den
sida
dede
Pro
babi
lidad
e
Modelo Fuzzy: Correlacao como Pre-processamentoIncompatıveisCompatıveis
Figura 4.19: Pre-processamento fuzzy x Correlacao como pre-processamento:
Distribuicoes de probabilidade do modelo fuzzy
0.0 0.2 0.4 0.6 0.8 1.0
Probabilidade de Falso Alarme
0.0
0.2
0.4
0.6
0.8
1.0
Pro
babi
lidad
ede
Det
ecca
o
Pre-processamento Fuzzy x Correlacao como Pre-processamentoModelo Fuzzy: Pre-processamento FuzzyModelo Fuzzy: Correlacao como Pre-processamento
Figura 4.20: Pre-processamento fuzzy x Correlacao como pre-processamento:
Curvas ROC do modelo fuzzy
60
Tabela 4.11: Pre-processamento fuzzy x Correlacao como pre-processamentos: Re-
sultado de AUC do modelo fuzzy
Pre-processamento AUC do modelo fuzzy (%)
Correlacao 75,15
Sistema Fuzzy 79,86
as funcoes de pertinencia dos sistemas fuzzy de pre-processamento foram ajustadas
individualmente. Acredita-se ser possıvel atingir um desempenho ainda melhor,
variando as funcoes de pertinencia do modelo como um todo (sistemas do pre-
processamento e sistema final).
4.2.2 Definicao do Limiar de Corte
O ultimo passo para a definicao do modelo e estabelecer o limiar de corte para
as classes. Para estabelecer um limiar de corte que equilibre PD e PF optou-se por
usar a Distancia Euclidiana para o ponto (0, 1) da curva ROC, que sera chamada
de D(0,1). Como ja foi dito o ponto (0, 1) e o ponto de operacao de um classificador
perfeito, portanto sera escolhido o limiar de corte que apresentar o ponto com menor
distancia ao ponto (0, 1). Essa distancia e calculada pela seguinte equacao.
D(0, 1) =√
(1− PD)2 + FA2
Calculando D(0,1) para cada ponto da curva ROC obteve-se seu valor mınimo
usando um limiar de decisao em 6,46. Ou seja, todos com nota acima serao consi-
derados compatıveis e abaixo incompatıveis. Tabela 4.12 mostra o limiar escolhido,
assim como os valores de PD, FA e D(0,1).
Tabela 4.12: Resultado do limiar de decisao
Limiar de Decisao PD (%) PF (%) D(0,1)
6,46 69,11 15,49 0.35
61
O resultado na Tabela 4.12 mostra que ha pouca diferenca de D(0,1) entre os
limiares da ROC 2 e ROC 3, e uma diferenca maior para a ROC 1. Pode-se esperar
portanto um desempenho semelhante para a classificacao das classes 2, 3 e 4 e um
desempenho um pouco inferior para classe 1.
4.2.3 Comparacao com Modelo de Referencia
Uma vez que foi definida a topologia do modelo e necessario aplicar um conjunto de
teste (dados que nao foram usados para definir o modelo). Isto e feito para garantir
a generalizacao do modelo, ou seja, garantir que o modelo nao apenas ”decorou”a
informacao do conjunto usado para definir seus parametros, o que e chamado de
overfitting.
Os resultados do modelo fuzzy sao comparados aos resultados do modelo utilizado
atualmente para a estimacao do grau de compatibilidade. Como o modelo atual e
diferente para cada empresa, foi escolhido o modelo de uma empresa em especıfico,
que possui eficiencia compatıvel com a eficiencia media dos modelos.
A Figura 4.21 mostra a densidade de probabilidade da saıda do modelo para o
conjunto de teste. Por fim a Tabela 5.2 compara o modelo fuzzy com o modelo
de referencia, considerando a separacao das classes 1 e 2 das classes 3 e 4. Sao
apresentados os valores de PD, PF e a distancia ao ponto (0, 1).
Tabela 4.13: Comparacao com modelo de referencia
Modelo PD (%) PF (%) D(0,1)
Modelo Fuzzy 71,42 30,15 0.42
Modelo de Referencia 69,44 14,81 0.34
Como pode ser visto na Tabela 5.2 a probabilidade de deteccao de ambos modelos
sao semelhantes. A probabilidade de falso alarme do modelo fuzzy, porem, e quase o
dobro da apresentada pelo modelo de referencia. Um resultado inferior era esperado
devido ao numero inferior de variaveis utilizadas na construcao do modelo fuzzy em
62
3 4 5 6 7 8 9
Saıda do Modelo Fuzzy
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
Den
sida
dede
Pro
babi
lidad
e
Modelo Fuzzy: Conjuto de TesteIncompatıveisCompatıveis
Figura 4.21: Conjunto de teste: Distribuicoes de Probabilidade do modelos
fuzzy
comparacao com o modelo de referencia. Optou-se, primeiramente, por fazer uma
otimizacao das funcoes de pertinencia do modelo fuzzy usando Algoritmo Genetico.
63
Capıtulo 5
Otimizacao por Algoritmo
Genetico
Ainda que as funcoes de pertinencia do modelo tenham sido escolhidas a par-
tir da iteracao de mais de 10.000 possıveis combinacoes, cada combinacao teve como
pre-requisito apenas ter uma relacao entre pontos que possa ser usada como funcao
de pertinencia do seu dado universo fuzzy. Esta e uma tecnica que dificilmente
vai encontrar uma combinacao otima. Neste capıtulo sera implementada algoritmo
genetico para a otimizacao das funcoes de pertinencia.
5.1 Algoritmo Genetico
Algoritmo genetico (AG) e uma heurıstica de busca que procura reproduzir o
comportamento do processo de evolucao biologico, descrito na Teoria da Evolucao
de Darwin [28]. Ela e uma tecnica amplamente utilizado para resolver problemas de
otimizacao [29].
Na biologia, cada celula e composta por um ou mais cromossomos. Cada cro-
mossomo e dividido em diferentes genes que sao responsaveis por caracterısticas
especıficas no organismo. Durante a reproducao, ocorre o chamado crossover, onde
os genes de cada um dos organismos sao recombinadas de forma a gerar um novo
organismo. O descendente esta sujeito a apresentar alguma mutacao devido a falhas
ao copiar a informacao genetica [29].
64
A evolucao ocorre quando ha selecao natural dos diferentes organismos. A selecao
natural representa a diferenca de sobrevivencia e reproducao de indivıduos devido
as suas caracterısticas [30]. Os que possuem as caracterısticas mais aptas para
sobrevivencia num dado ambiente irao sobreviver e reproduzir, passando essas ca-
racterısticas para a proxima geracao. Segundo Darwin, novas especies e classes de
seres vivos passam a existir atraves de processos de reproducao, crossover e mutacao
entre organismos ja existentes [31].
No AG, o termo cromossomo e utilizado, usualmente, para descrever uma possıvel
solucao para um dado problema. Ele e normalmente codificado como uma lista
de elementos dessa solucao. Esses elementos representam os genes [29]. No caso
do problema de otimizacao das funcoes de pertinencia do modelo fuzzy, como as
funcoes usadas sao trapezoidais, elas podem ser representadas por uma lista de
quatro pontos. Cada um desses pontos representara um gene. O cromossomo sera
a lista que concatena os pontos de todas as funcoes de pertinencia do modelo.
As formas mais simples de AG contam com as quatro operacoes abaixo, que sao
aplicadas aos cromossomos [29].
Selecao: Este operador seleciona os mais aptos cromossomos de uma populacao
para reproducao. Essa aptidao e calculada por uma funcao de avaliacao.
Crossover: No tipo mais simples de crossover, o operador seleciona aleatoriamente
uma posicao no cromossomo e troca as sequencias antes e depois deste ponto
entre os cromossomos envolvidos. Isso produz dois novos cromossomos. O
crossover e representado na Figura 5.1
Mutacao: A mutacao seleciona aleatoriamente um gene e muda o seu valor. Cada
gene tem uma probabilidade definida de sofrer mutacao. A Figura 5.2 mostra
um exemplo de mutacao.
Utilizando os operadores descritos, um algoritmo genetico simples pode ser des-
crito pelo Algoritmo 5.1.
65
A0
A1
A2
A3
A4
A5
A6
A7
B0
B1
B2
B3
B4
B5
B6
B7
A0
A1
A2
A3
A4
A5
A6
A7
B0
B1
B2
B3
B4
B5
B6
B7
Figura 5.1: Exemplo de crossover
A6
A5
A4
A3
A2
A1
A0
A7
A6
A5
M
A3
A2
A1
A0
A7
Figura 5.2: Exemplo de mutacao
66
Data: Populacao com n cromossomos
Result: Populacao otimizada e melhor indivıduo
while criterio de parada definido nao alcancado do
Avalie a aptidao de cada cromossomo na populacao;
Selecione n2
pares de cromossomos da populacao (pode haver a
repeticao do mesmo cromossomo);
Crie uma nova populacao de cromossomos, aplicando o operador de
crossover aos pares;
Aplique o operador de mutacao aos cromossomos da nova populacao;
Substitua a populacao antiga pela nova;
end
Algoritmo 5.1: Exemplo de algoritmo genetico
5.2 Modelo Fuzzy Genetico
O primeiro passo para aplicar AG para otimizar as funcoes de pertinencia do
modelos fuzzy e definir como sera escrito o cromossomo. Todas as funcoes de per-
tinencia do modelo sao do tipo trapezios retangulos, ou comecando em nıvel alto
em 0 ou terminando em nıvel alto no ultimo elemento do universo, por exemplo
[0, 0, 2, 6] ou [3, 6, 10, 10]. Por este motivo optou-se por representar a funcao de per-
tinencia apenas por dois numeros, no exemplo seriam [2, 6] e [3, 6]. Juntando todas
as funcoes de pertinencia do modelo o cromossomo necessario e uma lista de 28
elementos. Optou-se tambem por representar cada gene como um numero entre 0 e
1, pois algumas funcoes de pertinencia variam entre 0 e 10 e outras entre 0 e 100.
A funcao de avaliacao desenvolvida recebe como parametro o cromossomo, o con-
verte para as devidas funcoes de pertinencia. Em seguida avalia todos os pares de
candidato e empresa do conjunto de treino, retornando o valor de AUC do modelo.
Para a construcao do algoritmo, foi utilizada a biblioteca de Python para algoritmo
genetico DEAP (Distributed Evolutionary Algorithms in Python), que ja contem
diversas funcoes implementadas para selecao, mutacao e crossover. Para este projeto
optou-se por utilizar um algoritmo genetico simples, deixando maiores sofisticacoes
para os trabalhos futuros.
67
Para a selecao, optou-se por utilizar a funcao /emphselTournament(), para, a
partir de uma populacao com n cromossomos selecionar n2
pares de cromossomos
da populacao. Isso e feito atraves de n torneios entre k cromossomos. O mesmo
cromossomo pode ser selecionado mais de uma vez. o valor de k utilizado foi k = 3.
Para operador de crossover, optou-se por utilizar a funcao /emphcxTwoPoint().
Ela seleciona dois pontos do cromossomo e troca a informacao entre esses dois pontos
entre os cromossomos envolvidos.
Para operador de mutacao, optou-se por utilizar a funcao /emphmutGaussian().
Ela aplica uma mutacao gaussiana com media e variancia definidas aos genes do
cromossomo com uma probabilidade tambem determinada. Os valores escolhidos
foram µ = 0 e σ = 0, 2 para a gaussiana e probabilidade de 20% para um gene sofrer
mutacao. Foi tambem definida uma outra probabilidade, que e a de um indivıduo
ser escolhido para sofrer mutacao. Ela tambem foi definida como 20%. Estes valores
foram sugeridos pela documentacao do pacote.
Apos testar diversas formas de inicializacao para a populacao optou-se por cons-
truı-la da seguinte forma:
• 20% como copia do cromossomo gerado pelas funcoes de pertinencia definidas
no capıtulo anterior;
• 60% como uma modificacao do cromossomo gerado pelas funcoes de per-
tinencia definidas no capıtulo anterior, somando-se um valor aleatorio (dis-
tribuicao gaussiana com µ = 0 e σ = 0, 2) a 20% de seus genes.
• 20% construıdos aleatoriamente respeitando a regra que os pontos da funcao
de pertinencia trapezoidal [a, b, c, d] sao tais onde a ≤ b ≤ c ≤ d.
Desta forma a inicializacao comeca a partir de um cromossomo que ja apresenta
um bom desempenho mas com espaco para encontrar solucoes que sejam distantes
dessa.
68
0 50 100 150 200 250 300
Geracao
0.78
0.79
0.80
0.81
0.82
0.83
0.84
AUC
Evolucao do Modelo Fuzzy
Figura 5.3: Evolucao da AUC do modelo fuzzy ao longo das geracoes
O tamanho escolhido para a populacao foi de 100 cromossomos e rodou-se o
algoritmo por 300 geracoes. A Figura 5.3 mostra o resultado do AG ao longo das
geracoes. O melhor modelo que o AG conseguiu encontrar apresenta a densidade de
probabilidade na saıda mostrada na Figura 5.4. A curva ROC do modelo esta na 5.5.
As funcoes de pertinencia do modelo fuzzy genetico podem ser vistas no Apendice
A. Este modelo apresentou uma AUC de 83,73% para o conjunto de treino, o que e
superior a apresentada pelo modelo antes da otimizacao por AG, que era de 79,86%
para o conjunto de treino.
Para definir o limiar de corte das classes foi feito o mesmo procedimento do
capıtulo anterior. O limiar que apresentou menor D(0,1) e apresentado na Tabela
5.1.
Tabela 5.1: Resultado do limiar de decisao para o modelo fuzzy genetico
Limiar de Decisao PD (%) PF (%) D(0,1)
4,91 80.88 25,35 0.31
69
3.5 4.0 4.5 5.0 5.5 6.0 6.5
Saıda do Modelo Fuzzy Genetico
0.0
0.2
0.4
0.6
0.8
1.0
1.2
1.4
1.6
Den
sida
dede
Pro
babi
lidad
e
Modelo Fuzzy Genetico: Densidade de ProbabilidadeIncompatıveisCompatıveis
Figura 5.4: Distribuicao de probabilidade da saıda do modelo fuzzy genetico
0.0 0.2 0.4 0.6 0.8 1.0
Probabilidade de Falso Alarme
0.0
0.2
0.4
0.6
0.8
1.0
Pro
babi
lidad
ede
Det
ecca
o
Modelo Fuzzy Genetico: Curva ROC
Figura 5.5: Curva ROC do modelo fuzzy genetico
70
3.5 4.0 4.5 5.0 5.5 6.0 6.5
Saıda do Modelo Fuzzy Genetico
0.0
0.2
0.4
0.6
0.8
1.0
1.2
1.4
1.6
Den
sida
dede
Pro
babi
lidad
e
Modelo Fuzzy Genetico: Densidade de ProbabilidadeIncompatıveisCompatıveis
Figura 5.6: Distribuicao de probabilidade da saıda do modelo fuzzy genetico
para o conjunto de teste
5.3 Comparacao entre Modelos
Para comparar os modelos e necessario aplicar o conjunto de teste, que nao foi
usado na otimizacao do modelo. Aplicando o conjunto de teste e utilizando o limiar
que foi encontrado na ultima secao obtem-se a densidade de probabilidade na saıda
mostrada na Figura 5.6. Os resultados do modelo fuzzy genetico, comparados com
o modelo de referencia e o modelo fuzzy sao apresentados na Tabela 5.2
Tabela 5.2: Comparacao entre o modelo fuzzy, modelo fuzzy genetico e modelo de
referencia
Modelo PD (%) PF (%) D(0,1)
Modelo Fuzzy 71,42 30,15 0.42
Modelo Fuzzy Genetico 76,47 30,33 0.38
Modelo de Referencia 69,44 14,81 0.34
71
E possıvel ver que o resultado do modelo fuzzy genetico manteve aproximada-
mente a mesma probabilidade de falso alarme do modelo fuzzy, porem aumentando
a probabilidade de deteccao em aproximadamente cinco pontos percentuais. O mo-
delo de referencia continua apresentando um desempenho maior quando compara-se
os valores de D(0,1), mas a diferenca de D(0,1) entre ele e o modelo fuzzy genetico
e metade da que existia entre ele e o modelo fuzzy.
Deve-se lembrar que o modelo fuzzy genetico usa um numero inferior de variaveis
em comparacao com o modelo de referencia. Acrescentar novas variaveis podem
fazer o modelo se igualar ou talvez ate ultrapassar o desempenho do modelo de
referencia.
72
Capıtulo 6
Conclusoes
6.1 Conclusoes
A comparacao do capıtulo anterior entre o modelo fuzzy genetico e o modelo de
referencia mostra que o modelo fuzzy genetico e uma potencial alternativa para o
modelo atual. Vale ressaltar que a quantidade de variaveis utilizadas na entrada do
modelo fuzzy genetico e inferior a utilizada pelo modelo de referencia. Isso leva a crer
que a utilizacao de outras variaveis correlacionadas com o grau de compatibilidade
pode vir a elevar a eficiencia do modelo, possivelmente vindo a superar o modelo de
referencia.
Outro fator que deve ser levado em consideracao e a de que todos os testes de
eficiencia foram feitos com pares de varias empresas, de portes distintos. O modelo
de referencia e, atualmente construıdo para uma empresa em especıfico. Este e um
ponto positivo do modelo fuzzy em relacao ao modelo de referencia, uma vez que
torna-se possıvel a adocao de um unico modelo, o que reduz os custos operacionais
necessarios para a implementacao pratica do modelo.
Uma ultima vantagem do modelo fuzzy esta nas regras fuzzy, que sao uma forma
muito mais simples de modelar o conhecimento. Sob esta otica, o modelo pode ser
aperfeicoado a partir do conhecimento especialista sem a necessidade de o especia-
lista ter conhecimento em programacao ou estatıstica.
73
Todos os pontos apresentados levam a concluir que o modelo fuzzy genetico se
apresenta como uma alternativa em potencial para o modelo atual.
6.2 Trabalhos Futuros
Aperfeicoar o algoritmo genetico, alterando as funcoes escolhidas para selecao,
mutacao e crossover, assim como aperfeicoar sua execucao, executar o codigo usando
processamento paralelo e na nuvem, pode vir a gerar uma maior otimizacao do
modelo.
O modelo fuzzy pode ser aperfeicoado de outras formas, antes da aplicacao do AG.
Outras alternativas para o pre-processamento das entradas podem ser testadas. No
caso especıfico dos valores, como foi citado no Capıtulo 3.2.2, o trabalho de James
Sarros [2] ja sugere um agrupamento para os valores. Este agrupamento pode ser
uma alternativa ao agrupamento que foi escolhido para o modelo.
Por ultimo, talvez a mais importante sugestao de trabalho futuro, seja a aplicacao
de outras variaveis do questionario ao modelo fuzzy. Varias variaveis que apresentam
forte correlacao com o grau de compatibilidade nao foram utilizadas por este modelo.
Seu uso poderia aumentar significativamente o desempenho do mesmo.
74
Referencias Bibliograficas
[1] CAMERON, K. S., QUINN, R. E., Diagnosing and changing organizational
culture: Based on the competing values framework. 1 ed. Addison-Wesley, 1999.
[2] SARROS, J. C., GRAY, J., DENSTEN, I. L., et al., “The Organizational Cul-
ture Profile Revisited and Revised: An Australian Perspective”, Australian
Journal of Management, v. 30, pp. 159–182, 2005.
[3] ROSS, T. J., Fuzzy Logic with Engineering Applications. 3 ed. Wiley, 2010.
[4] KAUR, A., KAUR, A., “Comparison of Mamdani-Type and Sugeno-Type
Fuzzy Inference Systems for Air Conditioning System”, International Journal
of Soft Computing and Engineering, v. 2, 2012.
[5] CANTOR, G., “Beitrage zur Begrundung der transfiniten Mengenlehre”,
Mathematische Annalen, v. 46, pp. 481–512, Novembro 1895.
[6] KLIR, G. J., YUAN, B., Fuzzy Sets and Fuzzy Logic: Theory and Applications,
1 ed., chapter 1, Prentice Hall, p. 6, 1995.
[7] ZADEH, L. A., “Fuzzy Sets”, Information and Control, v. 8, pp. 338–353,
Junho 1965.
[8] OH, K. W., BANDLER, W., “Properties of fuzzy implication operators”, In-
ternational Journal of Approximate Reasoning, v. 1, pp. 273–285, Julho 1987.
[9] MICHAL BACZYNSKI, B. J., An Introduction to Fuzzy Implications, v. 231,
Studies in Fuzziness and Soft Computing. 1 ed. Springer, 2008.
[10] BACZYNSKI, M., JAYARAM, B., An Introduction to Fuzzy Implications, v.
231, Studies in Fuzziness and Soft Computing, 1 ed., chapter An Introduction
to Fuzzy Implications, Springer, p. 32, 2008.
75
[11] E.H. MAMDANI, S. A., “An experiment in linguistic synthesis with a fuzzy
logic controller”, International Journal of Man-Machine Studies, v. 8, pp. 1–
13, Janeiro 1975.
[12] LARSEN, P. M., “Industrial applications of fuzzy logic control”, International
Journal of Man-Machine Studies, v. 12, pp. 3–10, Janeiro 1980.
[13] LUKASIEWICZ, J., “Interpretacja liczbowa teorii zdan”, Ruch Filozoficzny,
v. 7, pp. 92–93, 1923.
[14] KLEENE, S. C., “On Notation for Ordinal Numbers”, The Journal of Symbolic
Logic, v. 3, pp. 150–155, Dezembro 1938.
[15] DIENES, Z. P., “On an Implication Function in Many-Valued Systems of Lo-
gic”, The Journal of Symbolic Logic, v. 14, pp. 95–97, Junho 1949.
[16] GODEL, K., “Zum intuitionistischen Aussagenkalkul”, Anzeiger der Akademie
der Wissenschaftischen in Wien, v. 69, pp. 65–66, 1932.
[17] K.H., L., First Course on Fuzzy Theory and Applications, v. 27, Advances in
Intelligent and Soft Computing, chapter 226-227, Springer, p. 32, 2005.
[18] ROSS, T. J., Fuzzy Logic with Engineering Applications, 3 ed., chapter 5, Wiley,
p. 147, 2010.
[19] ROSS, T. J., Fuzzy Logic with Engineering Applications, 3 ed., chapter 4, Wiley,
p. 98, 2010.
[20] INSTRUMENTS, N., “Defuzzification Methods PID and Fuzzy Lo-
gic Toolkit - LabVIEW 2010 PID and Fuzzy Logic Toolkit Help -
National Instruments”, http://zone.ni.com/reference/en-XX/help/370401G-
01/lvpid/defuzzification methods/, 2010, (Acesso em 17 Fevereiro de 2016).
[21] SUGENO, M., “An introductory survey of fuzzy control”, Information Sciences,
v. 36, pp. 59–83, 1985.
[22] PEEBLES, P., Probability, Random Variables, and Random Signal Principles.
4 ed. Addison-Wesley, 2000.
76
[23] TREESA, H. L. V., BELL, K. L., TIAN, Z., Detection Estimation and Modula-
tion Theory, Part I, Detection, Estimation, and Filtering Theory. 2 ed. Wiley,
2013.
[24] FAWCETT, T., “An introduction to ROC analysis”, Pattern Recognition Let-
ters, v. 28, pp. 861–874, 2006.
[25] O’REILLY, C. A., CHATMAN, J., CALDWELL, D. F., “People and Or-
ganizational Culture: a Profile Comparison Approach to Assessing Person-
Organization Fit”, Academy of Management Journal, v. 34, pp. 487–516, 1991.
[26] SCHEIN, E. H., On the Origin of Species. 2 ed. Jossey-Bass Publisher, 1985.
[27] PEARSON, K., “Note on Regression and Inheritance in the Case of Two Pa-
rents”, Proceedings of the Royal Society of London, v. 58, pp. 240–242, 1895.
[28] DARWIN, C., On the Origin of Species. 1 ed. John Murray, 1859.
[29] MITCHELL, M., An Introduction to Genetic Algorithms. 1 ed. The MIT Press,
1996.
[30] HALDANE, J. B. S., The Causes of Evolution. 1 ed. Princeton University Press,
1990.
[31] FORREST, S., “Genetic Algorithms: Principles of Natural Selection Applied
to Computation”, Science, v. 261, pp. 872–878, 1993.
77
Apendice A
Funcoes de Pertinencia do Modelo
Fuzzy Genetico
A Figura A.1 apresenta as funcoes de pertinencia do sistema fuzzy de pre-processamento
dos arquetipos. A Figura A.1 apresenta as funcoes de pertinencia do sistema fuzzy
de pre-processamento dos valores. Por fim, a Figura A.3 apresenta as funcoes de
pertinencia do sistema fuzzy que agrega as variaveis.
78
0 20 40 60 80 100
Valor classico
0.0
0.2
0.4
0.6
0.8
1.0
Pert
inen
cia
Entrada do Sistema Fuzzy para Arquetipos
BaixoAlto
0 2 4 6 8 10
Compatibilidade
0.0
0.2
0.4
0.6
0.8
1.0
Pert
inen
cia
Compatibilidade entre Arquetipos
Compatibilidade BaixaCompatibilidade Alta
Figura A.1: Funcoes de pertinencia do sistema fuzzy de pre-processamento
dos arquetipos
0 20 40 60 80 100
Valor classico
0.0
0.2
0.4
0.6
0.8
1.0
Pert
inen
cia
Entrada do Sistema Fuzzy para Valores
BaixoAlto
0 2 4 6 8 10
Compatibilidade
0.0
0.2
0.4
0.6
0.8
1.0
Pert
inen
cia
Compatibilidade entre Valores
Compatibilidade BaixaCompatibilidade Alta
Figura A.2: Funcoes de pertinencia do sistema fuzzy de pre-processamento
dos valores
79
0 2 4 6 8 10
Compatibilidade
0.0
0.2
0.4
0.6
0.8
1.0
Pert
inen
cia
Compatibilidade entre Arquetipos
BaixoAlto
0 2 4 6 8 10
Compatibilidade
0.0
0.2
0.4
0.6
0.8
1.0
Pert
inen
cia
Compatibilidade entre Valores
IncompatıvelCompatıvel
0 2 4 6 8 10
Compatibilidade
0.0
0.2
0.4
0.6
0.8
1.0
Pert
inen
cia
Compatibilidade da Saıda
Compatibilidade BaixaCompatibilidade Alta
Figura A.3: Conjunto de teste: Curvas ROC do modelos fuzzy
80