modelo fuzzy com otimização gen ética para classificação de

95
MODELO FUZZY COM OTIMIZAC ¸ ˜ AO GEN ´ ETICA PARA CLASSIFICAC ¸ ˜ AO DE COMPATIBILIDADE ENTRE CANDIDATOS E EMPRESAS Rafael Lopes Conde dos Reis Projeto de Gradua¸c˜ ao apresentado ao Curso de Engenharia Eletrˆ onicaedeComputa¸c˜ao da Escola Polit´ ecnica, Universidade Federal do Rio de Janeiro, como parte dos requisitos necess´ arios ` aobten¸c˜ ao do t´ ıtulo de Enge- nheiro. Orientador: Fl´ avio Luis de Mello Rio de Janeiro Mar¸co de 2016

Upload: vannhu

Post on 10-Jan-2017

219 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: modelo fuzzy com otimização gen ética para classificação de

MODELO FUZZY COM OTIMIZACAO GENETICA PARA

CLASSIFICACAO DE COMPATIBILIDADE ENTRE

CANDIDATOS E EMPRESAS

Rafael Lopes Conde dos Reis

Projeto de Graduacao apresentado ao Curso

de Engenharia Eletronica e de Computacao

da Escola Politecnica, Universidade Federal

do Rio de Janeiro, como parte dos requisitos

necessarios a obtencao do tıtulo de Enge-

nheiro.

Orientador: Flavio Luis de Mello

Rio de Janeiro

Marco de 2016

Page 2: modelo fuzzy com otimização gen ética para classificação de

MODELO FUZZY COM OTIMIZACAO GENETICA PARA

CLASSIFICACAO DE COMPATIBILIDADE ENTRE

CANDIDATOS E EMPRESAS

Rafael Lopes Conde dos Reis

PROJETO DE GRADUACAO SUBMETIDO AO CORPO DOCENTE DO CURSO

DE ENGENHARIA ELETRONICA E DE COMPUTACAO DA ESCOLA PO-

LITECNICA DA UNIVERSIDADE FEDERAL DO RIO DE JANEIRO COMO

PARTE DOS REQUISITOS NECESSARIOS PARA A OBTENCAO DO GRAU

DE ENGENHEIRO ELETRONICO E DE COMPUTACAO

Autor:

Rafael Lopes Conde dos Reis

Orientador:

Prof. Flavio Luis de Mello, D.Sc.

Examinador:

Prof. Heraldo Luıs Silveira de Almeida, D.Sc.

Examinador:

Profa. Priscila Machado Vieira Lima, Ph.D.

Rio de Janeiro

Marco de 2016

ii

Page 3: modelo fuzzy com otimização gen ética para classificação de

UNIVERSIDADE FEDERAL DO RIO DE JANEIRO

Escola Politecnica - Departamento de Eletronica e de Computacao

Centro de Tecnologia, bloco H, sala H-217, Cidade Universitaria

Rio de Janeiro - RJ CEP 21949-900

Este exemplar e de propriedade da Universidade Federal do Rio de Janeiro, que

podera incluı-lo em base de dados, armazenar em computador, microfilmar ou adotar

qualquer forma de arquivamento.

E permitida a mencao, reproducao parcial ou integral e a transmissao entre bibli-

otecas deste trabalho, sem modificacao de seu texto, em qualquer meio que esteja

ou venha a ser fixado, para pesquisa academica, comentarios e citacoes, desde que

sem finalidade comercial e que seja feita a referencia bibliografica completa.

Os conceitos expressos neste trabalho sao de responsabilidade do(s) autor(es).

iii

Page 4: modelo fuzzy com otimização gen ética para classificação de

”Ideias, e somente ideias, podem iluminar a escuridao”

- Ludwig von Mises

iv

Page 5: modelo fuzzy com otimização gen ética para classificação de

DEDICATORIA

Dedico este projeto a todos os gigantes os quais nos ombros fiquei de pe.

”Se vi mais longe foi por estar de pe sobre ombros de gigantes.”

- Isaac Newton

v

Page 6: modelo fuzzy com otimização gen ética para classificação de

AGRADECIMENTO

Acima de qualquer um agradeco aos meus pais Eliane de Lourdes Lopes Conde dos

Reis e Manoel Tupiara Conde dos Reis. Por toda a dedicacao e abnegacao durante

toda a minha criacao. Ao meu pai por ser um exemplo de carater e superacao que

sempre buscarei seguir. A minha mae, por ter aberto mao de tudo para se dedicar a

funcao mais nobre que existe, de mae, me amando mais do que tudo. Tenho muito

orgulho em ser filho de voces.

Agradeco aos meus avos e minha bisavo. Por formarem, junto com meus pais,

minha famılia, que, embora pequena, e toda a famılia que sempre precisei. Obrigado

pelo mimo que so avos conseguem dar. Que eu possa chegar a idade de voces com

todo bom humor e alegria que tem.

Agradeco as meus amigos. Por serem tambem minha famılia, embora nao de

sangue, de escolha. Aos amigos do Santa Marcelina, por estarem comigo por todos

esses anos e por todos que virao. Aos amigos do CEFET, em especial aos membros

da Equipe Genesis, voces foram e continuam sendo muito especiais. Aos amigos da

UFRJ por compartilharem os meus anos mais desafiadores e aos da Queen Mary

pelo melhor ano da minha vida. A todos que passaram e ainda vao passar pela

Equipe MinervaBots, te-la fundado e o maior orgulho que tenho ate hoje. A todas

essas e outras pessoas especiais que fazem parte da minha vida.

Agradeco aos meus professores. Por transmitirem seu conhecimento e por sua

paciencia nos momentos de dificuldade, especialmente aos professores do CEFET e

da UFRJ.

Agradeco a todos da Pin People. Por me fazerem ter ”brilho nos olhos”pelo meu

trabalho e por toda colaboracao com este projeto.

Agradeco, por fim, ao meu orientador. Por me direcionar ao longo deste projeto

e por todo tempo que dedicou a revisa-lo.

vi

Page 7: modelo fuzzy com otimização gen ética para classificação de

RESUMO

A identificacao de um perfil de cultura e valores para os candidatos e um im-

portante aspectos para a selecao de um candidato. Geralmente e realizado por

headhunters, ou durante extensos processos de entrevistas e dinamicas de grupo.

Para muitas empresas e necessario filtrar uma grande massa de candidatos, o que

e usualmente feito levando em consideracao, apenas, informacoes de competencia

tecnica. Essa pratica leva a entrevistas com candidatos que nao apresentam o perfil

da empresa, quanto a cultura e valores, e a menos tempo para avaliar candidatos

com quem a empresa e realmente compatıvel. Um modelo que possa antecipar o

perfil de cultura e valores de um candidato iria beneficiar, amplamente, tanto can-

didatos quanto empresas, por tirar subjetividade e automatizar parte do processo

seletivo.

Este projeto propoe um modelo computacional, capaz de classificar a compa-

tibilidade entre candidato e empresa, quanto a cultura e valores. O modelo foi

desenvolvido utilizando informacao provida pela empresa Pin People, extraıda de

dois questionarios apresentados para candidatos e colaboradores de empresas. A

informacao extraıda e pre-processada pelo modelo e serve como entrada para um

sistema fuzzy otimizado por algoritmo genetico. O sistema usa regras fuzzy, desen-

volvidas utilizando conhecimento especialista, a fim de retornar em qual classe de

compatibilidade um candidato e uma empresa pertencem.

Palavras-Chave: Logica Fuzzy, Algoritmo Genetico, Classificador, Recursos Hu-

manos.

vii

Page 8: modelo fuzzy com otimização gen ética para classificação de

ABSTRACT

Identifying values and cultural profile for a candidate is an important aspect of

an employee selection process. Often, this is realized by headhunters, or by an

extensive process of interviews and group dynamics. For many organizations it

is necessary to filter down a large amount of candidates, what is usually done just

taking into consideration the technical information. This practice leads to interviews

with candidates that do not have the same profile as the company. This overhead

spent with undesirable candidates consumes time and energy that should be used

with better options. A model that could anticipate the values and cultural profile of

a candidate would largely beneficiate both companies and candidates, making the

selection process less subjective and automating part of it.

This project proposes a computer model capable of classifying the compatibility

between a candidate and a company, according to their values and culture. The

model was developed using information provided by the company Pin People, ex-

tracted from two questionnaires presented to candidate and company collaborators,

in order to extract information about values and culture. The information extracted

is pre-processed and serves as an input for a fuzzy logic system, optimized by gene-

tic algorithm. The system uses fuzzy rules, developed using specialist knowledge in

order to evaluate the class in which a candidate and a company are compatible.

Key-words: Fuzzy Logic, Genetic Algorithm, Classifier, Human Resources.

viii

Page 9: modelo fuzzy com otimização gen ética para classificação de

SIGLAS

AG - Algoritmo Genetico

AUC - Area Under the Curve

D(0,1) - Distancia ao ponto (0, 1) no espaco ROC

DEAP - Distributed Evolutionary Algorithms in Python

MAX - Funcao que retorna lista de maximos entre duas listas

MIX - Funcao que retorna lista de mınimos entre duas listas

PD - Probabilidade de Deteccao

PDF - Probability Density Function

PF - Probabilidade de Falso Alarme

PROBOR - Probabilistic OR ou soma algebrica

PROD - Funcao que retorna lista com o produto, ponto a ponto, entre duas listas

ROC - Receiver Operating Characteristic

ix

Page 10: modelo fuzzy com otimização gen ética para classificação de

Sumario

1 Introducao 1

1.1 Tema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Delimitacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.3 Justificativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.4 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.5 Metodologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.6 Descricao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2 Logica Fuzzy 6

2.1 Teoria de Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.1.1 Definicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.1.2 Pertinencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.1.3 Operacoes Basicas entre Conjuntos . . . . . . . . . . . . . . . 8

2.2 Conjuntos Fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.2.1 Definicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.2.2 Operacoes com Conjuntos Fuzzy . . . . . . . . . . . . . . . . . 13

2.2.3 Exemplo de um Conjunto Fuzzy . . . . . . . . . . . . . . . . . 13

2.3 Inferencia Fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.3.1 Regras Fuzzy e Implicacao logica . . . . . . . . . . . . . . . . 16

2.3.2 Inferencia Fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.3.3 Exemplo de Aplicacao de Regras . . . . . . . . . . . . . . . . 22

2.4 Agregacao e Defuzzificacao . . . . . . . . . . . . . . . . . . . . . . . . 24

3 Delimitacao do Problema 27

3.1 Descricao do Problema . . . . . . . . . . . . . . . . . . . . . . . . . . 27

x

Page 11: modelo fuzzy com otimização gen ética para classificação de

3.2 Selecao de Variaveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.2.1 Arquetipos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.2.2 Valores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.2.3 Variaveis de Regua . . . . . . . . . . . . . . . . . . . . . . . . 34

4 Construcao do Modelo Fuzzy 36

4.1 Pre-processamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

4.1.1 Arquetipos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

4.1.2 Valores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

4.1.3 Variaveis de Regua . . . . . . . . . . . . . . . . . . . . . . . . 52

4.2 Sistema Fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

4.2.1 Definicao do Pre-processamento . . . . . . . . . . . . . . . . . 56

4.2.2 Definicao do Limiar de Corte . . . . . . . . . . . . . . . . . . 61

4.2.3 Comparacao com Modelo de Referencia . . . . . . . . . . . . . 62

5 Otimizacao por Algoritmo Genetico 64

5.1 Algoritmo Genetico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

5.2 Modelo Fuzzy Genetico . . . . . . . . . . . . . . . . . . . . . . . . . . 67

5.3 Comparacao entre Modelos . . . . . . . . . . . . . . . . . . . . . . . . 71

6 Conclusoes 73

6.1 Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

6.2 Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

Bibliografia 75

A Funcoes de Pertinencia do Modelo Fuzzy Genetico 78

xi

Page 12: modelo fuzzy com otimização gen ética para classificação de

Lista de Figuras

2.1 Representacao grafica de A ∪B . . . . . . . . . . . . . . . . . . . . . . 9

2.2 Representacao grafica de A ∩B . . . . . . . . . . . . . . . . . . . . . . 10

2.3 Representacao grafica de A \B . . . . . . . . . . . . . . . . . . . . . . . 11

2.4 Conjunto classico x Conjunto fuzzy . . . . . . . . . . . . . . . . . . . 12

2.5 Conjuntos fuzzy para temperaturas . . . . . . . . . . . . . . . . . . . 12

2.6 Problema da gorjeta - Variaveis fuzzy . . . . . . . . . . . . . . . . . . 15

2.7 Representacao grafica de A→ B . . . . . . . . . . . . . . . . . . . . . 17

2.8 Representacao grafica de A→ B . . . . . . . . . . . . . . . . . . . . . 18

2.9 Representacao grafica da funcao de pertinencia para a regra R(s, g) . 20

2.10 Implicacao fuzzy - Funcao de pertinencia µB′(g) . . . . . . . . . . . . 22

2.11 Saıda das regras fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.12 Defuzzificacao do problema da gorjeta . . . . . . . . . . . . . . . . . 26

3.1 Representacao grafica dos arquetipos para um candidato e uma empresa . 31

4.1 Diagrama de blocos do modelo fuzzy . . . . . . . . . . . . . . . . . . . . 37

4.2 Distribuicao de Probabilidade da Correlacao entre Arquetipos . . . . . . . 38

4.3 Curva ROC da correlacao entre crquetipos . . . . . . . . . . . . . . . . . 39

4.4 Funcoes de pertinencia dos arquetipos e de sua compatibilidade . . . . . . 40

4.5 Distribuicao de probabilidade dos arquetipos . . . . . . . . . . . . . . . 41

4.6 Comparacao entre defuzzificacoes: Densidades de probabilidade do pre-

processamento dos arquetipos . . . . . . . . . . . . . . . . . . . . . . . 41

4.7 Comparacao entre defuzzificacoes: Curvas ROC do pre-processamento dos

arquetipos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

4.8 Melhor combinacao de funcoes de pertinencia dos Arquetipos e de sua

compatibilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

xii

Page 13: modelo fuzzy com otimização gen ética para classificação de

4.9 Sistema fuzzy x Correlacao: Distribuicoes de probabilidade do pre-processamento

dos arquetipos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

4.10 Sistema fuzzy x Correlacao: Curvas ROC do pre-processamento dos arquetipos 46

4.11 Melhor combinacao de funcoes de pertinencia dos valores e de sua compa-

tibilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

4.12 Sistema fuzzy x Correlacao: Distribuicoes de probabilidade do pre-processamento

dos valores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

4.13 Sistema fuzzy x Correlacao: Curvas ROC do pre-processamento dos valores 51

4.14 Melhor combinacao de funcoes de pertinencia das variaveis de regua e de

sua compatibilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

4.15 Sistema Fuzzy x Correlacao: Distribuicoes de probabilidade do pre-processamento

das variaveis de regua . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

4.16 Sistema fuzzy x Correlacao: Curvas ROC do pre-processamento das variaveis

de regua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4.17 Funcoes de pertinencia do modelo fuzzy: Correlacao como pre-processamento 58

4.18 Funcoes de pertinencia do modelo fuzzy: Pre-processamento fuzzy . . . . 59

4.19 Pre-processamento fuzzy x Correlacao como pre-processamento: Distri-

buicoes de probabilidade do modelo fuzzy . . . . . . . . . . . . . . . . . 60

4.20 Pre-processamento fuzzy x Correlacao como pre-processamento: Curvas

ROC do modelo fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4.21 Conjunto de teste: Distribuicoes de Probabilidade do modelos fuzzy . . . 63

5.1 Exemplo de crossover . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

5.2 Exemplo de mutacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

5.3 Evolucao da AUC do modelo fuzzy ao longo das geracoes . . . . . . . . . 69

5.4 Distribuicao de probabilidade da saıda do modelo fuzzy genetico . . . . . 70

5.5 Curva ROC do modelo fuzzy genetico . . . . . . . . . . . . . . . . . . . 70

5.6 Distribuicao de probabilidade da saıda do modelo fuzzy genetico para o

conjunto de teste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

A.1 Funcoes de pertinencia do sistema fuzzy de pre-processamento dos arquetipos 79

A.2 Funcoes de pertinencia do sistema fuzzy de pre-processamento dos valores 79

A.3 Funcoes de pertinencia do sistema fuzzy que agrega as variaveis . . . . . . 80

xiii

Page 14: modelo fuzzy com otimização gen ética para classificação de

Lista de Tabelas

2.1 Operacoes com conjuntos fuzzy . . . . . . . . . . . . . . . . . . . . . 13

2.2 Principais funcoes de implicacao fuzzy. . . . . . . . . . . . . . . . . . 19

3.1 Graus de compatibilidade entre candidatos e empresas. . . . . . . . . 28

3.2 Descricao dos arquetipos . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.3 Descricao dos valores . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

4.1 Comparacao entre defuzzificacoes: Resultado de AUC do pre-processamento

dos arquetipos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

4.2 Tabela verdade de regras para a presenca de um determinado arquetipo

num candidato e numa empresa . . . . . . . . . . . . . . . . . . . . . 43

4.3 Tabela verdade de regras para a presenca de um determinado arquetipo

num candidato e de um oposto numa empresa . . . . . . . . . . . . . 43

4.4 Combinacoes de Regras para os Arquetipos: Resultado de AUC do

pre-processamento dos arquetipos . . . . . . . . . . . . . . . . . . . . 44

4.5 Sistema fuzzy x Correlacao: Resultado de AUC do pre-processamento

dos arquetipos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

4.6 Distribuicao dos Valores em Arquetipos . . . . . . . . . . . . . . . . . 48

4.7 Sistema fuzzy x Correlacao: Resultado de AUC do pre-processamento

dos valores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

4.8 Variaveis de regua para candidatos e seus apelidos . . . . . . . . . . . 52

4.9 Variaveis de regua para empresas e seus apelidos . . . . . . . . . . . . 52

4.10 Sistema fuzzy x Correlacao: Resultado de AUC do pre-processamento

das variaveis de regua . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4.11 Pre-processamento fuzzy x Correlacao como pre-processamentos: Re-

sultado de AUC do modelo fuzzy . . . . . . . . . . . . . . . . . . . . 61

xiv

Page 15: modelo fuzzy com otimização gen ética para classificação de

4.12 Resultado do limiar de decisao . . . . . . . . . . . . . . . . . . . . . . 61

4.13 Comparacao com modelo de referencia . . . . . . . . . . . . . . . . . 62

5.1 Resultado do limiar de decisao para o modelo fuzzy genetico . . . . . 69

5.2 Comparacao entre o modelo fuzzy, modelo fuzzy genetico e modelo

de referencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

xv

Page 16: modelo fuzzy com otimização gen ética para classificação de

Capıtulo 1

Introducao

1.1 Tema

O tema deste Projeto de Graduacao e o estudo da compatibilidade entre o perfil

de um candidato a uma vaga de emprego, e a cultura e valores de uma determinada

empresa. O projeto tem como desafio a concepcao de um sistema que seja capaz de

cruzar informacoes a respeito tanto de candidatos, quanto de empresas, retornando

o quanto um determinado candidato e compatıvel com a cultura e valores de uma

empresa.

1.2 Delimitacao

O objeto de estudo sao variaveis relacionadas a cultura e valores de candidatos

com nıvel superior completo ou incompleto. E desejavel tambem que os candidatos

ja possuam alguma experiencia previa de trabalho a fim de haver maior acuracia

nas respostas dadas pelos mesmos. Quanto as empresas, o objeto de estudo sao,

principalmente, pequenas e medias empresas, porem espera-se que isso nao afete a

amplitude do modelo para grandes empresas, requerendo futuros testes para este

tamanho de empresas.

O modelo computacional esta voltado para avaliacao de compatibilidade levando

em consideracao cultura e valores. Ele nao se aplica, portanto, para avaliar a com-

patibilidade tecnica de um candidato com uma determinada vaga.

1

Page 17: modelo fuzzy com otimização gen ética para classificação de

1.3 Justificativa

Modelos computacionais sao, cada vez mais, usados para automatizar diversas

areas da industria e do comercio. Modelos que reconhecem o perfil do usuario, nessa

realidade em que grandes quantidades de dado sao armazenadas e processadas a

cada segundo, sao cada vez mais comuns. No comercio, por exemplo, lojas vir-

tuais possibilitaram um grande aumento no faturamento de empresas tradicionais.

Primeiramente por gerarem maior produtividade, uma vez que sao totalmente es-

calaveis, mas tambem por possibilitarem uma maior assertividade no processo de

vendas, ao utilizarem sistemas de recomendacao de produtos baseado nos perfis dos

clientes.

O mercado de recrutamento e selecao, por sua vez, sempre se apresentou como

um mercado mais conservador. A maioria das solucoes para recrutamento e selecao

atualmente tem por foco a atracao de candidatos, tendo como funcionalidades, no

maximo, alguns filtros relacionados a competencia tecnica dos candidatos. Algumas

solucoes mais recentes servem como forma de acompanhamento do processo seletivo,

para fornecer o controle de quais candidatos passam por cada etapa do processo.

O conhecimento relacionado a compatibilidade entre candidatos e empresas, ba-

seado em cultura e valores, ainda e utilizado de forma muito pouco automatizada

sendo tambem muito subjetivo. Normalmente e feito por meio de head-hunters,

longos processos de entrevistas ou dinamicas de grupo. Em muitas empresas, onde

e necessario filtrar uma grande massa de candidatos, isto e feito levando em consi-

deracao, apenas, informacoes de competencia tecnica. Essa pratica leva a entrevistas

com candidatos que nao apresentam o perfil da empresa, quanto a cultura e valo-

res, e, portanto, a menos tempo para avaliar candidatos com quem a empresa e

realmente compatıvel.

Caso houvesse uma forma de avaliar esse tipo de compatibilidade previamente,

seria possıvel reduzir a subjetividade neste processo e ainda ter um aumento de

produtividade na triagem de candidatos.

2

Page 18: modelo fuzzy com otimização gen ética para classificação de

1.4 Objetivo

O objetivo geral do projeto e, entao, propor um modelo computacional capaz

de avaliar, a partir de variaveis relacionadas a cultura e valores, de candidatos

e empresas, a compatibilidade entre ambos. Desta forma, tem-se como objetivos

especıficos: (1) Selecionar, a partir das variaveis disponıveis um conjunto para ser

utilizado; (2) Definir o pre-processamento a ser aplicado as variaveis; (3) Elaborar

modelo fuzzy capaz de inferir o grau de compatibilidade entre um candidato e uma

empresa a partir das variaveis utilizadas; (4) Otimizar o modelo aplicando tecnicas

evolutivas para a definicao de seus parametros.

1.5 Metodologia

A partir da literatura a respeito da compatibilidade de cultura e valores [1] [2],

entre empresas e candidatos, a empresa Pin People (junto com a qual este projeto

esta sendo realizado) construiu dois questionarios para extrair as informacoes mais

relevantes a respeito dos candidatos e das empresas a fim de avaliar sua compatibili-

dade. Estes sao os dados utilizados para a construcao do modelo. Essa literatura foi,

tambem, utilizada como guia para a escolha de quais variaveis serao utilizadas para

a construcao deste modelo. Alem disso, para justificar essa escolha, tambem foram

utilizadas analises de correlacao entres as variaveis e o grau de compatibilidade.

Uma vez escolhidas as variaveis e definido o pre-processamento mais eficaz para

cada uma, foi construıdo um modelo computacional para a classificacao do grau de

compatibilidade. Foi escolhido o uso de logica fuzzy, mais especificamente pelo mo-

delo Mamdani [3], principalmente pela natureza do problema. Dentre os possıveis

tipos de modelos fuzzy o tipo Mamdani e o mais apropriado para capturar o co-

nhecimento de um especialista [4], sendo construıdo a partir de regras semanticas

simples, que podem ser facilmente compreendidas e validadas por um especialista

da area de recrutamento e selecao.

Para a construcao do modelo foi necessario definir o formato dos conjuntos fuzzy,

para cada variavel, e as regras fuzzy a serem utilizadas. Os formatos dos conjun-

3

Page 19: modelo fuzzy com otimização gen ética para classificação de

tos fuzzy foram determinados inicialmente a partir da analise das distribuicoes das

variaveis. Apos a consolidacao do modelo foi feita uma otimizacao dos conjuntos

fuzzy usando Algoritmo Genetico e feita uma comparacao entre ambos. As regras

fuzzy foram determinadas a partir de conhecimento de um especialista, inicialmente,

e em seguida foi feita uma analise de relevancia das regras previamente definidas.

A empresa atualmente conta com um modelo para estimar o grau de compati-

bilidade. Este modelo foi utilizado como benchmarck para o modelo fuzzy. Os

resultados do modelo fuzzy foram entao analisados e possıveis alteracoes para a

obter uma eficiencia compatıvel com a do modelo atualmente usado pela empresa

foram propostas.

1.6 Descricao

No Capıtulo 2 e apresentado o conceito de logica fuzzy. Comecando por uma

breve introducao a teoria de conjuntos classica, seguida por uma serie de conceitos

fundamentais para logica fuzzy, como: Conjuntos fuzzy, inferencia fuzzy, agregacao

e defuzzificacao.

O Capıtulo 3 apresenta a delimitacao do modelo fuzzy. Primeiramente e apresen-

tada a descricao do problema de classificacao de compatibilidade entre candidatos

e empresas. Em seguida sao definidas as variaveis que serao usadas pelo modelo.

Aqui sao apresentados os questionarios usados para coletar os dados usados pelo

modelo e apresentada a metodologia utilizada para sua concepcao.

O Capıtulo 4 contem todo o processo de definicao do modelo fuzzy. Ele comeca

pela escolha do pre-processamento utilizado pelo sistema fuzzy, comparando duas

formas distintas. Em seguida o sistema fuzzy e definido e seu resultado e, entao

comparado a um modelo de referencia.

O Capıtulo 5 trata do processo de otimizacao por algoritmo genetico. Primei-

ramente e introduzida uma breve teoria a sobre algoritmo genetico. Em seguida

este e aplicado para otimizar as funcoes de pertinencia do modelo fuzzy. Por fim

4

Page 20: modelo fuzzy com otimização gen ética para classificação de

sao comparados os resultados do modelo fuzzy, antes e apos a otimizacao com os

resultados do modelo de referencia.

O Capıtulo 6, finalmente, apresenta as conclusoes acerca do modelo e de sua com-

paracao com o modelo de referencia. Nele tambem sao descritos possıveis trabalhos

futuros, visando o aperfeicoamento do modelo.

5

Page 21: modelo fuzzy com otimização gen ética para classificação de

Capıtulo 2

Logica Fuzzy

2.1 Teoria de Conjuntos

Para comecarmos a tratar de logica fuzzy e primeiro necessario uma previa in-

troducao sobre a teoria classica de conjuntos, que diz respeito ao ramo da ma-

tematica que estuda os conjuntos. Serao apenas apresentados conceitos pontuais,

apenas para possibilitar a compreensao do restante do projeto.

2.1.1 Definicao

Um conjunto e compreendido como uma colecao de objetos distintos, mas que

tambem e objeto por si so. Georg Cantor, o criador da teoria de conjuntos, definiu

um conjunto da seguinte maneira: ”Um conjunto e o ajuntamento em um todo de

objetos definidos e distintos da nossa percepcao ou imaginacao - tambem chamados

de elementos do conjunto”[5].

Exemplos de conjuntos podem ser dos mais variados tipos. Os numeros 8, 9, 4,

12, sao um conjunto de inteiros. Tal conjunto pode ser representado, pela notacao

matematica, da seguinte maneira {8, 9, 4, 12}. As letras a, q, x, t, sao um conjunto

de caracteres. Podem ser criados conjuntos de todos os tipos, funcoes, palavras, in-

divıduos e ate conjuntos de conjuntos, uma vez que, como ja foi falado, um conjunto

e um objeto per se.

6

Page 22: modelo fuzzy com otimização gen ética para classificação de

Um conjunto e usualmente denotado por uma letra maiuscula. Os elementos sao

listados separados por vırgula e entre chaves. Como pode ser visto no exemplo

anterior a ordem dos elementos nao importa, mas e conveniente a representacao

em ordem ascendente, para facilitar a compreensao. O simbolo ∅ e usado para

representar um conjunto vazio. Sendo assim podemos representar um conjunto A

como:

A = {2, 4, 6, 8}.

Em alguns casos considera-se U , universo, a classe que contem todos os ele-

mentos que se deseja analisar. Por esta razao, tambem e conhecido como conjunto

universo. O conjunto dos inteiros Z, por exemplo, poderia ser considerado o conjunto

universo de um problema envolvendo apenas numeros inteiros.

Conjuntos sao comumente representados de forma grafica, usualmente por cırculos,

como sera visto mais adiante na Figura 2.1, Figura 2.2 e Figura 2.3.

2.1.2 Pertinencia

O conceito de pertinencia e muito importante em teoria classica de conjuntos assim

como para logica fuzzy. Os sımbolos ∈ e /∈ significam pertence a e nao pertence a,

respectivamente. Desta forma e correto de escrever

7 ∈ {2, 3, 7},

ou

7 /∈ {1, 4, 6}.

Um conjunto A pode ser representado por meio sua funcao caracterıstica. Ela

e a funcao que declara quais elementos do conjunto universo U sao elementos do

conjunto A. O conjunto A pode ser definido pela funcao caracterıstica UA, da

seguinte forma [6]:

UA(x) =

0 se x ∈ A,

1 se x /∈ A

7

Page 23: modelo fuzzy com otimização gen ética para classificação de

Isso e, a funcao caracterıstica mapeia os elementos de X em elementos do conjunto

{0, 1}, o que e formalmente expresso por:

UA : U → {0, 1}.

Portanto, para cada x ∈ U , quando UA(x) = 1, x e considerado como pertencendo

a A. Caso UA(x) = 0, x e considerado como nao pertencendo a A.

Como sera visto mais adiante a logica fuzzy extrapola este conceito de forma que

um elemento pode pertencer ”parcialmente”a um determinado conjunto.

Caso todos os elementos de um dado conjunto A tambem sejam elementos do

conjunto B, pode-se dizer que o conjunto A e um subconjunto do conjunto B. Isso

e representado pela notacao A ⊆ B, que tambem significa A esta contido em B.

Desta forma podemos escrever o exemplo

{2, 3} ⊆ {2, 3, 4, 5}.

O conjunto vazio e um subconjunto de qualquer conjunto (∅ ⊆ A) e qualquer

conjunto e um subconjunto de si proprio (A ⊆ A). Decorre, portanto, que A = B

se, e somente, se A ⊆ B e B ⊆ A.

2.1.3 Operacoes Basicas entre Conjuntos

A uniao de dois conjuntos e o conjunto composto por todos os elementos de cada

um dos dois conjuntos. A uniao de dois conjuntos A e B pode ser denotada por

A ∪B. Portanto

{2, 3} ∪ {3, 4, 5} = {2, 3, 4, 5}.

A Figura 2.1 representa a uniao de dois conjuntos.

A uniao entre A e B pode, tambem ser representada a partir de suas funcoes

caracterısticas:

A ∪B → UA∪B(x) = UA(x) ∨ UB(x) = max[UA(x),UB(x)].

Onde ∨ representa a operacao logica OU.

8

Page 24: modelo fuzzy com otimização gen ética para classificação de

Figura 2.1: Representacao grafica de A ∪B

A intercessao de dois conjuntos e o conjunto composto por todos os elementos

comuns a ambos os conjuntos. A intercessao de dois conjuntos A e B pode ser

denotada por A ∩B. Portanto

{2, 3} ∩ {3, 4, 5} = {3}.

A Figura 2.2 representa a intercessao de dois conjuntos.

A uniao entre A e B pode, tambem ser representada a partir de suas funcoes

caracterısticas:

A ∩B → UA∩B(x) = UA(x) ∧ UB(x) = min[UA(x),UB(x)].

Onde ∧ representa a operacao logica E.

A diferenca entre conjuntos e o conjunto composto por todos os elementos do

primeiro conjunto que nao estao contidos no segundo conjunto. A diferenca de dois

conjuntos A e B, tambem chamada de complemento relativo, pode ser denotada por

A \B. Portanto

{2, 3} \ {3, 4, 5} = {2}.

A Figura 2.3 representa a diferenca de dois conjuntos. Desta forma, considerando o

conjunto universo U , U \ A e chamado de complemento absoluto, ou apenas com-

plemento, de A, denotado por A.

9

Page 25: modelo fuzzy com otimização gen ética para classificação de

Figura 2.2: Representacao grafica de A ∩B

O complemento de um conjunto A , tambem pode ser representada a partir de

suas funcoes caracterısticas:

A→ UA(x) = 1− UA(x).

O teorema de De Morgan relaciona essas operacoes da seguinte forma:

A ∪B = A ∩B;

A ∩B = A ∪B.

Por ultimo, o produto cartesiano entre dois conjuntos A e B, denotado por A×B,

e o conjunto de pares ordenados definidos da seguinte forma:

A×B = {(a, b) : a ∈ A ∧ b ∈ B}

2.2 Conjuntos Fuzzy

2.2.1 Definicao

Logica Fuzzy tem como base a teoria de conjuntos fuzzy, criada por Zadeh em

1965 [7], a qual e uma generalizacao da teoria classica de conjuntos. O que significa

que a teoria classica e um caso especial da teoria de conjuntos fuzzy.

10

Page 26: modelo fuzzy com otimização gen ética para classificação de

Figura 2.3: Representacao grafica de A \B

Como foi tratado anteriormente, a funcao caracterıstica de um conjunto classico

atribui o valor 0 ou 1 a cada elemento do conjunto universo de forma a delimitar

os elementos que pertencem e os que nao pertencem ao dado conjunto classico.

Essa funcao caracterıstica pode ser generalizada de forma que os valores atribuıdos

possam estar em um intervalo (usualmente entre 0 e 1). Este valor passa a indicar o

grau de pertinencia do elemento ao conjunto. A essa generalizacao se da o nome de

funcao de pertinencia, e o conjunto definido por ela e chamado de conjunto fuzzy.

Uma funcao de pertinencia de um conjunto fuzzy A pode ser representada como:

µA : U → [0, 1].

A Figura 2.4 mostra graficamente a diferenca entre um conjunto fuzzy e um conjunto

classico.

Conjuntos fuzzy permitem a representacao de conceitos vagos de linguagem na-

tural. Por exemplo, ao tratar-se de um problema que envolve temperatura pode-se

definir um conjunto para temperaturas frias e outro para temperaturas quentes. Nao

existe, porem, um limiar definido em que um valor de temperatura seja considerado

frio e outro, um grau mais alto, seja considerado quente. O uso de conjuntos fuzzy,

para este caso, se mostra muito apropriado. Em um conjunto fuzzy para tempera-

turas quentes a temperatura 40 ◦C seria representada com um valor de pertinencia

maior do que a temperatura 15 ◦C, Figura 2.5.

11

Page 27: modelo fuzzy com otimização gen ética para classificação de

0 2 4 6 8 10

Universo do Conjunto

0.0

0.2

0.4

0.6

0.8

1.0

1.2G

rau

dePe

rtin

enci

aConjunto Classico

Funcao Caracterıstica

0 2 4 6 8 10

Universo do Conjunto

0.0

0.2

0.4

0.6

0.8

1.0

1.2

Gra

ude

Pert

inen

cia

Conjunto FuzzyFuncao de Pertinencia

Figura 2.4: Conjunto classico x Conjunto fuzzy

0 10 20 30 40 50 60

Temperatura em ◦C

0.0

0.2

0.4

0.6

0.8

1.0

1.2

Gra

ude

Pert

inen

cia

Conjuntos Fuzzy para TemperaturasFrioQuente

Figura 2.5: Conjuntos fuzzy para temperaturas

12

Page 28: modelo fuzzy com otimização gen ética para classificação de

2.2.2 Operacoes com Conjuntos Fuzzy

As operacoes de uniao, intercessao e complemento para conjuntos fuzzy podem

ser definidas a partir das funcoes de pertinencia dos conjuntos. A Tabela 2.1 mostra

as duas formas mais usadas para realizar estas operacoes.

Tabela 2.1: Operacoes com conjuntos fuzzy

Nome Intercessao (E):

µA∩B(x)

Uniao (OU):

µA∪B(x)

Complemento

(NAO): µA(x)

MIN/MAX min[µA(x), µB(x)] max[µA(x),UB(x)] 1− µA(x)

PROD/PROBOR µA(x)× µB(x) µA(x) + µB(x) −µA(x)× µB(x)

1− µA(x)

O teorema de De Morgan tambem continua valido para conjuntos fuzzy:

A ∪B = A ∩B;

A ∩B = A ∪B.

Dois axiomas dos conjuntos classicos, porem, nao se aplicam a conjuntos fuzzy. O

primeiro diz que a uniao entre um conjunto e seu complemento e igual ao conjunto

universo. A segunda, que a intercessao entre um conjunto e seu complemento e igual

a um conjunto vazio. Em conjuntos fuzzy esses axiomas seriam representados como

a seguir:

A ∪ A 6= U ;

A ∩ A 6= ∅.

Isso ocorre pois ha uma area de sobreposicao de A com A, o que nao ocorre com

conjuntos classicos. Ou seja, um elemento pode pertencer a A e a A ao mesmo

tempo.

2.2.3 Exemplo de um Conjunto Fuzzy

Para este projeto foi decidido utilizar a biblioteca Skikit-Fuzzy para Python. A

biblioteca possui diversas funcoes implementadas para facilitar principalmente a

13

Page 29: modelo fuzzy com otimização gen ética para classificação de

criacao e operacao de conjuntos fuzzy assim como no processo de defuzzificacao (ver

Secao 2.4).

Para exemplificar os conceitos apresentados e introduzir a biblioteca Skikit-Fuzzy

sera utilizado o problema da gorjeta, um problema classico da logica fuzzy. Deseja-

se, baseado em uma nota para a qualidade da comida e outra para a qualidade

do servico, determinar um percentual para a gorjeta. Ao longo deste capıtulo sera

descrito um modelo para este problema. Nesta secao serao definidos os conjuntos

fuzzy.

O problema e composto por duas variaveis de entrada e uma variavel de saıda.

Define-se tres conjuntos fuzzy para cada uma das variaveis. Para a variavel qualidade

da comida, os conjuntos ruim, normal e deliciosa. Para a variavel qualidade do

servico, os conjuntos fraco, aceitavel e maravilhoso. Ja para a variavel de saıda

percentual da gorjeta, os conjuntos baixo, medio e alto. Os formatos dos conjuntos

fuzzy podem ser vistos na Figura 2.6.

Os conjuntos foram definidos no scikit-fuzzy da seguinte forma:

1 # --*- coding: utf -8 -*-

2 import numpy as np

3 import skfuzzy as fuzz

4

5 # Gerando os universos das variaveis

6 # * Qualidade da comida e servico possuem uma nota subjetiva

no intervalo [0, 10]

7 # * Percentual de gorjeta pode variar no intervalo [0, 25]

8 x_qual = np.arange(0, 10.1, 0.1)

9 x_serv = np.arange(0, 10.1, 0.1)

10 x_tip = np.arange(0, 25.1, 0.1)

11

12 # Gerando as funcoes de pertinencia dos conjuntos fuzzy

13 qual_lo = fuzz.trimf(x_qual , [0, 0, 5])

14 qual_md = fuzz.trimf(x_qual , [0, 5, 10])

15 qual_hi = fuzz.trimf(x_qual , [5, 10, 10])

16 serv_lo = fuzz.trimf(x_serv , [0, 0, 5])

17 serv_md = fuzz.trimf(x_serv , [0, 5, 10])

14

Page 30: modelo fuzzy com otimização gen ética para classificação de

0 2 4 6 8 100.0

0.2

0.4

0.6

0.8

1.0Qualidade da Comida

RuimNormalDeliciosa

0 2 4 6 8 100.0

0.2

0.4

0.6

0.8

1.0Qualidade do Servico

FracoAceitavelMaravilhoso

0 5 10 15 20 250.0

0.2

0.4

0.6

0.8

1.0Percentual da Gorjeta

BaixoMedioAlto

Figura 2.6: Problema da gorjeta - Variaveis fuzzy

15

Page 31: modelo fuzzy com otimização gen ética para classificação de

18 serv_hi = fuzz.trimf(x_serv , [5, 10, 10])

19 tip_lo = fuzz.trimf(x_tip , [0, 0, 13])

20 tip_md = fuzz.trimf(x_tip , [0, 13, 25])

21 tip_hi = fuzz.trimf(x_tip , [13, 25, 25])

2.3 Inferencia Fuzzy

2.3.1 Regras Fuzzy e Implicacao logica

A forma de se representar um processo decisorio em logica fuzzy se da por meio

de regras fuzzy. Essas regras tem a forma de afirmacoes do tipo se-entao:

Se x ∈ A entao y ∈ B

Onde a expressao x ∈ A e uma premissa ou proposicao de que o elemento x

pertence ao conjunto fuzzy A contido em um universo X. Ja a expressao y ∈ B e

a consequencia de que o elemento y pertence ao conjunto fuzzy B contido em um

universo Y . O primeiro passo para podermos utilizar regras fuzzy e formalizar mate-

maticamente o conceito dessas regras se-entao, tambem conhecido como inferencia

logica.

Considere dois conjuntos classicos A e B contidos no universo X, assim como duas

proposicoes

p : x ∈ A,

q : x ∈ B.

Em logica classica, a implicacao logica, simbolizada por ”→”e um operador logico

para a criacao de afirmacoes condicionais. A seguinte afirmacao p→ q pode ser lida

como se p entao q. A afirmacao significa, simplesmente, que, se a proposicao p for

verdadeira, entao a proposicao q tambem sera verdadeira. Em logica classica temos:

p→ q = ¬p ∨ q,

onde ¬ e o simbolo de negacao logica e ∨ e o sımbolo de conjuncao logica (OU

logico).

16

Page 32: modelo fuzzy com otimização gen ética para classificação de

Figura 2.7: Representacao grafica de A→ B

Suponha que A representa o conjunto dos peixes e B o conjunto dos animais que

nadam. Suponha tambem que p e a proposicao isso e um peixe (x ∈ A) e que q e a

proposicao isso pode nadar (x ∈ B). Pode-se dizer:

SE isso e um peixe ENTAO isso pode nadar (p→ q)

Portanto, isso NAO e um peixe OU isso pode nadar (¬p ∨ q)

Ao se aplicar o operador de implicacao a dois conjuntos, por exemplo A → B,

tem-se como resultado um conjunto R em que, todos os elementos R que estiverem

contidos em A, tambem estarao contidos em B, como pode ser visto na Figura 2.7.

Portanto:

R = A→ B = A ∪B.

Representando A, B e R por meio de suas funcoes caracterısticas terıamos:

UR(x) = max[(1− UA(x)),UB(x)]

No caso em que A pertence a um universo X e B pertence a um universo Y , tem-se

que:

R = A→ B = (A× Y ) ∪ (A×B),

como pode ser observado na 2.8. Representando A, B e R por meio de suas funcoes

caracterısticas tem-se:

UR(x, y) = max[(1− UA(x)),min(UA(x),UB(y))]

17

Page 33: modelo fuzzy com otimização gen ética para classificação de

X

B

A

Y

A x B

A x Y

A→B

Figura 2.8: Representacao grafica de A→ B

No caso em que A e B sao conjuntos fuzzy a relacao R = A→ B = A ∪ B pode

ser reescrita, de forma que a funcao de pertinencia para a implicacao R seria:

µR(x, y) = max[(1− µA(x)),min(µA(x), µB(y))]

Esta, porem, nao e a unica forma de representar a implicacao na logica fuzzy. Diver-

sas maneiras sao utilizadas e cada uma satisfaz diferentes requisitos da implicacao

logica classica [8] [9]. A Tabela 2.2 mostra algumas das principais formas de im-

plicacao fuzzy. As implicacoes de Mamdani e Larsen, apesar de nao poderem ser

consideradas como implicacoes, por nao satisfazerem a tabela verdade da implicacao

classica, conseguiram uma enorme aceitacao na pratica [10].

Pode-se agora criar uma regra fuzzy para o exemplo do problema da gorjeta,

relacionando os conjuntos fuzzy estabelecidos anteriormente. Uma possıvel regra

seria:

Se qualidade do servico e aceitavel,

entao percentual da gorjeta e medio

18

Page 34: modelo fuzzy com otimização gen ética para classificação de

Tabela 2.2: Principais funcoes de implicacao fuzzy.

Nome Funcao

Mamdani [11] µR(x, y) = min(µA(x), µB(y))

Larsen [12] µR(x, y) = µA(x)× µB(y)

Lukasiewicz [13] µR(x, y) = min(1, 1− µA(x) + µB(y))

Kleene-Dienes [14] [15] µR(x, y) = max(1− µA(x), µB(y))

Godel [16] µR(x, y) =

1, se µA(x) ≤ µB(x);

µB(x), se µA(x) > µB(x).

Considere S e G os conjuntos universo para qualidade do servico e percentual da

gorjeta, respectivamente e variaveis s ∈ C e g ∈ G. Pode-se representar os conjuntos

fuzzy ”aceitavel”e ”medio”com A e B, respectivamente:

A = aceitavel, A ⊆ S,

B = medio, B ⊆ G

As suas funcoes de pertinencia, µA(s) e µB(g) foram representadas graficamente na

ultima secao pela Figura 2.6.

Apos estas definicoes, pode-se reescrever a regra fuzzy da seguinte forma:

R(s, g) Se s e A, entao g e B

Pode-se, entao, reduzir a regra para:

R : A→ B

Utilizando a funcao de implicacao de Mamdani neste exemplo. A funcao de per-

tinencia da relacao se da entao por:

µR(c, g) = min(µA(s), µB(g))

A Figura 2.9 mostra o resultado da funcao de pertinencia da regra usando µA(s)

e µB(g) da Figura 2.6.

19

Page 35: modelo fuzzy com otimização gen ética para classificação de

Qualidade

doS

ervico

0

2

4

6

8

10

Percentual da Gorjeta0 5 10 15 20 25

µR

(c, g

)

0.0

0.2

0.4

0.6

0.8

1.0

Funcao de Pertinencia de uma regra fuzzy

Figura 2.9: Representacao grafica da funcao de pertinencia para a regra

R(s, g)

2.3.2 Inferencia Fuzzy

O objetivo de um sistema fuzzy e, a partir de uma serie de entradas fornecidas

ao sistema, gerar uma saıda que satisfaca determinadas condicoes (regras). Ate o

momento definimos para o exemplo da gorjeta os conjuntos fuzzy de entrada e saıda

assim como uma regra. O que e necessario agora e definir como o conjunto de saıda

sera modificado quando o valor da entrada do sistema for definido. Para tal usa-se

o que e chamado de inferencia fuzzy.

Inferencia, nada mais e do que a associacao de premissas de forma a obter uma

conclusao. A principal forma de inferencia logica que e utilizada em sistemas fuzzy

e a Modus Ponens. Essa estrutura e formada por uma premissa de implicacao de

que A → B e uma premissa de que a proposicao A e verdadeira. Desta chega-se a

conclusao de que B tambem e verdadeiro. Por exemplo:

20

Page 36: modelo fuzzy com otimização gen ética para classificação de

Premissa 1: SE isto e um peixe ENTAO isto pode nadar. (A→ B)

Premissa 2: Isto E um peixe. (A)

Conclusao: Isto pode nadar. (B)

B pode ser definido a partir da composicao das relacoes apresentadas (Premissas 1

e 2) atraves da notacao B = A ◦ (A→ B).

A generalizacao de Modus Ponens para o exemplo da gorjeta seria a seguinte [17]:

Premissa 1: Se s ∈ A, entao g ∈ B.)

Premissa 2: s ∈ A′.Conclusao: B′.

Pode-se, entao, escrever B′ como:

B′ = A′ ◦ (A→ B) = A′ ◦R

Onde A′ e a restricao aplicada ao fuzzy set A e B′ e o novo conjunto fuzzy para a

saıda uma vez aplicada essa restricao a entrada.

Ao ser definido o valor de uma das entradas de um sistema fuzzy, este valor

primeiro sera fuzzificado. Isto, nada mais e, do que aplicar a funcao de pertinencia

ao valor. No caso do exemplo da gorjeta, tendo uma nota para a qualidade do

servico s0, o processo de fuzzificacao sera encontrar µA(s0). Em seguida a entrada

fuzzificada e aplicada ao sistema de inferencia. No sistema descrito acima tem-se

que:

A′ = s0

Para encontrar a funcao de pertinencia do conjunto de saıda apos esta restricao ser

aplicada a entrada, faz-se que [17]:

µB′(g) = s0 ◦ (µA(s)→ µB(g))

µB′(g) = µA(s0)→ µB(g)

µB′(g) = R(s0, g)

Ao aplicar a implicacao de Mamdani:

µB′(g) = min(µA(s0), µB(g))

21

Page 37: modelo fuzzy com otimização gen ética para classificação de

0 2 4 6 8 10

Qualidade do Servico

0.0

0.2

0.4

0.6

0.8

1.0

Pert

inen

cia

Qualidade do Servico

0 5 10 15 20 25

Percentual da Gorjeta

0.0

0.2

0.4

0.6

0.8

1.0

Pert

inen

cia

Percentual da Gorjeta

Figura 2.10: Implicacao fuzzy - Funcao de pertinencia µB′(g)

Caso seja atribuıda uma nota para a qualidade do servico, por exemplo, s0 = 6,

o resultado para o conjunto fuzzy da saıda pode ser visto na Figura 2.10 e pode,

tambem, ser visualizado como um corte transversal na superfıcie da Figura 2.9.

2.3.3 Exemplo de Aplicacao de Regras

Seguindo com o exemplo da gorjeta, foi definida uma regra fuzzy relacionando a

qualidade da comida com a gorjeta. Serao definidas mais duas regras ficando com

as tres regras a seguir:

1. Se a comida e ruim ou o servico e fraco, entao percentual da gorjeta sera baixo;

2. Se servico e aceitavel, entao percentual da gorjeta e medio;

3. Se a comida e excelente ou o servico e maravilhoso, entao o percentual da

gorjeta sera alto.

Serao tambem definidos os valores da entrada:

• Qualidade do servico: 4;

• Qualidade da comida: 9.5;

A Figura 2.11 mostra cada uma das regras aplicadas.

22

Page 38: modelo fuzzy com otimização gen ética para classificação de

A biblioteca scikit-fuzzy apresenta uma funcao para fuzzificar os valores de en-

trada. O codigo para aplicar as regras que foram definidas pode ser visto a seguir.

1 # O primeiro passo ap os definirmos as entradas 4 e 9.5 e a

fuzzificacao.

2 # A funcao interp_membership realiza esse processo retornando

o grau de pertin encia.

3 qual_level_lo = fuzz.interp_membership(x_qual , qual_lo , 4)

4 qual_level_md = fuzz.interp_membership(x_qual , qual_md , 4)

5 qual_level_hi = fuzz.interp_membership(x_qual , qual_hi , 4)

6

7 serv_level_lo = fuzz.interp_membership(x_serv , serv_lo , 9.5)

8 serv_level_md = fuzz.interp_membership(x_serv , serv_md , 9.5)

9 serv_level_hi = fuzz.interp_membership(x_serv , serv_hi , 9.5)

10

11 # Agora aplicamos as regras

12

13 # REGRA 1

14 # A regra 1 relaciona um servico ou comida ruim a uma gorjeta

baixa

15 # O operador OU e definido como o maximo dos dois

16 active_rule1 = np.fmax(qual_level_lo , serv_level_lo)

17 # A implicacao na saida e feita da mesma forma.

18 tip_activation_lo = np.fmin(active_rule1 , tip_lo) # removed

entirely to 0

19

20 # REGRA 2

21 # A regra 1 e uma implicacao de servico medio em gorjeta media

22 # Usamos o operador de implicac~ao de Mamdani que e o minimo

23 tip_activation_md = np.fmin(serv_level_md , tip_md)

24

25 # REGRA 3

26 # A regra 3 relaciona servico ou comida bons a gorjeta alta.

27 # As operacoes sao as mesmas da regra 1

28 active_rule3 = np.fmax(qual_level_hi , serv_level_hi)

29 tip_activation_hi = np.fmin(active_rule3 , tip_hi)

23

Page 39: modelo fuzzy com otimização gen ética para classificação de

0 5 10 15 20 250.0

0.2

0.4

0.6

0.8

1.0Atividade da Funcao de Pertinencia da Saıda

Regra 1Regra 2Regra 3

Figura 2.11: Saıda das regras fuzzy

2.4 Agregacao e Defuzzificacao

A maioria dos sistemas fuzzy sao compostos por mais de uma regra. O processo

pelo qual se obtem a conclusao final a partir das diferentes regras e chamado de

agregacao. Duas formas de agregacao sao [18]:

1. Sistema de regras conjuntivas: Onde as regras devem ser mutualmente satis-

feitas. Neste caso elas sao conectadas por uma operacao E.

R = R1 ∩R2 ∩ · · · ∩Rn

2. Sistema de regras disjuntivas: Onde pelo menos uma regra deve ser satisfeita.

Neste caso elas sao conectadas por uma operacao OU.

R = R1 ∪R2 ∪ · · · ∪Rn

Defuzzificacao e o processo de conversao de uma quantidade fuzzy para uma quan-

tidade precisa, assim como a fuzzificacao e o processo converter uma quantidade pre-

cisa em uma quantidade fuzzy. Abaixo estao listados alguns dos principais metodos

de defuzzificacao [19] [20]:

24

Page 40: modelo fuzzy com otimização gen ética para classificação de

1. Centroide (centro da area ou centro de gravidade): E uma das tecnicas mais

usadas possuindo um dos mais fortes apelos a fısica. [21].

zdefuzz =

∫µR(z).z dz∫µR(z) dz

2. Centro das Somas : E uma tecnica mais rapida do que a centroide, com o

ponto negativo de somar areas sobrepostas. Ela consiste em somar as areas de

cada funcao de pertinencia de saıda calculando, em seguida, o centroide dessa

soma.

zdefuzz =

∫z∑n

k=1 µRk(z) dz∫ ∑n

k=1 µRk(z) dz

3. Centro do Maximo, Mınimo do Maximo e Maximo do Maximo: Estas tecnicas

usam o maximo da funcao de pertinencia da saıda para calcular o valor de-

fuzzificado da saıda. Caso o maximo seja apenas um ponto as tres tecnicas

resultam no mesmo valor. Caso o maximo seja um plato elas retornaram o va-

lor referente ao seu centro, seu mınimo e seu maximo, respectivamente. Sento

a e b o menor e maior valores de z, respectivamente, a retornar o maximo de

µR(z), tem-se que:

Mınimo do Maximo: zdefuzz = a

Centro do Maximo: zdefuzz = a+b2

Maximo do Maximo: zdefuzz = b.

4. Media Ponderada: E a media dos centros de massa de cada funcao de cada

funcao de pertinencia da saıda ponderada pelo valor da funcao de transferencia

no centro de massa.

zdefuzz =

∑nk=1 µRk

(z).z∑nk=1 µRk

(z),

Onde z e o centro de massa da funcao de pertinencia.

Voltando ao exemplo da gorjeta, as funcoes de pertinencia da saıda serao agrega-

das usando a funcao de maximo como operador para o OU logico. Em seguida sera

feita defuzzificacao por centroide na funcao de pertinencia agregada. Apos estes dois

passos obtemos um valor para a gorjeta de 16,7%. O processo de defuzzificacao pode

ser visto na Figura 2.12, onde o ponto te centroide e indicado por uma linha vertical.

25

Page 41: modelo fuzzy com otimização gen ética para classificação de

0 5 10 15 20 25

Percentual de Gorjeta

0.0

0.2

0.4

0.6

0.8

1.0

Pert

inen

cia

Funcao de Pertinencia Agregada

Figura 2.12: Defuzzificacao do problema da gorjeta

A biblioteca scikit-fuzzy possui algumas funcoes de defuzzificacao implementada. O

codigo para agregacao e defuzzificacao pode ser visto abaixo:

1 # Agrega as 3 funcoes de pertinencia da saida

2 aggregated = np.fmax(tip_activation_lo ,

3 np.fmax(tip_activation_md ,

tip_activation_hi))

4

5 # Calcula o resultado defuzzificado

6 tip = fuzz.defuzz(x_tip , aggregated , ’centroid ’)

7 tip_activation = fuzz.interp_membership(x_tip , aggregated , tip

) # for plot

26

Page 42: modelo fuzzy com otimização gen ética para classificação de

Capıtulo 3

Delimitacao do Problema

3.1 Descricao do Problema

Na selecao de candidatos para um a vaga de emprego, a identificacao de um perfil

de cultura e valores para os candidatos e um aspecto excessivamente trabalhoso e

subjetivo. Isso pode ser feito por head hunters, ou durante extensos processos de en-

trevistas e dinamica de grupos. Este projeto tem como objetivo, o desenvolvimento

de um modelo computacional, capaz de reduzir essa subjetividade e automatizar o

processo de selecao de candidatos, no que diz respeito a compatibilidade de cultura

e valores, entre candidato e empresa.

O modelo recebe como entrada dados coletados por meio de dois questionarios

desenvolvidos pela empresa Pin People: um para candidatos e um para as empresas.

Aplica-se os devidos pre-processamentos aos dados e, em seguida, utiliza-se um

sistema de logica fuzzy para retornar um grau de compatibilidade entre o candidato

e a empresa.

O sistema fuzzy utilizado e do tipo Maidani, por ser amplamente utilizado para

capturar informacao de um especialista de maneira intuitiva [4]. As regras fuzzy

foram desenvolvidas juntamente com um especialista de recrutamento e selecao, de

forma a refletir o processo decisorio.

O grau de compatibilidade deve seguir as diretrizes para avaliacao ja utilizadas

pela Pin People, mostradas na Tabela 3.1. As variaveis utilizadas neste projeto serao

27

Page 43: modelo fuzzy com otimização gen ética para classificação de

descritas na proxima secao, mas novas variaveis podem ser adicionadas futuramente

de forma a refinar o sistema.

Tabela 3.1: Graus de compatibilidade entre candidatos e empresas.

Classe Grau de Compatibilidada Nota

1 Compatibilidade muito baixa 0 - 2,9

2 Compatibilidade baixa 3 - 5,9

3 Compatibilidade alta 6 - 7,9

4 Compatibilidade muito alta 8 - 10

Candidatos das classes 3 e 4 de compatibilidade com uma empresa sao os consi-

derados compatıveis. Sao esses os candidatos que serao apresentados as empresas.

Vale ressaltar que a compatibilidade e dependente tanto do candidato quanto da

empresa, de forma que um candidato altamente compatıvel com uma empresa nao

necessariamente o sera com as demais, e vice versa.

O erro em classificar um candidato que deveria ser da classe 3 como sendo da

classe 2 e muito mais preocupante do que classifica-lo como sendo da classe 4, pois

este erro significa nao apresenta-lo para a empresa. Por esta razao, neste projeto,

optou-se por juntar as classe 3 e 4, como compatıvel, assim como as classes 1 e

2, como incompatıvel, reduzindo o problema para um classificador binario. Desta

maneira a eficiencia do modelo pode ser representada pela probabilidade de deteccao

(PD), que e a probabilidade de alguem classificado como compatıvel ser realmente

compatıvel, e pela probabilidade de falso alarme (PF), que e a probabilidade de

alguem classificado como compatıvel ser, na verdade, incompatıvel.

Como figuras de merito, observou-se as PDFs (Probability Density Function) [22]

da saıda para os conjuntos compatıvel e incompatıvel, assim como a curva ROC (Re-

ceiver Operating Characteristic) [23] [24]. Ela relaciona a probabilidade de deteccao

(PD) com a probabilidade de falso alarme (PF), para cada limiar de corte possıvel

em um classificador binario. Um classificador binario perfeito e aquele operando no

ponto superior direito do espaco ROC, onde PD = 1 e PF = 0. Neste ponto as

28

Page 44: modelo fuzzy com otimização gen ética para classificação de

PDFs de cada classe nao apresentam nenhuma sobreposicao.

3.2 Selecao de Variaveis

Os dados utilizados neste projeto foram fornecidos pela empresa Pin People e

foram extraıdos das respostas de dois questionarios elaborados pela empresa. Es-

tes questionarios, tem como finalidade, mapear a Cultura Organizacional de uma

empresa, e o nıvel de compatibilidade de um candidato com essa cultura.

Ambos os questionarios foram desenvolvidos tomando como base a literatura a

respeito de cultura organizacional. Um deles e voltado para candidatos e o outro

para os colaboradores da empresa. A partir das respostas dos colaboradores, de uma

determinada area da empresa, e consolidado um perfil para aquela area. O modelo

desenvolvido, classifica o nıvel de compatibilidade do perfil de um candidato, com

uma determinada area de uma empresa.

Obteve-se acesso a apenas um numero restrito de variaveis dos questionarios,

portanto, foi necessario escolher as mais representativas para a avaliacao de com-

patibilidade. Buscou-se entao, variaveis que possuıssem uma alta correlacao com o

nıvel de compatibilidade assim como as variaveis que tivessem maior respaldo por

parte da literatura de cultura organizacional.

Uma analise, nao publica, feita pela Pin People, cruzando variaveis do questionario

com notas dadas por um especialista em recrutamento revelou duas variaveis como

sendo as mais correlacionadas com o grau de compatibilidade, sao elas: Arquetipos

e Valores. Ambas tambem possuem forte respaldo na literatura de cultura organi-

zacional.

3.2.1 Arquetipos

A variavel de arquetipo foi extraıda da metodologia Competing Values Framework

[1], desenvolvido por Kim Cameron e Robert Quinn, em 1999. Esta metodologia

permite diagnosticar uma determinada organizacao como uma composicao de quatro

arquetipos, brevemente descritos na Tabela 3.2.1. Estes arquetipos sao: Hierarchy,

29

Page 45: modelo fuzzy com otimização gen ética para classificação de

Market, Clan, Adhocracy. Eles foram traduzidos para o questionario, respectiva-

mente, como: Estruturado, Superacao, Colaborativo, Desbravador. Eles podem ser

representados graficamente como pode ser visto na Figura 3.1. Pode-se observar,

pela figura, que existe uma relacao de oposicao entre os arquetipos Estruturado e

Desbravador, assim como entre Superacao e Colaborativo.

Tabela 3.2: Descricao dos arquetipos

Arquetipo Descricao

Estruturado Uma organizacao que preza por definir processos claros, con-

seguem direcionar o que as pessoas precisam fazer no dia a

dia.

Superacao E uma organizacao com muita orientacao para resultado. A

maior preocupacao e ter o trabalho realizado e cada vez me-

lhor. As pessoas sao competitivas e orientadas a metas. Os

lıderes sao fortes direcionadores, executores e competidores.

Colaborativo E uma empresa com um ambiente muito amigavel para se

trabalhar, as pessoas compartilham muitas informacoes sobre

elas mesmas.

Desbravador E uma empresa dinamica e oferece um ambiente com bastante

autonomia para se trabalhar. E uma organizacao incentiva

muito a liberdade e pessoas que gostam de ir atras de novos

desafios e que assumem os riscos.

Os valores para os arquetipos devem somar 100% e sao extraıdos a partir de seis

perguntas do questionario por meio da metodologia Competing Values Framework

[1]. E considerado o arquetipo da area a ser mapeada a media aritmetica das respos-

tas de cada colaborador da area. A lista contendo os valores do candidato mapeados

em arquetipos, junto com a lista da empresa serao entradas do modelo.

3.2.2 Valores

A variavel de valores consiste em uma lista de 28 variaveis selecionadas a partir

dos estudos feito por O’Reilly [25] e James Sarros [2]. O’Reilly reduziu um conjunto

30

Page 46: modelo fuzzy com otimização gen ética para classificação de

Figura 3.1: Representacao grafica dos arquetipos para um candidato e uma

empresa

inicial de 110 valores, mais presentes em organizacoes, para 58 valores. Posterior-

mente James Sarros conseguiu, a partir destes 58, chegar numa lista de 28 valores.

A lista dos valores usados no questionario da Pin People com uma breve descricao

de cada um pode ser visto na Tabela 3.3.

Dessa lista, no questionario de candidatos, cada candidato que preenche deve

selecionar ate cinco valores que melhor o representam. Ja no questionario de em-

presas, cada colaborador da area a ser mapeada deve escolher ate cinco que melhor

representam a empresa. Os 5 valores mais marcados pelos colaboradores passam a

representar a area mapeada. Os valores do candidato e os valores da empresa serao

entradas do modelo.

31

Page 47: modelo fuzzy com otimização gen ética para classificação de

Tabela 3.3: Descricao dos valores

Valores Descricao

Agilidade As decisoes sao tomadas rapidamente, assim como

a implementacao das atividades

Assumir responsabili-

dade individual

Trazer para si a responsabilidade pelo cumpri-

mento ou nao de determinado objetivo

Baixo conflito Pouco desentendimento a respeito de diferentes in-

teresses, sentimentos e ideias

Brilho nos olhos Forte empolgacao e entusiasmo, que chegam a ser

aparentes sob a perspectiva do outro

Cautela Agir com cuidado, olhando para os detalhes

Clara filosofia de ori-

entacao

Saber exatamente o que se quer atingir, qual ca-

minho se deve seguir

Colaboracao Ato ou efeito de colaborar, trabalhar em conjunto.

Compartilha informacoes

livremente

Ser capaz de expressar ideias sem julgamento, ou

seja, sem distincao ou percepcao de diferencas

Correr riscos/ousar Ter coragem e ousadia para realizar algo

Distincao Ser, fazer ou ter algo que nao e comum em outras

organizacoes

Enfase na qualidade Importancia para que o produto ou servico ou ati-

vidade esteja em conformidade certo padrao de ex-

celencia

Entusiasmo no trabalho Ter prazer e empolgacao no desenvolvimento das

atividades

32

Page 48: modelo fuzzy com otimização gen ética para classificação de

Tabela 3.3 - Continuacao

Valores Descricao

Estabilidade Que age com firmeza, solidez, seguranca

Etica Princıpio moral que exige conduta justa, com res-

peito ao direito e a equidade, manifestado em ato

ou comportamento

Foco em equipes Acoes direcionadas a estimular que um conjunto

de pessoas trabalhe em prol do mesmo objetivo

Foco em pessoas Acoes direcionadas a motivacao e a maximizacao

dos resultados entregues pelas pessoas

Foco em resultados Acoes direcionadas ao resultado final

Foco na realizacao Acoes direcionadas a execucao e concretizacao

Garantia de emprego Seguranca da vaga por um determinado tempo

Inovacao Criacao e/ou implementacao de alguma novidade

Meritocracia Atribuicao de recompensa aos que fizeram por

merece-la.

Oportunidade para cres-

cimento profissional

Possibilidade para exercer atividades acima do es-

perado e obter reconhecimento

Organizacao As atividades funcionam corretamente no tempo

estipulado.

Ser calma Tranquilidade e paciencia

Ser competitiva Agir intensamente direcionado a conquista de um

objetivo

Socialmente responsavel Cumprimento dos deveres e obrigacoes dos in-

divıduos e empresas para com a sociedade em geral

Superacao Comportamento que traga resultados acima do so-

licitado/acordado

Transparencia Caracterıstica de nao ocultar informacoes perti-

nentes, se mostrando tal como e.

33

Page 49: modelo fuzzy com otimização gen ética para classificação de

3.2.3 Variaveis de Regua

Segundo Edgar Schein [26] para haver o entendimento de cultura e necessario um

processo de entrevistas qualitativas nas organizacoes. Um processo complementar a

construcao do questionario, feito pela Pin People, foram entrevistas em profundidade

com diversos gestores de empresa e tambem com candidatos, para um entendimento

mais profundo de cultura. Durante este processo, foi coletada informacao sobre o

que um candidato gostaria de saber sobre uma empresa e sobre o que uma empresas

gostaria de saber sobre um candidato.

A partir dessa informacao foi elaborada uma secao no questionario com as pergun-

tas mais relevantes. Serao utilizadas quatro dessas perguntas do lado do candidato e

quatro do lado da empresa. Estas quatro foram escolhidas pois cada uma das quatro

do candidato possui uma correspondencia direta com uma das quatro da empresa.

As variaveis escolhidas sao:

Candidato:

• No dia a dia prefiro trabalhar sozinho?

• No dia a dia gosto de ser o meu proprio chefe e tomar decisoes?

• Quanto ter flexibilidade de horario no dia a dia do seu trabalho e importante

para voce?

• Questiono o que e padrao e executo as coisas de forma diferente?

Empresa:

• Como voce avalia o nıvel de colaboracao entre pessoas da organizacao?

• Qual o grau de autonomia que voce tem para tomar e executar as decisoes?

• Com que frequencia voce possui flexibilidade para realizar seu trabalho fora

do escritorio?

• Com que frequencia voce percebe o suporte da organizacao para que uma nova

ideia seja colocada em pratica?

34

Page 50: modelo fuzzy com otimização gen ética para classificação de

Cada um destes itens sao avaliados com uma nota de 0 a 7. Essa nota e selecionada

ao arrastar com o mouse uma especie de regua na tela, por este motivo este grupo

de variaveis e chamado de variaveis de regua. E assim que estas variaveis serao

chamadas de agora em diante.

35

Page 51: modelo fuzzy com otimização gen ética para classificação de

Capıtulo 4

Construcao do Modelo Fuzzy

Este capıtulo trata do desenvolvimento do modelo fuzzy. Ele e composto por um

bloco de pre-processamento para cada grupo de variaveis selecionado (Arquetipos,

Valores e Variaveis de Regua). Cada bloco utiliza a informacao do candidato e da

empresa, com relacao a um dos grupos de variaveis, e apresenta uma saıda propor-

cional a compatibilidade apenas nesse grupo de variaveis.

A saıda destes blocos servirao como entrada para um sistema fuzzy. Usando a

informacao de compatibilidade com relacao a cada um dos grupos o sistema retorna,

entao um nıvel de compatibilidade final. O candidato e a empresa sao ditos com-

patıveis quando este nıvel esta acima de um determinado limiar de decisao, que

tambem e calculado neste capıtulo. Um diagrama de blocos representando o modelo

fuzzy completo e apresentado na Figura 4.1.

4.1 Pre-processamento

Nessa secao serao descritas as tecnicas usadas para pre-processar cada um dos

grupos de variaveis (Arquetipos, Valores e Variaveis de Regua) de forma se obter

um valor de compatibilidade entre candidato e empresa para cada uma delas. O

sistema fuzzy deve receber como entrada o nıvel de compatibilidade entre candidato

e empresa fornecido pelo pre-processamento de cada um dos grupos de variaveis.

36

Page 52: modelo fuzzy com otimização gen ética para classificação de

Pré-processamento dos Arquétipos

Pré-processamento dos Valores

Arquétipos do Candidato

Arquétipos da Empresa

Variáveis de Réguado Candidato

Grau deCompatibilidadePré-processamento

dos Valores

Valores do Candidato

Valores da Empresa

Variáveis de Réguada Empresa

SistemaFuzzy

Figura 4.1: Diagrama de blocos do modelo fuzzy

4.1.1 Arquetipos

A informacao extraıda dos questionarios e um par de vetores, um para o candidato

e outro para a empresa, contendo quatro valores cada um, referentes ao percentual

de quanto cada arquetipo esta presente. Foram testadas duas formas de extrair um

valor de compatibilidade entre esses vetores, o primeiro e por meio de um sistema

fuzzy exclusivo para este par de vetores e o segundo e pela simples correlacao entre

eles.

O valor usado para decidir entre ambos os pre-processamentos foi a area sob

a curva ROC, tambem conhecida como AUC (Area Under the Curve), que pode

variar entre 0 e 1. A AUC tambem pode ser interpretada como a probabilidade de

que o classificador de uma nota maior, para uma instancia positiva (candidato e

empresa compatıveis) aleatoriamente escolhida do que para uma instancia negativa

(candidato e empresa incompatıveis) aleatoriamente escolhida [24]. Quanto maior a

AUC menor e a sobreposicao entre as PDFs das saıdas, para as duas classes.

37

Page 53: modelo fuzzy com otimização gen ética para classificação de

−1.0 −0.5 0.0 0.5 1.0

Correlacao

0.0

0.5

1.0

1.5

2.0

Den

sida

dede

Pro

babi

lidad

e

Correlacao Entre ArquetiposIncompatıvelCompatıvel

Figura 4.2: Distribuicao de probabilidade da correlacao entre arquetipos

Para usar a correlacao como pre-processamento fez-se uso do Coeficiente de Cor-

relacao de Pearson [27], que e uma medida de correlacao linear entre duas variaveis.

Ele consiste em um valor entre -1 e 1, onde 1 indica correlacao positiva, 0 indica

nenhuma correlacao e -1 indica correlacao negativa. Aplicando o Coeficiente de

Correlacao de Pearson como resultado para a compatibilidade entre Arquetipos aos

pares compatıveis e incompatıveis e obtida a distribuicao mostrada na Figura 4.2.

Variando o limiar de decisao entre -1 e 1 e obtida a curva ROC mostrada na Figura

4.3. O valor de AUC para a correlacao foi de 75,45%.

No caso do sistema fuzzy para os arquetipos foi feita uma primeira tentativa

usando as funcoes de pertinencia mostradas na parte superior da Figura 4.4 para

cada um dos arquetipos, tanto de candidato como de empresa. As funcoes de per-

tinencia da saıda podem ser vistas na parte inferior da Figura 4.4. Elas foram

definidas por meio da distribuicao dos valores dos arquetipos (Figura 4.5), de forma

que os pontos em que as funcoes de pertinencia comecam a decrescer ou crescer

equivalem a media da distribuicao mais ou menos um desvio padrao. As seguintes

38

Page 54: modelo fuzzy com otimização gen ética para classificação de

0.0 0.2 0.4 0.6 0.8 1.0

Probabilidade de Falso Alarme

0.0

0.2

0.4

0.6

0.8

1.0

Pro

babi

lidad

ede

Det

ecca

o

Curvas ROC da Correlacao Entre Arquetipos

Figura 4.3: Curva ROC da correlacao entre arquetipos

regras fuzzy foram utilizadas:

• SE arquetipo colaborativo do candidato e alto E arquetipo colaborativo da em-

presa e alto, ENTAO saıda e compatıvel;

• SE arquetipo desbravador do candidato e alto E arquetipo desbravador da em-

presa e alto, ENTAO saıda e compatıvel;

• SE arquetipo estruturado do candidato e alto E arquetipo estruturado da em-

presa e alto, ENTAO saıda e compatıvel;

• SE arquetipo superacao do candidato e alto E arquetipo superacao da empresa

e alto, ENTAO saıda e compatıvel;

• SE arquetipo colaborativo do candidato e alto E arquetipo colaborativo da em-

presa e baixo, ENTAO saıda e incompatıvel;

• SE arquetipo desbravador do candidato e alto E arquetipo desbravador da em-

presa e baixo, ENTAO saıda e incompatıvel;

39

Page 55: modelo fuzzy com otimização gen ética para classificação de

0 20 40 60 80 100

Compatibilidade

0.0

0.2

0.4

0.6

0.8

1.0

Pert

inen

cia

Arquetipos Fuzzy

BaixoAlto

0 2 4 6 8 10

Compatibilidade

0.0

0.2

0.4

0.6

0.8

1.0

Pert

inen

cia

Compatibilidade entre Arquetipos Fuzzy

IncompatıvelCompatıvel

Figura 4.4: Funcoes de pertinencia dos arquetipos e de sua compatibilidade

• SE arquetipo estruturado do candidato e alto E arquetipo estruturado da em-

presa e baixo, ENTAO saıda e incompatıvel;

• SE arquetipo superacao do candidato e alto E arquetipo superacao da empresa

e baixo, ENTAO saıda e incompatıvel;

Com essa configuracao, testou-se dois metodos de defuzzificacao: Centroide e

Centro das Somas. As distribuicoes de probabilidade podem ser vistas na Figura 4.6

e a curva ROC na Figura 4.7. Os resultados comparando a AUC de cada um podem

ser visto na Tabela 4.1. Como a defuzzificacao por Centro das Somas apresentou um

resultado ligeiramente melhor e ainda e mais rapida computacionalmente, optou-se

por usa-la no projeto.

A Tabela 4.2 e Tabela 4.3 mostram todas as possibilidade de combinacoes de regras

entre arquetipos que fazem sentido do ponto de vista de cultura e valores. As regras

da Tabela 4.2 relaciona apenas arquetipos iguais (Se colaborativo no candidato e

alto e colaborativo na empresa e alto, entao resultado e compatıvel). Ja as regras

40

Page 56: modelo fuzzy com otimização gen ética para classificação de

0 10 20 30 40 50 60 70 80Valor do Arquétipo

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

Dens

idad

e de

Pro

babi

lidad

e

Histograma dos Arquetipos : µ=25.000, σ=8.642

Figura 4.5: Distribuicao de probabilidade dos arquetipos

2 3 4 5 6 7 8

Saıda do Modelo Fuzzy

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

Den

sida

dede

Pro

babi

lidad

e

CentroideIncompatıvelCompatıvel

2 3 4 5 6 7 8

Saıda do Modelo Fuzzy

0.0

0.2

0.4

0.6

0.8

1.0

Den

sida

dede

Pro

babi

lidad

e

Soma dos CentrosIncompatıvelCompatıvel

Figura 4.6: Comparacao entre defuzzificacoes: Densidades de probabilidade

do pre-processamento dos arquetipos

41

Page 57: modelo fuzzy com otimização gen ética para classificação de

0.0 0.2 0.4 0.6 0.8 1.0

Probabilidade de Falso Alarme

0.0

0.2

0.4

0.6

0.8

1.0

Pro

babi

lidad

ede

Det

ecca

o

Curvas ROC - Soma dos Centros x CentroideSoma dos CentrosCentroide

Figura 4.7: Curva ROC - Comparacao entre defuzzificacoes do pre-

processamento dos arquetipos

Tabela 4.1: Comparacao entre defuzzificacoes: Resultado de AUC do pre-

processamento dos arquetipos

Defuzzificacao AUC (%)

Centroide 70,92

Soma dos Centros 72,23

da Tabela 4.3 relacionam arquetipos opostos (Se colaborativo no candidato e alto e

superacao na empresa e alto, entao resultado e incompatıvel).

Pode-se considerar que cada uma das linhas de cada tabela se referem a um grupo

de quatro regras, uma para cada arquetipo. Dessa forma as oito regras utilizadas

ate entao poderiam ser representadas pelas duas ultimas linhas da Tabela 4.2.

Foram testadas diferentes combinacoes dos grupos de regras. O resultado da

comparacao da AUC de cada uma pode ser visto na Tabela 4.4. Pode-se observar

que a principal diferenca esta entre os grupos que contem regras relacionando o

42

Page 58: modelo fuzzy com otimização gen ética para classificação de

Tabela 4.2: Tabela verdade de regras para a presenca de um determinado arquetipo

num candidato e numa empresa

Grupo Arquetipo no Candidato Arquetipo na Empresa Resultado

Dir1 Baixo Baixo Compatıvel

Dir2 Baixo Alto Incompatıvel

Dir3 Alto Baixo Incompatıvel

Dir4 Alto Alto Compatıvel

Tabela 4.3: Tabela verdade de regras para a presenca de um determinado arquetipo

num candidato e de um oposto numa empresa

Grupo Arquetipo no Candidato Arquetipo Oposto

na Empresa

Resultado

Op1 Baixo Baixo Incompatıvel

Op2 Baixo Alto Compatıvel

Op3 Alto Baixo Compatıvel

Op4 Alto Alto Incompatıvel

mesmo arquetipo e o grupo com regras relacionando arquetipos opostos. E possıvel

supor que isso de deve ao fato de regras para arquetipos iguais serem universal-

mente validas. Ja regras envolvendo arquetipos opostos podem falhar em casos

especıficos onde um candidato ou empresa possuem como arquetipos predominan-

tes dois arquetipos que sao opostos. Por exemplo um candidato que tenha como

arquetipos predominantes, Superacao e Colaborativo seria dado como incompatıvel

tanto para uma empresa com Colaborativo quanto pra uma empresa com Superacao.

O conjunto dos quatro grupos de regras da Tabela 4.2 foi o que apresentou o

melhor resultado e portanto sera usado para o sistema de pre-processamento dos

arquetipos.

Em seguida foram testadas diferentes combinacoes para as funcoes de pertinencia

de entrada e saıda. Mais de 5000 iteracoes foram feitas e a melhor combinacao pode

43

Page 59: modelo fuzzy com otimização gen ética para classificação de

Tabela 4.4: Combinacoes de Regras para os Arquetipos: Resultado de AUC do

pre-processamento dos arquetipos

Grupos de Regras Usados AUC (%)

Dir1 e Dir2 72,23

Dir1, Dir2, Dir3 e Dir4 73,67

Op1 e Op2 67,13

Op1, Op2, Op3 e Op4 65,71

Dir1, Dir 2, Op1 e Op2 73,20

Op1-4 e Dir1-4 72,68

ser vista na Figura 4.8. A curva ROC para a melhor combinacao e a densidade de

probabilidade da saıda sao mostradas, respectivamente, na Figura 4.10 e na Figura

4.9, ja em comparacao com os resultados da correlacao. Os resultados de AOC para

a melhor combinacao sao mostrados na Tabela 4.5, tambem em comparacao com os

resultados de AUC da correlacao.

Tabela 4.5: Sistema fuzzy x Correlacao: Resultado de AUC do pre-processamento

dos arquetipos

Pre-processamento AUC (%)

Correlacao 75,45

Sistema Fuzzy 78,26

Como pode ser visto na Tabela 4.5 os resultados usando o modelo fuzzy foram

ligeiramente superiores, porem decidiu-se testar ambos os metodos no sistema fuzzy

que ira agregar todas os blocos de variaveis e observar a diferenca.

4.1.2 Valores

A variavel de valores, como ja foi discutido, consiste em cinco opcoes de valores que

sao escolhidas em uma lista de 28. Deve-se entao definir um metodo pelo qual se pode

chegar num nıvel de compatibilidade entre os valores marcados pelo candidato e os

cinco que melhor representam a empresa. A forma mais simples de fazer isso e contar

44

Page 60: modelo fuzzy com otimização gen ética para classificação de

0 20 40 60 80 100

Valor Classico

0.0

0.2

0.4

0.6

0.8

1.0

Pert

inen

cia

Arquetipos Fuzzy

BaixoAlto

0 2 4 6 8 10

Compatibilidade

0.0

0.2

0.4

0.6

0.8

1.0

Pert

inen

cia

Compatibilidade entre Arquetipos Fuzzy

IncompatıvelCompatıvel

Figura 4.8: Melhor combinacao de funcoes de pertinencia dos Arquetipos e

de sua compatibilidade

3 4 5 6 7 8 9

Saıda do Modelo Fuzzy

0.0

0.2

0.4

0.6

0.8

1.0

Den

sida

dede

Pro

babi

lidad

e

Sistema Fuzzy dos ArquetiposIncompatıveisCompatıveis

−1.0 −0.5 0.0 0.5 1.0

Correlacao

0.0

0.5

1.0

1.5

2.0

Den

sida

dede

Pro

babi

lidad

e

Correlacao dos ArquetipoIncompatıveisCompatıveis

Figura 4.9: Sistema fuzzy x Correlacao: Distribuicoes de probabilidade do

pre-processamento dos arquetipos

45

Page 61: modelo fuzzy com otimização gen ética para classificação de

0.0 0.2 0.4 0.6 0.8 1.0

Probabilidade de Falso Alarme

0.0

0.2

0.4

0.6

0.8

1.0

Pro

babi

lidad

ede

Det

ecca

o

Curvas ROC - Sistema Fuzzy x CorrelacaoSistema FuzzyCorrelacao

Figura 4.10: Sistema fuzzy x Correlacao: Curvas ROC probabilidade

quais valores foram escolhidos por ambos. Este metodo porem nao leva em conta a

relacao entre diferentes valores. Valores como ”Superacao”e ”Foco em Resultado”sao

fortemente correlacionados. Ja valores como ”Meritocracia”e ”Estabilidade”teriam

uma relacao de oposicao. Alem disso o total de valores marcados pelo candidato

pode variar.

Este pode ser interpretado como um problema onde existem 28 dimensoes, entre as

quais existem fortes relacoes de correlacao. Uma possıvel solucao e reduzir o numero

de dimensoes utilizadas para se representar os valores. A propria metodologia de

Sarros [2] ja sugere um agrupamento desses valores em sete grupos, mas como ainda

seria complexo criar regras fuzzy relacionando sete grupos para candidatos a sete

grupos para empresas optou-se por tentar representar os valores usando os quatro

grupos dos arquetipos.

Para representar os valores por meio dos arquetipos foi utilizada uma base de

dados com 17000 respostas de candidatos ao questionario. Desta base foram filtrados

apenas os candidatos que tinham um arquetipo fortemente predominante, pelos

46

Page 62: modelo fuzzy com otimização gen ética para classificação de

seguintes criterios:

• Maior arquetipo e maior que a media dos arquetipos mais um desvio padrao

(> 35.6);

• Maior arquetipo menor que 60, para evitar respostas falsas, onde o candidato

apenas arrasta o botao da resposta para o maximo;

• Segundo maior arquetipo menor que 30, para garantir a predominancia do

maior arquetipo.

Criou-se uma matriz onde cada linha corresponde a um valor e cada coluna a um

arquetipo. Para cada candidato que passou no filtro (3396 candidatos), para cada

valor que ele marcou foi adicionado uma a celula referente a esse valor e ao arquetipo

predominante do candidato. Em seguida cada coluna e normalizada pelo total de

pessoas que tem cada arquetipo como predominante. Isso foi feito, pois o numero de

pessoas que tem predominancia em um arquetipo se mostrou muito discrepante dos

outros tres (quase duas vezes mais pessoas tem o arquetipo colaborativo predomi-

nante em comparacao com todos os outros somados). Se esta normalizacao nao fosse

feita haveria a impressao de que o arquetipo colaborativo e o mais presente em todos

os valores. Finalmente, normalizou-se cada linha pelo total na linha. Desta forma o

total de cada linha passa a ser 1 e cada um de seus elementos pode ser interpretado

como o percentual de cada arquetipo para o valor referente aquela linha.

A Tabela 4.6 mostra a distribuicao de cada um do 28 valores em arquetipos.

E possıvel notar algumas caracterısticas que intuitivamente confirmam o agrupa-

mento. Valores como ”Ser competitiva”e ”Foco em resultado”tem como arquetipo

mais forte ”Superacao”. Ja valores como ”Foco em Equipes”e ”Colaboracao”tem

como arquetipo mais forte ”Colaborativo”. O mesmo pode ser observado entre

”Correr riscos/ousar”e ”Inovacao”com ”Desbravador”, assim como entre ”Cautela”e

”Estabilidade”com ”Estruturado”.

47

Page 63: modelo fuzzy com otimização gen ética para classificação de

Tabela 4.6: Distribuicao dos Valores em Arquetipos

Valores Superacao Colaborativo Desbravador Estruturado

Agilidade 23.70% 18.26% 22.06% 35.99%

Assumir respon-

sabilidade indi-

vidual

22.53% 13.08% 35.61% 28.78%

Baixo conflito 5.57% 34.49% 26.73% 33.21%

Brilho nos olhos 27.89% 27.12% 35.42% 9.57%

Cautela 7.46% 20.86% 4.97% 66.70%

Clara filosofia de

orientacao

20.25% 20.64% 20.09% 39.02%

Colaboracao 17.99% 41.62% 20.98% 19.40%

Compartilha in-

formacoes livre-

mente

15.85% 34.06% 32.62% 17.46%

Correr ris-

cos/ousar

23.77% 13.59% 56.34% 6.30%

Distincao 9.88% 13.81% 39.50% 36.80%

Enfase na quali-

dade

24.04% 21.02% 27.33% 27.61%

Entusiasmo no

trabalho

16.68% 31.54% 31.63% 20.15%

Estabilidade 13.24% 18.90% 6.91% 60.94%

Etica 20.58% 28.53% 20.90% 29.99%

Foco em equipes 19.26% 52.08% 16.92% 11.74%

Foco em pessoas 18.83% 41.43% 22.13% 17.60%

Foco em resulta-

dos

51.65% 11.50% 12.59% 24.26%

Foco na rea-

lizacao

35.18% 14.52% 18.18% 32.12%

48

Page 64: modelo fuzzy com otimização gen ética para classificação de

Tabela 3.3 - Continuacao

Valores Superacao Colaborativo Desbravador Estruturado

Garantia de em-

prego

10.92% 17.66% 8.09% 63.33%

Inovacao 18.70% 22.67% 44.69% 13.94%

Meritocracia 38.06% 17.65% 22.06% 22.23%

Oportunidade

para crescimento

profissional

28.33% 24.77% 21.32% 25.57%

Organizacao 13.50% 23.11% 11.95% 51.45%

Ser calma 12.31% 29.45% 24.61% 33.63%

Ser competitiva 61.07% 11.47% 14.11% 13.35%

Socialmente res-

ponsavel

9.36% 42.72% 30.73% 17.18%

Superacao 33.21% 26.42% 26.07% 14.30%

Transparencia 17.81% 32.23% 24.72% 25.24%

Um algoritmo de agrupamento, como K-means, poderia ser aplicado a fim de

separar os valores em grupos, mas optou-se por continuar a representa-los como

uma composicao dos diferentes arquetipos a fim de nao perder mais informacao.

Decidiu-se entao considerar o vetor igual a media dos vetores das distribuicoes de

cada valor como sendo o vetor a representar os valores de um dado candidato ou

empresa.

Uma vez tendo os valores mapeados em cada arquetipo decidiu-se tentar as mes-

mas formas de pre-processamento utilizada para os arquetipos, ou seja, comparar

um sistema fuzzy com a correlacao. As regras utilizadas e o metodo de defuzzi-

ficacao foram os mesmos usados para o sistema dos arquetipos. Apos iterar em

diversas combinacoes para funcoes de pertinencia chegou-se nas funcoes mostradas

na Figura 4.11. A Figura 4.12, compara as distribuicoes de probabilidade da saıda

para os pares compatıveis e nao compatıveis, tanto do sistema fuzzy quanto da cor-

49

Page 65: modelo fuzzy com otimização gen ética para classificação de

0 20 40 60 80 100

Valor Classico

0.0

0.2

0.4

0.6

0.8

1.0

Pert

inen

cia

Valores Fuzzy

BaixoAlto

0 2 4 6 8 10

Compatibilidade

0.0

0.2

0.4

0.6

0.8

1.0

Pert

inen

cia

Compatibilidade entre Valores Fuzzy

IncompatıvelCompatıvel

Figura 4.11: Melhor combinacao de funcoes de pertinencia dos valores e de

sua compatibilidade

relacao dos valores. A Figura 4.13, compara a curva ROC do sistema fuzzy com a

da correlacao dos valores. Na Tabela 4.7 pode ser vista a comparacao dos resultados

de AUC do sistema fuzzy e da correlacao de valores.

Tabela 4.7: Sistema fuzzy x Correlacao: Resultado de AUC do pre-processamento

dos valores

Pre-processamento AUC (%)

Correlacao 72,29

Sistema Fuzzy 73,23

Mais uma vez a diferenca de AUC, como pode ser vista, e pequena, de forma

que optou-se por testar ambas as formas de pre-processamento no sistema fuzzy que

agrega todas as variaveis.

50

Page 66: modelo fuzzy com otimização gen ética para classificação de

4.0 4.5 5.0 5.5 6.0 6.5 7.0

Saıda do Modelo Fuzzy

0.0

0.2

0.4

0.6

0.8

1.0

1.2

1.4

1.6

1.8

Den

sida

dede

Pro

babi

lidad

e

Sistema Fuzzy para os ValoresIncompatıveisCompatıveis

−1.0 −0.5 0.0 0.5 1.0

Correlacao

0.0

0.5

1.0

1.5

2.0

Den

sida

dede

Pro

babi

lidad

e

Correlacao dos ValoresIncompatıveisCompatıveis

Figura 4.12: Sistema Fuzzy x Correlacao: Distribuicoes de probabilidade do

pre-processamento dos valores

0.0 0.2 0.4 0.6 0.8 1.0

Probabilidade de Falso Alarme

0.0

0.2

0.4

0.6

0.8

1.0

Pro

babi

lidad

ede

Det

ecca

o

Curvas ROC - Sistema Fuzzy x CorrelacaoSistema FuzzyCorrelacao

Figura 4.13: Sistema Fuzzy x Correlacao: Curvas ROC do pre-processamento

dos valores

51

Page 67: modelo fuzzy com otimização gen ética para classificação de

4.1.3 Variaveis de Regua

As chamadas variaveis de regua ja foram listadas anteriormente, mas a Tabela 4.8

e a Tabela 4.9 mostram o nome utilizado para representar cada uma das pergun-

tas. Cada uma delas recebe como resposta um numero real de 0 a 7 diretamente

proporcional a quanto a pergunta ou afirmacao reflete a realidade.

Tabela 4.8: Variaveis de regua para candidatos e seus apelidos

Apelido Pergunta ao Candidato

Flexibilidade Quanto ter flexibilidade de horario no dia a dia do seu trabalho

e importante para voce?

Inovacao Questiono o que e padrao e executo as coisas de forma dife-

rente.

Autonomia No dia a dia gosto de ser o meu proprio chefe e tomar decisoes.

Trabalhar So No dia a dia prefiro trabalhar sozinho.

Tabela 4.9: Variaveis de regua para empresas e seus apelidos

Apelido Pergunta ao Colaborador da Empresa

Flexibilidade Com que frequencia voce possui flexibilidade para realizar seu

trabalho fora do escritorio?

Inovacao Com que frequencia voce percebe o suporte da organizacao

para que uma nova ideia seja colocada em pratica?

Autonomia Qual o grau de autonomia que voce tem para tomar e executar

as decisoes?

Colaboracao Como voce avalia o nıvel de colaboracao entre pessoas da or-

ganizacao?

Como pode ser visto as quatro variaveis de candidato e empresa se referem aos

mesmos temas (”Colaboracao”e ”Trabalhar So”sao do mesmo tema embora opostos)

de forma que e possıvel fazer o teste usando correlacao entre o vetor de quatro

variaveis de candidato com o da empresa, alem, e claro, do sistema fuzzy. O sistema

52

Page 68: modelo fuzzy com otimização gen ética para classificação de

fuzzy tambem utilizou soma dos centros como metodo de defuzzificacao e regras

fuzzy abaixo:

• SE flexibilidade para o candidato e alto E flexibilidade para a empresa e alto,

ENTAO saıda e compatıvel;

• SE inovacao para o candidato e alto E inovacao para a empresa e alto,

ENTAO saıda e compatıvel;

• SE autonomia para o candidato e alto E autonomia para a empresa e alto,

ENTAO saıda e compatıvel;

• SE trabalhar so para o candidato e alto E colaboracao para a empresa e baixo,

ENTAO saıda e compatıvel;

• SE flexibilidade para o candidato e alto E flexibilidade para a empresa e baixo,

ENTAO saıda e incompatıvel;

• SE inovacao para o candidato e alto E inovacao para a empresa e baixo,

ENTAO saıda e incompatıvel;

• SE autonomia para o candidato e alto E autonomia para a empresa e baixo,

ENTAO saıda e incompatıvel;

• SE trabalhar so para o candidato e alto E colaboracao para a empresa e alto,

ENTAO saıda e incompatıvel;

As funcoes de pertinencia para as entradas e saıda foram definidas apos iteracoes

em mais de 5000 combinacoes de funcoes de pertinencia. As funcoes de pertinencia

que resultaram no melhor desempenho estao representadas na Figura 4.14. A Figura

4.15, compara as distribuicoes de probabilidade do conjunto de pares compatıveis e

nao compatıveis, tanto do sistema fuzzy quanto da correlacao dos valores. A Figura

4.16, compara a curva ROC do sistema fuzzy com a da correlacao dos valores. Na

Tabela 4.10 pode ser vista a comparacao dos resultados da AUC do sistema fuzzy e

da correlacao de valores.

53

Page 69: modelo fuzzy com otimização gen ética para classificação de

0 1 2 3 4 5 6 7

Valor Classico

0.0

0.2

0.4

0.6

0.8

1.0

Pert

inen

cia

Arquetipos Fuzzy

BaixoAlto

0 2 4 6 8 10

Compatibilidade

0.0

0.2

0.4

0.6

0.8

1.0

Pert

inen

cia

Compatibilidade entre Arquetipos Fuzzy

IncompatıvelCompatıvel

Figura 4.14: Melhor combinacao de funcoes de pertinencia das variaveis de

regua e de sua compatibilidade

3 4 5 6 7 8 9

Saıda do Modelo Fuzzy

0.0

0.1

0.2

0.3

0.4

0.5

Den

sida

dede

Pro

babi

lidad

e

Sistema Fuzzy para as Variaveis de ReguaIncompatıveisCompatıveis

−1.0 −0.5 0.0 0.5 1.0

Correlacao

0.0

0.2

0.4

0.6

0.8

1.0

Den

sida

dede

Pro

babi

lidad

e

Correlacao das Variaveis de ReguaIncompatıveisCompatıveis

Figura 4.15: Sistema fuzzy x Correlacao: Distribuicoes de probabilidade do

pre-processamento das variaveis de regua

54

Page 70: modelo fuzzy com otimização gen ética para classificação de

0.0 0.2 0.4 0.6 0.8 1.0

Probabilidade de Falso Alarme

0.0

0.2

0.4

0.6

0.8

1.0

Pro

babi

lidad

ede

Det

ecca

o

Curvas ROC - Sistema Fuzzy x CorrelacaoSistema FuzzyCorrelacao

Figura 4.16: Sistema Fuzzy x Correlacao: Curvas ROC do pre-processamento

das variaveis de regua

Tabela 4.10: Sistema fuzzy x Correlacao: Resultado de AUC do pre-processamento

das variaveis de regua

Pre-processamento AUC (%)

Correlacao 54,46

Sistema Fuzzy 63,41

O resultado de AUC para a correlacao se aproxima do de uma escolha aleatoria,

onde a area e igual a 50%. A opcao da correlacao para as variaveis de regua foi,

entao, descartada. O sistema fuzzy sera testado como pre-processamento, para a

entrada variaveis de regua, no modelo final a fim de observar se ele apresenta uma

contribuicao positiva para o modelo.

Vale ressaltar que dos tres grupos de variaveis escolhidos esta era a unica que

nao apresentava uma forte correlacao com a avaliacao do especialista. E, portanto,

coerente a diferenca de eficiencia quanto a AUC quando comparado com arquetipos

ou valores. O grupo foi incluıdo no modelo por representar perguntas demandadas

55

Page 71: modelo fuzzy com otimização gen ética para classificação de

pelos candidatos e empresas, mas pode ser retirado caso seja observada necessidade.

4.2 Sistema Fuzzy

Esta secao ira descrever o sistema fuzzy que, como ja foi citado, tem como pro-

posta, receber o grau de compatibilidade entre candidato e empresa, em diferentes

aspectos, e combina-los de forma a classifica-los como compatıveis ou incompatıveis.

4.2.1 Definicao do Pre-processamento

Como foi mostrado no capıtulo anterior foram testadas duas formas de pre-

processamento para gerar o grau de compatibilidade de cada variavel. Uma delas

e utilizando um sistema fuzzy especıfico para a variavel e a outra e pelo coeficiente

de correlacao da mesma variavel, entre o candidato e a empresa. Ambas as formas

mostraram um resultado muito proximo no caso dos arquetipos e valores. No caso

das variaveis de regua o pre-processamento por fuzzy se mostrou como a unica opcao

viavel.

Serao testadas portanto dois diferentes sistemas fuzzy. O primeiro utiliza as tres

entradas sendo pre-processadas pelos seus respectivos sistemas fuzzy especıficos. Ja

o segundo utiliza o coeficiente de correlacao como pre-processamento das variaveis

arquetipos e valores, mas continua utilizando o sistema fuzzy para pre-processar as

variaveis de regua.

Para comparar os sistemas decidiu-se, primeiro, testar diversas combinacoes de

funcoes de pertinencia para as entradas e saıda dos modelos e fazer a comparacao

dos modelos ja com as melhores funcoes de pertinencias. O metodo de defuzzificacao

utilizado foi a Soma dos Centros. As regras fuzzy escolhidas para ambos os modelos,

levando em consideracao a relevancia das variaveis para o especialista, foram as

seguintes:

• SE compatibilidade de arquetipos e alta E compatibilidade de valores e alta

E compatibilidade das variaveis de regua e alta, ENTAO compatibilidade e

muito alta;

56

Page 72: modelo fuzzy com otimização gen ética para classificação de

• SE compatibilidade de arquetipos e alta E compatibilidade de valores e alta

E compatibilidade das variaveis de regua e baixa, ENTAO compatibilidade e

alta;

• SE compatibilidade de arquetipos e baixa OU compatibilidade de valores e

baixa, ENTAO compatibilidade e baixa;

• SE compatibilidade de arquetipos e baixa E compatibilidade de valores e baixa

E compatibilidade das variaveis de regua e baixa, ENTAO compatibilidade e

muito baixa;

Ao variar as funcoes de pertinencia das tres entradas (arquetipos, valores e variaveis

de regua), observou-se que variacoes nas funcoes de pertinencia da entrada variaveis

de regua nao causaram qualquer alteracao a eficiencia do modelo em termos de

AUC. A eficiencia tambem se manteve constante ao substituir a variavel pelo seu

valor medio ou ate mesmo ao exclui-la das regras. Isto pode ser devido ao fato de

ela ter um peso inferior as outras variaveis nas regras do sistema fuzzy. Optou-

se, portanto, remover a entrada variaveis de regra do modelo e substituir as regras

anteriores pelas seguintes:

• SE compatibilidade de arquetipos e alta E compatibilidade de valores e alta,

ENTAO compatibilidade e alta;

• SE compatibilidade de arquetipos e baixa OU compatibilidade de valores e

baixa, ENTAO compatibilidade e baixa;

Usando estas regras, atingi-se o melhor resultado com os conjuntos fuzzy da Figura

4.17, para o sistema fuzzy usando pre-processamento fuzzy e com os conjuntos fuzzy

da Figura 4.18, para o sistema fuzzy usando o coeficiente de correlacao como pre-

processamento. A Figura 4.19 compara as distribuicoes de probabilidade de ambos

e a Figura 4.20 compara suas curvas ROC. O resultado de AUC pode ser visto na

Tabela 4.11.

Optou-se por utilizar o sistema com o pre-processamento fuzzy. Primeiramente,

pelo fato de ter apresentado uma maior AUC, mas tambem pelo fato de que todas

57

Page 73: modelo fuzzy com otimização gen ética para classificação de

−1.0 −0.5 0.0 0.5 1.0

Correlacao

0.0

0.2

0.4

0.6

0.8

1.0

Pert

inen

cia

Compatibilidade entre Arquetipos

BaixoAlto

−1.0 −0.5 0.0 0.5 1.0

Correlacao

0.0

0.2

0.4

0.6

0.8

1.0

Pert

inen

cia

Compatibilidade entre Valores

IncompatıvelCompatıvel

0 2 4 6 8 10

Compatibilidade

0.0

0.2

0.4

0.6

0.8

1.0

Pert

inen

cia

Compatibilidade da Saıda

Compatibilidade BaixaCompatibilidade Alta

Figura 4.17: Funcoes de pertinencia do modelo fuzzy: Correlacao como pre-

processamento

58

Page 74: modelo fuzzy com otimização gen ética para classificação de

0 2 4 6 8 10

Compatibilidade

0.0

0.2

0.4

0.6

0.8

1.0

Pert

inen

cia

Compatibilidade entre Arquetipos

BaixoAlto

0 2 4 6 8 10

Compatibilidade

0.0

0.2

0.4

0.6

0.8

1.0

Pert

inen

cia

Compatibilidade entre Valores

IncompatıvelCompatıvel

0 2 4 6 8 10

Compatibilidade

0.0

0.2

0.4

0.6

0.8

1.0

Pert

inen

cia

Compatibilidade da Saıda

Compatibilidade BaixaCompatibilidade Alta

Figura 4.18: Funcoes de pertinencia do modelo fuzzy: Pre-processamento

fuzzy

59

Page 75: modelo fuzzy com otimização gen ética para classificação de

3 4 5 6 7 8 9

Saıda do Modelo Fuzzy

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

Den

sida

dede

Pro

babi

lidad

e

Modelo Fuzzy: Pre-processamento FuzzyIncompatıveisCompatıveis

2 3 4 5 6 7 8 9

Saıda do Modelo Fuzzy

0.0

0.2

0.4

0.6

0.8

1.0

1.2

Den

sida

dede

Pro

babi

lidad

e

Modelo Fuzzy: Correlacao como Pre-processamentoIncompatıveisCompatıveis

Figura 4.19: Pre-processamento fuzzy x Correlacao como pre-processamento:

Distribuicoes de probabilidade do modelo fuzzy

0.0 0.2 0.4 0.6 0.8 1.0

Probabilidade de Falso Alarme

0.0

0.2

0.4

0.6

0.8

1.0

Pro

babi

lidad

ede

Det

ecca

o

Pre-processamento Fuzzy x Correlacao como Pre-processamentoModelo Fuzzy: Pre-processamento FuzzyModelo Fuzzy: Correlacao como Pre-processamento

Figura 4.20: Pre-processamento fuzzy x Correlacao como pre-processamento:

Curvas ROC do modelo fuzzy

60

Page 76: modelo fuzzy com otimização gen ética para classificação de

Tabela 4.11: Pre-processamento fuzzy x Correlacao como pre-processamentos: Re-

sultado de AUC do modelo fuzzy

Pre-processamento AUC do modelo fuzzy (%)

Correlacao 75,15

Sistema Fuzzy 79,86

as funcoes de pertinencia dos sistemas fuzzy de pre-processamento foram ajustadas

individualmente. Acredita-se ser possıvel atingir um desempenho ainda melhor,

variando as funcoes de pertinencia do modelo como um todo (sistemas do pre-

processamento e sistema final).

4.2.2 Definicao do Limiar de Corte

O ultimo passo para a definicao do modelo e estabelecer o limiar de corte para

as classes. Para estabelecer um limiar de corte que equilibre PD e PF optou-se por

usar a Distancia Euclidiana para o ponto (0, 1) da curva ROC, que sera chamada

de D(0,1). Como ja foi dito o ponto (0, 1) e o ponto de operacao de um classificador

perfeito, portanto sera escolhido o limiar de corte que apresentar o ponto com menor

distancia ao ponto (0, 1). Essa distancia e calculada pela seguinte equacao.

D(0, 1) =√

(1− PD)2 + FA2

Calculando D(0,1) para cada ponto da curva ROC obteve-se seu valor mınimo

usando um limiar de decisao em 6,46. Ou seja, todos com nota acima serao consi-

derados compatıveis e abaixo incompatıveis. Tabela 4.12 mostra o limiar escolhido,

assim como os valores de PD, FA e D(0,1).

Tabela 4.12: Resultado do limiar de decisao

Limiar de Decisao PD (%) PF (%) D(0,1)

6,46 69,11 15,49 0.35

61

Page 77: modelo fuzzy com otimização gen ética para classificação de

O resultado na Tabela 4.12 mostra que ha pouca diferenca de D(0,1) entre os

limiares da ROC 2 e ROC 3, e uma diferenca maior para a ROC 1. Pode-se esperar

portanto um desempenho semelhante para a classificacao das classes 2, 3 e 4 e um

desempenho um pouco inferior para classe 1.

4.2.3 Comparacao com Modelo de Referencia

Uma vez que foi definida a topologia do modelo e necessario aplicar um conjunto de

teste (dados que nao foram usados para definir o modelo). Isto e feito para garantir

a generalizacao do modelo, ou seja, garantir que o modelo nao apenas ”decorou”a

informacao do conjunto usado para definir seus parametros, o que e chamado de

overfitting.

Os resultados do modelo fuzzy sao comparados aos resultados do modelo utilizado

atualmente para a estimacao do grau de compatibilidade. Como o modelo atual e

diferente para cada empresa, foi escolhido o modelo de uma empresa em especıfico,

que possui eficiencia compatıvel com a eficiencia media dos modelos.

A Figura 4.21 mostra a densidade de probabilidade da saıda do modelo para o

conjunto de teste. Por fim a Tabela 5.2 compara o modelo fuzzy com o modelo

de referencia, considerando a separacao das classes 1 e 2 das classes 3 e 4. Sao

apresentados os valores de PD, PF e a distancia ao ponto (0, 1).

Tabela 4.13: Comparacao com modelo de referencia

Modelo PD (%) PF (%) D(0,1)

Modelo Fuzzy 71,42 30,15 0.42

Modelo de Referencia 69,44 14,81 0.34

Como pode ser visto na Tabela 5.2 a probabilidade de deteccao de ambos modelos

sao semelhantes. A probabilidade de falso alarme do modelo fuzzy, porem, e quase o

dobro da apresentada pelo modelo de referencia. Um resultado inferior era esperado

devido ao numero inferior de variaveis utilizadas na construcao do modelo fuzzy em

62

Page 78: modelo fuzzy com otimização gen ética para classificação de

3 4 5 6 7 8 9

Saıda do Modelo Fuzzy

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

Den

sida

dede

Pro

babi

lidad

e

Modelo Fuzzy: Conjuto de TesteIncompatıveisCompatıveis

Figura 4.21: Conjunto de teste: Distribuicoes de Probabilidade do modelos

fuzzy

comparacao com o modelo de referencia. Optou-se, primeiramente, por fazer uma

otimizacao das funcoes de pertinencia do modelo fuzzy usando Algoritmo Genetico.

63

Page 79: modelo fuzzy com otimização gen ética para classificação de

Capıtulo 5

Otimizacao por Algoritmo

Genetico

Ainda que as funcoes de pertinencia do modelo tenham sido escolhidas a par-

tir da iteracao de mais de 10.000 possıveis combinacoes, cada combinacao teve como

pre-requisito apenas ter uma relacao entre pontos que possa ser usada como funcao

de pertinencia do seu dado universo fuzzy. Esta e uma tecnica que dificilmente

vai encontrar uma combinacao otima. Neste capıtulo sera implementada algoritmo

genetico para a otimizacao das funcoes de pertinencia.

5.1 Algoritmo Genetico

Algoritmo genetico (AG) e uma heurıstica de busca que procura reproduzir o

comportamento do processo de evolucao biologico, descrito na Teoria da Evolucao

de Darwin [28]. Ela e uma tecnica amplamente utilizado para resolver problemas de

otimizacao [29].

Na biologia, cada celula e composta por um ou mais cromossomos. Cada cro-

mossomo e dividido em diferentes genes que sao responsaveis por caracterısticas

especıficas no organismo. Durante a reproducao, ocorre o chamado crossover, onde

os genes de cada um dos organismos sao recombinadas de forma a gerar um novo

organismo. O descendente esta sujeito a apresentar alguma mutacao devido a falhas

ao copiar a informacao genetica [29].

64

Page 80: modelo fuzzy com otimização gen ética para classificação de

A evolucao ocorre quando ha selecao natural dos diferentes organismos. A selecao

natural representa a diferenca de sobrevivencia e reproducao de indivıduos devido

as suas caracterısticas [30]. Os que possuem as caracterısticas mais aptas para

sobrevivencia num dado ambiente irao sobreviver e reproduzir, passando essas ca-

racterısticas para a proxima geracao. Segundo Darwin, novas especies e classes de

seres vivos passam a existir atraves de processos de reproducao, crossover e mutacao

entre organismos ja existentes [31].

No AG, o termo cromossomo e utilizado, usualmente, para descrever uma possıvel

solucao para um dado problema. Ele e normalmente codificado como uma lista

de elementos dessa solucao. Esses elementos representam os genes [29]. No caso

do problema de otimizacao das funcoes de pertinencia do modelo fuzzy, como as

funcoes usadas sao trapezoidais, elas podem ser representadas por uma lista de

quatro pontos. Cada um desses pontos representara um gene. O cromossomo sera

a lista que concatena os pontos de todas as funcoes de pertinencia do modelo.

As formas mais simples de AG contam com as quatro operacoes abaixo, que sao

aplicadas aos cromossomos [29].

Selecao: Este operador seleciona os mais aptos cromossomos de uma populacao

para reproducao. Essa aptidao e calculada por uma funcao de avaliacao.

Crossover: No tipo mais simples de crossover, o operador seleciona aleatoriamente

uma posicao no cromossomo e troca as sequencias antes e depois deste ponto

entre os cromossomos envolvidos. Isso produz dois novos cromossomos. O

crossover e representado na Figura 5.1

Mutacao: A mutacao seleciona aleatoriamente um gene e muda o seu valor. Cada

gene tem uma probabilidade definida de sofrer mutacao. A Figura 5.2 mostra

um exemplo de mutacao.

Utilizando os operadores descritos, um algoritmo genetico simples pode ser des-

crito pelo Algoritmo 5.1.

65

Page 81: modelo fuzzy com otimização gen ética para classificação de

A0

A1

A2

A3

A4

A5

A6

A7

B0

B1

B2

B3

B4

B5

B6

B7

A0

A1

A2

A3

A4

A5

A6

A7

B0

B1

B2

B3

B4

B5

B6

B7

Figura 5.1: Exemplo de crossover

A6

A5

A4

A3

A2

A1

A0

A7

A6

A5

M

A3

A2

A1

A0

A7

Figura 5.2: Exemplo de mutacao

66

Page 82: modelo fuzzy com otimização gen ética para classificação de

Data: Populacao com n cromossomos

Result: Populacao otimizada e melhor indivıduo

while criterio de parada definido nao alcancado do

Avalie a aptidao de cada cromossomo na populacao;

Selecione n2

pares de cromossomos da populacao (pode haver a

repeticao do mesmo cromossomo);

Crie uma nova populacao de cromossomos, aplicando o operador de

crossover aos pares;

Aplique o operador de mutacao aos cromossomos da nova populacao;

Substitua a populacao antiga pela nova;

end

Algoritmo 5.1: Exemplo de algoritmo genetico

5.2 Modelo Fuzzy Genetico

O primeiro passo para aplicar AG para otimizar as funcoes de pertinencia do

modelos fuzzy e definir como sera escrito o cromossomo. Todas as funcoes de per-

tinencia do modelo sao do tipo trapezios retangulos, ou comecando em nıvel alto

em 0 ou terminando em nıvel alto no ultimo elemento do universo, por exemplo

[0, 0, 2, 6] ou [3, 6, 10, 10]. Por este motivo optou-se por representar a funcao de per-

tinencia apenas por dois numeros, no exemplo seriam [2, 6] e [3, 6]. Juntando todas

as funcoes de pertinencia do modelo o cromossomo necessario e uma lista de 28

elementos. Optou-se tambem por representar cada gene como um numero entre 0 e

1, pois algumas funcoes de pertinencia variam entre 0 e 10 e outras entre 0 e 100.

A funcao de avaliacao desenvolvida recebe como parametro o cromossomo, o con-

verte para as devidas funcoes de pertinencia. Em seguida avalia todos os pares de

candidato e empresa do conjunto de treino, retornando o valor de AUC do modelo.

Para a construcao do algoritmo, foi utilizada a biblioteca de Python para algoritmo

genetico DEAP (Distributed Evolutionary Algorithms in Python), que ja contem

diversas funcoes implementadas para selecao, mutacao e crossover. Para este projeto

optou-se por utilizar um algoritmo genetico simples, deixando maiores sofisticacoes

para os trabalhos futuros.

67

Page 83: modelo fuzzy com otimização gen ética para classificação de

Para a selecao, optou-se por utilizar a funcao /emphselTournament(), para, a

partir de uma populacao com n cromossomos selecionar n2

pares de cromossomos

da populacao. Isso e feito atraves de n torneios entre k cromossomos. O mesmo

cromossomo pode ser selecionado mais de uma vez. o valor de k utilizado foi k = 3.

Para operador de crossover, optou-se por utilizar a funcao /emphcxTwoPoint().

Ela seleciona dois pontos do cromossomo e troca a informacao entre esses dois pontos

entre os cromossomos envolvidos.

Para operador de mutacao, optou-se por utilizar a funcao /emphmutGaussian().

Ela aplica uma mutacao gaussiana com media e variancia definidas aos genes do

cromossomo com uma probabilidade tambem determinada. Os valores escolhidos

foram µ = 0 e σ = 0, 2 para a gaussiana e probabilidade de 20% para um gene sofrer

mutacao. Foi tambem definida uma outra probabilidade, que e a de um indivıduo

ser escolhido para sofrer mutacao. Ela tambem foi definida como 20%. Estes valores

foram sugeridos pela documentacao do pacote.

Apos testar diversas formas de inicializacao para a populacao optou-se por cons-

truı-la da seguinte forma:

• 20% como copia do cromossomo gerado pelas funcoes de pertinencia definidas

no capıtulo anterior;

• 60% como uma modificacao do cromossomo gerado pelas funcoes de per-

tinencia definidas no capıtulo anterior, somando-se um valor aleatorio (dis-

tribuicao gaussiana com µ = 0 e σ = 0, 2) a 20% de seus genes.

• 20% construıdos aleatoriamente respeitando a regra que os pontos da funcao

de pertinencia trapezoidal [a, b, c, d] sao tais onde a ≤ b ≤ c ≤ d.

Desta forma a inicializacao comeca a partir de um cromossomo que ja apresenta

um bom desempenho mas com espaco para encontrar solucoes que sejam distantes

dessa.

68

Page 84: modelo fuzzy com otimização gen ética para classificação de

0 50 100 150 200 250 300

Geracao

0.78

0.79

0.80

0.81

0.82

0.83

0.84

AUC

Evolucao do Modelo Fuzzy

Figura 5.3: Evolucao da AUC do modelo fuzzy ao longo das geracoes

O tamanho escolhido para a populacao foi de 100 cromossomos e rodou-se o

algoritmo por 300 geracoes. A Figura 5.3 mostra o resultado do AG ao longo das

geracoes. O melhor modelo que o AG conseguiu encontrar apresenta a densidade de

probabilidade na saıda mostrada na Figura 5.4. A curva ROC do modelo esta na 5.5.

As funcoes de pertinencia do modelo fuzzy genetico podem ser vistas no Apendice

A. Este modelo apresentou uma AUC de 83,73% para o conjunto de treino, o que e

superior a apresentada pelo modelo antes da otimizacao por AG, que era de 79,86%

para o conjunto de treino.

Para definir o limiar de corte das classes foi feito o mesmo procedimento do

capıtulo anterior. O limiar que apresentou menor D(0,1) e apresentado na Tabela

5.1.

Tabela 5.1: Resultado do limiar de decisao para o modelo fuzzy genetico

Limiar de Decisao PD (%) PF (%) D(0,1)

4,91 80.88 25,35 0.31

69

Page 85: modelo fuzzy com otimização gen ética para classificação de

3.5 4.0 4.5 5.0 5.5 6.0 6.5

Saıda do Modelo Fuzzy Genetico

0.0

0.2

0.4

0.6

0.8

1.0

1.2

1.4

1.6

Den

sida

dede

Pro

babi

lidad

e

Modelo Fuzzy Genetico: Densidade de ProbabilidadeIncompatıveisCompatıveis

Figura 5.4: Distribuicao de probabilidade da saıda do modelo fuzzy genetico

0.0 0.2 0.4 0.6 0.8 1.0

Probabilidade de Falso Alarme

0.0

0.2

0.4

0.6

0.8

1.0

Pro

babi

lidad

ede

Det

ecca

o

Modelo Fuzzy Genetico: Curva ROC

Figura 5.5: Curva ROC do modelo fuzzy genetico

70

Page 86: modelo fuzzy com otimização gen ética para classificação de

3.5 4.0 4.5 5.0 5.5 6.0 6.5

Saıda do Modelo Fuzzy Genetico

0.0

0.2

0.4

0.6

0.8

1.0

1.2

1.4

1.6

Den

sida

dede

Pro

babi

lidad

e

Modelo Fuzzy Genetico: Densidade de ProbabilidadeIncompatıveisCompatıveis

Figura 5.6: Distribuicao de probabilidade da saıda do modelo fuzzy genetico

para o conjunto de teste

5.3 Comparacao entre Modelos

Para comparar os modelos e necessario aplicar o conjunto de teste, que nao foi

usado na otimizacao do modelo. Aplicando o conjunto de teste e utilizando o limiar

que foi encontrado na ultima secao obtem-se a densidade de probabilidade na saıda

mostrada na Figura 5.6. Os resultados do modelo fuzzy genetico, comparados com

o modelo de referencia e o modelo fuzzy sao apresentados na Tabela 5.2

Tabela 5.2: Comparacao entre o modelo fuzzy, modelo fuzzy genetico e modelo de

referencia

Modelo PD (%) PF (%) D(0,1)

Modelo Fuzzy 71,42 30,15 0.42

Modelo Fuzzy Genetico 76,47 30,33 0.38

Modelo de Referencia 69,44 14,81 0.34

71

Page 87: modelo fuzzy com otimização gen ética para classificação de

E possıvel ver que o resultado do modelo fuzzy genetico manteve aproximada-

mente a mesma probabilidade de falso alarme do modelo fuzzy, porem aumentando

a probabilidade de deteccao em aproximadamente cinco pontos percentuais. O mo-

delo de referencia continua apresentando um desempenho maior quando compara-se

os valores de D(0,1), mas a diferenca de D(0,1) entre ele e o modelo fuzzy genetico

e metade da que existia entre ele e o modelo fuzzy.

Deve-se lembrar que o modelo fuzzy genetico usa um numero inferior de variaveis

em comparacao com o modelo de referencia. Acrescentar novas variaveis podem

fazer o modelo se igualar ou talvez ate ultrapassar o desempenho do modelo de

referencia.

72

Page 88: modelo fuzzy com otimização gen ética para classificação de

Capıtulo 6

Conclusoes

6.1 Conclusoes

A comparacao do capıtulo anterior entre o modelo fuzzy genetico e o modelo de

referencia mostra que o modelo fuzzy genetico e uma potencial alternativa para o

modelo atual. Vale ressaltar que a quantidade de variaveis utilizadas na entrada do

modelo fuzzy genetico e inferior a utilizada pelo modelo de referencia. Isso leva a crer

que a utilizacao de outras variaveis correlacionadas com o grau de compatibilidade

pode vir a elevar a eficiencia do modelo, possivelmente vindo a superar o modelo de

referencia.

Outro fator que deve ser levado em consideracao e a de que todos os testes de

eficiencia foram feitos com pares de varias empresas, de portes distintos. O modelo

de referencia e, atualmente construıdo para uma empresa em especıfico. Este e um

ponto positivo do modelo fuzzy em relacao ao modelo de referencia, uma vez que

torna-se possıvel a adocao de um unico modelo, o que reduz os custos operacionais

necessarios para a implementacao pratica do modelo.

Uma ultima vantagem do modelo fuzzy esta nas regras fuzzy, que sao uma forma

muito mais simples de modelar o conhecimento. Sob esta otica, o modelo pode ser

aperfeicoado a partir do conhecimento especialista sem a necessidade de o especia-

lista ter conhecimento em programacao ou estatıstica.

73

Page 89: modelo fuzzy com otimização gen ética para classificação de

Todos os pontos apresentados levam a concluir que o modelo fuzzy genetico se

apresenta como uma alternativa em potencial para o modelo atual.

6.2 Trabalhos Futuros

Aperfeicoar o algoritmo genetico, alterando as funcoes escolhidas para selecao,

mutacao e crossover, assim como aperfeicoar sua execucao, executar o codigo usando

processamento paralelo e na nuvem, pode vir a gerar uma maior otimizacao do

modelo.

O modelo fuzzy pode ser aperfeicoado de outras formas, antes da aplicacao do AG.

Outras alternativas para o pre-processamento das entradas podem ser testadas. No

caso especıfico dos valores, como foi citado no Capıtulo 3.2.2, o trabalho de James

Sarros [2] ja sugere um agrupamento para os valores. Este agrupamento pode ser

uma alternativa ao agrupamento que foi escolhido para o modelo.

Por ultimo, talvez a mais importante sugestao de trabalho futuro, seja a aplicacao

de outras variaveis do questionario ao modelo fuzzy. Varias variaveis que apresentam

forte correlacao com o grau de compatibilidade nao foram utilizadas por este modelo.

Seu uso poderia aumentar significativamente o desempenho do mesmo.

74

Page 90: modelo fuzzy com otimização gen ética para classificação de

Referencias Bibliograficas

[1] CAMERON, K. S., QUINN, R. E., Diagnosing and changing organizational

culture: Based on the competing values framework. 1 ed. Addison-Wesley, 1999.

[2] SARROS, J. C., GRAY, J., DENSTEN, I. L., et al., “The Organizational Cul-

ture Profile Revisited and Revised: An Australian Perspective”, Australian

Journal of Management, v. 30, pp. 159–182, 2005.

[3] ROSS, T. J., Fuzzy Logic with Engineering Applications. 3 ed. Wiley, 2010.

[4] KAUR, A., KAUR, A., “Comparison of Mamdani-Type and Sugeno-Type

Fuzzy Inference Systems for Air Conditioning System”, International Journal

of Soft Computing and Engineering, v. 2, 2012.

[5] CANTOR, G., “Beitrage zur Begrundung der transfiniten Mengenlehre”,

Mathematische Annalen, v. 46, pp. 481–512, Novembro 1895.

[6] KLIR, G. J., YUAN, B., Fuzzy Sets and Fuzzy Logic: Theory and Applications,

1 ed., chapter 1, Prentice Hall, p. 6, 1995.

[7] ZADEH, L. A., “Fuzzy Sets”, Information and Control, v. 8, pp. 338–353,

Junho 1965.

[8] OH, K. W., BANDLER, W., “Properties of fuzzy implication operators”, In-

ternational Journal of Approximate Reasoning, v. 1, pp. 273–285, Julho 1987.

[9] MICHAL BACZYNSKI, B. J., An Introduction to Fuzzy Implications, v. 231,

Studies in Fuzziness and Soft Computing. 1 ed. Springer, 2008.

[10] BACZYNSKI, M., JAYARAM, B., An Introduction to Fuzzy Implications, v.

231, Studies in Fuzziness and Soft Computing, 1 ed., chapter An Introduction

to Fuzzy Implications, Springer, p. 32, 2008.

75

Page 91: modelo fuzzy com otimização gen ética para classificação de

[11] E.H. MAMDANI, S. A., “An experiment in linguistic synthesis with a fuzzy

logic controller”, International Journal of Man-Machine Studies, v. 8, pp. 1–

13, Janeiro 1975.

[12] LARSEN, P. M., “Industrial applications of fuzzy logic control”, International

Journal of Man-Machine Studies, v. 12, pp. 3–10, Janeiro 1980.

[13] LUKASIEWICZ, J., “Interpretacja liczbowa teorii zdan”, Ruch Filozoficzny,

v. 7, pp. 92–93, 1923.

[14] KLEENE, S. C., “On Notation for Ordinal Numbers”, The Journal of Symbolic

Logic, v. 3, pp. 150–155, Dezembro 1938.

[15] DIENES, Z. P., “On an Implication Function in Many-Valued Systems of Lo-

gic”, The Journal of Symbolic Logic, v. 14, pp. 95–97, Junho 1949.

[16] GODEL, K., “Zum intuitionistischen Aussagenkalkul”, Anzeiger der Akademie

der Wissenschaftischen in Wien, v. 69, pp. 65–66, 1932.

[17] K.H., L., First Course on Fuzzy Theory and Applications, v. 27, Advances in

Intelligent and Soft Computing, chapter 226-227, Springer, p. 32, 2005.

[18] ROSS, T. J., Fuzzy Logic with Engineering Applications, 3 ed., chapter 5, Wiley,

p. 147, 2010.

[19] ROSS, T. J., Fuzzy Logic with Engineering Applications, 3 ed., chapter 4, Wiley,

p. 98, 2010.

[20] INSTRUMENTS, N., “Defuzzification Methods PID and Fuzzy Lo-

gic Toolkit - LabVIEW 2010 PID and Fuzzy Logic Toolkit Help -

National Instruments”, http://zone.ni.com/reference/en-XX/help/370401G-

01/lvpid/defuzzification methods/, 2010, (Acesso em 17 Fevereiro de 2016).

[21] SUGENO, M., “An introductory survey of fuzzy control”, Information Sciences,

v. 36, pp. 59–83, 1985.

[22] PEEBLES, P., Probability, Random Variables, and Random Signal Principles.

4 ed. Addison-Wesley, 2000.

76

Page 92: modelo fuzzy com otimização gen ética para classificação de

[23] TREESA, H. L. V., BELL, K. L., TIAN, Z., Detection Estimation and Modula-

tion Theory, Part I, Detection, Estimation, and Filtering Theory. 2 ed. Wiley,

2013.

[24] FAWCETT, T., “An introduction to ROC analysis”, Pattern Recognition Let-

ters, v. 28, pp. 861–874, 2006.

[25] O’REILLY, C. A., CHATMAN, J., CALDWELL, D. F., “People and Or-

ganizational Culture: a Profile Comparison Approach to Assessing Person-

Organization Fit”, Academy of Management Journal, v. 34, pp. 487–516, 1991.

[26] SCHEIN, E. H., On the Origin of Species. 2 ed. Jossey-Bass Publisher, 1985.

[27] PEARSON, K., “Note on Regression and Inheritance in the Case of Two Pa-

rents”, Proceedings of the Royal Society of London, v. 58, pp. 240–242, 1895.

[28] DARWIN, C., On the Origin of Species. 1 ed. John Murray, 1859.

[29] MITCHELL, M., An Introduction to Genetic Algorithms. 1 ed. The MIT Press,

1996.

[30] HALDANE, J. B. S., The Causes of Evolution. 1 ed. Princeton University Press,

1990.

[31] FORREST, S., “Genetic Algorithms: Principles of Natural Selection Applied

to Computation”, Science, v. 261, pp. 872–878, 1993.

77

Page 93: modelo fuzzy com otimização gen ética para classificação de

Apendice A

Funcoes de Pertinencia do Modelo

Fuzzy Genetico

A Figura A.1 apresenta as funcoes de pertinencia do sistema fuzzy de pre-processamento

dos arquetipos. A Figura A.1 apresenta as funcoes de pertinencia do sistema fuzzy

de pre-processamento dos valores. Por fim, a Figura A.3 apresenta as funcoes de

pertinencia do sistema fuzzy que agrega as variaveis.

78

Page 94: modelo fuzzy com otimização gen ética para classificação de

0 20 40 60 80 100

Valor classico

0.0

0.2

0.4

0.6

0.8

1.0

Pert

inen

cia

Entrada do Sistema Fuzzy para Arquetipos

BaixoAlto

0 2 4 6 8 10

Compatibilidade

0.0

0.2

0.4

0.6

0.8

1.0

Pert

inen

cia

Compatibilidade entre Arquetipos

Compatibilidade BaixaCompatibilidade Alta

Figura A.1: Funcoes de pertinencia do sistema fuzzy de pre-processamento

dos arquetipos

0 20 40 60 80 100

Valor classico

0.0

0.2

0.4

0.6

0.8

1.0

Pert

inen

cia

Entrada do Sistema Fuzzy para Valores

BaixoAlto

0 2 4 6 8 10

Compatibilidade

0.0

0.2

0.4

0.6

0.8

1.0

Pert

inen

cia

Compatibilidade entre Valores

Compatibilidade BaixaCompatibilidade Alta

Figura A.2: Funcoes de pertinencia do sistema fuzzy de pre-processamento

dos valores

79

Page 95: modelo fuzzy com otimização gen ética para classificação de

0 2 4 6 8 10

Compatibilidade

0.0

0.2

0.4

0.6

0.8

1.0

Pert

inen

cia

Compatibilidade entre Arquetipos

BaixoAlto

0 2 4 6 8 10

Compatibilidade

0.0

0.2

0.4

0.6

0.8

1.0

Pert

inen

cia

Compatibilidade entre Valores

IncompatıvelCompatıvel

0 2 4 6 8 10

Compatibilidade

0.0

0.2

0.4

0.6

0.8

1.0

Pert

inen

cia

Compatibilidade da Saıda

Compatibilidade BaixaCompatibilidade Alta

Figura A.3: Conjunto de teste: Curvas ROC do modelos fuzzy

80