k-nearest neighbor

11
Introdu¸ ao Algoritmo Pontos Importantes UFAL - Universidade Federal de Alagoas UFAL - Instituto de Computa¸ ao K-Vizinhos Mais Pr´ oximos Jonathas Magalh˜ aes [email protected] Magalh˜ aes, J.J. IA – 2013 1

Upload: jonathas-magalhaes

Post on 09-Jun-2015

1.562 views

Category:

Technology


0 download

DESCRIPTION

Apresentação sobre o classificador K-Vizinhos Mais Próximos (K-Nearest Neighbor).

TRANSCRIPT

Page 1: K-Nearest Neighbor

IntroducaoAlgoritmo

Pontos Importantes

UFAL - Universidade Federal de AlagoasUFAL - Instituto de Computacao

K-Vizinhos Mais Proximos

Jonathas [email protected]

Magalhaes, J.J. IA – 2013 1

Page 2: K-Nearest Neighbor

IntroducaoAlgoritmo

Pontos Importantes

K-Vizinhos mais Proximos

Aprendizado baseado em instancias:

Aprendizado: armazenar todos as instancias de treinamento;Classificacao: descobrir a qual classe uma nova instancia pertence.

Tecnica simples e intuitiva.

Magalhaes, J.J. IA – 2013 2

Page 3: K-Nearest Neighbor

IntroducaoAlgoritmo

Pontos Importantes

K-Vizinhos Mais Proximos – Exemplo

Table: Base de dados contendo informacoes de alunos.

x1 : Tempo de utilizacao x2 : Numero postagens y : Passou na disciplina

2 4 Nao

3 6 Nao

4 8 Nao

4 4 Nao

5 7 Nao

6 5 Nao

6 6 Sim

6 5 Sim

7 7 Sim

8 5 Sim

8 6 Sim

10 10 Sim

Magalhaes, J.J. IA – 2013 3

Page 4: K-Nearest Neighbor

IntroducaoAlgoritmo

Pontos Importantes

K-Vizinhos Mais Proximos

Dados dos alunos dispostos graficamente (em azul, os alunos quepassaram, em vermelho, os alunos que nao passaram).

Magalhaes, J.J. IA – 2013 4

Page 5: K-Nearest Neighbor

IntroducaoAlgoritmo

Pontos Importantes

K-Vizinhos Mais Proximos

Como classificar um novo registro (em verde)? (postagens = 6 etempo = 7, R(6, 7))

Magalhaes, J.J. IA – 2013 5

Page 6: K-Nearest Neighbor

IntroducaoAlgoritmo

Pontos Importantes

K-Vizinhos Mais Proximos

Passo 1: Calcular a distancia do novo registro a cada um dos registrosexistentes.

Dados dois pontos, A(xA1 ...xAn ) e B(xB1 ...x

Bn );

Distancia euclidiana quadrada: d(A,B) =∑n

i=1(xAi − xBi )2.

x1 : utilizacao x2 : postagens Distancia para o (6, 7)

2 4 (2− 6)2 + (4− 7)2 = 25

3 6 10

4 8 5

4 4 13

5 7 1

6 5 4

6 6 1

6 5 4

7 7 1

8 5 8

8 6 5

10 10 25Magalhaes, J.J. IA – 2013 6

Page 7: K-Nearest Neighbor

IntroducaoAlgoritmo

Pontos Importantes

K-Vizinhos Mais Proximos

Passo 2: Identificacao dos k registros da base de referencia queapresentaram menor distancia em relacao ao novo registro. (Parak = 3)

x1 : utilizacao x2 : postagens Distancia para o (6, 7) KNN

2 4 25

3 6 10

4 8 5

4 4 13

5 7 1 X6 5 4

6 6 1 X6 5 4

7 7 1 X8 5 8

8 6 5

10 10 25

Magalhaes, J.J. IA – 2013 7

Page 8: K-Nearest Neighbor

IntroducaoAlgoritmo

Pontos Importantes

K-Vizinhos Mais Proximos

Magalhaes, J.J. IA – 2013 8

Page 9: K-Nearest Neighbor

IntroducaoAlgoritmo

Pontos Importantes

K-Vizinhos Mais Proximos

Logo, a nova instancia e classificada como sendo um aluno quepassou/passara na disciplina.

Magalhaes, J.J. IA – 2013 9

Page 10: K-Nearest Neighbor

IntroducaoAlgoritmo

Pontos Importantes

K-Vizinhos mais Proximos

Normalizacao dos dados;

Tratando empates;

Qual valor para k utilizar?

Fuzzy KNN.

Magalhaes, J.J. IA – 2013 10

Page 11: K-Nearest Neighbor

IntroducaoAlgoritmo

Pontos Importantes

Perguntas?

Magalhaes, J.J. IA – 2013 11