game of data - predição e análise da série game of thrones a partir do uso de aprendizagem de...

40

Upload: joao-gabriel-lima

Post on 20-Jan-2017

57 views

Category:

Technology


1 download

TRANSCRIPT

Page 1: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina
Page 2: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

• Fã de Game of Thrones

• Pesquisador em Mineração de dados e

Aprendizagem de Máquina

• Doutorando em Computação Aplicada

• Head na Epitrack

Page 3: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

Vamos entender o direcionamentoda série do ponto de vista

matemático/computacional!

Page 4: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

Vamos analisar algunsestudos…

Page 5: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

Estudo de caso 1:

Professores e alunos da Universidade Técnica de Munique, na Alemanha, desenvolveram um algoritmo capaz de prever quem iria morrer na

6ª temporada da série popular da HBO.

Page 6: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

Onde essa história começa?

Eles também conseguiram descobrir qual casa é a mais perigosa e a opinião do público sobre

os personagens com base em dados do Twitter

Page 7: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

"A Song of Ice and Data”

Page 8: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

Um programa que realiza previsões depois de juntar 24 fatores diferentes sobre cada

personagem, como:sua idade, seu sexo, suas relações e se

seus pais estão vivos.

Por fim, a probabilidade de morrer, de acordo com o algoritmo desenvolvido.

Page 9: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

” Este projeto tem sido muito divertido para nós”

”Em seu trabalho diário, o nosso grupo de pesquisa concentra-se em responder a perguntas biológicas complexas usando algoritmos de aprendizagem de

máquina e mineração de dados”

(Dr. Guy Yachdav – lider do projeto)

Page 10: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

“We use Machine Learning”

Page 11: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

Mas o que é Apredizagemde Máquina?

Page 12: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

É um sub-campo da inteligência artificial dedicado ao desenvolvimento de algoritmos

e técnicas que permitam ao computador aprender, isto é, que permitam ao

computador aperfeiçoar seu desempenho em alguma tarefa.

Page 13: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

Não é mágica!

Em vez disso, ele aprende a partir de um número suficientemente grande de exemplos do passado para compilar automaticamente

estatísticas sobre eles e para prever se um evento é provável que aconteça no futuro.

Page 14: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

A Song of Ice and Fire série é conhecida por ter matado muitos personagens...

Será que a morte veio ao acaso ou vem para apenas aqueles selecionados que exibem

características semelhantes?

Page 15: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

A Song of Ice and Fire série é conhecida por ter matado muitos personagens...

Será que a morte veio ao acaso ou vem para apenas aqueles selecionados que exibem

características semelhantes?

Page 16: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

Como prever as chances de morte de um personagem?

Page 17: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

Passo 1: Extração de dados

Page 18: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

Usando o wiki de Gelo e Fogo resumiram as informações de todos os 5 livros sobre cada personagem. Também extraído outras informações (isto é, características) que descrevem um personagem, o que resultou em um total de mais de 30 características diferentes!

Page 19: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

Passo 2: Seleção

Page 20: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

Aprendizagem máquina pode estatisticamente comparar as características dos personagens mortos e vivos e selecione os recursos que são mais relevantes para a distinção entre eles. Nós fornecemos todos os recursos juntamente com a lista de todos os nomes de personagens como entrada para o algoritmo de aprendizado de máquina.

Page 21: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina
Page 22: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

As 24 características seguintes foram selecionados como mais contribuiu (ordenados do mais para o menos contribuindo):

Page 23: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina
Page 24: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina
Page 25: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

Modelagem

Page 26: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

Support Vector Machine

- conjunto de métodos do aprendizado supervisionado que analisam os dados e reconhecem padrões, usado para classificação e análise de regressão

Page 27: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

Support Vector Machine

- O SVM padrão toma como entrada um conjunto de dados e prediz, para cada entrada dada, qual de duas possíveis classes a entrada faz parte, o que faz do SVM um classificador linear binário não probabilístico

- Kernel polinomial - Otimização sequencial mínima

Page 28: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

• Os dados foram divididos em 10 subconjuntos de tamanho igual;

• Foi treinado com 9 subconjuntos e testado com o restante;

• Processo de validação cruzada(cross-validation)

Page 29: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

A precisão/exatidão e cobertura do método de previsão usando indicadores:

- TP (verdadeiros positivos, ou seja, previu corretamente personagens mortos)

- PF (falsos positivos, ou seja, personagens vivas previsto para ser mortos)

- FN (falsos negativos, ou seja, personagens mortos previsto para ser vivo)

- TN (verdadeiros negativos, ou seja, previu corretamente personagens vivos).

Page 30: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

Indicadores

Precision = TP / (TP + FP)

Recall = TP / (TP+FN)

Combinaram 2 medidas em um valor único:

F-meansure = 2*((Precision*Recall )/(Precision + Recall))

Page 31: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

Resultados:

Page 32: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina
Page 33: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

Análise de sentimento

Page 34: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

Análise de sentimento

Page 35: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

Análise de sentimento

Page 36: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

Análise de sentimento

Page 37: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

Sugestão de leitura:

“Bayesian Prediction for The Winds of Winter”

Page 38: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina
Page 39: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina

https://www.got.show/machine-learning-algorithm-predicts-death-game-of-throneshttp://phys.org/news/2016-04-algorithms-characters-game-thrones.htmlhttp://phys.org/news/2014-09-mathematical-tackles-game-thrones.htmlhttp://www.huffingtonpost.com/2015/04/01/game-of-thrones-die-psychics_n_6978112.htmlhttp://www.statsblogs.com/2015/03/25/bayesian-survival-analysis-for-game-of-thrones/http://arxiv.org/pdf/1409.5830v1.pdf

Créditos

Page 40: Game of data - Predição e Análise da série Game Of Thrones a partir do uso de aprendizagem de máquina