game of data - predição e análise da série game of thrones a partir do uso de aprendizagem de...

Post on 20-Jan-2017

57 Views

Category:

Technology

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

• Fã de Game of Thrones

• Pesquisador em Mineração de dados e

Aprendizagem de Máquina

• Doutorando em Computação Aplicada

• Head na Epitrack

Vamos entender o direcionamentoda série do ponto de vista

matemático/computacional!

Vamos analisar algunsestudos…

Estudo de caso 1:

Professores e alunos da Universidade Técnica de Munique, na Alemanha, desenvolveram um algoritmo capaz de prever quem iria morrer na

6ª temporada da série popular da HBO.

Onde essa história começa?

Eles também conseguiram descobrir qual casa é a mais perigosa e a opinião do público sobre

os personagens com base em dados do Twitter

"A Song of Ice and Data”

Um programa que realiza previsões depois de juntar 24 fatores diferentes sobre cada

personagem, como:sua idade, seu sexo, suas relações e se

seus pais estão vivos.

Por fim, a probabilidade de morrer, de acordo com o algoritmo desenvolvido.

” Este projeto tem sido muito divertido para nós”

”Em seu trabalho diário, o nosso grupo de pesquisa concentra-se em responder a perguntas biológicas complexas usando algoritmos de aprendizagem de

máquina e mineração de dados”

(Dr. Guy Yachdav – lider do projeto)

“We use Machine Learning”

Mas o que é Apredizagemde Máquina?

É um sub-campo da inteligência artificial dedicado ao desenvolvimento de algoritmos

e técnicas que permitam ao computador aprender, isto é, que permitam ao

computador aperfeiçoar seu desempenho em alguma tarefa.

Não é mágica!

Em vez disso, ele aprende a partir de um número suficientemente grande de exemplos do passado para compilar automaticamente

estatísticas sobre eles e para prever se um evento é provável que aconteça no futuro.

A Song of Ice and Fire série é conhecida por ter matado muitos personagens...

Será que a morte veio ao acaso ou vem para apenas aqueles selecionados que exibem

características semelhantes?

A Song of Ice and Fire série é conhecida por ter matado muitos personagens...

Será que a morte veio ao acaso ou vem para apenas aqueles selecionados que exibem

características semelhantes?

Como prever as chances de morte de um personagem?

Passo 1: Extração de dados

Usando o wiki de Gelo e Fogo resumiram as informações de todos os 5 livros sobre cada personagem. Também extraído outras informações (isto é, características) que descrevem um personagem, o que resultou em um total de mais de 30 características diferentes!

Passo 2: Seleção

Aprendizagem máquina pode estatisticamente comparar as características dos personagens mortos e vivos e selecione os recursos que são mais relevantes para a distinção entre eles. Nós fornecemos todos os recursos juntamente com a lista de todos os nomes de personagens como entrada para o algoritmo de aprendizado de máquina.

As 24 características seguintes foram selecionados como mais contribuiu (ordenados do mais para o menos contribuindo):

Modelagem

Support Vector Machine

- conjunto de métodos do aprendizado supervisionado que analisam os dados e reconhecem padrões, usado para classificação e análise de regressão

Support Vector Machine

- O SVM padrão toma como entrada um conjunto de dados e prediz, para cada entrada dada, qual de duas possíveis classes a entrada faz parte, o que faz do SVM um classificador linear binário não probabilístico

- Kernel polinomial - Otimização sequencial mínima

• Os dados foram divididos em 10 subconjuntos de tamanho igual;

• Foi treinado com 9 subconjuntos e testado com o restante;

• Processo de validação cruzada(cross-validation)

A precisão/exatidão e cobertura do método de previsão usando indicadores:

- TP (verdadeiros positivos, ou seja, previu corretamente personagens mortos)

- PF (falsos positivos, ou seja, personagens vivas previsto para ser mortos)

- FN (falsos negativos, ou seja, personagens mortos previsto para ser vivo)

- TN (verdadeiros negativos, ou seja, previu corretamente personagens vivos).

Indicadores

Precision = TP / (TP + FP)

Recall = TP / (TP+FN)

Combinaram 2 medidas em um valor único:

F-meansure = 2*((Precision*Recall )/(Precision + Recall))

Resultados:

Análise de sentimento

Análise de sentimento

Análise de sentimento

Análise de sentimento

Sugestão de leitura:

“Bayesian Prediction for The Winds of Winter”

https://www.got.show/machine-learning-algorithm-predicts-death-game-of-throneshttp://phys.org/news/2016-04-algorithms-characters-game-thrones.htmlhttp://phys.org/news/2014-09-mathematical-tackles-game-thrones.htmlhttp://www.huffingtonpost.com/2015/04/01/game-of-thrones-die-psychics_n_6978112.htmlhttp://www.statsblogs.com/2015/03/25/bayesian-survival-analysis-for-game-of-thrones/http://arxiv.org/pdf/1409.5830v1.pdf

Créditos

top related