data science e machine learning aplicado a economia · learning aplicado a economia vitor bianchi...

41
Data Science e Machine Learning aplicado a Economia Vitor Bianchi Lanzetta – Consultor Cientista de Dados na

Upload: others

Post on 03-Jul-2020

16 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Data Science e Machine Learning aplicado a Economia

Vitor Bianchi Lanzetta – Consultor Cientista de Dados na

Page 2: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Sumário

I. Introdução a Ciência de Dados

II. Redes Neurais Artificiais

III. Redes Neurais usando R

IV. Machine Learning vsEconometria

Page 3: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

O que é Ciência de DadosCampo multidisciplinar responsávelpor usar métodos científicos, processos e algoritmos para extrairconhecimento e insights de dados.

Page 4: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

O que é Machine Learning

• Alan Turing

• Paradigma da Programação: Regra + Input > Resultado

• Machine Learning: Input + Resultado > Regra

Page 5: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Métodos

• Regressão linear, logística, naive bayes

• Clustering, análise de componentes principais (PCA)

• Redes neurais (Deep Learning), florestas aleatórias

• GBM (gradiente boosting machines)

Page 6: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Buzz Words

• Big Data, Deep Learning

• Supervised, Unsupervised Learning

• Feature Engeniring

Page 7: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Principais aplicações

• Recomendadores (Amazon)

• Detecção de Spam (Gmail)

• Reconhecimento Facial (Facebook)

Page 8: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Principais PreocupaçõesAplicações em larga escala, erros em larga escala

Page 9: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Ferramentas

• R

• Rstudio

• Python

• Spark

• Haadop

Page 10: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Métodos: lineares e não lineares

Problema do XOR:

• Simples, 2 variáveis

• Não-linear

Page 11: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Redes Neurais Artificiais (RNN)

• Aproximadores universais funções

• Inspiração Biológica

• Caixa preta

Page 12: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência
Page 13: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

História das RNN

Conceito em 1943 – McCulloch e Pitts

Primeira RNN em 1951 – Marvin Minsky (Princeton)

Livro Perceptron (Minsky & Papert, 1961)

Page 14: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Perceptron

Page 15: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Perceptron: limitações

Page 16: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

História das RNN:

Linnainmaa, 1970 –retropropagação eficiente

Parker, 1985 & LeCun, 1985 redescoberta da retropropagação

Renascença

Page 17: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Retropropagação – Como funciona

• Otimização (escolha dos parâmetros)

• Baseado em Gradiente

• Serve de base para os principais algos usados no treinamento

• Não convexo (pré-processamento ajuda)

Page 18: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Gradiente

Salário

Anos de estudo

A

B

C

Page 19: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

História das RNN – AlexNet

• Desafio ImageNet

• 1.3 mi imagens em alta resolução

• 1000 classes diferentes

Page 20: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

RNN Hoje!

• Popular no Kaggle

• ONGs : DeepMind / Open.Ai

• Google (TensorFlow)

Page 21: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Aplicações Interessantes

• Redes Recorrentes

• Reinforcement Learning

• GANs

Page 22: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Reiforcement Learning – casos:

• DeepMind, StarCraft II

• Open.ai, Dota 2

Page 23: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

GANs

• Generative Adversarial Networks

• Redes concorrentes

• Podem ser usadas para criar maisdados

• Também usadas em artes

Page 24: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência
Page 25: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Redes Recorrentes

• Interessante propriedade temporal

• LSTM: “Portões” controlam o que a rede lembra ou esquece

• Muito usadas em NLP

Page 26: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Prós:

Elevada Capacidade

Possibilidade de modelar relações não lineares

Explora relações

Contras:

Difícil interpretar (black box)

Overfitting

Ganancioso

Page 27: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

RNN – O Modelo

Unidade Básica:

• Neurônio / nódulo

• Aceita diferentes funções de ativação

Page 28: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Nódulo

• Entrada:

𝐴𝑖 =

𝑖=𝑜

𝑛

𝑊𝑖𝑋𝑖

• Saída: G(Ai)

Page 29: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Função de Ativação –

Degrau

Page 30: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Função de Ativação –

Sigmoid

Page 31: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Função de Ativação –

Tahn

Page 32: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Função de Ativação -

ReLU

Page 33: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Função de Ativação –Leaky ReLU

Page 34: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

RNN –Nôdulos em

Conjunto, REDES!

Page 35: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

RNN – Camadas

• Input / Entrada

• Hidden / Saída

• Output / Saída

Page 36: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

RNN – Pré-treino

• Glutamina + BCCAA

• Limpeza dos dados

• Normalização

Page 37: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Treinamento

• Algoritmo de treino

• Fornada

• Épocas

Page 38: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Validação

• Cross Validation (CV)

• Holdout

• Leave One Out (LOO)

Page 39: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

RNN no R

• Software livre

• Amplo conjunto de bibliotecas

• Comunidadeamistosa

Page 40: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Machine Learning vs EconometriaDestruição Criativa … ? Com Certeza não.

Page 41: Data Science e Machine Learning aplicado a Economia · Learning aplicado a Economia Vitor Bianchi Lanzetta –Consultor Cientista de Dados na. Sumário I. Introdução a Ciência

Obrigado UEM

[email protected]

@vitorlanzetta