aprendizado de máquina (machine learning) - unisulpaginas.unisul.br/max.pereira/ml_aula01.pdf ·...

43
Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira

Upload: vongoc

Post on 18-Nov-2018

229 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Ciência da Computação

Aprendizado de Máquina(Machine Learning)

Aula 01 Motivação, áreas de aplicação e fundamentos

Max Pereira

Page 2: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Nem todo conhecimento tem o mesmo valor.

Aprendizado de Máquina

Page 3: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

O que torna determinado conhecimento mais importante que outro?

O que exatamente fornece ao conhecimento, ou a informação o seu valor?

Aprendizado de Máquina

Page 4: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Resumindo...

O conhecimento que utilizamos tem mais valor do que o conhecimento que não utilizamos.

Aprendizado de Máquina

Page 5: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

• Para que os humanos usam o conhecimento?

• Por que sempre queremos mais?

• O que planejamos fazercom tal conhecimento?

Aprendizado de Máquina

Page 6: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Humanos usam o conhecimento para tomar decisões!

Estamos constantemente tentando prever as consequências das escolhas que fazemos.

Por que?

Aprendizado de Máquina

Page 7: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Se podemos prever as consequênciasdas escolhas, então podemos escolher as consequências que queremos.

Aprendizado de Máquina

Page 8: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

O valor do conhecimento é a sua utilidade em influenciar as decisões.

Em outras palavras, seu valor é determinado pela sua utilidade em fazer previsões precisas.

Isso pode ser quantificado?

Aprendizado de Máquina

Page 9: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Apesar de ser impraticável a tentativa de quantificar o valor de um determinado conhecimento, torna-se muito mais fácil quando ele é combinado com uma tarefa de previsão.

Aprendizado de Máquina

Page 10: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Ter ou não ter um algoritmo, eis a questão!

Aprendizado de Máquina

Page 11: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Problema: ordenar números

Entrada: uma sequência de números

Saída: uma lista ordenada dos números

Aprendizado de Máquina

Existem vários algoritmos!

Page 12: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Problema: Identificar spam e-mails

Entrada: um e-mail (arquivo de caracteres)

Saída: sim/não

Aprendizado de Máquina

Não sabemos como transformar a entrada para a

saída!

Page 13: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Aprendizado de Máquina

A falta de conhecimento é compensada pelos dados.

Queremos “aprender” o que diferencia os spams de e-mails que não são spams.

Queremos que o computador (máquina) extraia automaticamente o algoritmo.

Page 14: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Os dados armazenados se tornam úteis quando analisados e são transformados em informação que, podemos utilizar para, por exemplo, fazer previsões.

Aprendizado de Máquina

Page 15: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Há um processo que explica os dados que observamos. Os dados não são completamente

randômicos. Há certos padrões nos dados.

Aprendizado de Máquina

Page 16: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Talvez não possamos identificar completamente o processo, mas podemos construir uma boa aproximação. Assim, podemos detectar certos padrões e regularidades.

Esse é o foco do aprendizado de máquina!

Aprendizado de Máquina

Page 17: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Áreas de aplicação

• Aplicações de crédito

• Detecção de fraudes

• Mercado de ações

• Controle e otimização de manufatura

• Diagnóstico médico

• Otimização de redes de telecomunicação

• Análise de dados biológicos e físicos

• Análise de dados na Web

Aprendizado de Máquina

Page 18: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

A aplicação de métodos de aprendizado de máquina em grandes bases de dados é chamada de Mineração de Dados (data mining).

Aprendizado de Máquina

Page 19: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Aprendizado de máquina não é apenas um método para problemas de banco de dados; é também uma parte da Inteligência Artificial.

Aprendizado de Máquina

Page 20: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Aprendizado de máquina nos ajuda a resolver problemas nas áreas de:

• Visão computacional;

• Reconhecimento de voz;

• Robótica

• Reconhecimento de padrões.

Aprendizado de Máquina

Page 21: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Aprendizado de máquina é a programação de computadores para otimizar a execução de critériosusando dados de exemplos ou experiências passadas.

Aprendizado de Máquina

Page 22: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Os modelos definidos podem ser preditivos para realizar previsões, ou descritivos para adquirir conhecimento a partir dos dados, ou mesmo ambos.

Aprendizado de Máquina

Page 23: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

O aprendizado de máquina usa a teoria estatística para construir modelos matemáticos, porque a tarefa principal é a realização de inferência a partir de uma amostra.

Aprendizado de Máquina

Page 24: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação
Page 25: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Resumindo...

Basicamente, o aprendizado de máquina trata de prever o futuro com base no passado.

Aprendizado de Máquina

Page 26: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Desafios

Escalabilidade

Alta dimensionalidade

Dados complexos e heterogêneos

Propriedade e Distribuição de Dados

Análises não Tradicionais

Page 27: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Exemplo:

Prever quanto uma determinada pessoa irá gostar de um filme que ela ainda não viu, com base nas notas dos filmes que ela já viu.

Aprendizado de Máquina

Page 28: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

E quanto aos dados?

Podem ser palavras em um documento ou pixels em uma imagem.

Pode ser necessário convertê-los em um formato padrão.

Aprendizado de Máquina

Representação dos Dados

Page 29: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Muitos datasets podem ser representados por matrizes, com valores binários, reais, discretos, etc.

Outros podem ser documentos ou imagens com tamanhos diversos.

É importante pensar na representação (estrutura) e transformar os dados caso seja necessário, antes de aplicar os algoritmos.

Aprendizado de Máquina

Page 30: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação
Page 31: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação
Page 32: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação
Page 33: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

O que significa aprender?

Uma forma comum de verificar se uma pessoa aprendeu sobre determinado assunto é aplicar uma “prova”.

Aprendizado de Máquina

Page 34: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Espera-se que a pessoa estude (aprenda) exemplos específicos sobre o assunto, e depois possa responder questões novas, porém relacionadas ao assunto.

Dessa forma, pode-se testara habilidade de generalização da pessoa.

Aprendizado de Máquina

Page 35: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

A generalização é um dos conceitos mais importantes em aprendizado de máquina.

Overfitting, underfitting....???

Aprendizado de Máquina

Page 36: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Principais tarefas

Classificação

Na classificação, nosso objetivo é prever qual classeuma determinada instância de dados pertence.

Regressão

Na regressão, procuramos prever um valor numérico.

Aprendizado de Máquina

Page 37: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Classificação e regressão são exemplos de aprendizado supervisionado.

Supervisionado porque estamos dizendo ao algoritmo o que ele deve prever.

Aprendizado de Máquina

Page 38: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Em contrapartida, há um conjunto de tarefas conhecido como aprendizado não-supervisionado.

Nesse tipo de aprendizado não há rótulosou valor alvo contidos nos dados.

A tarefa de agrupar dados similares é conhecida como agrupamento(clustering).

Aprendizado de Máquina

Page 39: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

No aprendizado não-supervisionado podemos também procurar valores estatísticos que descrevam os dados.

Aprendizado de Máquina

Estimativa de densidade

Page 40: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Aprendizado de Máquina

Aprendizado supervisionado Aprendizado não-

supervisionado

k-Nearest Neighbors k-Means

Naive Bayes DBSCAN

Support vector machines (SVM)

Decision trees

Algoritmos

Como escolher o algoritmo correto?

Page 41: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Primeiro:

Definir qual o seu objetivo.

O que você quer? A probabilidade de chuva amanhã ou encontrar grupos de eleitores com interesses similares?

Aprendizado de Máquina

Page 42: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Segundo:

Quais dados você tem ou pode conseguir?

Aprendizado de Máquina

Page 43: Aprendizado de Máquina (Machine Learning) - Unisulpaginas.unisul.br/max.pereira/ML_Aula01.pdf · Aprendizado de Máquina (Machine Learning) Aula 01 Motivação, áreas de aplicação

Desenvolvimento de aplicações de aprendizado de máquina

1. Coletar os dados

2. Preparar os dados de entrada

3. Analisar os dados de entrada

4. Treinar o algoritmo

5. Testar o algoritmo

Aprendizado de Máquina