aula 9: overfittingw3.impa.br/~vitorgr/cda/notebooks/aula9.pdfaula 9: overfitting representação de...

14
Ciência de Dados Aplicada Aula 9: Overfitting

Upload: others

Post on 05-Jun-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Ciência de Dados Aplicada

Aula 9: Overfitting

Representação de características

Amostras (X)

Valor-alvo (y)

Conjunto de treinamento e testes

Treinamento é o processode estimar os parâmetros

do modelo

Avaliação

Revisão de termos importantes

Classificação

- Valor-alvo é discreto

- Tipos de problemas

Binária

Multi-Classe

Multi-Label

Regressão

- Valor-alvo é contínuo

- Geralmente osAlgoritmos de classificação possuem variações paracada tipo de problema

Classificação Multi-Label

Generalização, Overfitting e Underfitting

Quantidade de dados utilizados para treinar o algoritmo

É o problema principal quando estamos utilizando algoritmosde aprendizado de máquina

Tendência global dos dados de treinamento

Overfitting na RegressãoV

ariá

vel v

alor

-alv

o

Variável de entrada

Var

iáve

l val

or-a

lvo

Variável de entrada

Underfitting

Modelo IdealV

ariá

vel v

alor

-alv

o

Variável de entrada

OverfittingV

ariá

vel v

alor

-alv

o

Variável de entrada

Overfitting na ClassificaçãoC

arac

terí

stic

a 1

Característica 2

UnderfittingC

arac

terí

stic

a 1

Característica 2

Modelo IdealC

arac

terí

stic

a 1

Característica 2

OverfittingC

arac

terí

stic

a 1

Característica 2

OverfittingC

arac

terí

stic

a 1

Característica 2