introducao redes neurais - ufsc · topologias das redes neurais • redes feed-forward: – redes...

53
1 REDES NEURAIS REDES NEURAIS Marley Marley Maria B.R. Maria B.R. Vellasco Vellasco ICA: Núcleo de Pesquisa em Inteligência ICA: Núcleo de Pesquisa em Inteligência Computacional Aplicada Computacional Aplicada PUC PUC- Rio Rio CONTEÚDO CONTEÚDO Introdução Introdução Motivação , Objetivo, Definição, Características Básicas e Histórico Conceitos Básicos Conceitos Básicos – Neurônio Artificial, Modos de Interconexão Processamento Processamento Neural Neural Recall e Learning Regras de Aprendizado Regras de Aprendizado – Regra de Hebb, Perceptron, Back Propagation, Hopfield, Competitive Learning, RBF, etc.

Upload: others

Post on 05-Jun-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

1

REDES NEURAISREDES NEURAIS

Marley Marley Maria B.R.Maria B.R. VellascoVellascoICA: Núcleo de Pesquisa em Inteligência ICA: Núcleo de Pesquisa em Inteligência

Computacional AplicadaComputacional AplicadaPUCPUC--RioRio

CONTEÚDOCONTEÚDO•• IntroduçãoIntrodução

– Motivação, Objetivo, Definição, Características Básicas e Histórico

•• Conceitos BásicosConceitos Básicos– Neurônio Artificial, Modos de Interconexão

•• Processamento Processamento NeuralNeural– Recall e Learning

•• Regras de AprendizadoRegras de Aprendizado– Regra de Hebb, Perceptron, Back Propagation,

Hopfield, Competitive Learning, RBF, etc.

Page 2: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

2

MOTIVAÇÃOMOTIVAÇÃOConstatação que o cérebro processa informações de forma diferente dos computadores convencionais

COMPUTADORCOMPUTADOR

processamento extremamente rápido e preciso na execução de seqüência de instruções

muito mais lento no reconhecimento de padrões

Processamento altamente paraleloProcessamento altamente paralelo(10(101111 neurônios com 10neurônios com 1044 conexões cada)conexões cada)

CÉREBROCÉREBRO

velocidade 1 milhão de vezes mais lenta que qualquer “gate”digital processamento extremamente rápido no reconhecimento de padrões

Problema dos 100 PassosProblema dos 100 PassosNeurônio: 2ms Processador: 2ns

Processador é 106 mais rápido que o neurônio

Cérebro reage a um estímulo entre 0,20,2 e 1 seg.

O cérebro responde em 100 passos100 passos

Page 3: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

3

MOTIVAÇÃOMOTIVAÇÃO•• Observações:Observações:

– O cérebro tem ∼ 10 bilhões10 bilhões de neurônios.– Cada neurônio tem ∼ 1.0001.000 a 10.00010.000 conexões

–– 60 trilhões60 trilhões de conexões - 10101414 sinapsessinapses!

– Cada pessoa pode dedicar 100.000 conexões100.000 conexõespara armazenar cada segundo de experiência

(65 anos ⇒ 2.000.000.000 de segundos!)

– Durante os 2 primeiros anos de vida, 1.000.0001.000.000de de sinapsessinapses são formadas por segundo!!

CONTEÚDOCONTEÚDO•• IntroduçãoIntrodução

– Motivação, Objetivo, Definição, Características Básicas e Histórico

•• Conceitos BásicosConceitos Básicos– Neurônio Artificial, Modos de Interconexão

•• Processamento Processamento NeuralNeural– Recall e Learning

•• Regras de AprendizadoRegras de Aprendizado– Regra de Hebb, Perceptron, Back Propagation,

Hopfield, Competitive Learning, RBF, etc.

Page 4: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

4

OBJETIVOOBJETIVO

Estudar a teoria e a implementação de sistemas massivamente massivamente paralelosparalelos, que possam processar informações com eficiência comparáveleficiência comparável ao cérebro.

DEFINIÇÃODEFINIÇÃO

Redes Redes Neurais Neurais ArtificiaisArtificiais são sistemas inspirados nos neurônios biológicosneurônios biológicos e na estrutura estrutura massivamente massivamente paralelaparalela do cérebro, com capacidade de adquiriradquirir,armazenararmazenar e utilizarutilizar conhecimento experimental.

Page 5: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

5

IDÉIA BÁSICAIDÉIA BÁSICASistemas compostos de diversas Sistemas compostos de diversas unidades simplesunidades simples (neurônios artificiais) (neurônios artificiais) ligadas de maneira apropriada, podem ligadas de maneira apropriada, podem gerar gerar comportamentos interessantescomportamentos interessantes e e complexoscomplexos..ComportamentoComportamento é determinado pela é determinado pela estrutura das ligações (estrutura das ligações (topologiatopologia) e ) e pelos pelos valores das conexõesvalores das conexões (pesos (pesos sinápticossinápticos))

Aquisição de Conhecimento:Aquisição de Conhecimento:AprendizadoAprendizado

Treinamento efetuado através da apresentação de exemplos

Existe uma variedade de algoritmosalgoritmos que estabelecem QUANDO e COMO os parâmetros da Rede Neural devem ser atualizados

Algoritmos: Substituem a programação necessária para a execução das tarefas nos computadores

Page 6: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

6

APLICAÇÕES GERAISAPLICAÇÕES GERAISReconhecimento de PadrõesClassificação de PadrõesCorreção de PadrõesPrevisão de Séries TemporaisAproximação de FunçõesSuporte à DecisãoGeração de InformaçãoDescoberta de Conhecimento

CONTEÚDOCONTEÚDO•• IntroduçãoIntrodução

– Motivação, Objetivo, Definição, Características Básicas e Histórico

•• Conceitos BásicosConceitos Básicos– Neurônio Artificial, Modos de Interconexão

•• Processamento Processamento NeuralNeural– Recall e Learning

•• Regras de AprendizadoRegras de Aprendizado– Regra de Hebb, Perceptron, Back Propagation,

Hopfield, Competitive Learning, RBF, etc.

Page 7: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

7

Características BásicasCaracterísticas Básicas

Devido à similaridade com a estrutura do cérebro, as Redes Neurais exibem características similares ao do comportamento humano, tais como:

Características BásicasCaracterísticas Básicas

•• Procura Paralela e Procura Paralela e Endereçamento pelo ConteúdoEndereçamento pelo Conteúdo::

O cérebro nãonão possui endereço de endereço de memóriamemória e nãonão procuraprocura a informação sequencialmentesequencialmente

Page 8: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

8

Características BásicasCaracterísticas Básicas

•• AprendizadoAprendizado::

A rede aprende por experiênciaaprende por experiência, não necessitando explicitar os algoritmos para executar uma determinada tarefa

Características BásicasCaracterísticas Básicas

•• AssociaçãoAssociação::A rede é capaz de fazer associações entre padrões diferentes

Ex: Cidade PessoaPerfume PessoaPessoa Nome

Page 9: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

9

Características BásicasCaracterísticas Básicas

•• GeneralizaçãoGeneralização::

Habilidade de lidar com ruruíídos e distordos e distorççõesões, respondendo corretamente a padrões novos.

Redes Neurais são capazes de generalizar o seu generalizar o seu conhecimentoconhecimento a partir de exemplos anteriores

Características BásicasCaracterísticas Básicas

•• AbstraçãoAbstração::

Capacidade de abstrair a essência de um abstrair a essência de um conjunto de entradasconjunto de entradas, isto é, a partir de padrões ruidosos, extrair a informação do padrão sem ruído.

Page 10: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

10

Características BásicasCaracterísticas Básicas

•• Robustez e Degradação GradualRobustez e Degradação Gradual::

A perda de um conjunto de elementos processadores e/ou conexões sinápticasnão causa o mal funcionamento da rede neural.

CONTEÚDOCONTEÚDO•• IntroduçãoIntrodução

– Motivação, Objetivo, Definição, Características Básicas e Histórico

•• Conceitos BásicosConceitos Básicos– Neurônio Artificial, Modos de Interconexão

•• Processamento Processamento NeuralNeural– Recall e Learning

•• Regras de AprendizadoRegras de Aprendizado– Regra de Hebb, Perceptron, Back Propagation,

Hopfield, Competitive Learning, RBF, etc.

Page 11: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

11

EVOLUÇÃOEVOLUÇÃOMcCulloch & Pitts (Mathematical Bio-Physics, Vol. 5, 1943),

“A Logical Calculus of Ideas Immanent in Nervous Activity”

Von Neumann Marvin Minsky Frank RosenblattMachine

IntelligenceMacroscopicIntelligence

MicroscopicIntelligence

1945 DigitalComputers

1950 Black-Box AI(LISP)

Perceptron,Adaline

1960 Mainframes Theorem Solver1970 Vax 780

(Time Sharing)Expert Systems

1980 Workstations,PCs

Commercializationof E.S.

Rumelhart,Hopfield

1990 DesktopSupercomputers

Commercializationof N.N.

EVOLUÇÃOEVOLUÇÃO

•• Modelo de Modelo de McCullochMcCulloch--PittsPitts::ww11ww22

wwnn

xx11xx22

xxnn

T

wi = + 1-i = 1,2,..., n

ssEntradas(valores 0,1)

Entradas(valores 00,,11)

n

sk+1 = 1 se Σ wi xik ≥ T

i=1n

0 se Σ wi xik < T

i=1

n

sk+1 = 1 se Σ wi xik ≥ T

i=1n

0 se Σ wi xik < T

i=1

Page 12: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

12

EVOLUÇÃOEVOLUÇÃO•• Modelo de Modelo de McCullochMcCulloch--PittsPitts::

T=0

T=0

T=0

T=1

x1

x2

x3

1-1 s1

1-1

-1

EVOLUÇÃOEVOLUÇÃO•• Modelo de Modelo de McCullochMcCulloch--PittsPitts::

T=0

T=0

T=0

T=1

x1

x2

x3

1-1 s1

1-1

-1 NAND __A B AB0 0 10 1 11 0 11 1 0

NANDNAND ____A B ABA B AB0 0 10 0 10 1 10 1 11 0 11 0 11 1 01 1 0

Page 13: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

13

EVOLUÇÃOEVOLUÇÃO•• Modelo de Modelo de McCullochMcCulloch--PittsPitts::

T=0

T=0

T=0

T=1 T=1 T=0

x1

x2

x1

x3

x21

x3

-1 s11

1

1

1-1

-1

-1

s

NAND __A B AB0 0 10 1 11 0 11 1 0

NANDNAND ____A B ABA B AB0 0 10 0 10 1 10 1 11 0 11 0 11 1 01 1 0

EVOLUÇÃOEVOLUÇÃO•• Modelo de Modelo de McCullochMcCulloch--PittsPitts::

T=0

T=0

T=0

T=1 T=1 T=0

x1

x2

x1

x3

x21

x3

-1 s11

1

1

1-1

-1

-1

s

NAND __A B AB0 0 10 1 11 0 11 1 0

NANDNAND ____A B ABA B AB0 0 10 0 10 1 10 1 11 0 11 0 11 1 01 1 0

NOR ___A B A+B0 0 10 1 01 0 01 1 0

NORNOR ______A B A+BA B A+B0 0 10 0 10 1 00 1 01 0 01 0 01 1 01 1 0

Page 14: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

14

EVOLUÇÃOEVOLUÇÃO•• Modelo de Modelo de McCullochMcCulloch--PittsPitts::

T=0

T=0

T=0

T=1 T=1 T=0

T=1

x1

x2

x1

x3

x21

x3

-1 s

entradaexcitatória sk+1 = xk

11

1

1

1

11

-1

-1

-1

-1

s

entradainibitória

NAND __A B AB0 0 10 1 11 0 11 1 0

NANDNAND ____A B ABA B AB0 0 10 0 10 1 10 1 11 0 11 0 11 1 01 1 0

NOR ___A B A+B0 0 10 1 01 0 01 1 0

NORNOR ______A B A+BA B A+B0 0 10 0 10 1 00 1 01 0 01 0 01 1 01 1 0

Célula d e Memóriana ausência de entradas,a saída é armazenada indefinidamente

Célula d e MemóriaCélula d e Memóriana ausência de entradas,na ausência de entradas,a saída é armazenada a saída é armazenada indefinidamenteindefinidamente

HISTÓRICOHISTÓRICO• McCulloch & Pitts (1943):

– modelo computacional para o neurônio artificial. Não possuía capacidade de aprendizado

• Hebb (1949):– modelo de aprendizado ((Hebbian Learning RuleHebbian Learning Rule))

• Rosenblatt (1957):– modelo Perceptron, com grande sucesso em certas aplicações

e problemas em outras aparentemente similares• Minsky & Papert ( Perceptrons 1969):

– prova matemática de que as redes Perceptron são incapazes de solucionar problemas simples tipo OU-EXCLUSIVO

• Rumelhart (início da década de 80):– novos modelos que superaram os problemas dos Perceptrons.

Page 15: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

15

CONTEÚDOCONTEÚDO•• IntroduçãoIntrodução

– Motivação, Objetivo, Definição, Características Básicas e Histórico

•• Conceitos BásicosConceitos Básicos– Neurônio Artificial, Modos de Interconexão

•• Processamento Processamento NeuralNeural– Recall e Learning

•• Regras de AprendizadoRegras de Aprendizado– Regra de Hebb, Perceptron, Back Propagation,

Hopfield, Competitive Learning, RBF, etc.

CONCEITOS BÁSICOSCONCEITOS BÁSICOS

•• Neurônio ArtificialNeurônio Artificial– (Elemento Processador)

•• Estruturas de Estruturas de InterconexãoInterconexão– FeedForward de 1 camada– FeedForward de Múltiplas Camadas– Recorrente (com realimentação)

Page 16: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

16

Elemento ProcessadorElemento ProcessadorElemento Processador inspirado no Neurônio Biológico

Elemento ProcessadorElemento ProcessadorElemento Processador inspirado no Neurônio Biológico

Squashing FunctionSquashing Function

Page 17: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

17

Elementos BásicosElementos Básicos

•• Estado de AtivaçãoEstado de Ativação sj

•• Conexões entre ProcessadoresConexões entre Processadores– a cada conexão existe um peso sináptico

que determina o efeito da entrada sobre o processador wji

•• Função de AtivaçãoFunção de Ativação– determina o novo valor do Estado de

Ativação do processador sj = F (netj)

Funções de AtivaçãoFunções de AtivaçãoÉ a função que determina o nível de ativação do Neurônio Artificial: sj = F(netj)

F(netj) F(netj)F(netj)

netjnetj netj

DegrauDegrau PseudoPseudo--LinearLinear SigmoidSigmoid

Page 18: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

18

RN x Sistema Nervoso RealRN x Sistema Nervoso RealFeed-Forwardtotalmente conectadaestrutura uniformepoucos tipos de processadoresgeralmente estática

Recorrenteconexões localizadas

módulos funcionaiscentenas de tipos de neurôniosdinâmico

Tipos de ProcessadoresTipos de Processadores

Recebe os dados de entrada

Apresenta os dados de saída

As suas entradas e saídas permanecem dentro do sistema

Page 19: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

19

Neurônio ArtificialNeurônio Artificial3 pontos importantes: Thresholding

Não-LinearidadeSaturação

F(netj)

netjthreshold

saturação

não-linear

F(net)net

w0

w1

w2

x1

x2

bias

y

net = w0 + w1x1 + w2x2F(net) = 1 (sigmoid)

1 + e-net

Neurônio ArtificialNeurônio Artificial

Em função das equações de net e F(net):

1y = F(net) =

1 + e -(w0+ x

1w

1+ x

2w

2)

Fórmula matemática representada pelo neurônio artificial

Page 20: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

20

Neurônio ArtificialNeurônio Artificial

Em função das equações de net e F(net):

1y = F(net) =

1 + e -(w0+ x

1w

1+ x

2w

2)

Fórmula matemática representada pelo neurônio artificial

x1

x2

y

ExemplosExemplosRegressão Linear:

y = a0 + a1x1 + a2x2 + a3x3

Variáv eis explicativas

Acha a retareta com erro mínimo que passe pelos pontos existentes(padrões de treinamento)

Page 21: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

21

ExemplosExemplosRegressão Linear:

y = a0 + a1x1 + a2x2 + a3x3

Variáv eis explicativas

Acha a retareta com erro mínimo que passe pelos pontos existentes(padrões de treinamento)

Reta obtidapela regressão

Deslocamentoem funçãodo a0 (bias)

ExemplosExemplosRegressão Linear:

y = a0 + a1x1 + a2x2 + a3x3

Variáv eis explicativas

Representação Neural Bias = +1

a2

a1a0

a3x3

x2

x1

yFunçãolinear

Acha a retareta com erro mínimo que passe pelos pontos existentes(padrões de treinamento)

Reta obtidapela regressão

Deslocamentoem funçãodo a0 (bias)

Page 22: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

22

ExemplosExemplos

Transformada de Fourier:y = a0 + a1sen(wt + φ1) + a2sen(2wt + φ2) +

a3sen(3wt + φ3) + ...

RepresentaçãoNeural

+1(bias)

t(tempo)

y

Todos com funçãode ativação senoidal

FunçãoLinear

w

a1

a0

a3

a2

3w2w

φ2φ3

φ1

CONCEITOS BÁSICOSCONCEITOS BÁSICOS

•• Neurônio ArtificialNeurônio Artificial– (Elemento Processador)

•• Estruturas de Estruturas de InterconexãoInterconexão– FeedForward de 1 camada– FeedForward de Múltiplas Camadas– Recorrente (com realimentação)

Page 23: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

23

Topologias Topologias das Redes das Redes NeuraisNeurais

•• Redes Redes FeedFeed--ForwardForward::– redes de uma ou mais camadas de

processadores, cujo fluxo de dadosfluxo de dados é sempre em uma única direçãouma única direção, isto é, não existe realimentação.

•• Redes RecorrentesRedes Recorrentes::– redes com conexões entre processadores da

mesma camada e/ou com processadores das camadas anteriores (realimentaçãorealimentação).

Redes Redes FeedFeed--ForwardForward

Redes de uma camadaRedes de uma camada

PE3

PE2

PE1

PEn

Page 24: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

24

Redes Redes FeedFeed--ForwardForwardRede de Múltiplas CamadasRede de Múltiplas Camadas

CamadaIntermediária(Escondida)

Camada de Saída

PE3

PE2

PE1

PEn

PE1

PE2

PEm

Redes RecorrentesRedes Recorrentes

I n p u tI n p u t

O u t p u tO u t p u tRReeaallii

mmeennttaaççããoo

Page 25: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

25

Redes RecorrentesRedes Recorrentes

I n p u tI n p u t

O u t p u tO u t p u tRReeaallii

mmeennttaaççããoo

CONTEÚDOCONTEÚDO•• IntroduçãoIntrodução

– Motivação, Objetivo, Definição, Características Básicas e Histórico

•• Conceitos BásicosConceitos Básicos– Neurônio Artificial, Modos de Interconexão

•• Processamento Processamento NeuralNeural– Recall e Learning

•• Regras de AprendizadoRegras de Aprendizado– Regra de Hebb, Perceptron, Back Propagation,

Hopfield, Competitive Learning, RBF, etc.

Page 26: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

26

Processamento Processamento NeuralNeuralO processamento de uma Rede Neural pode ser dividido em duas fases:

Processo de cálculo da saída da rede, dado um certo padrão de entrada -Recuperação da InformaçãoRecuperação da Informação

Processo de atualização dos pesos sinápticos para a aquisição do conhecimento - Aquisição da InformaçãoAquisição da Informação

AprendizadoAprendizado

Page 27: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

27

AprendizadoAprendizado• Processo pelo qual os parâmetros livres -pesos sinápticos - de uma rede neural são adaptados através de um processo contínuo de estimulação pelo ambiente.

• Existem 5 tipos básicos de aprendizado:Treinamento Supervisionado (TS);Treinamento Não-Supervisionado;Treinamento em “Batch”;“Reinforcement Learning”;TS com “distal teacher”;

Treinamento SupervisionadoTreinamento Supervisionado

Geralmente efetuado através do processo de minimização minimização do errodo erro calculado na saída.

A rede é treinada através do fornecimento dos valores de entradaentrada e de seus respectivos valores desejados de sasaíída da (“training pair”).

Page 28: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

28

Treinamento SupervisionadoTreinamento Supervisionado

PESOSAJUSTÁVEIS

(W)

PESOSPESOSAJUSTÁVEISAJUSTÁVEIS

(W)(W)

CÁLCULODO ERRO

(e)

CÁLCULOCÁLCULODO ERRODO ERRO

(e)(e)

PADRÃOPADRÃODE ENTRADADE ENTRADA

(X)(X)SAÍDASAÍDA

(s)(s)

VALORVALORDESEJADODESEJADO

(t)(t)

e(t,s)e(t,s)

Treinamento SupervisionadoTreinamento Supervisionado

Page 29: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

29

Treinamento SupervisionadoTreinamento SupervisionadoFUNÇÕES OBJETIVO: Genérica

• Sum ofSum of SquaredSquared ErrorsErrors:ESSE = Σp Σi (tpi - ypi)2

p = padrõesi = elemento processador de saída

Treinamento SupervisionadoTreinamento SupervisionadoFUNÇÕES OBJETIVO: Classificação

• CrossCross EntropyEntropy Error (Error (logarithmiclogarithmic error)error):Elog = Σp Σi [ tpi ln ypi + (1 - tpi)ln(1 - ypi)]p = padrõesi = elemento processador de saídaypi interpretada como a probabilidade

de o padrão p pertencer à classe i

Page 30: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

30

Treinamento NãoTreinamento Não--SupervisionadoSupervisionado

“Self-Organization” Não requer o Não requer o valor desejado de savalor desejado de saíídada da rede. O sistema extrai as características do conjunto de padrões, agrupando-os em classes inerentes aos dadosclasses inerentes aos dados.

Aplicado a problemas de ““ClusterizaçãoClusterização””

PESOSAJUSTÁVEIS

(W)

PESOSPESOSAJUSTÁVEISAJUSTÁVEIS

(W)(W)

PADRÃOPADRÃODE ENTRADADE ENTRADA

(X)(X)SAÍDASAÍDA

(s)(s)

Treinamento NãoTreinamento Não--SupervisionadoSupervisionado

Page 31: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

31

Treinamento em “Treinamento em “BatchBatch””

Os valores dos pesos sinápticos são estabelecidos a priori, em um único passo. Também chamado de

GravaçãoGravação - “Recording”

““Reinforcement LearningReinforcement Learning””

• Semelhante ao Treinamento Supervisionado (existe um objetivo);

• NÃO existe um target para cada padrão;• Existe uma realimentação (sinal de reforço)

que avalia a resposta como boa ou ruim;• O objetivo é maximizar a quantidade de reforço

positivo Ex. aprendizado de jogos.

Page 32: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

32

TS com “TS com “DistalDistal TeacherTeacher””• Treinamento intermediário entre o aprendizado

supervisionado e o reinforcement learning

TS com “TS com “DistalDistal TeacherTeacher””• Exemplo: braço mecânicobraço mecânico

θ1

θ2

θ3

(θ1 θ2 θ3)

(x,y)

(x’,y’)

Rede Neural

Braço Mecânico

Posição desejada

Ângulos das juntas

Posição real

Page 33: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

33

Recuperação de DadosRecuperação de Dados

Recuperação de DadosRecuperação de Dados

Assumindo que um conjunto de padrões tenha sido armazenadoarmazenado, a Rede Neural pode executar as seguintes tarefas:

– Auto-associação– Hetero-associação– Classificação

GENERALIZAÇÃOGENERALIZAÇÃO

Page 34: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

34

Recuperação de DadosRecuperação de Dados

AutoassociaçãoAutoassociação::A Rede Neural recupera o padrão armazenado mais semelhante ao padrão de entrada apresentado. Recuperação de

padrões ruidosos

Padrão de entrada distorcido

Padrão correto recuperado

Recuperação de DadosRecuperação de Dados

HeteroassociaçãoHeteroassociação::A Rede Neural armazena a associação entre um par de padrões. Recuperação de um

padrão diferente do da entrada.

Padrão de entrada com ou sem ruído

Padrão correto recuperado

Page 35: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

35

Recuperação de DadosRecuperação de Dados

Padrão de entrada com ou sem ruído

Classe 3 - (Quadrados)Classe 3

Classe 2

Classe 1

Classificação:Classificação:A Rede Neural responde com a informação relativa à classe a qual o padrão de entrada pertence.

Ex: Padrões de entrada div ididos em 3 classes distintas.Caso especial de Heteroassociação

Recuperação de DadosRecuperação de Dados

Generalização:Generalização:A Rede Neural responde corretamente a um padrão de entrada fora do conjunto de treinamento .

Page 36: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

36

GENERALIZAÇÃOGENERALIZAÇÃO

A Rede Neural responde corretamente a um padrão de entrada fora do conjunto de treinamento . Interpola corretamente os novos

pontos apresentados

x

f(x)

x1 x2 x3 x4 x5Xnovo

generalizações Boa interpolação

Interpolação ruim

xi pontos do conjunto de treinamentoxnovo novo ponto para generalização

Exemplos de Treinamento Exemplos de Treinamento SupervisionadoSupervisionado

Reconhecimento de CaracteresReconhecimento de Caracteres

Previsão de Séries TemporaisPrevisão de Séries Temporais

Page 37: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

37

Reconhecimento de Reconhecimento de CaracteresCaracteres

H 1I 1

AtividadeNeural

EntradaPesos

Escondida

I 2

I 3

H 2

H 3

w

w

w

w

w

w

w

w

w

O 1

Saída

O 2

O 3

w

w

w

w

w

w

w

w

w

Pesos

Estrutura da Rede Estrutura da Rede NeuralNeural

Page 38: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

38

H 1I 1

Dados paraTreinamento I 3

H 2

H 3

w

w

w

w

w

w

w

w

w

O 1

O 2

O 3

w

w

w

w

w

w

w

w

w

Alv o

Processo de AprendizadoProcesso de Aprendizado

I 2

AtividadeNeural

EntradaPesos

Escondida SaídaPesos

H 1I 1

I 2

I 3

H 2

H 3

O 1

O 2

O 3

w

w

w

w

w

w

w

w

Alv ow

w

w

w

w

w

w

w

w

Processo de AprendizadoProcesso de Aprendizado

w

AtividadeNeural

EntradaPesos

Escondida SaídaPesos

Dados paraTreinamento

Page 39: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

39

H 1I 1

I 2

I 3

H 2

H 3

O 1

O 2

O 3

w

w

w

w

w

w

w

w

w

w

w

w

w

w

w

w

w

Alv o

Processo de AprendizadoProcesso de Aprendizado

w

AtividadeNeural

EntradaPesos

Escondida SaídaPesos

Dados paraTreinamento

H 1I 1

EntradaPesos

Escondida

I 2

I 3

H 2

H 3

w

w

w

w

w

w

w

w

w

O 1

Saída

O 2

O 3

w

w

w

w

w

w

w

w

w

Erro = -

Processo de AprendizadoProcesso de Aprendizado

Pesos

Dados paraTreinamento

Atualização dos pesos em função do erroAtualização dos pesos em função do erro

Page 40: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

40

H 1I 1

I 3

H 2

H 3

w

w

w

w

w

w

w

w

w

O 1

O 2

O 3

w

w

w

w

w

w

w

w

w

Alv o

Processo de AprendizadoProcesso de Aprendizado

I 2

AtividadeNeural

EntradaPesos

Escondida SaídaPesos

Dados paraTreinamento

H 1I 1

I 2

I 3

H 2

H 3

O 1

O 2

O 3

w

w

w

w

w

w

w

w

Alv ow

w

w

w

w

w

w

w

w

Processo de AprendizadoProcesso de Aprendizado

w

AtividadeNeural

EntradaPesos

Escondida SaídaPesos

Dados paraTreinamento

Page 41: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

41

Alv o

Processo de AprendizadoProcesso de AprendizadoAtividade

Neural

H 1I 1

I 2

I 3

H 2

H 3

w

w

w

w

w

w

w

w

w

w

w

w

w

w

w

w

ww

EntradaPesos

EscondidaPesos

Dados paraTreinamento

O 1

O 2

O 3

Saída

H 1I 1

I 2

I 3

H 2

H 3

w

w

w

w

w

w

w

w

w

O 1

O 2

O 3

w

w

w

w

w

w

w

w

w

Erro = -

Processo de AprendizadoProcesso de Aprendizado

Dados paraTreinamento

EntradaPesos

Escondida SaídaPesos

Atualização dos pesos em função do erroAtualização dos pesos em função do erro

Page 42: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

42

H 1I 1

I 3

H 2

H 3

w

w

w

w

w

w

w

w

w

O 1

O 2

O 3

w

w

w

w

w

w

w

w

w

Alv o

Processo de AprendizadoProcesso de Aprendizado

I 2

AtividadeNeural

EntradaPesos

Escondida SaídaPesos

Dados paraTreinamento

H 1I 1

I 2

I 3

H 2

H 3

O 1

O 2

O 3

w

w

w

w

w

w

w

w

Alv ow

w

w

w

w

w

w

w

w

Processo de AprendizadoProcesso de Aprendizado

w

AtividadeNeural

EntradaPesos

Escondida SaídaPesos

Dados paraTreinamento

Page 43: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

43

Alv o

Processo de AprendizadoProcesso de AprendizadoAtividade

Neural

H 1I 1

I 2

I 3

H 2

H 3

w

w

w

w

w

w

w

w

w

w

w

w

w

w

w

w

ww

EntradaPesos

EscondidaPesos

Dados paraTreinamento

O 1

O 2

O 3

Saída

Processo de GeneralizaçãoProcesso de Generalização

Recuperação da Informação Aprendida

Page 44: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

44

H 1I 1

Novo dado(não apresentado

durante o treinamento)

I 3

H 2

H 3

w

w

w

w

w

w

w

w

w

O 1

O 2

O 3

w

w

w

w

w

w

w

w

w

Processo de GeneralizaçãoProcesso de Generalização

I 2

AtividadeNeural

EntradaPesos

Escondida SaídaPesos

H 1I 1

I 2

I 3

H 2

H 3

O 1

O 2

O 3

w

w

w

w

w

w

w

w

w

w

w

w

w

w

w

w

w

Processo de GeneralizaçãoProcesso de Generalização

w

AtividadeNeural

EntradaPesos

Escondida SaídaPesos

Page 45: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

45

Processo de GeneralizaçãoProcesso de GeneralizaçãoAtividade

Neural

H 1I 1

I 2

I 3

H 2

H 3

w

w

w

w

w

w

w

w

w

w

w

w

w

w

w

w

ww

EntradaPesos

EscondidaPesos

O 1

O 2

O 3

Saída

Resposta Resposta correta a um correta a um novo padrão!novo padrão!

Previsão de Previsão de Séries TemporaisSéries Temporais

Page 46: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

46

Série temporal

janela

alvo

Entradasda red e =n valorespassados

Estrutura da Rede Estrutura da Rede NeuralNeural

Dados de Treinamento

Saída Desejada =

valor da sériek passos à

frente

Ex: 5 v alores passados

Ex: v alor um passo à f rente

Entradasda red e

Saída da rede:Valor previstoum passo à frente

Processo de AprendizadoProcesso de AprendizadoSérie temporal

janela

alvo

Dados de Treinamento

Page 47: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

47

Ajuste dos pesosa partir do erro(Erro= alvo - previsto)

Entradasda red e

Saída da rede:Valor previstoum passo à frente

Processo de AprendizadoProcesso de AprendizadoSérie temporal

janela

alvo

Dados de Treinamento

janela

alvo

Ajuste dos pesosa partir do erro(Erro= alvo - previsto)

Entradasda red e

Processo de AprendizadoProcesso de Aprendizado

Dados de Treinamento

Série temporal

Saída da rede:Valor previstoum passo à frente

Page 48: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

48

janela

alvo

Entradasda red e

Dados de Treinamento

Série temporal

Saída da rede:Valor previstoum passo à frente

Ajuste dos pesosa partir do erro(Erro= alvo - previsto)

Processo de AprendizadoProcesso de Aprendizado

janelaalvo

Entradasda red e

Dados de Treinamento

Série temporal

Saída da rede:Valor previstoum passo à frente

Ajuste dos pesosa partir do erro(Erro= alvo - previsto)

Processo de AprendizadoProcesso de Aprendizado

Page 49: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

49

janela

alvo

Entradasda red e

Dados de Treinamento

Série temporal

Saída da rede:Valor previstoum passo à frente

Ajuste dos pesosa partir do erro(Erro= alvo - previsto)

Processo de AprendizadoProcesso de Aprendizado

Ajuste dos pesosa partir do erro(Erro= alvo - previsto)

Entradasda red e

Saída da rede:Valor previstoum passo à frente

Processo de AprendizadoProcesso de AprendizadoSérie temporal

janela

alvo

Dados de Treinamento

Page 50: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

50

janela

alvo

Ajuste dos pesosa partir do erro(Erro= alvo - previsto)

Entradasda red e

Processo de AprendizadoProcesso de Aprendizado

Dados de Treinamento

Série temporal

Saída da rede:Valor previstoum passo à frente

janela

alvo

Entradasda red e

Dados de Treinamento

Série temporal

Saída da rede:Valor previstoum passo à frente

Ajuste dos pesosa partir do erro(Erro= alvo - previsto)

Processo de AprendizadoProcesso de Aprendizado

Page 51: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

51

Processo de GeneralizaçãoProcesso de Generalização

Recuperação da Informação Aprendida

janela

Entradasda red e

Dados de Treinamento

Série temporal

Processo de GeneralizaçãoProcesso de Generalização

Page 52: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

52

janelaprevisto

Entradasda red e

Saída da rede:Valor previsto

Dados de Treinamento

Série temporal

Processo de GeneralizaçãoProcesso de Generalização

Dados previstos

janela previsto

Entradas d a rede:inclui o(s) valor(es) previstos pela Red e

Saída da rede:Valor previsto

Dados de Treinamento

Série temporal

Dados previstos

Processo de GeneralizaçãoProcesso de Generalização

Page 53: introducao redes neurais - UFSC · Topologias das Redes Neurais • Redes Feed-Forward: – redes de uma ou mais camadas de processadores, cujo fluxo de dadosé sempre em uma única

53

janela

previsto

Dados de Treinamento

Série temporal

Dados previstos

Processo de GeneralizaçãoProcesso de Generalização

Entradas d a rede:inclui o(s) valor(es) previstos pela Red e

Saída da rede:Valor previsto