aprendizagem de máquina - eletrica.ufpr.brestudodecaso-am.pdf · – reconhecimento da fala –...
TRANSCRIPT
Aprendizagem de Máquina
Alessandro L. Koerich
Programa de Pós-Graduação em Engenharia ElétricaUniversidade Federal do Paraná (UFPR)
Introdução + Estudo de Caso
Introdução
• Percepção de máquina• Um exemplo• Um sistema inteligente• O ciclo de projeto• Aprendizagem e adaptação• Conclusão
Percepção de Máquina
• Construir uma máquina que possa padrões:
– Reconhecimento da fala
– Identificação de impressões digitais
– OCR (Reconhecimento ótico de caracteres)
– Identificação da seqüência de DNA
Um Exemplo
• “Separar peixes vindo em uma esteira de acordo com a espécie usando um sensor ótico”
Robalo
Espécies
Salmão
Análise de Problema
• Montar uma câmera e colher algumas imagens de exemplo para extrair características.
• Quais características?– Comprimento– Luminosidade– Largura– Número e forma das nadadeiras– Posição da boca, etc…
• Este é um conjunto de todas características sugeridas a serem exploradas em nosso classificador!
Pré-Processamento
• Usa uma operação de segmentação para isolar os peixes uns dos outros e do fundo.
• A informação de um único peixe é enviada para um extrator de características cujo propósito é reduzir os dados através da medida de certas características.
• As características são passadas a um classificador
Características
• Selecionar o comprimento do peixe como uma característica possível para discriminação.
Características
• O comprimento é uma característica fraca isoladamente!
• Selecionar a luminosidade como uma característica possível.
Classificação
• Relação entre o limiar da fronteira de decisão e custo
– Mover nossa fronteira de decisão em direção a valores menores de luminosidade no intuito de minimizar o custo (reduzir o número de robalos que são classificados como salmão)
Tarefa da teoria da decisão
Características
• Adotar a luminosidade e adicionar a largura do peixe
• Peixe xT = [x1, x2]
Luminosidade Largura
Características
• Poderíamos adicionar outras características que não sejam correlacionadas com as que já temos. Devemos ter precaução para não reduzir o desempenho pela adição de “características ruidosas”
• Idealmente, a melhor fronteira de decisão deve ser aquela que fornece um desempenho ótimo como na seguinte figura:
Fronteira de Decisão
• Entretanto, nossa satisfação é prematura, pois, o objetivo principal no projeto de um classificador é classificar corretamente novas entradas
Papel da generalização!
Sistemas Inteligentes
• Aquisição
– Uso de um transdutor (câmera ou microfone)– Sistemas de RP dependem da largura de banda,
resolução, sensibilidade e distorção do transdutor
• Segmentação e agrupamento
– Padrões devem ser bem separados e não devem se sobrepor
Sistemas Inteligentes
• Extração de características– Características discriminantes– Características invariantes com respeito a translação,
rotação e escala.
• Classificação– Usa um vetor de características fornecido pelo extrator de
características para atribuir o objeto a uma categoria.
• Pós-Processamento– Explora informação dependente do contexto (não inerente
do próprio padrão) para melhorar o desempenho.
O Ciclo de Projeto
• Obtenção de dados• Escolha de características• Escolha do modelo• Treinamento (aprendizagem)• Avaliação• Complexidade computacional
O Ciclo de Projeto
• Obtenção de dados
– Como sabemos quando já coletamos uma quantidade suficientemente grande e representativa de exemplos para treinamento e teste do sistema?
O Ciclo de Projeto
• Escolha de características
– Depende das características do domínio de aplicação. Simples de extrair, invariantes a transformações irrelevantes, insensível a ruído.
O Ciclo de Projeto
• Escolha do modelo
– Insatisfeito com o desempenho do nosso classificador de peixes e querendo mudar para outra classe de modelo.
O Ciclo de Projeto
• Treinamento
– Usar dados para determinar o classificador.– Inúmeros procedimentos para o treinamento de
classificadores e escolha de modelos.
O Ciclo de Projeto
• Avaliação
– Medir a taxa de erro (ou desempenho) e mudar de um conjunto de características para outro.
– Alterar o classificador
O Ciclo de Projeto
• Complexidade computacional
– Qual é o compromisso entre facilidade computacional e desempenho?
– Como o algoritmo se comporta em função do número de características, padrões ou categorias?