inteligência artificial por marina fouto

Inteligência Artificial

Meet David!

● Ciência recente

● Nomeada por John McCarthy em 1956 - Summer Seminar

● Grande quantidade de problemas em aberto

Sobre a criação

● Aprendizado● Percepção● Arte● Jogos● Demonstração de teoremas matemáticos● Finanças● Medicina● Web

Abrangência

Para o David...

● Teste de Turing

○ Processamento de linguagem natural○ Representação de conhecimento○ Raciocínio automatizado○ Aprendizado de máquina

● Teste de Turing Total

○ Visão computacional○ Robótica

Solução de problemas

● Criação de agentes capazes de planejar para resolver problemas

● A complexidade de um problema depende da quantidade de estados que o envolve

● Qual é a melhor escolha agora?

● Para onde eu vou depois?


Qual é a complexidade do problema apresentado na foto?

Visibilidade parcial


● Primeiro caso:○ O agente sabe o que precisa fazer○ Pensa e planeja o próximo passo○ Age de acordo com a melhor solução encontrada,

ignorando as outras

● Segundo caso:○ O agente não tem noção do caminho completo

(visibilidade comprometida)○ Fica impossibilitado de encontrar a maneira ótima

para chegar ao seu destino (não conhece as ações possíveis para aplicar ao ambiente)


● Funciona quando:

○ O domínio do problema pode ser completamente observável (é possível saber onde o agente começa)

○ O domínio do problema deve ser conhecido (ações possíveis)

○ O domínio do problema deve ser discreto (um número finito de ações para escolher)

○ O domínio do problema deve ser determinístico (é possível saber o resultado de uma ação)

Aprendizado de Máquina

● Encontrar modelos (como redes de Bayes) baseados nos dados que o agente possui

● Aprendizado de máquina = aprender modelos através dos dados○ O Google utiliza os dados para saber como irá

responder a cada busca de usuário

● Aprendizado supervisionado e não supervisionado


● Vetor de característicasx1, x2, x3, ..., xn

● Previsão do que as características irão abranger

x1, x2, x3, ..., xn y● O algoritmo deve buscar uma função que

utilize as características como entradas e compare com situações reais onde o vetor de características é encontrado


● Exemplo:○ Processamento de imagens○ O vetor de características corresponde a pixels da

imagem○ O "y" pode ser um identificador, dizendo se o

conjunto de pixels no vetor de características pertence a uma determinada imagem.

Aprendizado de MáquinaNavalha de Occam:EVERYTHING ELSE BEING EQUAL, CHOOSETHE LESS COMPLEX HYPOTHESIS.

● Erro de Generalização (dados desconhecidos)

● Erro de treinamento de dado (dados agrupados da melhor forma possível -> alta complexidade)

● Erro de overfitting (onde o máximo possível de dados é agrupado)Complexidade

Erro de generalização = erro de treinamento de dados + erro de overfitting


● SPAM!!!○ Bag of words -> usado para filtro de spam simples

■ Contagem de palavras existentes num dicionário○ Maximun Likelihood

■ Estima os parâmetros de um problema, dado um conjunto de dados e um modelo estatístico

○ Bayes Network■ Grafo acíclico que representa um conjunto de variáveis e

suas dependências condicionais● Quais as palavras mais comumente encontradas em

um spam?

Aprendizado de máquina

Exemplo: Rede de Bayes


● K Nearest Neighbors○ Usado em casos em que o número de parâmetros

pode crescer vastamente○ Algoritmo:

■ Aprendizado: memoriza os dados■ Atribui um peso ao novo exemplo:

● Encontra os vizinhos mais próximos● Retorna o peso que aparece na maioria dos vizinhos

próximos

● Perceptron○ No próximo episódio...

Redes Neurais

● Neurônio○ Célula cerebral que coleta, processa e dissemina

sinais elétricos○ Constituído por

■ Dendritos = recebem sinais elétricos■ Axônio = enviam sinais elétricos■ Sinapses = Pontos de encontro■ Soma = corpo celular

○ Córtex = tecido formado por redes neurais

Redes Neurais

● Modelo de McCulloch & Pitts

(Norvig)

Redes Neurais

● Formadas por unidades ligadas por vínculos● Vínculo entre unidades propagam a ativação

entre estas unidades● Cada vínculo possui um peso● Cada unidade calcula uma soma de suas

entradas

Redes Neurais

● Uma função de ativação é aplicada à soma apresentada anteriormente, que irá ativar a saída

Redes Neurais

● Função de ativação próxima a 1 quando as entradas forem corretas e próxima a 0 caso contrário

● Não-linear○ Funções lineares fazem a rede neural entrar em

colapso

Redes Neurais

● Configurando o peso de desvio e as entradas de uma unidade, é possível representar portas lógicas como neurônios artificiais

Redes Neurais● Os pesos de desvio são os parâmetros da

função● Ajustando-os, é mudada a função que a rede

representa. Assim acontece o aprendizado● São comumente utilizadas para classificação ou

regressão● Existem duas categorias de redes neurais,

baseando-se na alimentação de suas entradas:○ Direta: representa uma função da sua entrada atual

somente○ Recorrente: utiliza como entrada suas próprias

saídas

Redes Neurais: Perceptron

● Redes perceptron são utilizadas quando os dados que desejamos analizar podem ser separados por uma função linear

Uma rede perceptron só convege caso os dados sejam linearmente separáveis.

Redes Neurais: Perceptron

● Função linear: W1X+W0

● "Chutar" um valor para W1 e W0, que não serão corretos (a menos que se tenha muita sorte!)

● Os pesos seguintes serão encontrados a partir dos pesos anteriores, baseado em uma função considerando uma taxa de erro

● Após muitas iterações, se houver um separador linear adequado aos dados, a rede perceptron irá convergir.

Inteligência Artificial

inteligência artificial por marina fouto

Design