big data e inteligência artificial
TRANSCRIPT
BIG DATA E INTELIGÊNCIA ARTIFICIAL
Prof. João Gabriel Lima linkedin.com/in/joaogabriellima
SOBRE
Data Scientist na Epitack
Professor
Pesquisador em aprendizagem de máquina e análise de dados
Doutorando em Mineração de dados e Inteligência Artificial
MINERAÇÃO DE DADOS
A transformação de grandes quantidades de dados em padrões e regras:
Direcionada e Não Direcionada
Direcionada: tentamos prever um ponto de dados em particular
◦ Ex.: preço de venda de uma casa baseado em informações sobre outras casas à venda no bairro
Não direcionada:
◦ Tentamos criar grupos de dados, ou achar padrões em dados existentes
“O objetivo da mineração de dados é criar um modelo que possa melhorar o modo pelo qual interpretamos nossos dados existentes e futuros.
Uma nova tecnologia Uma nova técnica Um novo processo Uma nova abordagem Um novo campo do conhecimento Uma revolução
O QUE É BIG DATA?
Desde antes do surgimento do conceito, já éramos capazes de trabalhar com grandes volumes de dados.
Trabalhar por amostragem era a solução mais comum
Tratamento de dados => correção ou informação valiosa
Técnicas e ferramentas para lidar com o grande volume de dados provenientes de diversas fontes.
O aprendizado de máquina (ML — Machine Learning) é um subcampo da inteligência artificial dedicado ao desenvolvimento de algoritmos e técnicas que permitam ao computador aprender a partir do
reconhecimento de padrões.
APRENDIZAGEM DE MÁQUINA
1. Deep Neural Networks
2. Bayes Classifier Algorithm
3. K Means Clustering Algorithm
4. Support Vector Machine Algorithm
5. Linear Regression
6. Logistic Regression
7. Artificial Neural Networks
8. Random Forests
9. Decision Trees
10. Nearest Neighbours
Alguns dos principais modelos de ML
VidaComo a IA irá afetar nossa realidade?
NegócioComo a IA irá mudar nossos negócios?
SociedadeQuais impactos a IA irá causar em nossa força de trabalho?
ANI - Artificial Narrow Intelligence - Especializada em uma única área, resolvendo problemas específicos
AGI - Artificial General Intelligence - Especializada em diversas áreas, geralmente atual como assistentes pessoais e sistemas de apoio ao usuário
7 Habilidades: 1. Razão 2. Plano 3. Resolver problemas 4. Pensar de forma abstrata 5. Compreender idéias complexas 6. Aprender rapidamente 7. Aprender com a experiência
ASI - Artificial Super Intelligence - Mais inteligente do que os seres humanos em todos os sentidos
3 tipos de Inteligência Artificial
WaveNet: A Generative Model for Raw Audio
https://deepmind.com/blog/wavenet-generative-model-raw-audio/
97,35%
Our method reaches an accuracy of 97.35% on the Labeled Faces in the Wild (LFW) dataset, reducing the error of the current state of the art by more than 27%, closely approaching human-level performance.
DeepFace
https://research.fb.com/publications/deepface-closing-the-gap-to-human-level-performance-in-face-verification/
http://cs.stanford.edu/people/karpathy/deepimagesent/
Deep Visual-Semantic Alignments for Generating Image Descriptions
BIG DATA STORYTELLING
➤ É uma forma de construir histórias com base em dados
➤ Contar histórias é, desde sempre, uma forma excelente de transmitir experiências, sensações e pensamentos.
➤ Compreender ações e comportamentos para traçar estratégias que possam persuadir e instigar mudanças em um público-alvo
➤ Ponto chave: Visualização adequada da informação
➤ Criar histórias envolventes e apresentações visualmente interessantes é o caminho para tornar os números algo mais “concreto”
BIG DATA STORYTELLING
➤ Grande parte dessas oportunidades é perdida por conta da falta de contextualização dos dados coletados
➤ Não basta coletar e armazenar dados para poder desenvolver narrativas que contem a história de uma empresa ou produto. É preciso igualmente contextualizar esses dados para que o conteúdo se torne relevante
➤ Para obter sucesso utilizando Big Data Storytelling, analistas com expertise precisam estar alocados no processo de desenvolvimento
SUGESTÃO DE LEITURA
STORYTELLING WITH DATA: A DATA VISUALIZATION GUIDE FOR BUSINESS PROFESSIONALS
https://goo.gl/2giAWU
COMBATE À CORRUPÇÃO
Um grupo de jornalistas, cientistas de dados, estatísticos se reuniu para combater a corrupção através da análise dos dados públicos sobre gastos dos parlamentares, entregando relatórios quinzenais para a realização de denúncias junto aos órgão competentes para a restituição dos valores.
https://github.com/datasciencebr/serenata-de-amor
Irio Musskopf Data Science Brigadehttps://goo.gl/RtpO7N
ROBÔS E PLANEJAMENTO
A Rosie (https://github.com/datasciencebr/rosie) digere os dados, aplica modelos matemáticos. E aprende com os exemplos.
Hoje a Rosie está aplicando regras dos limites de uso da CEAP. Em um dia foram identificados 157 notas que extrapolam os limites legais.
O Jarbas ( https://github.com/datasciencebr/jarbas) recolhe os dados e apresentará as notas da CEAP com um índice de suspeita de corrupção e seus motivos.
Para as ferramentas mais comuns a várias analises, foi criado a “caixa de ferramentas comuns” — https://github.com/datasciencebr/serenata-toolbox que permite o reaproveitamento de código entre diversos pesquisadores.
https://goo.gl/RtpO7N
COMO APRENDER DATA SCIENCE DE GRAÇA NAS MELHORES UNIVERSIDADES DO MUNDO
Open Source Society
Álgebra Linear
Cálculo de Variáveis Únicas
Cálculo de Variáveis Múltiplas
Python
Probabilidade e Estatística em R
Introdução a Data Science
Machine Learning
https://goo.gl/PD2AQ8
BIG DATA E INTELIGÊNCIA ARTIFICIAL
Prof. João Gabriel Lima linkedin.com/in/joaogabriellima