data mining fabiany lamboia luciano machado pereira fabiany lamboia luciano machado pereira

12
DATA MINING DATA MINING Fabiany Lamboia Fabiany Lamboia Luciano Machado Pereira Luciano Machado Pereira

Upload: internet

Post on 22-Apr-2015

110 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: DATA MINING Fabiany Lamboia Luciano Machado Pereira Fabiany Lamboia Luciano Machado Pereira

DATA MININGDATA MININGDATA MININGDATA MINING

Fabiany LamboiaFabiany Lamboia

Luciano Machado PereiraLuciano Machado Pereira

Page 2: DATA MINING Fabiany Lamboia Luciano Machado Pereira Fabiany Lamboia Luciano Machado Pereira

SumárioSumárioSumárioSumário

• IntroduçãoIntrodução• ConceitosConceitos• Principais TarefasPrincipais Tarefas• TécnicasTécnicas• Algoritmos utilizadosAlgoritmos utilizados• AplicaçõesAplicações• TecnologiasTecnologias• ConclusãoConclusão

Page 3: DATA MINING Fabiany Lamboia Luciano Machado Pereira Fabiany Lamboia Luciano Machado Pereira

IntroduçãoIntroduçãoIntroduçãoIntrodução Empresas acumulam diversos dados em seus bancos de dados

Informação sobre os vários processos das funções da empresa

Estes dados podem contribuir com a empresa, sugerindo tendências e particularidades pertinentes a ela

A tecnologia de Data Mining com suas ferramentas permite a "mineração“ destes dados.

Page 4: DATA MINING Fabiany Lamboia Luciano Machado Pereira Fabiany Lamboia Luciano Machado Pereira

ConceitoConceitoConceitoConceito

Data mining (DM), é o processo de seleção, exploração de dados e criação de modelos que utiliza um grande volume de armazenamento de dados para identificar padrões previamente desconhecidos.

Page 5: DATA MINING Fabiany Lamboia Luciano Machado Pereira Fabiany Lamboia Luciano Machado Pereira

Principais Tarefas Principais Tarefas

• Classificação• Estimativa• Segmentação• Regressão• Agregação (cluster)

Page 6: DATA MINING Fabiany Lamboia Luciano Machado Pereira Fabiany Lamboia Luciano Machado Pereira

• Sumarização • Modelo de Dependência• Associação • Análise de Seqüência• Predição

Principais Tarefas Principais Tarefas

Page 7: DATA MINING Fabiany Lamboia Luciano Machado Pereira Fabiany Lamboia Luciano Machado Pereira

TécnicasTécnicas

• EstatísticaEstatística• Métodos LinearesMétodos Lineares• Indução de RegrasIndução de Regras

– Regras de ClassificaçãoRegras de Classificação– Regras de AssociaçãoRegras de Associação– Regras de CaracterizaçãoRegras de Caracterização

Page 8: DATA MINING Fabiany Lamboia Luciano Machado Pereira Fabiany Lamboia Luciano Machado Pereira

Algoritmos utilizadosAlgoritmos utilizadosAlgoritmos utilizadosAlgoritmos utilizados

• Árvores de DecisãoÁrvores de Decisão• ClusterCluster• Naive BayesNaive Bayes• Adaptive Bayes NetworkAdaptive Bayes Network

Page 9: DATA MINING Fabiany Lamboia Luciano Machado Pereira Fabiany Lamboia Luciano Machado Pereira

AplicaçãoAplicaçãoAplicaçãoAplicação

• Marketing• Vendas• Finanças• Manufatua• Saúde• Energia

Page 10: DATA MINING Fabiany Lamboia Luciano Machado Pereira Fabiany Lamboia Luciano Machado Pereira

TecnologiasTecnologiasTecnologiasTecnologias

• IBM DB2 Enterprise Edition 8.2: suporta IBM DB2 Enterprise Edition 8.2: suporta técnicas de árvore de decisão regressão, técnicas de árvore de decisão regressão, associação e técnicas de agrupamento;associação e técnicas de agrupamento;

• Oracle Database 10g: Naive Bayes, Oracle Database 10g: Naive Bayes, redes Adaptive Bayes e Support Vector redes Adaptive Bayes e Support Vector Machines;Machines;

• Microsoft SQL Server 2000 Analisys Microsoft SQL Server 2000 Analisys Services: suporta árvores de decisão.Services: suporta árvores de decisão.

Page 11: DATA MINING Fabiany Lamboia Luciano Machado Pereira Fabiany Lamboia Luciano Machado Pereira

Empresas Empresas Empresas Empresas • Wall Mart : 60% das mães que compram Wall Mart : 60% das mães que compram

boneca Barbie, levam também uma barra de boneca Barbie, levam também uma barra de chocolate;chocolate;

• Banco Itaú : aumentar sua taxa de retorno Banco Itaú : aumentar sua taxa de retorno nas malas diretas para 30%;nas malas diretas para 30%;

• Sprint : previa com 61% de segurança se o Sprint : previa com 61% de segurança se o consumidor trocaria de companhia de consumidor trocaria de companhia de telefone dentro de um período de 2 meses;telefone dentro de um período de 2 meses;

• SERPRO : cruzar e analisar informações em SERPRO : cruzar e analisar informações em cinco minutos, o que antes demorava quinze cinco minutos, o que antes demorava quinze dias de trabalho.dias de trabalho.

Page 12: DATA MINING Fabiany Lamboia Luciano Machado Pereira Fabiany Lamboia Luciano Machado Pereira

ConclusãoConclusãoConclusãoConclusão

A tendência é que todo desenvolvedor de banco de dados dever ser capaz de criar e treinar os modelos de data mining para incorporar esses recursos avançados nos aplicativos do consumidor.