data mining

7

Click here to load reader

Upload: andre-luiz-bernardes

Post on 09-Jun-2015

1.292 views

Category:

Technology


2 download

DESCRIPTION

Mesmo sendo um tópico recente para a Ciência da Computação, este utiliza-se de várias técnicas com maior maturidade tais como a estatística, a recuperação de informação, a inteligência artificial e o reconhecimento de padrões.

TRANSCRIPT

Page 1: Data Mining

Data MiningIntrodução

Page 2: Data Mining

Data MiningIntrodução

A informática deu-nos a capacidade de ter acesso a grandes volumes de dados. Insondáveis quantidades de dados são captados diariamente de forma sistemática, com segundas, terceiras e quartas intenções.

Page 3: Data Mining

Data MiningIntrodução

O fato de termos tão grandiosas bases de dados armazenadas em diversos servidores ao redor do mundo, permitiu-nos ficar livres de pilhas e mais pilhas de livros e volumes enciclopédicos. 

Além desse aspecto físico, trouxe-nos o benefício do acesso a inúmeras ferramentas de Busca, estendendo a nossa compreensão da sua utilização, bem como ampliando suas aplicabilidades com o seu respectivo amadurecimento.

Page 4: Data Mining

Data MiningIntrodução

Data Mining - É a prospecção de dados ou a mineração de dados. É o processo de explorar grandes volumes de dados à procura de padrões consistentes. Estas podem ser regras de associação ou mesmo seqüências temporais. Ao detectar tais relacionamentos sistemáticos entre variáveis, detectamos também novos subconjuntos de dados.

O Data Mining é uma das recentes novidades da Ciência da Computação, a qual certamente veio para ficar. Não existe forma mais nobre de utilizar esses vastos repositórios de dados do que  descobrir se há algum conhecimento escondido neles, através da busca por padrões.

Page 5: Data Mining

Data MiningIntrodução

Etapas da Mineração de Dados

Os passos fundamentais de uma mineração bem sucedida a partir de fontes de dados (bancos de dados, relatórios, logs de acesso, transações, etc.) consistem de uma limpeza (consistência, preenchimento de informações, remoção de ruído e redundâncias, etc.). Disto nascem os repositórios organizados (Data Marts e Data Warehouses).

Page 6: Data Mining

Data MiningIntrodução

É a partir deles que se pode selecionar algumas colunas para atravessarem o processo de mineração. Tipicamente, este processo não é o final da história: de forma interativa e freqüentemente usando visualização gráfica, um analista refina e conduz o processo até que os padrões apareçam. Observe que todo esse processo parece indicar uma hierarquia, algo que começa em instâncias elementares (embora volumosas) e terminam em um ponto relativamente concentrado.

Page 7: Data Mining

Data MiningIntrodução

Encontrar padrões requer que os dados brutos sejam sistematicamente "simplificados" de forma a desconsiderar aquilo que é específico e privilegiar aquilo que é genérico. Faz-se isso porque não parece haver muito conhecimento a extrair de eventos isolados. Uma loja de sua rede que tenha vendido a um cliente uma quantidade impressionante de um determinado produto em uma única data pode apenas significar que esse cliente em particular procurava grande quantidade desse produto naquele exato momento. Mas isso provavelmente não indica nenhuma tendência de mercado.