data mining
DESCRIPTION
Mesmo sendo um tópico recente para a Ciência da Computação, este utiliza-se de várias técnicas com maior maturidade tais como a estatística, a recuperação de informação, a inteligência artificial e o reconhecimento de padrões.TRANSCRIPT
Data MiningIntrodução
Data MiningIntrodução
A informática deu-nos a capacidade de ter acesso a grandes volumes de dados. Insondáveis quantidades de dados são captados diariamente de forma sistemática, com segundas, terceiras e quartas intenções.
Data MiningIntrodução
O fato de termos tão grandiosas bases de dados armazenadas em diversos servidores ao redor do mundo, permitiu-nos ficar livres de pilhas e mais pilhas de livros e volumes enciclopédicos.
Além desse aspecto físico, trouxe-nos o benefício do acesso a inúmeras ferramentas de Busca, estendendo a nossa compreensão da sua utilização, bem como ampliando suas aplicabilidades com o seu respectivo amadurecimento.
Data MiningIntrodução
Data Mining - É a prospecção de dados ou a mineração de dados. É o processo de explorar grandes volumes de dados à procura de padrões consistentes. Estas podem ser regras de associação ou mesmo seqüências temporais. Ao detectar tais relacionamentos sistemáticos entre variáveis, detectamos também novos subconjuntos de dados.
O Data Mining é uma das recentes novidades da Ciência da Computação, a qual certamente veio para ficar. Não existe forma mais nobre de utilizar esses vastos repositórios de dados do que descobrir se há algum conhecimento escondido neles, através da busca por padrões.
Data MiningIntrodução
Etapas da Mineração de Dados
Os passos fundamentais de uma mineração bem sucedida a partir de fontes de dados (bancos de dados, relatórios, logs de acesso, transações, etc.) consistem de uma limpeza (consistência, preenchimento de informações, remoção de ruído e redundâncias, etc.). Disto nascem os repositórios organizados (Data Marts e Data Warehouses).
Data MiningIntrodução
É a partir deles que se pode selecionar algumas colunas para atravessarem o processo de mineração. Tipicamente, este processo não é o final da história: de forma interativa e freqüentemente usando visualização gráfica, um analista refina e conduz o processo até que os padrões apareçam. Observe que todo esse processo parece indicar uma hierarquia, algo que começa em instâncias elementares (embora volumosas) e terminam em um ponto relativamente concentrado.
Data MiningIntrodução
Encontrar padrões requer que os dados brutos sejam sistematicamente "simplificados" de forma a desconsiderar aquilo que é específico e privilegiar aquilo que é genérico. Faz-se isso porque não parece haver muito conhecimento a extrair de eventos isolados. Uma loja de sua rede que tenha vendido a um cliente uma quantidade impressionante de um determinado produto em uma única data pode apenas significar que esse cliente em particular procurava grande quantidade desse produto naquele exato momento. Mas isso provavelmente não indica nenhuma tendência de mercado.