datawarehouse e datamining

Upload: roger-reurian

Post on 09-Feb-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/22/2019 Datawarehouse e Datamining

    1/2

    Conceitos bsicos de Datamining e Datawarehouse

    Datamining

    Data mining uma expresso inglesa ligada informtica cuja traduo minerao de dados.Consiste em uma funcionalidade que agrega e organiza dados, encontrando neles padres,associaes, mudanas e anomalias relevantes.

    A expresso data mining surgiu pela primeira vez em 1990 em comunidades de bases de dado.A minerao de dados a etapa de anlise do processo conhecido como KDD (KnowledgeDiscovery in Databases), sendo a sua traduo literal "Descoberta de Conhecimento em Basesde Dado".

    O data mining pode ser divido em algumas etapas bsicas que so: explorao, construo demodelo, definio de padro e validao e verificao.

    A minerao de dados uma prtica relativamente recente no mundo da computao, e utilizatcnicas de recuperao de informao, inteligncia artificial, reconhecimento de padres e deestatstica para procurar correlaes entre diferentes dados que permitam adquirir umconhecimento benfico para uma empresa ou indivduo. Para uma empresa, o data mining podeser uma importante ferramenta que potncia a inovao e lucratividade.

    A utilizao da minerao de dados bastante usual em grandes bases de dados, e o resultadofinal da sua utilizao pode ser exibido atravs de regras, hipteses, rvores de deciso,dendrogramas, etc.

    Uma minerao de dados bem executada deve cumprir tarefas como: deteco de anomalias,aprendizagem da regra de associao (modelo de dependncia), clustering (agrupamento),classificao, regresso e sumarizao. O processo de data mining costuma ocorrer utilizandodados contidos dentro do data warehouse.

    Existem vrias empresas e softwares que se dedicam minerao de dados, pois a identificaode padres em bancos de dados cada vez mais importante. No entanto, a identificao depadres relevantes no exclusivo do mundo informtico. O crebro humano, utiliza umprocesso semelhante para identificar padres e adquirir conhecimento.

    Nos ltimos anos, a minerao de dados tem sido amplamente utilizada nas reas da cincia eengenharia, tais como bioinformtica, gentica, medicina, educao e engenharia eltrica.

    O conceito de data mining muitas vezes associado extrao de informao relativa aocomportamento de pessoas. Por esse motivo, em algumas situaes, a minerao de dadoslevanta aspectos legais e questes relativas privacidade e tica. Apesar disso, muitas pessoas

    afirmam que a minerao de dados eticamente neutra, pois no apresenta implicaes ticas.

    Exemplos reais de Data MiningA minerao de dados muitas vezes usada por empresas e organizaes para a obteno deconhecimento a respeito de utilizadores / funcionrios / clientes. Por exemplo, no setor pblico possvel fazer o cruzamento de dados entre o estado civil de um funcionrio e o salrio que eleganha, para verificar se isso tem influncia na sua vida conjugal.

    Empresas como cadeias de supermercados podem recorrer a esse cruzamento de dados paradeterminarem produtos que so comprados em conjunto. Se um cliente que compra o produto Xtambm compra o produto Y, talvez seja uma boa ideia posicionar os dois produtos perto, parafacilitar a compra por parte do cliente.

    Datawarehouse

  • 7/22/2019 Datawarehouse e Datamining

    2/2

    O que Data Warehouse:

    Data warehouse um depsito de dados digitais que serve para armazenar informaesdetalhadas relativamente a uma empresa, criando e organizando relatrios atravs de histricosque so depois usados pela empresa para ajudar a tomar decises importantes com base nosfatos apresentados.

    O data warehouse serve para recolher informaes de uma empresa para que essa possacontrolar melhor um determinado processo, disponibilizando uma maior flexibilidade naspesquisas e nas informaes que necessitam.

    Para alm de manter um histrico de informaes, o Data Warehouse cria padres melhorandoos dados analisados de todos os sistemas, corrigindo os erros e reestruturando os dados semafetar o sistema de operao, apresentando somente um modelo final e organizado para aanlise.

    Data warehouse e data martUm data mart uma subdiviso ou subconjunto de um data warehouse. Os data marts so comopequenas fatias de data warehouse, que armazenam subconjuntos de dados.

    Normalmente o data mart direcionado para uma linha de negcios ou equipe, sendo que a suainformao costuma pertencer a um nico departamento.

    Vantagens e desvantagens do data warehouseAlgumas das principais vantagens do data warehouse so:

    Inconsistncias so identificadas e solucionadas antes dos dados serem carregados, o quefacilita a execuo da anlise e de relatrios;Contribuem para o processo de tomar decises, atravs de relatrios de tendncias, de exceoe relatrios que revelam os objetivos versus desempenho real.O data warehouse tambm tem algumas desvantagens, entre as quais:

    No so uma soluo adequada para dados no-estruturados;Podem ter custos elevados e podem ficar ultrapassados com alguma rapidez.Data warehouse e Business intelligenceBusiness intelligence (inteligncia empresarial em portugus), o processo de recolha etratamento de informaes que apoiam a gesto de um negcio.

    Normalmente, as vrias vertentes de business intelligence utilizam informao recolhida em umdata warehouse. Apesar disso, nem todos os data warehouses so usados no contexto debusiness intelligence, porque nem todos as aplicaes de business intelligence exigem um datawarehouse.

    OLAPOLAP (Online Analytical Processing - Processo Analtico em Tempo Real), uma dasferramentas mais usadas para a explorao de um data warehouse. O OLAP possibilita alterare analisar grandes quantidades de dados em vrias perspectivas diferentes.

    A aplicao dessa ferramenta pode ser usada pelos gestores de qualquer rea e nvel,disponibilizando informaes e ajudando na deciso final. O uso da OLAP pode ser aplicado emfunes muito distintas, algumas das mais utilizadas variam desde funes financeiras (anlises,fluxos de caixa, contas, oramentos, etc.) passando pelo marketing (anlise de preo, volume demercado) concluindo nas vendas (previses, lucro, clientes).