folder bigdata issuu

4

Upload: daniel-oliveira

Post on 01-Oct-2015

281 views

Category:

Documents


2 download

DESCRIPTION

bigdata

TRANSCRIPT

  • BLOCO A | 110h

    ObtenO, Anlise e VisuAlizAO de dAdOs: VAlOr

    CAses:Solues utilizadas em diversas reas: mdica, marketing, mercado financeiro, educao, redes sociais; Motores de Busca; Arquitetura de Solues Big Data; Correlao de Dados.

    Big DAtA AnALytiCs:Analtica Descritiva, Preditiva e Prescritiva; Formulao de Problemas; Modelagem; Mensurao; Anlise de Resultados; Ferramentas Analticas; Anlises Quantitativa e Qualitativa; Formulao de questes; Estudos de Caso Aplicados (Marketing, Cadeia de Fornecimento, Finanas, RH, Pesquisa e Desenvolvimento); Visualizao de Resultados (data visualization).

    PrOjetO De BLOCO:Com base no estudo de caso de uma grande rede de varejo, elaborar questes, coletar dados, realizar anlises e apresentar resultados que respondam s questes levantadas.

    COmPetnCiAs ADquiriDAs:O aluno recebe uma viso geral sobre aplicaes de solues adotadas no mundo Big Data. Alm disso, desenvolve o raciocnio analtico e trabalha com a apresentao de resultados.

    Bloco B | 110h

    infrAestruturA pArA big dAtA: VOlume

    mAP reDuCe/ HADOOP:Hadoop como framework; Papel desempenhado por servidores mster e slaves; Arquitetura: Map Reduce; HDFS e Ferramentas (Hive, HBase, Mahout, Pig, Oozie, Flume, Scoop, Spark/shark); Solues em Python; Papeis Task tracker, Data node, Job tracker e Name node; Tolerncia a falhas; Clusterizao; Transparncia de programao; Gerncia de usurios; Estudo de caso.

    PrOgrAmAO:Rstudio; Lendo e gravando dados; Estruturas de processamento; Simulaes; Otimizao; Coleta e limpeza de dados (leitura, mescla, agregao); Grficos; Clusterizao de dados; Bases da Linguagem Python; Introduo ao Machine Learning.

    PrOjetO De BLOCO:Modelar e projetar uma soluo composta por infraestrutura Hadoop e desenvolvida utilizando a linguagem Python, observando as prticas recomendadas no presente Bloco.

    COmPetnCiAs ADquiriDAs:O aluno aprende a desenvolver solues simples envolvendo Hadoop e Map Reduce, assim como a criar pequenos programas utilizando RStudio ou Python.

    Bloco C | 110h

    ArmAzenAmentO HeterOgneO de dAdOs: VelOcidAde

    gerenCiAmentO De DADOs:SGBDs Relacionais vs. NoSQL; Agregaes; No Schema; Bases Distribudas; Consistncia; Map-Reduce; Gerenciadores Key-Value (Redis, Memcached, Riak); Gerenciadores Orientados a Documento (MongoDb, CouchBase, RavenDB); Bancos InMemory (SAP HANA e VoltDB); Gerenciadores Relacionais para Big Data (Vertica, Pivotal). Neste mdulo teremos laboratrios prticos visando realizar comparaes entre os diversos produtos.

    mOngODB:Instalao; Organizao de Dados; Trabalhando com Dados; GridFS; Consultas; Administrao; Otimizao; Replicao; Particionamento de dados (sharding). Integrao com Hadoop.

    PrOjetO De BLOCO:Prova prtica em laboratrio envolvendo resoluo de problemas de administrao e otimizao com MongoDB.

    COmPetnCiAs ADquiriDAs:O aluno recebe uma viso geral sobre os principais produtos NoSQL. Torna-se capaz tambm de realizar a instalao, configurao e otimizao de base NoSQL MongoDB.

    Bloco D | 110h

    indexAO e trAtAmentO de dAdOs HeterOgneOs: VAriedAde

    meCAnismOs De BusCA:Indexao; Recuperao de Informao; Solr; elasticsearch.

    minerAO De textO:Manipulao de dados brutos; Dados temporais; Algoritmos de busca; Anlise de resultados; Busca inferente em bases texto; Identificao de padres; Ferramentas; Web Mining; Text Mining; Algoritmos genticos; Anlise de sentimento.

    PrOjetO De BLOCO:Prova prtica em laboratrio envolvendo resoluo de problemas de minerao de textos.

    COmPetnCiAs ADquiriDAs:O aluno ser capaz de dominar conceitos relativos a predies de dados, construir, gerenciar e consultar modelos preditivos, e por fim, conhecer as principais ferramentas do mercado de minerao de texto.

    tCC

    Orientao para o desenvolvimento do Trabalho de Concluso de Curso individual.