sumários das aulas teóricas de análise inteligente de ?· sumários das aulas teóricas de...

Download Sumários das Aulas Teóricas de Análise Inteligente de ?· Sumários das Aulas Teóricas de Análise…

Post on 26-Jan-2019

213 views

Category:

Documents

0 download

Embed Size (px)

TRANSCRIPT

Sumrios das Aulas Tericas de Anlise Inteligente de Dados

N. de

Lio

Data Sumrio Bibliografia

1 2007/09/173 Apresentao dos contedos programticos e objectivos da disciplina. Normas de avaliao, forma de funcionamento das aulas prticas e terico - prticas. Bibliografia recomendada e sua relevncia. Breve introduo problemtica a que a disciplina procura responder: grande disponibilidade de dados e a dificuldade na extraco de informao e conhecimento.

2 2007/09/19 Introduo anlise de dados e tomada de deciso - algumas consideraes gerais acerca da sua necessidade e inevitabilidade: problemtica do universo de dados em expanso e a necessidade de desenvolver novas tcnicas para encontrar, e extrair informao e conhecimento das enormes quantidades de dados disponveis; a informao como factor de produo. Apresentao e incio de discusso acerca do referencial informacional e de conhecimento: seus componentes arquitecturais, fluxo de dados e funes.

Data Mining, Pieter Adriaans e Dolf Zantinge, Addison-Wesley, 1996; Data Warehousing, Data Mining, and OLAP, Alex Berson, Stephen J. Smith, McGraw-Hill, 1997; Transparncias relativas totalidade dos contedos programticos, disponveis em fotocpias ou para consulta on-line.

3 2007/09/24 Continuao da discusso do referencial informacional e de conhecimento, numa perspectiva de gesto de informao e extraco de informao e conhecimento (componente de distribuio - query / reporting, OLAP e data mining). Diferentes forma de conhecimento: raso, multidimensional, escondido e profundo; diferentes ferramentas para cada tipo de conhecimento: SQL - investigar dados rasos; OLAP - conhecimento multidimensional; Data mining - para conhecimento escondido;

Data Warehousing: Tecnologia e Estratgia para DSS, Coimbra, 1999; Data Mining, Pieter Adriaans e Dolf Zantinge, Addison-Wesley, 1996; Transparncias relativas totalidade dos contedos programticos, disponveis em fotocpias ou para consulta on-line.

Conhecimento profundo - necessidade de conhecer pistas que possibilitem saber onde procurar. Explorao de dados: Anlise tradicional (query, grficos e estatsticas) e anlise multidimensional; perspectivas, objectivos. KDD - extraco de conhecimento em bases de dados - perspectiva, tcnicas e ferramentas e objectivos. Distino face anlise tradicional e OLAP.

4 2007/09/26 Conceitos para ECBD: padres e modelos. O que um padro e modelo: definio genrica e centrada em bases de dados; exemplo de dados e extraco de padro; diferena entre padres e modelos. Onde so utilizados os modelos e padres: exemplo ligado a empresa de telecomunicaes mveis e seus clientes, abrangendo a fase de seleco, aquisio, reteno e extenso. Indirectamente mostrar o interesse da ECBD j que trata directamente a extraco de padres e construo de modelos. Aprofundamento da relao da ECBD e relacionamento com clientes CRM e e-CRM.

Data Warehousing: Tecnologia e Estratgia para DSS, Coimbra, 1999; Data Mining, Pieter Adriaans e Dolf Zantinge, Addison-Wesley, 1996; Transparncias relativas totalidade dos contedos programticos, disponveis em fotocpias ou para consulta on-line.

5 2007/10/01 Modelo perfeito como quimera ideal. Limitaes que levam imperfeio dos modelos: dados em falta ou com erros e forma de lidar com estes problemas. Definio de termos utilizados em modelao predictiva: registos, variveis independentes (campos de entrada ou predictores) e variveis dependentes (de alvo ou de sada). Tipos de predictores: contnuos e categricos - definio e distino; caracterizao dos predictores categricos quanto ao relacionamento ou no entre os valores ou categorias que possam apresentar - nominais, ordinais e de intervalo. Converso de predictores, sua necessidade ou convenincia. Problemtica da amostragem como forma de lidar com o tamanho dos dados; problemas com a amostragem e tcnicas de amostragem.

Data Mining, Pieter Adriaans e Dolf Zantinge, Addison-Wesley, 1996; Data Warehousing, Data Mining, and OLAP, Alex Berson, Stephen J. Smith, McGraw-Hill, 1997 - captulo 14; Data Mining: Building Competitive Advantage, Robert Groth, Prentice Hall, 2000 Transparncias relativas totalidade dos contedos programticos, disponveis em fotocpias ou para consulta on-line.

6 2007/10/03 Mais alguns conceitos estatsticos importantes - Aprendizagem e contedo informacional: aprendizagem como compresso de dados, noo de complexidade de Kolmogorov e princpio de Rissanen; contedo informacional de uma mensagem e noo de contedo informacional de Shannon. Probabilidade: definio, distino entre probabilidade a priori e condicional; exemplo. Conceito de evento e de independncia entre eventos; relevncia do conceito de independncia entre eventos e, por oposio, oportunidade da dependncia: relacionamentos causais e colinearidade; exemplo ligado a estes conceitos. Teste do Qui-quadrado para verificar do relacionamento entre colunas de uma base de dados.

7 2007/10/08 Relatrios, Query e OLAP: trs perspectivas de distribuio de informao e conhecimento.

Data Warehousing, Data Mining, and OLAP, Alex Berson, Stephen J. Smith,

Relatrios e consultas: relatrios - inevitabilidade dada compatibilizao entre as necessidades MIS e o processamento em lotes; limitaes e sua evoluo at s ferramentas actuais: emissores de relatrios de produo, geradores de relatrios, ferramentas de query grficas e dotadas de middleware de isolamento dos utilizadores face s complexidades da estrutura dos dados (ex. catlogo de informao). Breve apresentao das caractersticas mais salientes de uma das ferramentas paradigmticas desta classe: Impromptu da Cognos; aluso ao outras aplicaes dentro da mesma classe. Aplicaes de produtividade pessoal, ambientes geridos de query (MQE) ou Hybrid OLAP: apelo para esta abordagem e sua limitaes; caracterizao de cada uma e distino. Aplicaes OLAP: tecnologias, benefcios e perspectiva multidimensional dos dados.

McGraw-Hill, 1997 - captulo 14; DataMining, Pieter Adriaans, Dolf Zantinge, cap. 7; Transparncias relativas totalidade dos contedos programticos, disponveis em fotocpias ou para consulta on-line.

8 200710/10 Modelo de dados multidimensional e cubo de Natureza do modelo multidimensional: caminhos de consolidao (constituindo hierarquias) e operaes de anlise: drill-down, roll-up, drill-anywhere e slice-and-dice. Anlise multidimensional e solues OLAP; perspectivas arquitecturais: MOLAP ou MD-OLAP (bases de dados

fisicamente multidimensionais); ROLAP (mapeamento mono-multidimensional

utilizando suporte relacional e motor multidimensional);

HOLAP, RAP e MQE como solues alternativas e hbridas.dados; caractersticas dos dados multidimensionais.

Desempenho em OLAP e necessidade de agregaes: agregao on-the-fly versus pr-agregao; exploso de tamanho; disperso dos dados multidimensional e limitao de exploso dos dados. Regras para avaliao de produtos OLAP de E.F. Codd - anlise detalhada de cada uma, mostrando a sua importncia para o OLAP e a forma como as diferentes aplicaes (e suas tecnologias subjacentes) lhe do suporte.

Data Warehousing, Data Mining, and OLAP, Alex Berson, Stephen J. Smith, McGraw-Hill, 1997; Data Warehousing: Tecnologia e Estratgia para DSS, Coimbra, 1999; Transparncias relativas totalidade dos contedos programticos, disponveis em fotocpias ou para consulta on-line.

9 2007/10/15 Objectivos chave das Arquitecturas Multidimensionais: discusso detalhada da problemtica do desempenho: acesso aos dados rpido, resposta linear e dados calculados - pr-clculo dos valores agregados e utilizao de funes de negcio ou estatsticas. Balanceamento entre a velocidade de acesso e exploso de dados, devida a materializao de sumarizaes; grfico de pr-clculo de sumarizaes tempo de resposta; consequncia: a existncia das diversas solues arquitecturais OLAP. Estudo detalhado da perspectiva ROLAP:

Data Warehousing, Data Mining, and OLAP, Alex Berson, Stephen J. Smith, McGraw-Hill, 1997; Data Warehousing: Tecnologia e Estratgia para DSS, Coimbra, 1999; Transparncias relativas totalidade dos contedos programticos, disponveis em fotocpias ou para consulta on-line.

arquitectura, mxima adoptada e funcionamento. Prs e contras desta arquitectura. Bases de dados multidimensionais: arquitectura, estruturas de armazenamento; sistema de indexao, seu tamanho e tratamento em memria. Aproximao MOLAP, utilizando bases de dados multidimensionais. Prs e contras desta arquitectura.

10 2007/10/17 RAP (real-time analytical processing) - arquitectura que explora o outro extremo da tecnologia de bases de dados multidimensionais: inexistncia de dados pr-calculados. Vantagens, reverso da medalha e ajudas para as limitaes. Estudo mais aprofundado das arquitecturas HOLAP e MQE: apelos para esta aproximao e limitaes; exemplos de alguns produtos comerciais.

Data Warehousing, Data Mining, and OLAP, Alex Berson, Stephen J. Smith, McGraw-Hill, 1997; Data Warehousing: Tecnologia e Estratgia para DSS, Coimbra, 1999; Transparncias relativas totalidade dos contedos programticos, disponveis em fotocpias ou para consulta on-line.

11 2007/10/22 Apresentao de quadro comparativo entre as diversas abordagens OLAP, relativamente a um conjunto de caractersticas. Ferramentas OLAP e a Internet: casamento entre as tecnologias e conceitos DW e Internet - inevitabilidade, razes e vantagens. Trs geraes, sua arquitectura e evoluo; estado actual. Resumo do captulo, concluses e aluso a alguns produtos comerciais mais relevantes.

Data Warehousing, Data Mining, and OLAP, Alex Berson, Stephen J. Smith, McGraw-Hill, 1997; Data Warehousing: Tecnologia e Estratgia para DSS, Coimbra, 1999; Transparncias relativas totalidade dos contedos programticos, disponveis em fotocpias ou para consulta on-line.

12 2007/10/24 Definio de ECBD e relao entre DQ/Reporting e OLAP versus data mining. Defin

Recommended

View more >