análise e modelagem de processossilvana.detro/mineracaoprocessos... · 2019-08-07 · •a...

25
Análise e Modelagem de Processos Introdução – Data Science e Big Data Silvana Pereira Detro

Upload: others

Post on 12-Jul-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Análise e Modelagem de Processossilvana.detro/MineracaoProcessos... · 2019-08-07 · •A mineração de processos assume logsde eventos onde os eventos têm timestamps(horário

Análise e Modelagem de Processos 

Introdução – Data Science e Big Data

Silvana Pereira Detro

Page 2: Análise e Modelagem de Processossilvana.detro/MineracaoProcessos... · 2019-08-07 · •A mineração de processos assume logsde eventos onde os eventos têm timestamps(horário

• Data Science• Internet de Eventos• Big Data• Mineração de dados e de processo• Mineração de dados• Etapas do Knowledge Discovery Databases (KDD)• Métodos de Mineração de dados• Mineração de processos x Mineração de Dados

Engenharia de Produção 2

Page 3: Análise e Modelagem de Processossilvana.detro/MineracaoProcessos... · 2019-08-07 · •A mineração de processos assume logsde eventos onde os eventos têm timestamps(horário

A importância dos dados

Nos últimos 10 minutos, nos geramos mais dados desde o tempo pré‐histórico até 2003 

Fonte: Universidade de Tecnologia de Eindhoven (TU/e)

Engenharia de Produção 3

Page 4: Análise e Modelagem de Processossilvana.detro/MineracaoProcessos... · 2019-08-07 · •A mineração de processos assume logsde eventos onde os eventos têm timestamps(horário

Geração de dados

Comprando um café

Reabastecendo o carro

Fazendo uma ligação telefônica

Ajustando a temperatura

Enviando um e‐mail

Marcando uma consulta

Assistindo uma série

Engenharia de Produção 4

Page 5: Análise e Modelagem de Processossilvana.detro/MineracaoProcessos... · 2019-08-07 · •A mineração de processos assume logsde eventos onde os eventos têm timestamps(horário

Geração de dados

Fonte: Universidade de Tecnologia de Eindhoven (TU/e)Engenharia de Produção 5

Page 6: Análise e Modelagem de Processossilvana.detro/MineracaoProcessos... · 2019-08-07 · •A mineração de processos assume logsde eventos onde os eventos têm timestamps(horário

Internet de eventos

Internet ofContent

Internet ofPeople

Internet ofThings

Internet ofplaces

Internet of events

“Big data” “Social” “Cloud” “Mobility”

Fonte: Universidade de Tecnologia de Eindhoven (TU/e)Engenharia de Produção 6

Page 7: Análise e Modelagem de Processossilvana.detro/MineracaoProcessos... · 2019-08-07 · •A mineração de processos assume logsde eventos onde os eventos têm timestamps(horário

Dados de eventos

Engenharia de Produção 7

Page 8: Análise e Modelagem de Processossilvana.detro/MineracaoProcessos... · 2019-08-07 · •A mineração de processos assume logsde eventos onde os eventos têm timestamps(horário

Big Data

• Lei de Moore

• Outros exemplos:• Poder de computação• Capacidade de discos• …

2 = 1.048.576x em 40 anos

Engenharia de Produção 8

Page 9: Análise e Modelagem de Processossilvana.detro/MineracaoProcessos... · 2019-08-07 · •A mineração de processos assume logsde eventos onde os eventos têm timestamps(horário

Big Data

• 2014 ‐ a quantidade de informação digital armazenada excedeu 4 zettabytes

• 2020: o “universo digital” irá crescer para 44 zettabytes

Engenharia de Produção 9

Page 10: Análise e Modelagem de Processossilvana.detro/MineracaoProcessos... · 2019-08-07 · •A mineração de processos assume logsde eventos onde os eventos têm timestamps(horário

Questão 1,5 x 60 x 60 / 220 = 0,00515 segundos

Há 40 anos, uma viagem de trem de Eindhoven até Amsterdam levava aproximadamente 1,5 horas.

Quanto tempo levaria hoje, se a tecnologia de transporte seguisse a lei de Moore?

Fonte: Universidade de Tecnologia de Eindhoven (TU/e)Engenharia de Produção 10

Page 11: Análise e Modelagem de Processossilvana.detro/MineracaoProcessos... · 2019-08-07 · •A mineração de processos assume logsde eventos onde os eventos têm timestamps(horário

Questão 7 x 60 x 60 / 220 = 0,0240 segundos

Há 40 anos, uma viagem de avião de Amsterdam até Nova York 

levava aproximadamente 7 horas.

Quanto tempo levaria hoje, se a tecnologia de transporte seguisse 

a lei de Moore?

Fonte: Universidade de Tecnologia de Eindhoven (TU/e)Engenharia de Produção 11

Page 12: Análise e Modelagem de Processossilvana.detro/MineracaoProcessos... · 2019-08-07 · •A mineração de processos assume logsde eventos onde os eventos têm timestamps(horário

Como extrair valor dos dados?

Engenharia de Produção 12

Page 13: Análise e Modelagem de Processossilvana.detro/MineracaoProcessos... · 2019-08-07 · •A mineração de processos assume logsde eventos onde os eventos têm timestamps(horário

5 V’s do Big Data

Volume Variedade Velocidade Veracidade

Big Data

Fonte: Universidade de Tecnologia de Eindhoven (TU/e)

Valor

Engenharia de Produção 13

Page 14: Análise e Modelagem de Processossilvana.detro/MineracaoProcessos... · 2019-08-07 · •A mineração de processos assume logsde eventos onde os eventos têm timestamps(horário

Os dados NÃO precisam ser “Big” para serem desafiadores

Questões envolvendo análise de dados estão por todas as partes!

Engenharia de Produção 14

Page 15: Análise e Modelagem de Processossilvana.detro/MineracaoProcessos... · 2019-08-07 · •A mineração de processos assume logsde eventos onde os eventos têm timestamps(horário

Extrair VALOR dos dados!

Engenharia de Produção 15

Page 16: Análise e Modelagem de Processossilvana.detro/MineracaoProcessos... · 2019-08-07 · •A mineração de processos assume logsde eventos onde os eventos têm timestamps(horário

Engenharia de Produção

Questões genéricas sobre a ciência dos dados

O queaconteceu?

Por quêaconteceu?

O que iráacontecer?

O quede melhor

podeacontecer?

16

Page 17: Análise e Modelagem de Processossilvana.detro/MineracaoProcessos... · 2019-08-07 · •A mineração de processos assume logsde eventos onde os eventos têm timestamps(horário

Perguntas respondidas pela ciência de dados

Por quê os clientes precisam esperar tanto esperar tanto?Os colaboradores 

seguem as diretrizes organizacionais?

Podemos prever os tempos de espera?

Quantos funcionários precisaremos amanhã?

Como podemos reduzir os custos?

Engenharia de Produção 17

Page 18: Análise e Modelagem de Processossilvana.detro/MineracaoProcessos... · 2019-08-07 · •A mineração de processos assume logsde eventos onde os eventos têm timestamps(horário

Como as máquinas são utilizadas?

Quando e por quê as máquinas apresentam 

falhas?

Quais componentes defeituosos podem ser 

substituídos?

Podemos prever se uma máquina irá falhar na próxima 

semana?

Quais as partes que precisam ser melhoradas?

Perguntas do nível organizacional até os níveis de hardware/software

Fonte: Universidade de Tecnologia de Eindhoven (TU/e)Engenharia de Produção 18

Page 19: Análise e Modelagem de Processossilvana.detro/MineracaoProcessos... · 2019-08-07 · •A mineração de processos assume logsde eventos onde os eventos têm timestamps(horário

Foco desta disciplina

Fonte: Universidade de Tecnologia de Eindhoven (TU/e)Engenharia de Produção 19

Page 20: Análise e Modelagem de Processossilvana.detro/MineracaoProcessos... · 2019-08-07 · •A mineração de processos assume logsde eventos onde os eventos têm timestamps(horário

Mineração de dados

• “A análise de conjuntos de dados (geralmente grandes) para encontrar relacionamentos e resumir os dados de maneiras novas, que são compreensíveis e úteis para o proprietário dos dados” (Hand et al., 2001).

Google Flu Trends data, África do SulEngenharia de Produção 20

Page 21: Análise e Modelagem de Processossilvana.detro/MineracaoProcessos... · 2019-08-07 · •A mineração de processos assume logsde eventos onde os eventos têm timestamps(horário

Mineração de dados

• Extração de conhecimento de grandes volumes de dados;

• “data snooping", “fishing" e “data dredging";

• Centrada nos dados e não no processo;

• Consistem em um dos processos de KDD (Knowledge Discovery in Databases)

Engenharia de Produção 21

Page 22: Análise e Modelagem de Processossilvana.detro/MineracaoProcessos... · 2019-08-07 · •A mineração de processos assume logsde eventos onde os eventos têm timestamps(horário

Mineração de processos

• Posicionamento

Fonte: Universidade de Tecnologia de Eindhoven (TU/e)Engenharia de Produção 22

Page 23: Análise e Modelagem de Processossilvana.detro/MineracaoProcessos... · 2019-08-07 · •A mineração de processos assume logsde eventos onde os eventos têm timestamps(horário

Mineração de processos x Mineração de dados

• Começam a partir de dados

• Técnicas de mineração de dados geralmente não são centradas no processo;

• Técnicas tradicionais de mineração de dados não abordam tópicos como descoberta de processo, verificação de conformidade e análise de gargalo.

Engenharia de Produção 23

Page 24: Análise e Modelagem de Processossilvana.detro/MineracaoProcessos... · 2019-08-07 · •A mineração de processos assume logsde eventos onde os eventos têm timestamps(horário

Mineração de processos x Mineração de dados

• Os modelos de processo de ponta‐a‐ponta (end‐to‐end) e a concorrência (concurrency) são essenciais para a mineração de processos;

• A mineração de processos assume logs de eventos onde os eventos têm timestamps (horário de início e fim) e referem‐se aos casos (cases), ou seja, instâncias do processo;

• A mineração de processos e a mineração de dados precisam ser combinadas para questões mais avançadas.

Engenharia de Produção 24

Page 25: Análise e Modelagem de Processossilvana.detro/MineracaoProcessos... · 2019-08-07 · •A mineração de processos assume logsde eventos onde os eventos têm timestamps(horário

Referências

• Camilo, C.O. e Silva, J.C. 2009. Mineração de Dados: Conceitos, Tarefas, Métodos e Ferramentas. Instituto de Informática. Universidade Federal de Goiás.

• Google Flu Trends. Disponível em: https://www.google.org/flutrends/about/• Han, J., Pei, J. and Kamber, M., 2011. Data mining: concepts and techniques. Elsevier.• Hand, D.,  Mannila, H. and Smyth. P. Principles of Data Mining. MIT Press, Cambridge, MA, 2001.

• Van der Aalst, W.M.P. 2011. Process Mining Discovery, Conformance and Enhancement of Business Processes. Springer Heidelberg Dordrecht London New York.

• Van der Aalst, W.M.P. 2016. Data Science in Action: Process Mining. Second Edition, Springer.

• Witten, I.H., Frank, E., Hall, M.A., Pal, C.J. 2016.  Data Mining: Practical MachineLearning Tools and Techniques. Morgan Kauffman. 

Engenharia de Produção 25