gráficos em melhoriaapp.ihi.org/extranetng/content/cae07d8a-808a-41b4-be23-3caaaf4ecef4... · 4...

66
Gráficos em Melhoria Ademir Petenate, PhD Paulo Borem, MD Especialista em Melhoria Frequência, Pareto e Dispersão São Paulo, Brasil Hospital Israelita Albert Einstein

Upload: doanthuan

Post on 01-Dec-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

Gráficos em Melhoria

Ademir Petenate, PhDPaulo Borem, MD

Especialista em Melhoria

Frequência, Pareto e Dispersão

São Paulo, Brasil

Hospital Israelita Albert Einstein

Gráfico de Frequência

Ademir Petenate, PhDPaulo Borem, MD

Especialista em Melhoria

São Paulo, Brasil

Hospital Israelita Albert Einstein

3

Distribuição:

Gráfico de Frequência

4

Gráficos de Freqüência

Um gráfico de frequência é uma ferramenta para mostrar informações básicas sobre a localização, forma e dispersão de um medida ou indicador em uma amostra.

A interpretação depende da condição da medida/indicador com respeito à estabilidade

5

Gráficos de Frequência

• Para variável numérica

– Histograma

• Para variável classificatória

– Gráfico de barras

– Gráfico de setores

– Gráfico de Pareto

6

Gráfico de Freqüência: Histograma

3074.32 1184.04 631.14 970.81 1126.45 86.00 694.34 757.04

778.88 107.78 809.86 711.36 1403.13 1172.68 197.84 92.50

602.36 489.40 1033.09 732.89 760.71 1275.38 338.41 6.99

253.61 191.21 1249.77 793.21 516.11 27.19 474.35 666.90

43.15 608.39 707.19 2837.39 954.81 15.40 574.56 2106.47

1243.20 933.57 651.78 79.80 1076.80 320.45 3065.79 890.95

928.44 306.15 807.55 2566.06 1063.25 193.04 779.07 1252.07

154.55 629.59 357.53 1132.04 209.84 1239.65 429.08 383.45

1121.12 1142.27 295.61 1689.13 891.68 349.22 3005.68 1572.08

959.55 906.96 453.15 587.72 436.04 623.76 521.65 2589.97

2705.86 458.13 401.17 60.45 2415.94 1503.63 280.52 20.37

1052.25 1348.63 538.09 858.61 347.03 1469.26 891.91 33.00

234.90 1047.04 693.39 513.15 159.12 364.84 3239.65 3637.38

1633.70 176.02 494.01 857.72 1261.66 409.74 27.11 1685.12

1688.66 1065.77 175.59 1449.60 413.37 403.72 1851.64 3711.79

23.84 326.36 592.99 26.40 3689.57 1258.30 934.65 730.77

602.71 386.14 358.21 413.78 208.51 283.67 380.95 2541.23

122.40 414.68 51.22 2.00 601.91 1669.42 987.59 692.49

924.84 245.54 150.13 3850.09 431.53 190.56 537.33 611.32

713.29 2202.69 123.86 45.58 167.57 1768.33 732.66 1218.76

1088.30 2.06 861.27 1014.46 2020.19 1263.97 3042.79 406.31

1561.42 1562.89 400.46 727.84 728.29 775.67 2166.44 368.39

89.54 2076.58 1532.15 571.24 778.95 154.25 702.29 30.00

785.85 141.17 853.03 2100.70 134.10 648.24 1622.95 424.75

185.93 1609.05 4187.47 2478.63 203.56 238.76 451.58 283.78

Considere os

custo/dia de

internação de uma

amostra de 200

pacientes internados

em um Hospital

7

Gráfico de Freqüência: Histograma

Interv. de classe Pt. Médio Freq Freq. Acum Porc. Porc.Acum.

-250.00<=x<250.000 0 42 42 21.00 21.00

250.000<=x<750.000 500 68 110 34.00 55.00

750.000<=x<1250.00 1000 44 154 22.00 77.00

1250.00<=x<1750.00 1500 21 175 10.50 87.50

1750.00<=x<2250.00 2000 8 183 4.00 91.50

2250.00<=x<2750.00 2500 6 189 3.00 94.50

2750.00<=x<3250.00 3000 6 195 3.00 97.50

3250.00<=x<3750.00 3500 3 198 1.50 99.00

3750.00<=x<4250.00 4000 2 200 1.00 100.00

Divide a faixa de variação dos dados em intervalos e conta a freqüência

de ocorrência dos dados em cada faixa

A quantidade de

intervalos e os limites

de cada intervalo são

arbitrários

A escolha deve ser feita

de forma a evidenciar a

forma como os dados

se “distribuem”

8

Gráfico de Freqüência: Histograma

• Representa graficamente a Tabela de Frequências

(distribuição dos dados)

42003600300024001 8001 2006000

1 6

1 4

1 2

1 0

8

6

4

2

0

Custo_int_dia

Perc

en

t

Histogram of Custo_int_dia

9

Histograma: Características a serem

observadas:

• Simetria ou Assimetria

1 02.751 02.001 01 .251 00.5099.7599.0098.2597.50

1 2

1 0

8

6

4

2

0

X1

Perc

en

t

Histogram of X1

2400002000001 600001 2000080000400000

35

30

25

20

1 5

1 0

5

0

X2

Perc

en

t

Histogram of X2

10

Histograma: Características a serem

observadas:

• Pontos extremos

1 1 01 081 061 041 021 0098

20

1 5

1 0

5

0

X3

Perc

en

t

Histogram of X3

11

Histograma: Características a serem

observadas:

• Valor Médio e Quantidade de variação

Variação Variação

Mínimo MínimoMáximo Máximo

Indicadores de Localização

e de Variação

13

Indicadores de localização

• São valores que informam

– Entre que faixa os dados ocorreram

– Mínimo e Máximo

– Qual é centro dos dados

– Média e Mediana

– Qual é o valor abaixo do qual temos uma certa

porcentagem dos dados

– Quartis (Quartil 1 e Quartil 3) e Percentis

14

Média, Mediana e forma da Distribuição

Média =15.20

Mediana = 11.64

Média =15.036

Mediana = 15.035

Distribuição simétrica Distribuição assimétrica

15

Média e Mediana - Observações

• A mediana é “robusta” a causas especiais do

tipo “ponto astronômico”, ou seja, não é

influenciada por valores extremos

• É recomendável usar a mediana

– Se o tamanho da amostra é pequeno

– Se a distribuição dos dados é assimétrica

16

Indicadores de localização: Quartis

• Quartis: Quartil 1 (Q1) e Quartil 3 (Q3)– O quartil 1 (ou primeiro quartil) é definido como a mediana

dos 50% menores valores

– O quartil 3 (ou terceiro quartil) é definido como a mediana dos 50% maiores valores

• O quartil 1 divide o conjunto de dados ordenado em dois subconjuntos: 25% do valores estão abaixo da quartil 1 e 75% dos valores estão acima do quartil 1

• O quartil 3 divide o conjunto de dados ordenado em dois subconjuntos: 25% do valores estão acima da quartil 3 e 75% dos valores estão abaixo do quartil 3

17

Indicadores de Variação

• Variação está presente em praticamente todos

os processos

• Observe a distribuição dos dois conjuntos de

dados abaixo

• A média é praticamente a mesma, mas a

quantidade de variação é diferente

18

Indicadores de Variação

• A variação nos dados pode ser medida calculando-se quão longe os valores se afastam do centro, sendo que o centro é medido pela média ou pela mediana

• Existem diferentes formas de se medir a quantidade de variação

• A mais simples é a amplitude– Amplitude = Máximo-Mínimo

• O desvio padrão, outra forma de medir a quantidade de variação

19

Desvio Padrão

• Considere os seguintes dados

• A média é 73. Os desvios em relação à média estão na tabela abaixo

• A soma dos desvio é zero (de fato, a soma dos desvios em relação à média é zero para qualquer conjunto de dados)

70 71 73 74 77

-3 -2 0 1 4

20

Desvio Padrão

• Para calcular o desvio padrão, inicialmente eleva-se os

desvios ao quadrado (contribuição de cada desvio)

• O próximo passo é somar a contribuição de cada desvio

e dividir pelo total de valores menos 1

• O último passo é calcular a raiz quadrada da variância

amostral que é o desvio padrão

9 4 0 1 16

(9 + 4 + 0 + 1 + 16) / 4 = 7.5

74.25.7.. PD

21

Desvio Padrão

• Não é possível interpretar o valor do desvio

padrão sem especificar um contexto ou

estabelecer uma referência

• Assim como a média, mediana, mínimo,

máximo, quartis, etc o desvio padrão só deve

ser usado se o processo está estável.

22

Resumo: caracterização de um indicador

• Se os dados são coletados ao longo do tempo a análise deve começar pelo gráfico de tendência (análise dinâmica)

• Se o indicador está estável então o análise estática pode ser útil.

Variable N_Consultas_dia

Mean 201.47

StDev 16.73

Minimum 170

Q1 191

Median 201

Q3 210.75

Maximum 243605448423630241 81 261

250

225

200

1 75

1 50

Dia

N_C

on

sult

as_

dia

Número de consultas por dia

24023022021 02001 901 801 70

30

25

20

1 5

1 0

5

0

N_Consultas_dia

Po

rcen

tag

em

Histograma de Número de Consultas por dia

Visão dinâmica Visão estática

23

Visão Estática ou Dinâmica?

Considere os seis

conjuntos de dados

Visão estática: Todos

tem média, mediana,

desvio padrão e

amplitude iguais

Tempo 1 Tempo 2 Tempo 3 Tempo 4 Tempo 5 Tempo 6

36 36 74 36 21 96

43 43 82 43 22 93

28 28 51 28 23 83

74 34 93 74 25 82

82 22 61 82 28 74

51 21 58 51 34 61

93 38 96 93 34 58

34 23 83 21 36 51

61 34 36 22 38 48

22 25 43 23 42 43

58 42 28 34 43 42

21 48 34 34 48 38

38 74 22 38 51 36

48 82 21 61 58 34

42 51 38 58 61 34

96 93 23 48 74 28

23 61 34 96 82 25

83 58 25 42 83 23

34 96 42 83 93 22

25 83 48 25 96 21

Média 49.60 49.60 49.60 49.60 49.60 49.60

Mediana 43.00 43.00 43.00 43.00 43.00 43.00

D.P. 22.67 22.67 22.67 22.67 22.67 22.67

Amplitude 75.00 75.00 75.00 75.00 75.00 75.00

24

Visão Estática ou Dinâmica?

24

Visão estática:

Todos tem mesma

distribuição

Então todos os

processos são

iguais!

1 0080604020

4

3

2

1

0

Tempo 1

Fre

qu

en

cy

1 0080604020

4

3

2

1

0

Tempo 2

Fre

qu

en

cy

1 0080604020

4

3

2

1

0

Tempo 3

Fre

qu

en

cy

1 0080604020

4

3

2

1

0

Tempo 4

Fre

qu

en

cy

1 0080604020

4

3

2

1

0

Tempo 5

Fre

qu

en

cy

1 0080604020

4

3

2

1

0

Tempo 6

Fre

qu

en

cy

Histogram of Tempo 1 Histogram of Tempo 2 Histogram of Tempo 3

Histogram of Tempo 4 Histogram of Tempo 5 Histogram of Tempo 6

25

Visão Estática ou Dinâmica?

Visão dinâmica

Os processos

não são iguais!201 61 284

1 00

50

0

Dia

Te

mp

o 1

201 61 284

1 00

50

0

Dia

Te

mp

o 2

201 61 284

1 00

50

0

Dia

Te

mp

o 3

201 61 284

1 00

50

0

Dia

Te

mp

o 4

201 61 284

1 00

50

0

Dia

Te

mp

o 5

201 61 284

1 00

50

0

Dia

Te

mp

o 6

Tempo para realizar uma atividade Tempo para realizar uma atividade

Tempo para realizar uma atividade Tempo para realizar uma atividade

Tempo para realizar uma atividade Tempo para realizar uma atividade

Gráfico de Pareto

São Paulo, Brasil

Hospital Israelita Albert Einstein

Ademir Petenate, PhDPaulo Borem, MD

Especialista em Melhoria

27

Conheça Vilfredo Pareto (1848-1923)

• Engenheiro italiano, sociólogo, economista, cientista

político e filósofo.

• Introduziu o conceito de eficiência de Pareto

– É um condição de alocação de recursos em que é impossível

fazer um indivíduo melhor sem fazer pelo menos um pior (em

situação de distribuição de renda).

• Em 1897 executou um estudo sobre a distribuição de

renda. Através deste estudo, percebeu-se que a

distribuição de riqueza não se dava de maneira uniforme,

havendo grande concentração de riqueza (80%) nas mãos

de uma pequena parcela da população (20%).

• A regra 80/20 foi observada por Juran na área da

Qualidade: 80% dos defeitos provêm de 20% de motivos.

29

Gráfico de Pareto

• Um dos objetivos centrais de um programa de qualidade é reduzir perdas provocadas por itens defeituosos que não atendem às especificações

• Existem muitos tipos de defeitos que fazem com um produto não atenda às especificações

• Concentrar esforços no sentido de eliminar todos os tipos de defeitos não é uma política eficaz

• Geralmente, alguns poucos tipos de defeitos são responsáveis pela maioria das rejeições, e é mais eficaz atacar as causas desses poucos defeitos mais importantes

30

Gráfico de Pareto

• Essa abordagem já foi proposta por J. M. Juran, um dos pioneiros da Qualidade. Ele estabeleceu uma regra hoje conhecida como “a regra dos poucos vitais e dos muitos triviais”

• Para identificar os poucos vitais ele propôs a utilização de um diagrama conhecido como Diagrama de Pareto

• O diagrama é basicamente um histograma da distribuição dos defeitos pelos tipos, ordenado em ordem decrescente de freqüência de ocorrência

• O princípio de Pareto, também conhecido como regra de 80/20 que diz que dos muitos defeitos presentes, 80% são triviais e 20% são vitais.

31

Exemplo: Reclamações em PS

Motivo Motivo_cod Freq

Demora para ser atendido A 55

Poucas vagas no estacionamento B 8

Revistas velhas na recepção C 4

Sala de espera com poucas cadeiras D 7

Retorno não é com o mesmo médico E 22

Tempo de consulta muito curto F 38

Mau atendimento na recepção G 2

32

Construção do Gráfico de Pareto

• Preparação– Definir um problema específico. (Você coletará os dados para

esse problema)

– Listar os tipos de defeitos que se apresentam. Eles poderão já estar definidos, se você estiver usando dados existentes, ou gerados através de um brainstorm com a equipe.

– Determinar uma medida comum para comparar as categorias.

– Definir o período de tempo durante o qual os dados serão coletados (escolher um período de tempo que seja relevante para a situação)

– Coletar dados referente aos defeitos, caso eles ainda não existam (pelo menos 30 ocorrências)

– Calcular a frequência de ocorrência dos defeitos (ou outra medida relevante)

– Ordenar os defeitos pela frequência de ocorrência

33

Construção do Gráfico de Pareto

• Construção do gráfico

– Use o eixo horizontal para os tipos de defeitos

– Use o eixo vertical esquerdo para a freqüência de

ocorrência e o eixo vertical direito para a

porcentagem de ocorrência

– Desenhe as barras para cada defeito com altura

proporcional à sua freqüência de ocorrência,

ordenadas da esquerda para a direita

– Desenhe segmentos de reta ligados mostrando a

porcentagem acumulada da esquerda para a direita

34

O Princípio de Pareto

O Princípio de Pareto se aplica: uma ou

algumas categorias responsáveis pela

maioria dos defeitos. Concentre os

esforços de melhoria no topo de uma ou

duas barras

O Princípio de Pareto não se aplica: as

barras são todas de alturas

semelhantes. Procure por outras

maneiras de categorizar os dados, ou

procure por um tipo diferente de dado

para este problema.

35

Cuidados ao Fazer o Gráfico

O eixo-Y só é tão alto quanto a barra

mais alta. A altura das barras é vista em

relação à barra mais alta, não em

relação ao número total de defeitos

Quando corretamente desenhado, não

parece que a Barra A seja realmente tão

mais alta do que as outras. Trate como se

o Princípio de Pareto não se aplicasse

(isto é, não concentre-se somente na

Barra A).

O eixo vertical deve ter altura igual à soma de todas as freqüências

36

Estratificação

Tipo de erro Vendas RH Manuf. Eng. Finan. Trein. Total

Falta

assinatura

Funcionário 2 3 3 2 10

Gerente 25 1 40 1 2 1 70

V.P. 2 2 2 6

Falta recibo Taxi 3 1 3 1 8

Refeição 3 3 6

Estacion. 33 26 1 60

Comb. 2 2 1 5

Total de

erros68 3 76 9 6 3 165

Erros em relatório de despesas

37

Pareto por tipo e por local

Freq 70 60 10 8 6 6 5

Percent 42.4 36.4 6.1 4.8 3.6 3.6 3.0

Cum % 42.4 78.8 84.8 89.7 93.3 97.0 100.0

Tipo

Othe

r

Falta

recib

o re

feição

Falta

ass

in.V.P.

Falta

recibo

taxi

Falta

assin.fu

nc.

Falta

recibo

estac

ion.

Falta

ass

in.geren

te

180

160

140

120

100

80

60

40

20

0

100

80

60

40

20

0

Fre

q

Pe

rce

nt

Pareto Chart of Tipo

freq 76 68 9 6 6

Percent 46.1 41.2 5.5 3.6 3.6

Cum % 46.1 87.3 92.7 96.4 100.0

local OtherFinan.Eng.VendasManuf.

180

160

140

120

100

80

60

40

20

0

100

80

60

40

20

0

fre

q

Pe

rce

nt

Pareto Chart of local

38

Pareto estratificado por departamentos

Venda e Manuf 65 59 6 4 4 6

Percent 45.1 41.0 4.2 2.8 2.8 4.2

Cum % 45.1 86.1 90.3 93.1 95.8 100.0

Tipo

Other

Falta

rec

ibo co

mb.

Falta

ass

in.V.P.

Falta

rec

ibo re

feiçã

o

Falta

recibo

estac

ion.

Falta

ass

in.geren

te

160

140

120

100

80

60

40

20

0

100

80

60

40

20

0

Ve

nd

a e

Ma

nu

f

Pe

rce

nt

Pareto Chart of Tipo: Vendas+Manuf.

39

Modificações no Gráfico de Pareto

• Existem muitas opções para o eixo vertical nos gráficos de Pareto. A escala mais comum é a freqüência de ocorrências.

• Três alternativas importantes são:– Valor monetário

– Tempo

– Contribuição percentual de cada classificação para o total (tempo, ocorrências, dinheiro etc.)

• Ao se decidir sobre onde focalizar os esforços de melhoria usando análise de Pareto deve-se considerar cuidadosamente uma escala apropriada

40

Estreitando o Foco (Macro para Micro)

41

Estabilidade na Análise de Pareto

• O gráfico de Pareto tem que ser analisado considerando-se as causas de variação presentes

• Se o processo for estável, o gráfico de Pareto mostra os defeitos vitais e os triviais produzidos por causas comuns

• Se o processo for instável, deve ser feita a estratificação dos dados para separar os dados obtidos quando causas especiais estavam presentes dos dados

42

Estabilidade na Análise de Pareto

43

Análise de Pareto com “Causas”

• Os exemplos de Pareto mostrados até agora

lidaram com situações nas quais uma contagem de

algum efeito foi feita

• Nessas situações o gráfico terá um significado claro

• Podemos questionar se as classificações escolhidas

apresentam as informações mais úteis e podemos

questionar a precisão das contagens, mas se

estivermos confiantes nesses dois pontos o gráfico

de Pareto tem um significado definido para todos os

membros da equipe

44

Análise de Pareto com “Causas”

• Outro uso do gráfico de Pareto é o de resumir

dados a respeito das “causas” de um dado

efeito

0

5

10

15

20

25

30

35

Correio Computador Assinatura Outros erros Recibos Códig. vendedor

Causas

% A

traso

s

Causas de Pagamento Atrasado

45

Análise de Pareto com “Causas”

• Apesar de gráficos de Pareto para “causas” serem usados comumente, é preciso tomar alguns cuidados especiais. Como exatamente podemos interpretar o gráfico?

• A determinação de “causas” requer o julgamento de um perito

• Sempre que declararmos que sabemos a “causa” de algo devemos considerar qual é o grau de nossa crença. Ele é alto, baixo ou médio?

• Deve-se notar que entender “causas” é uma coisa bem diferente de simplesmente colocar uma observação em uma de várias categorias

46

Análise de Pareto com “Causas”

• Grandes desperdícios e perdas podem resultar de pensar que sabemos o sistema de causas quando, de fato, tudo que tínhamos era uma opinião pobremente fundamentada, tornada ainda mais perigosa por sua apresentação “autorizada” como dados em um gráfico

• Com frequência não existe uma causa única ou dominante

• Como relataremos isso em nosso gráfico de Pareto? Uma contagem em cada categoria? Uma contagem de um terço (1/3) em cada categoria?

• Frequentemente um efeito será causado por uma interação de causas

47

Análise de Pareto com “Causas”

• Resumindo, se você vir um gráfico de Pareto

que mostra “causas” seja particularmente cético.

– Em que bases as causas foram determinadas?

– Como que as combinações de efeitos foram

registradas?

– Como que as interações de efeitos foram

registradas?

– O quão certo você está de que estas de fato

representam o gráfico de Pareto das causas?

Gráfico de Dispersão

São Paulo, Brasil

Hospital Israelita Albert Einstein

Ademir Petenate, PhDPaulo Borem, MD

Especialista em Melhoria

49

Estudo de relações entre variáveis

O

Variáveisde Entrada

Variáveis deProcesso

Variáveis deResultado

PI

X1,, X2 , ... , Xk Y

Y = f(X1,, X2 , ... , Xk)

S C

Sistema de Causas

Associação entre variáveis

Y: Numérica X: Numérica

51

Associação entre variáveis

Projeto Dias de atraso

Índice Satisfação

Projeto Dias de atraso

Índice Satisfação

1 -3 3.90 13 -8 3.91

2 -6 3.42 14 8 3.57

3 -1 3.10 15 -15 4.40

4 0 2.95 16 -15 4.63

5 4 1.83 17 10 2.98

6 5 2.25 18 -11 4.11

7 9 1.92 19 11 1.83

8 11 3.15 20 -13 4.57

9 19 2.85 21 4 2.92

10 12 3.00 22 0 3.70

11 -5 2.64 23 10 2.63

12 -6 3.96 24 -7 4.51

Dados sobre satisfação e atraso de 24 projetos.A satisfação depende do atraso?

52

Gráfico de Dispersão

53

Análise de Gráficos de Dispersão

Aspectos a serem observados

em m Gráfico de Dispersão

Direção

Forma

Força

54

Coeficiente de correlação linear

• Fórmula

• -1 ≤ r ≤ 1

• Obs: – O coeficiente r mede o grau de associação linear entre

duas variáveis. Valor de r baixo (próximo de zero) não indica que as variáveis não estão relacionadas. Não interprete o valor de r sem o gráfico de dispersão

– A interpretação de r (se é alto) depende do contexto

22yyxx

yyxxr

ii

ii

55

Correlação

Sem correlação Correlação

positiva forte

Correlação

positiva média

Correlação

negativa forte

Correlação

negativa média

56

Correlação e causalidade

EVOLUÇÃO DA POPULAÇÃO DE OLDENBURG E DO

NÚMERO DE CEGONHAS (1930-1936)

NÚMERO DE CEGONHAS

PO

PU

LA

ÇÃ

O (

EM

MIL

HA

RE

S)

54

58

62

66

70

74

78

120 140 160 180 200 220 240 260

População versus Número de cegonhas

57

Correlação e causalidade

• A direção é positiva, a direção é linear e a

correlação é forte

• O gráfico sugere que quanto maior é o número

de cegonhas, maior é a população

• Podemos concluir que cegonhas trazem os

bebes?!

58

Correlação e causalidade

Relação entre N. de Doentes Mentais e N. apar. de rádio

Número de aparelhos de rádio (em milhões)

Núm

ero

de d

oente

s m

enta

is

6

10

14

18

22

26

0 2000 4000 6000 8000 10000

Entre os anos 1920 e 1935 foram coletados os dados relativos ao

número de aparelhos de rádio e número de doentes mentais por

100.000 habitantes na Inglaterra.

59

Correlação e causalidade

• A direção é positiva, a direção é linear e a

correlação é forte

• O gráfico sugere que quanto maior é o número

de aparelhos de rádio, maior é o número de

doentes mentais

• Podemos concluir que ouvir rádio provoca

doença mental?!

60

Correlação e causalidade

• Correlação não implica causalidade

• Duas variáveis podem estar correlacionadas devido a:– A variável X é causa direta da variável Y

– A variável Y é causa direta da variável X

– A variável X contribui para a variação em Y, mas não é a única causa

– Outras variáveis podem estar provocando a correlação

– Ambas as variáveis estão mudando com o tempo

– A associação não passa de coincidência

• Em estudos observacionais não se pode atribuir relação de causa e efeito a variáveis correlacionadas

• Para atribuir relação de causa e efeito, é preciso realizar experimentos planejados

Associação entre variáveis

Y: Classificatória X: Classificatória

Associação entre variáveis

Y: Classificatória X: Classificatória

63

Tabela de contingência

Quando as variáveis X e Y são categóricas, o estudo de

correlação é feito através de tabelas de contingênciaTabela de Contingência

Variável A

Categorias A1 A2 Total

B1 n11 n12 n1+ Variável B

B2 n21 n22 n2+

Total n+1 n+2 n++

Definições

n11 Freqüência de indivíduos nas categorias A1 e B1

n12 Freqüência de indivíduos nas categorias A2 e B1

n21 Freqüência de indivíduos nas categorias A1 e B2

n22 Freqüência de indivíduos nas categorias A2 e B2

n1+ Freqüência de indivíduos nas categorias B1

n2+ Freqüência de indivíduos nas categorias B2

n+1 Freqüência de indivíduos nas categorias A1

n+2 Freqüência de indivíduos nas categorias A2

n++ Total de indivíduos na amostra

64

Tabela de contingência

Resultado

Tratamento N S Total

Ciclosporina 15 (40.54%)

22 (59.46%)

37 (100%)

Placebo 23 (67.65%)

11 (32.35%)

34 (100%)

Exemplo: comparar ciclosporina com placebo

no tratamento de Doença de Crohn

Pergunta: Ciclosporina é melhor que

Placebo?

O que se pode concluir do estudo com base

nos dados?

65

Cuidado com tabelas

O procedimento de um hospital era aplicar antibiótico antes da cirurgia em pacientes para minimizar a chance de infecção hospitalar. Com o objetivo de avaliar a eficácia de três tipos de antibióticos, foram coletados dados de 100 pacientes que desenvolveram infecção após a cirurgia. A tabela abaixo apresenta a frequência por tipo de antibiótico. Qual é o melhor antibiótico?

Antibiótico Infecção

A 12

B 60

C 28

Total 100

66

Cuidados com tabelas

Infecção

Antibiótico Sim Não

A 12 10

B 60 20

C 28 70

A tabela abaixo apresenta dados sobre 100 pacientes que desenvolveram infecção e 100 que não desenvolveram infecção após cirurgia e tipo de antibiótico administrado. Qual antibiótico é melhor?

Ao construirmos tabelas cruzadas, devemos apresentar todas as categorias de cada variável