iii.3. primjer neparametrijskog testa: 2-test (hi-kvadrat

95
III.3. Primjer neparametrijskog testa: χ 2 -test (hi-kvadrat test) III.3.1. Općenito o χ 2 -testu Često je potrebno usporediti razne skupine ispitanika po učestalostima (frekvencijama) i vidjeti razlikuju li se te skupine ili se ne razlikuju. UtvrĎivanje tih razlika treba obaviti upotrebom statistike a ne procjenom razlika od oka, tako da se govori o statistički značajnim razlikama. Kako frekvencije u biostatistici ima odreĎeno značenje, to se moţe govoriti o različitim slučajevima: da se usporeĎuju dobivene frekvencije jedne skupine s teoretskima, ili se frekvencije za dvije ili više skupina meĎusobno usporeĎuju u odnosu na referentne teoretske vrijednosti. Dakle, radi se o jednom obiljeţju ili o dva obiljeţja u vidu klasa (razreda) u koje je svaka skupina podijeljena. UsporeĎuju se raspodjele kojima frekvencije tih razreda pripadaju, dakle pitanje razlika izmeĎu nizova frekvencija svodi se na pitanje da li su njihove raspodjele iste ili su različite u odnosu na očekivane raspodjele. Razlike izmeĎu raspodjela se pak mogu utvrditi ako se ispitaju razlike izmeĎu frekvencija razreda tih raspodjela. Nizovi frekvencija koje se ispituju predstavljaju kategorijske varijable. Mjera za odstupanje opaţenih frekvencija od očekivanih zove se vrijednost hi -kvadrata ili χ 2 -vrijednost, a najčešći statistički test u kojem se ovaj parametar koristi je hi-kvadrat test ili χ 2 -test. Prema definiciji, χ 2 -vrijednost za k stupnjeva slobode je zbroj od k odreĎenih z-vrijednosti standardizirane normalne raspodjele. Ovakav zbroj z-vrijednosti podlijeţe zakonu χ 2 -raspodjele a ne normalne raspodjele:

Upload: others

Post on 02-Feb-2022

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

III.3. Primjer neparametrijskog testa: χ2-test (hi-kvadrat test) III.3.1. Općenito o χ2-testu

Često je potrebno usporediti razne skupine ispitanika po učestalostima

(frekvencijama) i vidjeti razlikuju li se te skupine ili se ne razlikuju. UtvrĎivanje

tih razlika treba obaviti upotrebom statistike a ne procjenom razlika od oka, tako

da se govori o statistički značajnim razlikama. Kako frekvencije u biostatistici

ima odreĎeno značenje, to se moţe govoriti o različitim slučajevima: da se

usporeĎuju dobivene frekvencije jedne skupine s teoretskima, ili se frekvencije

za dvije ili više skupina meĎusobno usporeĎuju u odnosu na referentne

teoretske vrijednosti. Dakle, radi se o jednom obiljeţju ili o dva obiljeţja u vidu

klasa (razreda) u koje je svaka skupina podijeljena. UsporeĎuju se raspodjele

kojima frekvencije tih razreda pripadaju, dakle pitanje razlika izmeĎu nizova

frekvencija svodi se na pitanje da li su njihove raspodjele iste ili su različite u

odnosu na očekivane raspodjele. Razlike izmeĎu raspodjela se pak mogu

utvrditi ako se ispitaju razlike izmeĎu frekvencija razreda tih raspodjela.

Nizovi frekvencija koje se ispituju predstavljaju kategorijske varijable. Mjera za

odstupanje opaţenih frekvencija od očekivanih zove se vrijednost hi-kvadrata ili

χ2-vrijednost, a najčešći statistički test u kojem se ovaj parametar koristi je

hi-kvadrat test ili χ2-test. Prema definiciji, χ2-vrijednost za k stupnjeva slobode je

zbroj od k odreĎenih z-vrijednosti standardizirane normalne raspodjele. Ovakav

zbroj z-vrijednosti podlijeţe zakonu χ2-raspodjele a ne normalne raspodjele:

Page 2: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Često je kod malih uzoraka, malih i problematičnih kontingencijskih tablica zbog

nedovoljno velikih razreda, potrebno uvesti Yatesovu korekciju. U toj korekciji,

apsolutna vrijednost razlike izmeĎu opaţene i očekivane frekvencije umanjuje

se za 0.5, te se potom vrijednost kvadrira i normalizira s Ei:

U χ2-testu računa se tzv. χ2-parametar, χ2-vrijednost ili χ2-statistika (slijedi

χ2-raspodjelu), koji je za praktičnu primjenu za statističke uzorke i skupove

definiran kao aproksimacija, zbroj normaliziranih razlika izmeĎu opaţenih (Oi) i

očekivanih (Ei) frekvencija svih C razreda u tzv. kontingencijskoj tablici (C je

broj ćelija za vrijednosti Oi ili Ei u kontingencijskoj tablici). Što je χ2-vrijednost

veća, to ukupna razlika izmeĎu opaţenih i očekivanih frekvencija statistički

značajnija. χ2-vrijednost se u praksi moţe računati na dva načina, pri čemu sve

očekivane frekvencije moraju biti Ei ≥ 5:

Page 3: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

χ2-test uveo je statističar Karl Pearson 1900. godine u časopisu Philosophical

Magazine Series 5, vol. 50 (302), str. 157-175:

Broj statističkih uzoraka i varijabli koji se uključuju u χ2-test:

1 uzorak, 1 varijabla χ2-test slaganja, prilagodbe ili aproksimacije

(rijetko u biostatistici)

1 uzorak, 2 varijable χ2-test nezavisnosti dviju varijabli

(ne tako često u biostatistici):

-običan ili Pearsonov χ2-test nezavisnosti

-χ2-test nezavisnosti s Yatesovom korekcijom

2 i više uzoraka, 2 varijable χ2-test homogenosti skupa

(često u biostatistici)

-običan ili Pearsonov χ2-test homogenosti

-χ2-test homogenosti s Yatesovom korekcijom

Page 4: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

χ2-test slaganja ili aproksimacije:

ispituje se koliko jedan niz opaţenih frekvencija odstupa od očekivanih

frekvencija, tj. da li raspodjela uzorka bitno odstupa od raspodjele populacije za

koju se očekuje da je iz nje uzet uzorak.

χ2-test homogenosti skupa:

ispituje se kolike su razlike unutar skupa odnosno izmeĎu dvaju ili više uzoraka,

tj. da li se uzorci meĎusobno bitno razlikuju. Ova provjera se temelji na

ispitivanju razlika niza opaţenih frekvencija uzoraka u odnosu na frekvencije

jedne pretpostavljene raspodjele.

χ2-test nezavisnosti dviju varijabli:

ispituje se koliko su dvije varijable meĎusobno povezane tj. zavisne unutar

jednog uzorka (cijeli skup je shvaćen kao jedan uzorak). Ova provjera

pretpostavlja da dvije kategorijske varijable nisu korelirane ili sparene.

Korelirane varijable su one koje imaju iste ispitanike ili statističke jedinice, a

sparene varijable su one koje imaju parove ispitanika ili statističke jedinice

meĎusobno strogo pridruţene u parovima.

Svaki χ2-test je detaljno objašnjen i pokazan na primjerima u ovom predavanju.

U svakom χ2-testu svaki ispitanik ili statistička jedinica pojavljuje se u

podacima samo jednom, a ne dva ili više puta.

Radi boljeg razumijevanja χ2-testa potrebno je pojasniti χ2-raspodjelu.

Page 5: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

df vjerojatnost (α)

0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001

1 0.004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.64 10.83

2 0.10 0.21 0.45 0.71 1.39 2.41 3.22 4.60 5.99 9.21 13.82

3 0.35 0.58 1.01 1.42 2.37 3.66 4.64 6.25 7.82 11.34 16.27

4 0.71 1.06 1.65 2.20 3.36 4.88 5.99 7.78 9.49 13.28 18.47

5 1.14 1.61 2.34 3.00 4.35 6.06 7.29 9.24 11.07 15.09 20.52

6 1.63 2.20 3.07 3.83 5.35 7.23 8.56 10.64 12.59 16.81 22.46

7 2.17 2.83 3.82 4.67 6.35 8.38 9.80 12.02 14.07 18.48 24.32

8 2.73 3.49 4.59 5.53 7.34 9.52 11.03 13.36 15.51 20.09 26.12

9 3.32 4.17 5.38 6.39 8.34 10.66 12.24 14.68 16.92 21.67 27.88

10 3.94 4.86 6.18 7.27 9.34 11.78 13.44 15.99 18.31 23.21 29.59

Nije značajno Značajno

χ2-raspodjela:

kritične vrijednosti χ2*

desnog kraka raspodjele

ovise o df i α; kritične

vrijednosti prikazane su za

prvih 10 vrijednosti df i za

11 vrijednost α (od 0.95 do

0.001)

Funkcija fk(x) je funkcija χ2-raspodjele

vjerojatnosti, koja jako ovisi o broju

stupnjeva slobode k (često i u oznaci

df). Za velike k (k > 50) ova raspodjela

pribliţuje se normalnoj raspodjeli.

Nezavisna varijabla funkcije fk(x) je

x = χ2α = Σi (Oi - Ei)/Ei, tj. zbroj

normiranih kvadrata odstupanja

opaţenih frekvencija (Oi) od

očekivanih (Ei).

Page 6: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Oblik fk(x) funkcije χ2-raspodjele:

x = χ2 i vjerojatnost p = α na

desnom su kraku raspodjele.

Osnovni oblici četiriju najčešćih funkcija

raspodjele vjerojatnosti: standardizirana

Gaussova (z-vrijednost), Studentova

(t-vrijednost), Fisherova (F-vrijednost) i

hi-kvadrat raspodjela (χ2-vrijednost).

χ2-raspodjela općenito nije simetrična,

ali postaje simetrična za velike df, kada

se pribliţuje normalnoj raspodjeli.

Page 7: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

χ2-raspodjela:

kritične

vrijednosti χ2*

desnog kraka

raspodjele

ovise o df i α.

Statistički

značajnim

smatra se

vjerojatnost

P < 0.05, tj.

razlika je

značajna na

razini α = 0.05

ili manjoj.

Page 8: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

χ2-raspodjela: kritične

vrijednosti χ2* desnog kraka.

Dane su vrijednosti za prvih

30 vrijednosti df i za

vrijednosti α od 0.99 do

0.001.

Page 9: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

III.3.2. χ2-test slaganja ili aproksimacije

Ovaj χ2-test nosi različita imena: test slaganja, test o prilagodbi modela

podacima, test aproksimacije empirijske raspodjele teorijskoj (Engl. chi-square

goodness-of-fit test, one-sample chi-square test).

Ovdje je x statističko obiljeţje od interesa, tj. 1 varijabla izmjerena za

1 uzorak. Ovim testom se provjerava je li uzorak reprezentativan za populaciju,

tj. je li razlika izmeĎu opaţene raspodjele uzorka i pretpostavljene raspodjele

populacije statistički značajna. Statistička hipoteza je:

H0: Varijabla x ima pretpostavljenu (očekivanu) raspodjelu.

H1: Varijabla x nema pretpostavljenu (očekivanu) raspodjelu.

UsporeĎuju se dvije raspodjele za uzorak – opaţena i očekivana raspodjela.

Opaţena raspodjela: empirijska raspodjela apsolutnih frekvencija po razredima

(O1, O2, O3, …, OC), raspodjela dobivena mjerenjem odnosno eksperimentom,

skupljanjem podataka uzorak je podijeljen na dva ili više razreda, kategorija

ili klasa (tj. podskupova, poduzoraka) po nekoj osobini.

Očekivana raspodjela: raspodjela koja se očekuje, bilo da se radi o nekoj

teorijskoj raspodjeli (diskretna uniformna, normalna, binomna, Poissonova i dr.),

bilo da se radi o prethodno ustanovljenoj empirijskoj raspodjeli ili kojoj drugoj

raspodjeli koja se pretpostavlja raspodjela apsolutnih frekvencija po razre-

dima (E1, E2, E3, …, EC) izračunava se kao produkti veličine uzorka N (ukupna

frekvencija) i očekivanih relativnih frekvencija ili vjerojatnosti p1, p2, p3, …, pC.

Broj razreda je C ≥ 2, a broj stupnjeva slobode (često i u oznaci k) je df = C - 1.

Page 10: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

χ2-test slaganja ili aproksimacije nije čest u biostatistici. Uglavnom se

koristi za kategorijske varijable – nominalne i ordinalne varijable.

RjeĎe se koristi za druge tipove varijabli koje se transformiraju u kategorijske

varijable:

1) Likertova ljestvica, koja je po prirodi ordinalna varijabla, ovdje se strogo

shvaća kao ordinalna varijabla, tj. varijabla s kategorijama (razredima, klasama)

koje su poredane u odreĎeni niz ili red;

2) diskretna varijabla se transformira u ordinalnu varijablu tako što se svakoj

brojevnoj vrijednosti pripisuje tzv. klasni razred, ili se intervalima brojevnih

vrijednosti pripisuju klasni razredi (intervali moraju biti iste veličine), a sam

klasni razred je oznaka za klasu (brojevna vrijednost postaje samo brojevna

oznaka za razred);

3) kontinuirana varijabla se takoĎer transformira u ordinalnu varijablu, tako što

se razlomi u intervale brojevnih vrijednosti kojima se pripisuju klasni razredi

(intervali moraju biti iste veličine), a sam klasni razred je oznaka za klasu

(brojevna vrijednost postaje samo brojevna oznaka za razred).

Na početku testiranja potrebno je načiniti kontingencijsku tablicu (slijedeći slajd)

i ispuniti je): prvo se definiraju razredi, zatim se odreĎuju opaţene frekvencije

prebrojavanjem u skupu dobivenih podataka, te se potom izračunavaju

očekivane frekvencije. Svi ovi podaci se upišu u tablicu (zelena polja), a

kontrola zbrajanjem obavlja se na rubu, izvan tablice (ţuta polja).

Page 11: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Razredi (kategorije) Opaţene frekvencije (Oi) Očekivane frekvencije (Ei)

razred 1 O1 E1

razred 2 O2 E2

razred 3 O3 E3

... ... ...

razred C OC EC

Ukupno (N) N N

Kontingencijska tablica opaţenih (Oij) i očekivanih (Eij) frekvencija s C razreda:

Nakon što je kontingencijska tablica popunjena i provjerena, pristupa se

izračunavaju niza vrijednosti: χ2-vrijednosti, broja stupnjeva slobode df,

vjerojatnosti P za nul-hipotezu H0, te kritične vrijednosti χ2* za zadanu razinu

statističke značajnosti α.

Nakon toga slijedi statistička odluka – prihvatiti ili odbaciti nul-hipotezu H0 – te

slijedno tome odbaciti ili prihvatiti alternativnu hipotezu H1 za postojanje

značajnih razlika izmeĎu opaţenih i očekivanih frekvencija tj. hipotezu da

postoji značajno neslaganje izmeĎu podataka i teorijskog modela. Drugim

riječima, alternativna hipoteza tvrdi da empirijska raspodjela i raspodjela

teorijskog modela nisu iste ili pribliţno iste, da se značajno razlikuju s

vjerojatnošću 1 - P.

χ2-test slaganja ili aproksimacije NE koristi se za male uzorke (N < 20).

Page 12: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Primjer 1. Postpartum (postporoĎajna) depresija (PPD). Dva američka

istraţivača postavljanju različite hipoteze s obzirom na postpartum depresiju

majke (PPD), koja se javlja 4-8 tjedana nakon poroda ili kasnije tijekom prve

godine djetetovog ţivota. Istraţivač A tvrdi da 1/3 majki bude manje depresivna,

1/3 više depresivna, a 1/3 majki ni manje ni više depresivna nakon poroda nego

što su bile prije poroda. Istraţivač B tvrdi da je istraţivač A u krivu i odluči

skupiti podatke za potvrdu svoje hipoteze. Intervjuirano je 60 majki prije i nakon

poroĎaja. Iskusni kliničari poslušali su snimke svih intervjua te su svrstali 60

ispitanica u tri razreda s obzirom na stupanj depresije nakon poroda u odnosu

na stanje prije poroda: ocjena -1 (više depresivne) za 13 ispitanica, ocjena 0 (ni

manje ni više depresivne) za 33 ispitanica, te 1 (manje depresivne) za 14

ispitanica. Koji istraţivač je u pravu? Jesu li majke podjednako zastupljene u

trima razredima, ili je njihova zastupljenost bitno drugačija?

----------------------------------------------------

1) Postavljanje statističke hipoteze:

H0: Majke su podjednako zastupljene u sve tri kategorije, tj. ne postoji značajna

razlika izmeĎu opaţenih i očekivanih frekvencija (razlika je nula).

H1: Majke nisu podjednako zastupljene u sve tri kategorije, tj. postoji značajna

razlika izmeĎu opaţenih i očekivanih frekvencija (razlika nije nula).

2) Izbor testa: χ2-test slaganja.

3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke

značajnosti α = 0.05

Page 13: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

4) Izračunavanje:

N = 60 ---- veličina cijelog uzorka (sve ispitivane majke) = ukupna frekvencija

C = 3 ---- broj razreda broj stupnjeva slobode df = C - 1 = 2

O1 = 13 ---- opaţena frekvencija za poduzorak više postpartum depresivnih

majki

O2 = 33 ---- opaţena frekvencija za poduzorak majki koje nisu ni više ni manje

postpartum depresivne

O3 = 14 --- opaţena frekvencija za poduzorak manje postpartum depresivnih

majki

-provjera ukupne frekvencije: N = O1 + O2 + O3 = 13 + 33 + 14 = 60

-računanje očekivanih frekvencija (pretpostavlja se diskretna uniformna

raspodjela): E1 = E2 = E3 = N/C = 60/3 = 20, gdje su vjerojatnosti

p1 = p2 = p3 = 1/N, tj. prema definiciji je E1 = N×p1, E2 = N×p2, E3 = N×p3

-izrada kontingencijske tablice:

------------------------ Postpartum depresija majki Opaţene frekvencije (Oi) Očekivane frekvencije (Ei)

više depresivne 13 20

ni manje ni više depresivne 33 20

manje depresivne 14 20

Ukupno (N) 60 60

Page 14: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

-računanje χ2-vrijednosti:

a) sloţeniji način (po definiciji):

χ2 = Σi (Oi - Ei)2/Ei = (13 - 20)2/20 + (33 - 20)2/20 + (14 - 20)2/20 = 12.7

b) jednostavniji način (po izvedenom izrazu):

χ2 = Σi (Oi)2/Ei - N = 132/20 + 332/20 + 142/20 - 60 = 12.7

df = C - 1 = 2 ---- broj stupnjeva slobode

U tablici kritičnih vrijednosti χ2-raspodjele (prethodni slajdovi) nalazi se za df = 2

i za α = 0.05 kritična vrijednost χ2* = 5.991. Stoga je P < 0.005.

5) Zaključivanje:

χ2 > χ2* H0 se ne moţe zadrţati – odbacuje se, a H1 se prihvaća.

Odgovor: Opaţene frekvencije postpartum razina depresija majki značajno se

razlikuju od očekivanih (df = 2, χ2 = 12.7, χ2* = 5.991 za α = 0.05, P < 0.005).

Razlika je značajna i na razini α = 0.005 (χ2* = 10.597). Drugim riječima,

hipoteza istraţivača B pokazala se točnom, a hipoteza istraţivača A netočnom.

To znači da majke uglavnom ne podlijeţu jačoj ili slabijoj postpartum depresiji

zbog poroĎaja, a manji broj ih podlijeţe.

Tako na primjer, u jednom članku ispitano je 450 majki [L. I. Alasoom, M. R.

Koura. Predictors of Postpartum Depression in the Eastern Province Capital of

Saudi Arabia. Journal of Family Medicine and Primary Care, 3(2), (2014), 146-

150.], od kojih je 82.2% (370 ispitanica) bilo bez PPD, 9.8% (44 majki) je imalo

umjerenu PPD, a samo 8.0% (36 majki) je imalo tešku PPD.

Razina postpartum depresije je ordinalna varijabla,

Page 15: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Primjer 2. Zastupljenost spolova u uzorku. U jednom istraţivanju nasumično je

odabrano 100 osoba iz populacije koja ima 50% muškaraca i 50% ţena.

Uzorak su činila 44 muškarca i 56 ţena. Jesu li spolovi podjednako zastupljeni

u uzorku, ili je njihova zastupljenost bitno drugačija od očekivane?

----------------------------------------------------

1) Postavljanje statističke hipoteze:

H0: Spolovi su podjednako zastupljeni u uzorku, tj. ne postoji značajna razlika

izmeĎu opaţenih i očekivanih frekvencija (razlika je nula).

H1: Spolovi nisu podjednako zastupljeni u uzroku, tj. postoji značajna razlika

izmeĎu opaţenih i očekivanih frekvencija (razlika nije nula).

2) Izbor testa: χ2-test slaganja.

3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke

značajnosti α = 0.05

4) Izračunavanje:

N = 100 ---- veličina cijelog uzorka = ukupna frekvencija

C = 2 ---- broj razreda broj stupnjeva slobode df = C - 1 = 1

O1 = 44 ---- opaţena frekvencija za poduzorak muškaraca

O2 = 56 ---- opaţena frekvencija za poduzorak ţena

-provjera ukupne frekvencije: N = O1 + O2 = 44 + 56 = 60

-računanje očekivanih frekvencija (pretpostavlja se uniformna raspodjela):

E1 = E2 = N/C = 100/2 = 50

Spol je nominalna varijabla.

Page 16: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

-izrada kontingencijske tablice:

-----------------------------------------------------------------

Spol Opažene frekvencije (Oi) Očekivane frekvencije (Ei)

muški 44 50

ženski 56 50

Ukupno (N) 100 100

-računanje χ2-vrijednosti:

a) sloţeniji način (po definiciji):

χ2 = Σi (Oi - Ei)2/Ei = (44 - 50)2/50 + (56 - 50)2/50 = 1.44

b) jednostavniji način (po izvedenom izrazu):

χ2 = Σi (Oi)2/Ei - N = 442/50 + 562/50 - 100 = 1.44

df = C - 1 = 1 ---- broj stupnjeva slobode

U tablici kritičnih vrijednosti χ2-raspodjele (prethodni slajdovi) nalazi se za df = 1

i za α = 0.05 kritična vrijednost χ2* = 3.841. Stoga je P > 0.05.

5) Zaključivanje:

χ2 < χ2* H0 se ne moţe odbaciti – zadrţava se, a H1 se odbacuje.

Odgovor: Opaţene frekvencije spolova u danom uzorku značajno se ne

razlikuju od očekivanih (df = 1, χ2 = 1.44, χ2* = 3.841 za α = 0.05, P > 0.05).

Razlika nije značajna ni na razini α = 0.10 (χ2* = 2.706), što znači da je i

P > 0.10. Drugim riječima, spolovi su podjednako zastupljeni u uzorku, kao što

bi se i očekivalo na njihovu zastupljenosti u populaciji.

Page 17: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Primjer 3. Promjena etničke strukture. Pet godina nakon zadnjeg popisa

stanovništva u jednoj saveznoj drţavi u SAD nasumično je odabran uzorak za

istraţivanje od 2500 ispitanika sa slijedećom etničkom strukturom:

Skupina Broj

-----------------------------------

Bijelci 1732

Crnci 538

Izvorni Amerikanci 32

Hispanoamerikanci 42

Azijati 133

Ostali 23

-----------------------------------

Udio etničkih skupina u spomenutom popisu stanovništva je bio:

Skupina Udio

--------------------------------------

Bijelci 0.743

Crnci 0.216

Izvorni Amerikanci 0.012

Hispanoamerikanci 0.012

Azijati 0.008

Ostali 0.009

--------------------------------------

Page 18: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Provjeriti na temelju uzorka ima li dovoljno dokaza na razini značajnosti 1% da

se raspodjela etničkih skupina promijenila od zadnjeg popisa stanovništva.

----------------------------------------------------

1) Postavljanje statističke hipoteze:

H0: Etnička zastupljenost se nije značajno promijenila u zadnjih pet godina.

H1: Etnička zastupljenost se je značajno promijenila u zadnjih pet godina.

2) Izbor testa: χ2-test slaganja.

3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke

značajnosti α = 0.01

4) Izračunavanje:

N = 2500 ---- veličina cijelog uzorka = ukupna frekvencija

C = 6 ---- broj razreda broj stupnjeva slobode df = C - 1 = 5

-opaţene apsolutne frekvencije su dane u tablici zadatka: zbroj je točno 2500

-računanje očekivanih frekvencija prema prethodno utvrĎenoj raspodjeli

popisom stanovništva: etnička skupina je nominalna varijabla

Ei = N × fr,i = ukupan broj × udio (relativna frekvencija)

E1 = 2500 × 0.743 = 1857.5

E2 = 2500 × 0.216 = 540

E3 = 2500 × 0.012 = 30

E4 = 2500 × 0.012 = 30

E5 = 2500 × 0.008 = 20

E6 = 2500 × 0.009 = 22.5

Page 19: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

-izrada kontingencijske tablice:

-----------------------------------------------------------------

Etnička skupina Opažene frekvencije (Oi) Očekivane frekvencije (Ei)

Bijelci 1732 1857.5

Crnci 538 540

Izvorni Amerikanci 32 30

Hispanoamerikanci 42 30

Azijati 133 20

Ostali 23 22.5

Ukupno (N) 2500 2500

-računanje χ2-vrijednosti na jednostavniji način (po izvedenom izrazu):

χ2 = Σi (Oi)2/Ei - N = 17322/1857.5 + 5382/540 + 322/30 + 422/30 + 1332/20 +

+ 232/22.5 - 2500 = 651.88113 ≈ 651.881

df = C - 1 = 5 ---- broj stupnjeva slobode

U tablici kritičnih vrijednosti χ2-raspodjele (slika na idućem slajdu) nalazi se za

df = 5 i za α = 0.01 kritična vrijednost χ2* = 15.086. Stoga je P < 0.001.

5) Zaključivanje:

χ2 > χ2* H0 se ne moţe zadrţati – odbacuje se, a H1 se prihvaća.

Odgovor: Opaţene frekvencije etničkih skupina značajno se razlikuju od onih

prije pet godina (df = 5, χ2 = 1651.881, χ2* = 15.086 za α = 0.01, P < 0.001).

Dakle, etnička struktura savezne drţave se promijenila u zadnjih pet godina.

Page 20: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Primjer 4. Koncentracija α-1-antitripsina. Kod 135 ţena starosti od 46 do 65

godina odreĎena je koncentracija (u g/L) α-1-antitripsina. Dobiveni podaci

ureĎeni su u klasne intervale i prikazani kao raspodjela frekvencija, a zatim su

iz izračunate srednje vrijednosti i standardne devijacije izračunate očekivane

frekvencije za normalnu raspodjelu. Pokazati da li je dobijena raspodjela

normalna. Podaci za opaţene i očekivane frekvencije su u tablici (idući slajd).

----------------------------------------------------

1) Postavljanje statističke hipoteze:

H0: Dobivene frekvencije slijede očekivanu normalnu raspodjelu.

H1: Dobivene frekvencije ne slijede očekivanu normalnu raspodjelu.

-dobivena vrijednost χ2 = 651.881

veća je od bilo koje granične

vrijednost u tablici χ2-raspodjele,

stoga se uzima da je P < 0.001.

Desni krak raspodjele od

granične vrijednosti znači

vjerojatnost α da je hipoteza H0

točna. Lijevo od te granične

vrijednosti površina ispod krivulje

je jednaka vjerojatnosti 1 - α, tj.

vjerojatnost da je H1 točna.

Page 21: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

2) Izbor testa: χ2-test

slaganja. Klasni interval

metričke varijable je

ordinalna varijabla.

3) Izbor testnog kriterija:

kritična vrijednost za dani df i

razinu stat. značaj. α = 0.01

4) Izračunavanje:

N = 135 ---- veličina uzorka

C = 8 ---- broj razreda

broj st. slob. df = C - 1 = 7

-zbroj svih opaţenih

frekvencija je 135

-zbroj svih očekivanih

frekvencija je točno 135

-računanje χ2-vrijednosti na jednostavniji način (po izvedenom izrazu):

χ2 = Σi (Oi)2/Ei - N = 22/2 + 102/9 + 272/24 + 412/38 + 312/36 + 162/19 + 62/6 +

22/1 - 135 = 2.8910819 ≈ 2.891 U tablici χ2-raspodjele nalazi se za df = 7 i za

α = 0.05 kritična vrijednost χ2* = 14.067. Stoga je P > 0.05.

5) Zaključivanje: χ2 < χ2* H0 se zadrţava – prihvaća se, a H1 se odbacuje.

Odgovor: Empirijska raspodjela ne razlikuje se značajno od normalne

raspodjele (df = 7, χ2 = 2.891, χ2* = 14.067 za α = 0.05, P > 0.05).

Page 22: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Primjer 5. Učestalost prometnih nesreća. U jednom tjednu zabiljeţen je slijedeći

broj prometnih nesreća na jednoj opasnoj cesti, posljedica kojih je bila hitan

transport unesrećenih u obliţnju bolnicu:

Dan u tjednu Broj nesreća

------------------------------------------

ponedjeljak 4

utorak 2

srijeda 2

četvrtak 3

petak 6

subota 5

nedjelja 7

------------------------------------------

Što se moţe zaključiti iz ove empirijske raspodjele? Jesu li frekvencije

prometnih nesreća podjednake kroz taj tjedan?

----------------------------------------------------

1) Postavljanje statističke hipoteze:

H0: Broj prometnih nesreća je podjednak kroz taj tjedan.

H1: Broj prometnih nesreća je podjednak kroz taj tjedan.

2) Izbor testa: χ2-test slaganja.

3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke

značajnosti α = 0.05 uzima se ova vrijednost ako nije navedena neka druga

Page 23: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

4) Izračunavanje:

N = O1 + O2 + … + O7 = 28 ---- veličina cijelog uzorka = ukupna frekvencija

C = 7 ---- broj razreda = broj dana u tjednu broj stup. slobode df = C - 1 = 6

-opaţene apsolutne frekvencije su dane u tablici zadatka: zbroj je točno 2500

-računanje očekivanih frekvencija prema uniformnoj raspodjeli – da su

frekvencije kroz tjedan potpuno jednake: E1 = E2 = … = E7 = N/C = 28/7 = 4.0

-izrada kontingencijske tablice: dan u tjednu je ordinalna varijabla

-----------------------------------------------------------------

Dan u tjednu Opažene frekvencije (Oi) Očekivane frekvencije (Ei)

ponedjeljak 4 4

utorak 2 4

srijeda 2 4

četvrtak 3 4

petak 6 4

subota 5 4

nedjelja 7 4

Ukupno (N) 28 28

-računanje χ2-vrijednosti na jednostavniji način (po izvedenom izrazu):

χ2 = Σi (Oi)2/Ei - N = 42/4 + 22/4 + 22/4 + 32/4 + 62/4 + 52/4 + 72/4 - 28 = 7.75

U tablici χ2-raspodjele nalazi se za df = 6 i za α = 0.05 kritična vrijednost

χ2* = 12.592. Stoga je P > 0.05.

Page 24: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

5) Zaključivanje: χ2 < χ2* H0 se ne moţe odbaciti - prihvaća se, a H1 se ne

moţe zadrţati - odbacuje se.

Odgovor: Frekvencije prometnih nesreća kroz taj tjedan na cesti ne razlikuje se

značajno po danima (df = 6, χ2 = 7.75, χ2* = 12.592 za α = 0.05, P > 0.05).

Primjer 6. Autosomno recesivno nasljedne bolesti. U genetičkom testiranju na

jednu autosomno recesivnu nasljednu bolest sudjelovalo je 100 ispitanika s

njihovim roditeljima. Dobivene su slijedeće učestalosti tih 100 ispitanika za

bolesne osobe (kombinacija alela ƇƇ), zdrave nositelje bolesti (kombinacije

alela ƇC) i zdrave nenositelje (kombinacija alela CC):

Genotip Učestalost

---------------------------------

ƇƇ 26

ƇC 45

CC 29

---------------------------------

Shema s primjerom genetičkog nasljeĎivanja dana je na idućem slajdu.

Teorijske relativne frekvencije prema toj shemi jesu: 25% za ƇƇ, 50% za ƇC i

25% za CC. Jesu li razlike izmeĎu empirijske i teorijske raspodjele značajne, tj.

obaraju li ove razlike ili potvrĎuju Hardy-Weinbergov zakon? Ovaj zakon je

zakon genetičke ravnoteţe populacije, prema kojemu se relativne frekvencije

alela odreĎenog lokusa odrţavaju na istoj razini u nizu sukcesivnih generacija

ako nisu prisutni drugi evolucijski čimbenici.

Page 25: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Shema

autosomno

recesivnog

naslijeĎivanja:

Co – zdrav gen

oca

Cm – zdrav gen

majke

Ƈo – oštećeni

gen oca

Ƈm – oštećeni

gen majke

Postoji osam

kombinacija

roditeljskih

gena:

ƇoCm (sin, kćer)

CoƇm (sin, kćer)

ƇoCm (sin, kćer)

ƇoƇm (sin, kćer)

Page 26: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

----------------------------------------------------

1) Postavljanje statističke hipoteze:

H0: Razlike u frekvencijama nisu značajne, tj. vrijedi spomenuti genetički zakon.

H1: Razlike u frekvencijama jesu značajne - ne vrijedi spomenuti genet. zakon.

2) Izbor testa: χ2-test slaganja.

3) Izbor testnog kriterija: kritična vrijednost za dani df i α = 0.05

4) Izračunavanje: N = O1 + O2 + O3 = 100, C = 3, df = C - 1 = 2

-računanje očekivanih frekvencija prema teorijskim relativnim frekvencijama

(vjerojatnostima): E1 = E3 = 0.25 × 100 = 25, E2 = 0.50 × 100 = 50

-izrada kontingencijske tablice: genotip je nominalna varijabla

Genotip Opažene frekvencije (Oi) Očekivane frekvencije (Ei)

ƇƇ 26 25

ƇC 45 50

CC 29 25

Ukupno (N) 100 100

-računanje χ2-vrijednosti na jednostavniji način (po izvedenom izrazu):

χ2 = Σi (Oi)2/Ei - N = 262/25 + 452/50 + 292/25 - 100 = 1.18 U tablici χ2-rasp.

za df = 2 i za α = 0.05 je χ2* = 5.991. Stoga je P > 0.05.

5) Zaključivanje: χ2 < χ2* H0 se prihvaća, a H1 se odbacuje.

Odgovor: Razlike frekvencija nisu značajne (df = 2, χ2 = 1.18, χ2* = 15.991 za

α = 0.05, P > 0.05), što potvrĎuje valjanost spomenutog genetičkog zakona.

Page 27: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

III.3.3. χ2-test homogenosti skupa i χ2-test nezavisnosti dviju varijabli

χ2-test homogenosti skupa je čest test, a χ2-test nezavisnosti dviju

varijabli nije čest u biostatistici. Izračunavanja su jednaka za oba testa, ali

su razlike u shvaćanju skupa podataka, u statističkoj hipotezi i

interpretaciji rezultata. Uglavnom se koriste za kategorijske varijable –

nominalne i ordinalne varijable, a rjeđe za druge tipove varijabli koje se

shvaćaju kao ordinalne ili se transformiraju u ordinalnu varijablu (vrijede

ista pravila kao kod χ2-testa slaganja ili aproksimacije).

Ovdje postoje dva statistička obiljeţja od interesa, tj. 2 varijable izmjerene za

statistički skup koji se moţe shvatiti na više načina (kao jedan uzorak, ili kao

dva i više uzoraka). Zato kontingencijska tablica ima oblik matrice, i ona se

posebno radi za opaţene frekvencije i za očekivane frekvencije (idući slajd).

Brojevi se upisuju u zelene ćelije, a sume se provjeravaju izvan tablice (ţuto).

χ2-test homogenosti skupa (Engl. chi-square test for/of homogeneity, chi-

square test for homogeneity of populations, chi-square test for homogeneity of

proportions): cijeli statistički skup shvaća se kao cijela populacija, a sastoji se

od dva ili više podskupova tj. uzoraka ili populacija – ova podjela skupa na

klase (razrede, kategorije) je tzv. vertikalna kategorijska varijabla A u

kontingencijskoj tablici (idući slajd). Varijabla B je svojstvo čija nas raspodjela

zanima po klasama varijable A – podjela horizontalne kategorijske varijable B

na klase ispitivanog svojstva vidljiva je u kontingencijskoj tablici (idući slajd).

Page 28: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Varijabla B

Varijabla A razred B1 razred B2 razred B3 ... razred BC2 Ukupno

razred A1 O11 O12 O13 ... O1C2 A1

razred A2 O21 O22 O23 ... O2C2 A2

razred A3 O31 O32 O33 ... O3C2 A3

... ... ... ... ... ... ...

razred AC1 OC11 OC12 OC13 ... OC1C2 AC1

Ukupno B1 B2 B3 ... BC2 T (N)

Varijabla B

Varijabla A razred B1 razred B2 razred B3 ... razred BC2 Ukupno

razred A1 E11 E12 E13 ... E1C2 A1

razred A2 E21 E22 E23 ... E2C2 A2

razred A3 E31 E32 E33 ... E3C2 A3

... ... ... ... ... ... ...

razred AC1 EC11 EC12 EC13 ... EC1C2 AC1

Ukupno B1 B2 B3 ... BC2 T (N)

Kontingencijska tablica očekivanih frekvencija (Eij) tipa C1×C2:

Kontingencijska tablica opaţenih frekvencija (Oij) tipa C1×C2:

Page 29: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Ovim testom se provjerava postoje li statistički značajne razlike unutar skupa tj.

izmeĎu dvaju ili više uzoraka. Ako takve razlike postoje, skup je nehomogen, a

ako razlike ne postoje onda je skup homogen. Dakle, kao i u slučaju χ2-testa

slaganja, i ovdje se usporeĎuju opaţene i očekivane frekvencije, koje se

definiraju, odreĎuju i izračunavaju na isti način. No kod χ2-testa slaganja radilo

se o jednodimenzionalnoj empirijskoj raspodjeli jer je postojala samo jedna

varijabla. U slučaju χ2-testa homogenosti postoje dvije varijable, pa je teorijska

raspodjela dvodimenzionalna, a empirijska raspodjela moţe imati i više

dimenzija ako uzorci predstavljaju meĎusobno različite raspodjele i još k tome

različite raspodjele u odnosu na teorijsku.

Statistička hipoteza je:

H0: Ne postoje značajne razlike u raspodjeli uzoraka tj. skup je homogen (svi

uzorci imaju istu pretpostavljenu, očekivanu raspodjelu).

H1: Postoje značajne razlike u raspodjeli uzoraka tj. skup je nehomogen (svi

uzorci nemaju istu pretpostavljenu, očekivanu raspodjelu - barem jedan uzorak

ju nema).

Najmanja kontingencijska tablica ima dimenzije 2×2, tj. tipa je 2×2. Ako je broj

klasa za varijablu A jednak C1, a broj klasa za varijablu B je C2, onda

kontingencijska tablica je tipa C1×C2. Zbrojevi po razredima varijable A jesu A1,

A2, A3, …, a zbrojevi po razredima varijable B jesu B1, B2, B3, … Ukupan zbroj

po svim Ai ili Bj je jednak N (u čestoj oznaci i T). Element kontingencijske

tablice Oij ili Eij pripada i-tom razredu varijable A i j-tom razredu varijable B.

Page 30: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Orijentacija kontingencijske tablice tj. izbor dviju varijabli A i B:

-bilo koji izbor dviju varijabli za orijentaciju tablice, tj. koja od dviju varijabli bude

A a koja B, ne utječe na χ2-vrijednost i rezultat statističkog testa, s Yatesovom

korekcijom ili bez korekcije, neovisno takoĎer o tipu tablice;

-preporučuje se za vertikalnu varijablu A uzeti varijablu koja je nezavisna

varijabla, kontrolna varijabla, ili je moguće da bude nezavisna varijabla ili više

nezavisna nego druga varijabla;

-preporučuje se za horizontalnu varijablu B uzeti varijablu koja je zavisna, nije

kontrolna kada je druga kontrolna, ili je moguće da bude zavisna varijabla ili

više zavisna nego druga varijabla;

-ustaljena orijentacija tablice omogućuje bolje razumijevanje i interpretaciju

statističkog testa.

χ2-test nezavisnosti dviju varijabli (Engl. chi-square test for/of

independence): cijeli statistički skup shvaća se kao jedinstvena populacija ili

uzorak, a sastoji se od dva ili više podskupova tj. poduzoraka – ova podjela

skupa na klase (razrede, kategorije) varijabli A i B je ista kao za χ2-test

homogenosti. Ovim testom se provjerava postoji li statistički značajna veza tj.

zavisnost izmeĎu dviju varijabli koje nisu korelirane ili sparene, drugim riječima

jesu li dvije takve varijable meĎusobno zavisne ili nezavisne. Takva provjera

nezavisnosti moguća je samo kada se ispituju dva obiljeţja istog uzorka.

Često je teško utvrditi što je uzorak a što ispitivani skup, tako da je za mnoge

skupove podataka moguće obaviti i χ2-test homogenosti i χ2-test nezavisnosti.

Page 31: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Statistička hipoteza je:

H0: Dvije kategorijske varijable meĎusobno su nezavisne.

H1: Dvije kategorijske varijable nisu meĎusobno nezavisne.

χ2-test homogenosti skupa vrlo je čest u biostatistici, dok χ2-test

nezavisnosti dviju varijabli i nije baš čest.

Općenito se svaki običan χ2-test tj. χ2-test bez ikakve korekcije zove i

Pearsonov χ2-test (Engl. Pearson’s χ2-test).

U slučaju Yatesove korekcije, χ2-test se zove Yatesov χ2-test ili χ2-test s

Yatesovom korekcijom (Engl. Yates’s χ2-test, χ2-test with Yates’s correction).

Yatesovu korekciju preporučeno je učiniti u slučajevima da:

1- kontingencijska tablica ima dimenzije 2×2, dok je N izmeĎu 20 i 40 ili barem

jedna ćelija sadrţi očekivanu frekvenciju koja je manja od 5;

2- više od 20% ćelija u kontingencijskoj tablici većih dimenzija sadrţi očekivane

frekvencije koje su manje od 5 (ili se neke ćelije spajaju da se ovo izbjegne);

3- ukupna frekvencija N je manja od 20 tj. radi se o malom skupu.

U slučaju da jedna ili više ćelija sadrži nulu kao očekivanu frekvenciju,

onda se χ2-test nikako ne može izvesti. Prilikom određivanja opaženih

frekvencija za bilo koji χ2-test, svaka statistička jedinica (osoba, ispitanik,

bolesnik itd.) smije se pojaviti samo jednom a ne dvaput ili više puta.

Za male skupove, umjesto χ2-testa izvodi se Fisherov egzaktni test (Engl.

Fisher’s exact test, koji nije predmet ovog kolegija).

Page 32: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Primjer 1A. Liječenje abdominalne boli. U slijedećoj tablici navedeni su rezultati

(frekvencije) za 154 bolesnika s abdominalnom boli, od kojih je jedna grupa bila

liječena pinaverij bromidom (dvije tablete dnevno), a druga placebom.

Bol prisutna

Terapija DA NE Ukupno

pinaverij bromid 6 57 63

placebo 30 61 91

Ukupno 36 118 154

Testirati efikasnost soli (pinaverij bromida) u liječenju abdominalne boli

upotrebom χ2-testa.

----------------------------------------------------

1) Postavljanje statističke hipoteze:

H0: Grupe s različitim terapijama se bitno ne razlikuju u frekvencijama, tj. razlike

izmeĎu opaţenih i očekivanih frekvencija nisu bitne (nisu bitno različite od

nule).

H1: Grupe s različitim terapijama se bitno razlikuju u frekvencijama, tj. razlike

izmeĎu opaţenih i očekivanih frekvencija jesu bitne (bitno su različite od nule).

2) Izbor testa: χ2-test homogenosti skupa, uz Yatesovu korekciju jer se radi o

kontingencijskoj tablici tipa 2×2.

Page 33: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Broj uzoraka: 2 uzorka – uzorak bolesnika liječen pinaverij bromidnom

terapijom i uzorak bolesnika liječen placebo terapijom. Skup = 2 uzorka

Varijable (nominalne): vrsta terapije - nezavisna varijabla s dvije vrijednosti

(pinaverij bromid i placebo), prisutnost boli – zavisna varijabla s dvije vrijednosti

(DA i NE)

3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke

značajnosti α = 0.05 uzima se ova vrijednost ako nije navedena neka druga

df = (broj redova - 1) × (broj stupaca - 1) = (2 - 1) × ( 2 - 1) = 1

4) Izračunavanje: T = 154 ---- ukupna frekvencija

A1 = 63, A2 = 91 --- frekvencije nezavisne varijable (vrsta terapije)

B1 = 36, B2 = 118 --- frekvencije zavisne varijable (prisutnost boli)

-opaţene apsolutne frekvencije su dane u kontingencijskoj tablici zadatka

-računanje očekivanih frekvencija prema uniformnoj raspodjeli za svaku

varijablu: općenito je Eij = Ai Bj /T tj. Eij : Ai = Bj : T odnosno

Eij : Bj = Ai : T, kako slijedi:

E11:36 = 63:154 tj. E11:63= 36:154 E11 = 36×63/154 = 14.727273 ≈ 14.73

E12:118 = 63:154 tj. E12:63= 118:154 E12 = 118×63/154 = 48.272727 ≈ 48.27

E21:36 = 91:154 tj. E21:91= 36:154 E21 = 36×91/154 = 21.272727 ≈ 21.27

E22:118 = 63:154 tj. E22:63= 118:154 E22 = 118×91/154 = 69.727273 ≈ 69.73

Najlakše je koristiti opću formulu Eij = Ai Bj /T

-izrada kontingencijske tablice za očekivane frekvencije (na idućem slajdu):

-----------------------------------------------------------------

Page 34: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Bol prisutna

Terapija DA NE Ukupno

pinaverij bromid 14.73 48.27 63

placebo 21.27 69.73 91

Ukupno 36 118 154

-Pearsonov ili običan χ2-test:

a) računanje χ2-vrijednosti na sloţeniji način (po definiciji):

χ2 = Σi (Oi - Ei)2/Ei = (6 - 14.73)2/14.73 + (57 - 48.27)2/48.27 +

+ (30 - 21.27)2/21.27 + (61 - 69.73)2/69.73 = 11.428968 ≈ 11.429

b) računanje χ2-vrijednosti na jednostavniji način (po izvedenom izrazu):

χ2 = Σi (Oi)2/Ei - N = 62/14.73 + 572/48.27 + 302/21.27 + 612/69.73 - 154 =

= 11.428968 ≈ 11.429

-Yatesov χ2-test ili χ2-test s Yatesovom korekcijom:

χ2 = Σi (|Oi - Ei| - 0.5)2/Ei = (|6 - 14.73| - 0.5)2/14.73 + (|57 - 48.27| - 0.5)2/48.27 +

+ (|30 - 21.27| - 0.5)2/ 21.27 + (|61 - 69.73| -0.5)2/69.73 = 10.157298 ≈ 10.157

U tablici χ2-rasp. za df = 1 i α = 0.05 je χ2* = 3.841. Stoga je P < 0.002.

5) Zaključivanje: χ2 > χ2* H0 se odbacuje, a H1 se prihvaća.

Odgovor: Razlike opaţenih i očekivanih frekvencija su značajne (df = 1,

χ2* = 3.841 za α = 0.05; bez korekcije - χ2 = 11.429, P < 0.001; s korekcijom - χ2

= 10.157, P < 0.002), što potvrĎuje učinkovitost pinaverij bromida.

Page 35: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Primjer 1B. Isti problem (primjer 1A), s istim podacima. Zadatak je χ2-testom

utvrditi jesu li dvije kategorijske varijable (vrsta terapije i prisutnost boli)

meĎusobno nezavisne. Izračunavanje je istovjetno, samo je interpretacija

rezultata drugačija.

----------------------------------------------------

U odnosu na prethodni primjer 1A, razlike postoje svega na nekoliko mjesta,

dok je računski postupak u svemu isti:

-1) Postavljanje statističke hipoteze:

H0: Dvije kategorijske varijable meĎusobno su nezavisne.

H1: Dvije kategorijske varijable nisu meĎusobno nezavisne.

-2) Izbor testa: χ2-test nezavisnosti dviju varijabli, uz Yatesovu korekciju jer se

radi o kontingencijskoj tablici tipa 2×2. Skup od 154 ispitanika moţe se smatrati

jednim uzorkom koji je izvučen iz iste populacije (svi bolesnici imaju

abdominalnu bolest, samo se liječe na dva različita načina).

-5) Zaključivanje: χ2 > χ2* H0 se ne moţe zadrţati – odbacuje se, a H1 se ne

moţe odbaciti - prihvaća se. Vrijednost χ2 odreĎuje razinu meĎusobne

povezanosti dviju varijabli – što je ova vrijednost veća varijable su jače

povezane tj. manje neovisne.

-Odgovor: Dvije varijable su značajno zavisne (df = 1, χ2* = 3.841 za α = 0.05;

bez korekcije - χ2 = 11.429, P < 0.001; s korekcijom - χ2 = 10.157, P < 0.002),

što potvrĎuje učinkovitost pinaverij bromida. Drugim riječima, pinaverij bromid

je bolja terapija, a placebo slabija terapija za abdominalnu bol.

Page 36: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Primjer 2A. Liječenje Hodgkinovog limfoma. U slijedećoj tablici navedeni su

rezultati (frekvencije) za 140 bolesnika s Hodgkinovim limfomom, od kojih je

jedna grupa bila liječena kemoterapijom, a druga radioterapijom.

Odgovor na terapiju

Terapija potpun djelomičan nikakav Ukupno

kemoterapija 50 20 10 80

radioterapija 20 20 20 60

Ukupno 70 40 30 140

Testirati efikasnost vrsta terapija u liječenju Hodgkinovog limfoma upotrebom

χ2-testa.

----------------------------------------------------

1) Postavljanje statističke hipoteze:

H0: Grupe s različitim terapijama se bitno ne razlikuju u frekvencijama, tj. razlike

izmeĎu opaţenih i očekivanih frekvencija nisu bitne (nisu bitno različite od

nule).

H1: Grupe s različitim terapijama se bitno razlikuju u frekvencijama, tj. razlike

izmeĎu opaţenih i očekivanih frekvencija jesu bitne (bitno su različite od nule).

2) Izbor testa: χ2-test homogenosti skupa, bez Yatesove korekciju jer se radi o

kontingencijskoj tablici tipa 2×3, s velikom ukupnom frekvencijom

(T = 140 > 40) i velikim brojem u svakoj ćeliji (10 - 50). Skup = 2 uzorka

Page 37: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Broj uzoraka: 2 uzorka – uzorak bolesnika liječen kemoterapijom i uzorak

bolesnika liječen radioterapijom.

Varijable: vrsta terapije (nominalna) - nezavisna varijabla s dvije vrijednosti

(kemoterapija i radioterapija), odgovor bolesti na terapiju (ordinalna) - zavisna

varijabla s tri vrijednosti (potpuna, djelomična i nikakva)

3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke

značajnosti α = 0.05 uzima se ova vrijednost ako nije navedena neka druga

df = (broj redova - 1) × (broj stupaca - 1) = (3 - 1) × (2 - 1) = 2

4) Izračunavanje: T = 140 ---- ukupna frekvencija

A1 = 80, A2 = 60 --- frekvencije nezavisne varijable (vrsta terapije)

B1 = 70, B2 = 40, B3 = 30 --- frekvencije zavisne varijable (odgovor na terapiju)

-opaţene apsolutne frekvencije su dane u kontingencijskoj tablici zadatka

-računanje očekivanih frekvencija prema uniformnoj raspodjeli za svaku

varijablu: Eij = Ai Bj /T

E11 = 70×80/140 = 40

E12 = 40×80/140 = 22.857143 ≈ 23

E13 = 30×80/140 = 17.142857 ≈ 17

E21 = 70×60/140 = 30

E22 = 40×60/140 = 17.142857 ≈ 17

E23 = 30×60/140 = 12.857143 ≈ 13

-izrada kontingencijske tablice za očekivane frekvencije (na idućem slajdu):

-----------------------------------------------------------------

Page 38: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Odgovor na terapiju

Terapija potpun djelomičan nikakav Ukupno

kemoterapija 40 23 17 80

radioterapija 30 17 13 60

Ukupno 70 40 30 140

-Pearsonov ili običan χ2-test:

a) računanje χ2-vrijednosti na sloţeniji način (po definiciji):

χ2 = Σi (Oi - Ei)2/Ei = (50 - 40)2/40 + (20 - 23)2/23 + (10 - 17)2/17 + (20 - 30)2/30 +

(20 - 17)2/17 + (20 - 13)2/13 = 13.405633 ≈ 13.406

b) računanje χ2-vrijednosti na jednostavniji način (po izvedenom izrazu):

χ2 = Σi (Oi)2/Ei - N = 502/40 + 202/23 + 102/17 + 202/30 + 202/17 + 202/13 - 140 =

= 13.405633 ≈ 13.406

U tablici χ2-rasp. za df = 2 i α = 0.05 je χ2* = 5.991. Stoga je P < 0.002.

5) Zaključivanje: χ2 > χ2* H0 se odbacuje, a H1 se prihvaća.

Odgovor: Razlike izmeĎu opaţenih i očekivanih frekvencija su značajne (df = 2,

χ2* = 5.991 za α = 0.05; χ2 = 13.406, P < 0.002), što potvrĎuje bitne razlike

meĎu terapijama. Kemoterapija se pokazala učinkovitijom od radioterapije.

Page 39: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Primjer 2B. Isti problem (primjer 2A), s istim podacima. Zadatak je χ2-testom

utvrditi jesu li dvije kategorijske varijable (vrsta terapije i odgovor Hodgkinovog

limfoma na terapiju) meĎusobno nezavisne. Izračunavanje je istovjetno, samo

je interpretacija rezultata drugačija.

----------------------------------------------------

U odnosu na prethodni primjer 2A, razlike postoje svega na nekoliko mjesta,

dok je računski postupak u svemu isti:

-1) Postavljanje statističke hipoteze:

H0: Dvije kategorijske varijable meĎusobno su nezavisne.

H1: Dvije kategorijske varijable nisu meĎusobno nezavisne.

-2) Izbor testa: χ2-test nezavisnosti dviju varijabli. Skup od 140 ispitanika moţe

se smatrati jednim uzorkom koji je izvučen iz iste populacije (svi bolesnici imaju

Hodgkinov limfom, samo se liječe na dva različita načina).

-5) Zaključivanje: χ2 > χ2* H0 se ne moţe zadrţati – odbacuje se, a H1 se ne

moţe odbaciti - prihvaća se. Vrijednost χ2 odreĎuje razinu meĎusobne

povezanosti dviju varijabli – što je ova vrijednost veća varijable su jače

povezane tj. manje neovisne.

-Odgovor: Dvije varijable su značajno zavisne (df = 2, χ2* = 5.991 za α = 0.05,

χ2 = 11.429, P < 0.002), što potvrĎuje učinkovitost kemoterapije u odnosu na

radioterapiju. Drugim riječima, kemoterapija je bolja terapija, a radioterapija je

slabija terapija za Hodgkinov limfom.

Page 40: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Primjer 3. Odnos astme i gripe. U jednom eksperimentu se provjeravao odnos

izmeĎu astmatične krize i pojave gripe. Ispitano je 150 nasumično odabrana

djeteta u domu zdravlja u jednoj gradskoj četvrti. Dobiveni su slijedeći podaci o

frekvencijama za vremensko razdoblje od jednog tjedna:

Astma/Gripa DA NE

DA 27 34

NE 42 47

Jesu li astmatični napadi i pojava gripe meĎusobno nezavisni? Uzeti α = 4%.

----------------------------------------------------

1) Postavljanje statističke hipoteze:

H0: Dvije kategorijske varijable meĎusobno su nezavisne.

H1: Dvije kategorijske varijable nisu meĎusobno nezavisne.

2) χ2-test nezavisnosti dviju varijabli. Yatesova korekcija je potrebna jer se radi

od kontingencijskoj tablici tipa 2×2, s velikom ukupnom frekvencijom i velikim

brojem u svakoj ćeliji. Skup = 1 uzorak

Broj uzoraka: 1 uzorak – djeca koja imaju ili nemaju astmatičnu krizu i/ili gripu.

Varijable: astmatična kriza (nominalna) - varijabla s dvije vrijednosti (DA i NE),

pojava gripe (nominalna) - varijabla s dvije vrijednosti (DA i NE). Sama astma je

nezavisna varijabla u odnosu na gripu, pa je pogodnije astmatične napade

staviti formalno na mjesto nezavisne varijable tj. u vertikalan poloţaj, a pojavu

gripe u horizontalan poloţaj.

Page 41: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke

značajnosti α = 0.04

df = (broj redova - 1) × (broj stupaca - 1) = (2 - 1) × (2 - 1) = 1

4) Izračunavanje:

-puna kontingencijska tablica opaţenih frekvencija, na osnovu danih podataka:

Pojava gripe

Astmatična kriza DA NE Ukupno

DA 27 34 61

NE 42 47 89

Ukupno 69 81 150

T = 150 ---- ukupna frekvencija

A1 = 61, A2 = 89 --- frekvencije formalno nezavisne varijable (astmatična kriza)

B1 = 69, B2 = 81 --- frekvencije formalno zavisne varijable (pojava gripe)

-računanje očekivanih frekvencija prema uniformnoj raspodjeli: Eij = Ai Bj /T

E11 = 61×69/150 = 28.06

E12 = 61×81/150 = 32.94

E21 = 89×69/150 = 40.94

E22 = 89×81/150 = 48.06

-izrada kontingencijske tablice za očekivane frekvencije (na idućem slajdu):

-----------------------------------------------------------------

Page 42: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Pojava gripe

Astmatična kriza DA NE Ukupno

DA 28.06 32.94 61

NE 40.94 48.06 89

Ukupno 69 81 150

-Pearsonov ili običan χ2-test:

računanje χ2-vrijednosti po definiciji:

χ2 = Σi (Oi - Ei)2/Ei = (27 - 28.06)2/28.06 + (34 - 32.94)2/32.94 +

+ (42 - 40.94)2/40.94 + (47 - 48.06)2/48.06 = 0.1249774 ≈ 0.125

-Yatesov χ2-test ili χ2-test s Yatesovom korekcijom:

χ2 = Σi (|Oi - Ei| - 0.5)2/Ei = (|27 - 28.06| - 0.5)2/28.06 + (|34 - 32.94| - 0.5)2/32.94

+ (|42 - 40.94| - 0.5)2/40.94 + (|47 - 48.06| -0.5)2/48.06 = 0.0348816 ≈ 0.034

U tablici χ2-rasp. za df = 1 i α = 0.04 je χ2* = 4.218. Stoga je P > 0.04.

5) Zaključivanje: χ2 < χ2* H0 se ne moţe odbaciti pa se prihvaća, a H1 se ne

moţe zadrţati pa se odbacuje.

Odgovor: Za ispitan uzorak djece, dvije varijable nisu značajno zavisne (df = 1,

χ2* = 4.218 za α = 0.04; bez korekcije - χ2 = 0.125, P > 0.04; s korekcijom –

χ2 = 0.034, P > 0.04). Drugim riječima, astmatični napadi nisu uzrokovani ili

pojačani gripom, niti oni utječu na pojavnost gripe.

Page 43: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Primjer 4. Liječenje HIV pozitivnih osoba. Provedeno je istraţivanje o kvaliteti

liječenja HIV pozitivnih osoba u sustavu javnog zdravstva u Brazilu. U gradu A,

nasumično je odabrano 150 HIV pozitivnih osoba, a u gradu B 200 HIV

pozitivnih osoba. Koristeći podatke dane u slijedećoj tablici, moţe li se tvrditi da

vlada isto mišljenje u oba grada, uz α = 5%?

Grad/Liječenje dobro zadovoljavajuće loše

A 73 37 40

B 94 61 45

----------------------------------------------------

1) Postavljanje statističke hipoteze:

H0: Gradovi se bitno ne razlikuju u frekvencijama, tj. razlike izmeĎu opaţenih i

očekivanih frekvencija nisu bitne (nisu bitno različite od nule).

H1: Gradovi se bitno razlikuju u frekvencijama, tj. razlike izmeĎu opaţenih i

očekivanih frekvencija nisu bitne (bitno su različite od nule).

2) Izbor testa: χ2-test homogenosti skupa, bez Yatesove korekciju jer se radi o

kontingencijskoj tablici tipa 2×3, s velikom ukupnom frekvencijom i velikim

brojem u svakoj ćeliji. Skup = 2 uzorka

Broj uzoraka: 2 uzorka – ispitanici u gradu A i ispitanici u gradu B.

Varijable: grad (nominalna) - nezavisna varijabla s dvije vrijednosti (A i B),

kvaliteta liječenja HIV pozitivnih osoba (ordinalna) - zavisna varijabla s tri

vrijednosti (dobro, zadovoljavajuće, loše)

Page 44: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Kvaliteta liječenja HIV pozitivnih osoba

Grad dobro zadovoljavajuće loše Ukupno

A 73 37 40 150

B 94 61 45 200

Ukupno 167 98 85 350

3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke

značajnosti α = 0.05; df = (broj redova - 1) × (broj stupaca - 1) = (2-1)×(3 -1) = 2

4) Izračunavanje:

-puna kontingencijska tablica opaţenih frekvencija, na osnovu danih podataka:

4) Izračunavanje: T = 350 ---- ukupna frekvencija

A1 = 150, A2 = 200 --- frekvencije nezavisne varijable (grad)

B1 = 167, B2 = 98, B3 = 85 --- frekvencije zavisne varijable (kvaliteta liječenja)

-računanje očekivanih frekvencija prema uniformnoj raspodjeli: Eij = Ai Bj /T

E11 = 150×167/350 = 71.571429 ≈ 72

E12 = 150×98/350 = 42

E13 = 150×85/350 = 36.428571 ≈ 36

E21 = 200×167/350 = 95.428571 ≈ 95

E22 = 200×98/350 = 56

E23 = 200×85/350 = 48.571429 ≈ 49

-izrada kontingencijske tablice za očekivane frekvencije (na idućem slajdu):

-----------------------------------------------------------------

Page 45: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Kvaliteta liječenja HIV pozitivnih osoba

Grad dobro zadovoljavajuće loše Ukupno

A 72 42 36 150

B 95 56 49 200

Ukupno 167 98 85 350

-Pearsonov ili običan χ2-test:

računanje χ2-vrijednosti po definiciji:

χ2 = Σi (Oi - Ei)2/Ei = (73 - 72)2/72 + (37 - 42)2/42 + (40 - 36)2/36 + (94 - 95)2/95 +

(61 - 56)2/56 + (45 - 49)2/49 = 1.8370569 ≈ 1.837

U tablici χ2-rasp. za df = 2 i α = 0.05 je χ2* = 5.991. Stoga je P > 0.05.

5) Zaključivanje: χ2 < χ2* H0 se ne moţe odbaciti pa se prihvaća, a H1 se ne

moţe zadrţati pa se odbacuje.

Odgovor: Razlike izmeĎu opaţenih i očekivanih frekvencija nisu značajne

(df = 2, χ2* = 5.991 za α = 0.05; χ2 = 1.837, P > 0.05). Drugim riječima,

anketirane HIV pozitivne osobe u dva brazilska grada imaju isto mišljenje o

kvaliteti liječenja HIV pozitivnih osoba u sustavu javnog zdravstva.

Primjer 5. Učinkovitost kemoterapije. Ispitivana je reakcija karcinoma na

kemoterapiju u četiri skupine onkoloških bolesnika. Bolesnici su svrstani u tri

skupine, prema reakciji karcinoma na kemoterapiju: slaba, osrednja i jaka.

Ispitati za α = 2% reagiraju li svi tipovi karcinoma na isti način. Podaci u tablici:

Page 46: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Razina reakcije karcinoma na kemoterapiju

Tip karcinoma slaba osrednja jaka Ukupno

Tip I 51 33 16 100

Tip II 58 29 13 100

Tip III 48 42 30 120

Tip IV 26 38 16 80

Ukupno 183 142 75 400

----------------------------------------------------

1) Postavljanje statističke hipoteze:

H0: Tipovi karcinoma se bitno ne razlikuju u frekvencijama, tj. razlike izmeĎu

opaţenih i očekivanih frekvencija nisu bitne (nisu bitno različite od nule).

H1: Tipovi karcinoma se bitno razlikuju u frekvencijama, tj. razlike izmeĎu

opaţenih i očekivanih frekvencija su bitne (bitno su različite od nule).

2) Izbor testa: χ2-test homogenosti skupa, bez Yatesove korekciju jer se radi o

kontingencijskoj tablici tipa 4×3, s velikom ukupnom frekvencijom i velikim

brojem u svakoj ćeliji. Skup = 4 uzorka

Broj uzoraka: 4 uzorka – ispitanici s tipovima karcinoma I, II, III i IV.

Varijable: tip karcinoma (nominalna) - nezavisna varijabla s četiri vrijednosti

(tipovi: I, II, III i IV), razina reakcije karcinoma na kemoterapiju (ordinalna) -

zavisna varijabla s tri vrijednosti (slaba, osrednja, jaka)

Page 47: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke

značajnosti α = 0.02

df = (broj redova - 1) × (broj stupaca - 1) = (4 - 1) × (3 - 1) = 6

4) Izračunavanje: T = 140 ---- ukupna frekvencija

A1 = 100, A2 = 100, A3 = 120, A4 = 80 --- frekvencije nezavisne varijable (tip

karcinoma)

B1 = 183, B2 = 142, B3 = 75 --- frekvencije zavisne varijable (razina reakcije

karcinoma na kemoterapiju)

-opaţene apsolutne frekvencije su dane u kontingencijskoj tablici zadatka

-računanje očekivanih frekvencija prema uniformnoj raspodjeli: Eij = Ai Bj /T

E11 = 100×183/400 = 45.75

E12 = 100×142/400 = 35.5

E13 = 100×75/400 = 18.75

E21 = 100×183/400 = 45.75

E22 = 100×142/400 = 35.5

E23 = 100×75/400 = 18.75

E31 = 120×183/400 = 54.9

E32 = 120×142/400 = 42.6

E33 = 120×75/400 = 22.5

E41 = 80×183/400 = 36.6

E42 = 80×142/400 = 28.4

E43 = 80×75/400 = 15

Page 48: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Razina reakcije karcinoma na kemoterapiju

Tip karcinoma slaba osrednja jaka Ukupno

Tip I 45.75 35.5 18.75 100

Tip II 45.75 35.5 18.75 100

Tip III 54.9 42.6 22.5 120

Tip IV 36.6 28.4 15 80

Ukupno 183 142 75 400

-izrada kontingencijske tablice za očekivane frekvencije:

-----------------------------------------------------------------

-Pearsonov ili običan χ2-test:

računanje χ2-vrijednosti po definiciji:

χ2 = Σi (Oi - Ei)2/Ei = (51 - 45.75)2/45.75 + (33 - 35.5)2/35.5 + (16 - 18.75)2/18.75

+ (58 - 45.75)2/45.75 + (29 - 35.5)2/35.5 + (13 - 18.75)2/18.75 + (48 - 54.9)2/

54.9 + (42 - 42.6)2/42.6 + (30 - 22.5)2/22.5 + (26 - 36.6)2/36.6 + (38 - 28.4)2/

28.4 + (16 - 15)2/15 = 17.172724 ≈ 17.173

U tablici χ2-rasp. za df = 6 i α = 0.02 je χ2* = 15.033. Stoga je P < 0.02.

5) Zaključivanje: χ2 > χ2* H0 se ne moţe zadrţati pa se odbacuje, a H1 se ne

moţe odbaciti pa se prihvaća.

Odgovor: Razlike izmeĎu reakcija različitih tipova karcinoma na kemoterapiju

su značajne (df = 6, χ2* = 15.033 za α = 0.02; χ2 = 17.173, P < 0.02). Dakle,

tipovi karcinoma su značajno različito reagirali na kemoterapiju.

Page 49: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Primjer 6. Operacija duodenalng ulkusa. Četiri skupine bolesnika s

duodenalnim ulkusom podvrgnute su operaciji različitim operacijama, koje su

se razlikovale u postotku uklonjenog gastričnog tkiva: 0% (vagotomija i

drenaţa, V+D), 25% (vagotomija i antrektomija, V+A), 50% (vagotomija i

piloroplastija, V+P) i 75% (gastrektomija i Roux-en-Y rekonstrukcija, G+R).

Bolesnici su svrstani u razrede prema jačini različitih neţeljenih posljedica

operacije: nikakva, slaba, osrednja. Provjeriti postoji li povezanost izmeĎu

postotka uklonjenog gastričnog tkiva i jačine neţeljenih posljedica operacije.

Podaci su dani u tablici:

Jačina neželjenih posljedica operacije

Tip operacije nikakva slaba osrednja Ukupno

V+D (0%) 61 28 7 96

V+A (25%) 68 23 13 104

V+P (50%) 58 40 12 110

G+R (75%) 53 38 6 97

Ukupno 240 129 38 407

----------------------------------------------------

1) Postavljanje statističke hipoteze:

H0: Dvije kategorijske varijable meĎusobno su nezavisne.

H1: Dvije kategorijske varijable nisu meĎusobno nezavisne.

Page 50: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

2) χ2-test nezavisnosti dviju varijabli. Yatesova korekcija nije potrebna jer se

radi od kontingencijskoj tablici tipa 4×3, s velikom ukupnom frekvencijom i

velikim brojem u svakoj ćeliji. Skup = 1 uzorak

Broj uzoraka: 1 uzorak – bolesnici kojima je operiran duodenalnog ulkusa.

Varijable: tip operacije (ordinalna, zbog postotka uklonjenog gastričnog tkiva) -

varijabla s četiri vrijednosti (0%: V+D, 25%: V+A, 50%: V+P, 75%: G+R), jačina

neţeljenih posljedica operacije (ordinalna) - varijabla s tri vrijednosti (nikakva,

slaba, osrednja).

3) Izbor testnog kriterija: kritična vrijednost za dani df i α = 0.05

df = (broj redova - 1) × (broj stupaca - 1) = (4 - 1) × (3 - 1) = 6

4) Izračunavanje: T = 407 ---- ukupna frekvencija

A1 = 96, A2 = 104, A3 = 110, A4 = 97 --- frekvencije nezavisne varijable (tip

operacije); B1 = 240, B2 = 129, B3 = 38 --- frekvencije zavisne varijable (jačina

neţeljenih posljedica operacije)

-opaţene apsolutne frekvencije su dane u kontingencijskoj tablici zadatka

-računanje očekivanih frekvencija prema uniformnoj raspodjeli: Eij = Ai Bj /T

E11 = 96×240/407 = 56.609337 ≈ 57 E31 = 110×240/407 = 64.864865 ≈ 65

E12 = 96×129/407 = 30.427518 ≈ 30 E32 = 110×129/407 = 34.864865 ≈ 35

E13 = 96×38/407 = 8.963145 ≈ 9 E33 = 110×38/407 = 10.27027 ≈ 10

E21 = 104×240/407 = 61.326781 ≈ 61 E41 = 97×240/407 = 57.199017 ≈ 57

E22 = 104×129/407 = 32.963145 ≈ 33 E42 = 97×129/407 = 30.744472 ≈ 31

E23 = 104×38/407 = 9.7100737 ≈ 10 E43 = 97×38/407 = 9.0565111 ≈ 9

Page 51: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Jačina neželjenih posljedica operacije

Tip operacije nikakva slaba osrednja Ukupno

V+D (0%) 57 30 9 96

V+A (25%) 61 33 10 104

V+P (50%) 65 35 10 110

G+R (75%) 57 31 9 97

Ukupno 240 129 38 407

-izrada kontingencijske tablice za očekivane frekvencije:

-----------------------------------------------------------------

-Pearsonov ili običan χ2-test:

računanje χ2-vrijednosti po definiciji:

χ2 = Σi (Oi - Ei)2/Ei = (61 - 57)2/57 + (28 - 30)2/30 + (7 - 9)2/9 + (68 - 61)2/61 + (23

- 33)2/33 + (13 - 10)2/10 + (58 - 65)2/65 + (40 - 35)2/35 + (12 - 10)2/10 + (53 -

57)2/57 + (38 - 31)2/31+ (6 - 9)2/9 = 10.32154 ≈ 10.322

U tablici χ2-rasp. za df = 6 i α = 0.05 je χ2* = 12.592. Stoga je P > 0.05.

5) Zaključivanje: χ2 < χ2* H0 se ne moţe odbaciti pa se zadrţava, a H1 se ne

moţe zadrţati pa se odbacuje.

Odgovor: Za ispitan uzorak bolesnika, dvije varijable nisu značajno zavisne

(df = 6, χ2* = 12.592 za α = 0.06, χ2 = 10.322, P > 0.05). Drugim riječima, jačina

neţeljenih posljedica operacije ne ovisi značajno o tipu operacije (tj. o postotku

uklonjenog gastričnog tkiva).

Page 52: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

III.3.4. Primjeri zadataka o χ2-testu homogenosti uzorka

Primjeri slijedećih zadataka odnose se na slučaj χ2-testa homogenosti uzorka,

tj. χ2-testa kojim se ispituje homogenost cijelog skupa (gdje je skup shvaćen

kao jedan uzorak) odnosno postoje li značajne razlike unutar skupa = razlike

izmeĎu originalnih uzoraka (podskupova) različitih veličina. Broj takvih uzoraka

(podskupova) moţe biti dva, tri, četiri i više.

Ovaj tip χ2-testa primijenjen je u svim zadacima radi jednostavnosti.

U zadatku se ne traţi izračunavanje očekivanih vrijednosti i χ2-vrijednosti, jer su

takvi računi komplicirani i dugo traju da bi se rješavali za vrijeme ispita.

MeĎutim, uz sve zadane podatke, u zadatku se moţe traţiti:

-izraĎivanje kontingencijske tablice opaţenih vrijednosti

-odreĎivanje broja stupnjeva slobode

-nalaţenje kritične vrijednosti χ2* i vjerojatnosti P iz priloţene tablice

-statističko zaključivanje tj. statističko odlučivanje o postavljenoj hipotezi

(hipoteza da nema ili ima značajnih razlika u skupu tj. izmeĎu podskupova)

Vjerojatnost P uvijek se određuje iz tablica za najmanji α za koji je χ2 > χ2*.

Ako α za statističko testiranje nije navedeno, uzima se vrijednost α = 0.05.

U odgovoru zadatka se uvijek navode informacije o rješenju i konačnom

statističkom testiranju.

Page 53: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Primjer 1. Postoperativne komplikacije. Slučajno su odabrani uzorci od po 800

bolesnika koji su operirani u gradu A i u gradu B. Bolesnici su svrstani u dva

razreda – koji nemaju i koji imaju postoperativne komplikacije. Ispitivalo se

χ2-testom na razini značajnosti α = 5% postoje li značajne razlike izmeĎu

bolesnika iz gradova A u B, upotrebom χ2-testa za homogenost skupa. Sastaviti

kontingencijsku tablicu za opaţene vrijednosti, kada je poznato da je broj

pacijenata bez postoperativnih komplikacija u gradu A jednak 762, a u oba

grada je 1522. Odrediti broj stupnjeva slobode.

---------------------------

Postupak:

a) podaci:

-dva nezavisna uzorka u skupu: uzorak 1 – uzorak bolesnika operiranih u gradu

A, uzorak 2 – uzorak bolesnika operiranih u gradu B χ2-test homogenosti

skupa, gdje se ispituje postoji li značajna razlika izmeĎu bolesnika operiranih u

dva grada s obzirom na postoperativne komplikacije

-veličine uzoraka: 800 (uzorak 1) i 800 (uzorak 2) veličina skupa: 1600

-varijable: grad - mjesto stanovanja (nominalna) s dvije vrijednosti (A i B);

postojanje postoperativnih komplikacija (nominalna) s dvije vrijednosti (DA i NE)

kontingencijska tablica tipa 2×2 Yatesova korekcija

b) traţe se:

-kontingencijska tablica opaţenih vrijednosti

-broj stupnjeva slobode

Page 54: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Postoperativne komplikacije

Grad DA NE Ukupno

A 38 762 800

B 40 760 800

Ukupno 78 1522 1600

Izračunavanje:

I) Izrada kontingencijske tablice opaţenih vrijednosti:

1- konstruira se tablica veličine 2x2, jer je utvrĎen broj razreda dviju varijabli

2- vertikalno se postavi varijabla koja je nezavisna varijabla, kontrolna varijabla

ili je moguće da bude nezavisna varijabla; u ovom slučaju to je grad – mjesto

stanovanja

3- horizontalno se postavi varijabla koja je zavisna, nije kontrolna niti

nezavisna, ili je moguće da bude zavisna varijabla; u ovom slučaj to je

postojanje postoperativnih komplikacija

-postavljanje ovih varijabli je stvar konvencije, a ovaj poredak ili obratan

poredak daju istu χ2-vrijednost bez korekcije ili s korekcijom

4- upišu se brojevne vrijednosti iz zadatka u pripadne ćelije u tablici

5- izračunavaju se brojevi u prazne ćelije (označeni crveno u gornjoj tablici),

postepenim računanjem iz poznatih brojeva:

800 + 800 = 1600 800 - 762 = 38

1600 - 1522 = 78 1522 - 762 = 760 800 - 760 = 40

Page 55: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

6- provjeravaju se SVI zbrojevi, da se isprave eventualna kriva izračunavanja ili

upisivanja zadanih brojeva:

-horizontalni zbrojevi: 38 + 762 = 800 40 + 760 = 800 78 + 1522 = 1600

-vertikalni zbrojevi: 38 + 40 = 78 762 + 760 = 1522 800 + 800 = 1600

II) Računanje broja stupnjeva slobode df:

df = (broj redova - 1) × (broj stupaca - 1) = (2 - 1)×(2 -1) = 1

Odgovor: Broj stupnjeva slobode je df = 1. Kontingencijska tablica opaţenih

vrijednosti je slijedeća:

Postoperativne komplikacije

Grad DA NE Ukupno

A 38 762 800

B 40 760 800

Ukupno 78 1522 1600

Primjer 2. Postoperativne komplikacije 2. Nastavljajući se na problem u

Primjeru 1, na osnovi izraĎene kontingencijske tablice dobivena je vrijednost

χ2 = 0.054 bez korekcije i χ2 = 0.013 s Yatesovom korekcijom. Testirati hipotezu

da nema značajne razlike u pojavljivanju postoperativnih komplikacija u

gradovima A i B, za α = 5% i df = 1. Podaci za χ2-raspodjelu:

df vjerojatnost α

0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001

1 0.004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.64 10.83

Page 56: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

---------------------------

Postupak:

a) podaci:

-razina statističke značajnosti: α = 5% = 0.05

-broj stupnjeva slobode: df = 1

-χ2-vrijednost: χ2 = 0.054 bez korekcije, χ2 = 0.013 s Yatesovom korekcijom,

dakle meĎusobno su bliske vrijednosti

-statistička hipoteza:

Nul-hipoteza (H0): Nema značajne razlike u pojavljivanju postoperativnih

komplikacija u gradovima A i B. slijedno tome je:

Alternativna, suprotna hipoteza (H1): Postoje značajne razlike u pojavljivanju

postoperativnih komplikacija u gradovima A i B.

b) traţi se:

-testirati hipotezu H0 i odlučiti koja će se zadrţati, H0 ili H1; u tu svrhu treba

pronaći odgovarajuću kritičnu vrijednost u tablici χ2-raspodjele

Izračunavanje:

Kritična χ2-vrijednost: χ2* = 3.84

Testiranje: χ2 < χ2* tj. 0.054 < 3.84 i 0.013 < 3.84 H0 se prihvaća, a H1 se

odbacuje, a vjerojatnost za H0 je P > 0.05.

Odgovor: Razlike u pojavljivanju postoperativnih komplikacija u gradovima A i B

nisu značajne (df = 1, χ2* = 3.84 za α = 0.05; χ2 = 0.054 bez korekcije,

χ2 = 0.013 s Yatesovom korekcijom, P > 0.05).

Page 57: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Primjer 3. Pušači i nepušači. U jednom istraţivanju o pušenju u nekoj zemlji

nasumično je odabrano 1000 ispitanika, od kojih je 328 bilo pušača od kojih

125 ţena. Znajući da je bilo 515 ispitanica, sastaviti kontingencijsku tablicu za

opaţene vrijednosti, za χ2-test homogenosti kojim se ispituje razlika izmeĎu

muškaraca i ţena s obzirom na učestalost pušenja. Izračunati df.

---------------------------

Postupak:

a) podaci:

-dva nezavisna uzorka u skupu: uzorak 1 – uzorak muškaraca, uzorak 2 –

uzorak ţena χ2-test homogenosti skupa, gdje se ispituje postoji li značajna

razlika izmeĎu spolova s obzirom na učestalost pušenja

-veličina skupa: 1000

-varijable: spol (nominalna) s dvije vrijednosti (muški i ţenski); pušenje

(nominalna) s dvije vrijednosti (DA i NE) kontingencijska tablica tipa 2×2

Yatesova korekcija

b) traţe se:

-kontingencijska tablica opaţenih vrijednosti

-broj stupnjeva slobode

Izračunavanje:

I) Izrada kontingencijske tablice opaţenih vrijednosti (idući slajd), povodeći se

istim pravilima kao u Primjeru 1.

Page 58: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

-izračunavanje brojeva za prazne ćelije:

1000 - 515 = 485 328 - 125 = 203

1000 - 328 = 672 515 - 125 = 390

485 - 203 = 282 ili 672 - 390 = 282

-provjera ispravnosti tablice zbrojevima:

horizontalno: 203 + 282 = 485 125 + 390 = 515 328 + 672 = 1000

vertikalno: 203 + 125 = 328 282 + 390 = 672 485 + 515 = 1000

II) Računanje broja stupnjeva slobode df:

df = (broj redova - 1) × (broj stupaca - 1) = (2 - 1)×(2 -1) = 1

Odgovor: Broj stupnjeva slobode je df = 1. Kontingencijska tablica opaţenih

vrijednosti:

Pušenje

Spol DA NE Ukupno

muškarci 203 282 485

žene 125 390 515

Ukupno 328 672 1000

Pušenje

Spol DA NE Ukupno

muškarci 203 282 485

žene 125 390 515

Ukupno 328 672 1000

Page 59: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Primjer 4. Pušači i nepušači 2. Nastavljajući se na problem u Primjeru 3, na

osnovi izraĎene kontingencijske tablice dobivena je vrijednost χ2 = 35.037 bez

korekcije i χ2 = 34.244 s Yatesovom korekcijom. Testirati hipotezu da nema

značajne razlike u učestalosti pušenja meĎu spolovima, za α = 0.1% i df = 1.

Podaci za χ2-raspodjelu:

df vjerojatnost α

0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001

1 0.004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.64 10.83

---------------------------

Postupak:

a) podaci:

-razina statističke značajnosti: α = 0.1% = 0.001

-broj stupnjeva slobode: df = 1

-χ2-vrijednost: χ2 = 35.037 bez korekcije, χ2 = 34.244 s Yatesovom korekcijom,

dakle meĎusobno su bliske vrijednosti

-statistička hipoteza:

Nul-hipoteza (H0): Nema značajne razlike u učestalosti pušenja meĎu

spolovima. slijedno tome je:

Alternativna, suprotna hipoteza (H1): Postoje značajne razlike u učestalosti

pušenja meĎu spolovima.

Page 60: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

b) traţi se:

-testirati hipotezu H0 i odlučiti koja će se zadrţati, H0 ili H1; u tu svrhu treba

pronaći odgovarajuću kritičnu vrijednost u tablici χ2-raspodjele

Izračunavanje:

Kritična χ2-vrijednost: χ2* = 10.83

Testiranje: χ2 > χ2* tj. 35.037 >> 3.84 i 34.244 >> 3.84 H0 se odbacuje, a H1

se prihvaća, a vjerojatnost za H0 je P < 0.001.

Odgovor: Razlike u učestalosti pušenja meĎu spolovima su značajne (df = 1,

χ2* = 10.83 za α = 0.001; χ2 = 35.037 bez korekcije, χ2 = 34.244 s Yatesovom

korekcijom, P < 0.001).

Primjer 5. Učinkovitost lijekova. U jednom istraţivanju o učinkovitosti dvaju

lijekova A i B s obzirom na odreĎenu bolest sudjelovalo je 160 osoba, od kojih

su 55 osjetile a 25 nisu osjetile učinak lijeka A. Sveukupno je 100 osoba osjetilo

djelovanje lijekova. Sastaviti kontingencijsku tablicu za opaţene vrijednosti, za

χ2-test homogenosti kojim se ispituje jesu li lijekovi A i B podjednako učinkoviti

odnosno neučinkoviti. Odrediti broj stupnjeva slobode.

---------------------------

Postupak:

a) podaci:

-dva nezavisna uzorka u skupu: uzorak 1 – osobe liječene lijekom A, uzorak 2 –

osobe liječene lijekom B χ2-test homogenosti skupa, gdje se ispituje postoji li

značajna razlika izmeĎu osoba liječenih lijekom A i B s obzirom na učinkovitost

Page 61: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

-veličina skupa: 160

-varijable: terapija - lijek (nominalna) s dvije vrijednosti (A i B); postojanje učinka

lijeka (nominalna) s dvije vrijednosti (DA i NE) kontingencijska tablica tipa

2×2 Yatesova korekcija

b) traţe se:

-kontingencijska tablica opaţenih vrijednosti

-broj stupnjeva slobode

Izračunavanje:

I) Izrada kontingencijske tablice opaţenih vrijednosti, povodeći se istim

pravilima kao u Primjeru 1.

Postojanje učinka lijeka

Lijek DA NE Ukupno

A 55 25 80

B 45 35 80

Ukupno 100 60 160

-izračunavanje brojeva za prazne ćelije:

55 + 25 = 80 160 - 80 = 80 160 - 100 = 60 100 - 55 = 45

60 - 25 = 35 ili 80 - 45 = 35

-provjera ispravnosti tablice zbrojevima:

horizontalno: 55 + 25 = 80 45 + 35 = 80 100 + 60 = 160

vertikalno: 55 + 45 = 100 25 + 35 = 60 80 + 80 = 160

Page 62: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

II) Računanje broja stupnjeva slobode df:

df = (broj redova - 1) × (broj stupaca - 1) = (2 - 1)×(2 -1) = 1

Odgovor: Broj stupnjeva slobode je df = 1. Kontingencijska tablica opaţenih

vrijednosti:

Postojanje učinka lijeka

Lijek DA NE Ukupno

A 55 25 80

B 45 35 80

Ukupno 100 60 160

Primjer 6. Učinkovitost lijekova 2. Nastavljajući se na problem u Primjeru 5, na

osnovi izraĎene kontingencijske tablice dobivena je vrijednost χ2 = 2.667 bez

korekcije i χ2 = 2.16 s Yatesovom korekcijom. Testirati hipotezu da postoji

značajna razlika u učinkovitosti dvaju lijekova, za α = 1% i df = 1. Podaci za

χ2-raspodjelu:

df vjerojatnost α

0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001

1 0.004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.64 10.83

Page 63: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

---------------------------

Postupak:

a) podaci:

-razina statističke značajnosti: α = 1% = 0.01

-broj stupnjeva slobode: df = 1

-χ2-vrijednost: χ2 = 2.667 bez korekcije, χ2 = 2.16 s Yatesovom korekcijom,

dakle meĎusobno bliske vrijednosti

-statistička hipoteza:

Nul-hipoteza (H0): Nema značajne razlike u učinkovitosti lijekova A i B.

slijedno tome je:

Alternativna, suprotna hipoteza (H1): Postoje značajne razlike u učinkovitosti

lijekova A i B.

b) traţi se:

-testirati hipotezu H0 i odlučiti koja će se zadrţati, H0 ili H1; u tu svrhu treba

pronaći odgovarajuću kritičnu vrijednost u tablici χ2-raspodjele

Izračunavanje:

Kritična χ2-vrijednost: χ2* = 6.64

Testiranje: χ2 < χ2* tj. 2.667 < 6.64 i 2.16 < 6.64 H0 se prihvaća, a H1 se

odbacuje, a vjerojatnost za H0 je P > 0.01.

Odgovor: Razlike u učinkovitosti dvaju lijekova nisu značajne (df = 1, χ2* = 6.64

za α = 0.01; χ2 = 2.667 bez korekcije, χ2 = 2.16 s Yatesovom korekcijom,

P > 0.01).

Page 64: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Primjer 7. Albumin u urinu. U jednom istraţivanju je kod 33 zdrave osobe, 50

osoba sa različitim nefrološkim dijagnozama i 33 osobe sa kardiološkim

bolestima dokazivan albumin u urinu. Pozitivan rezultat na albumin u urinu

dobijen je kod 4 zdrave osobe, 41 pacijenta sa nefrološkim i 8 pacijenata sa

kardiloškim oboljenjima. Sastaviti kontingencijsku tablicu za opaţene

vrijednosti, za χ2-test homogenosti kojim se ispituje postoji li razlika izmeĎu

učestalosti pojavljivanja pozitivnih rezultata za albumin u urinu kod ovih grupa.

Odrediti broj stupnjeva slobode.

---------------------------

Postupak:

a) podaci:

-tri nezavisna uzorka u skupu: uzorak 1 – zdrave osobe, uzorak 2 – nefrološki

bolesnici, uzorak 3 – kardiološki bolesnici χ2-test homogenosti skupa, gdje

se ispituje postoji li značajna razlika izmeĎu tri uzorka ispitanika s obzirom na

pozitivan rezultat albumina u urinu

-varijable: zdravstveno stanje (nominalna) s tri vrijednosti (zdrave osobe,

nefrološki bolesnici, kardiološki bolesnici); prisutnost albumina u urinu

(nominalna) s dvije vrijednosti (DA i NE) kontingencijska tablica tipa 3×2

b) traţe se:

-kontingencijska tablica opaţenih vrijednosti

-broj stupnjeva slobode

Page 65: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Prisutnost albumina u urinu

Zdravstveno stanje DA NE Ukupno

zdrave osobe 4 29 33

nefrološki bolesnici 41 9 50

kardiološki bolesnici 8 25 33

Ukupno 53 63 116

Izračunavanje:

I) Izrada kontingencijske tablice opaţenih vrijednosti, povodeći se istim

pravilima kao u Primjeru 1.

-izračunavanje brojeva za prazne ćelije:

4 + 41 + 8 = 53 33 - 4 = 29 50 - 41 = 9 33 - 8 = 25

33 + 50 + 33 = 116

116 - 53 = 63 ili 29 + 9 + 25 = 63

-provjera računa:

horizontalno: 4 + 29 = 33 41 +9 = 50 8 + 25 = 33 53 + 63 = 116

vertikalno: 4 + 41 + 8 = 53 29 + 9 + 25 = 63 33 + 50 + 33 = 116

II) Računanje broja stupnjeva slobode df:

df = (broj redova - 1) × (broj stupaca - 1) = (3 - 1)×(2 -1) = 2

Odgovor: Broj stupnjeva slobode je df = 2. Kontingencijska tablica opaţenih

vrijednosti (idući slajd):

Page 66: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Prisutnost albumina u urinu

Zdravstveno stanje DA NE Ukupno

zdrave osobe 4 29 33

nefrološki bolesnici 41 9 50

kardiološki bolesnici 8 25 33

Ukupno 53 63 116

Primjer 8. Albumin u urinu 2. Nastavljajući se na problem u Primjeru 7, na

osnovi izraĎene kontingencijske tablice dobivena je vrijednost χ2 = 47.669.

Testirati hipotezu da postoji značajna razlika izmeĎu triju skupina osoba u

prisutnosti albumina u urinu, za α = 0.05 i df = 2. Podaci za χ2-raspodjelu:

df vjerojatnost α

0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001

1 0.004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.64 10.83

2 0.10 0.21 0.45 0.71 1.39 2.41 3.22 4.60 5.99 9.21 13.82

3 0.35 0.58 1.01 1.42 2.37 3.66 4.64 6.25 7.82 11.34 16.27

Page 67: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

---------------------------

Postupak:

a) podaci:

-razina statističke značajnosti: α = 0.05

-broj stupnjeva slobode: df = 2

-χ2-vrijednost: χ2 = 47.669

-statistička hipoteza:

Nul-hipoteza (H0): Nema značajne razlike u prisutnosti albumina u urinu triju

skupina osoba. slijedno tome je:

Alternativna, suprotna hipoteza (H1): Postoje značajne razlike u prisutnosti

albumina u urinu triju skupina osoba.

b) traţi se:

-testirati hipotezu H0 i odlučiti koja će se zadrţati, H0 ili H1; u tu svrhu treba

pronaći odgovarajuću kritičnu vrijednost u tablici χ2-raspodjele

Izračunavanje:

Kritična χ2-vrijednost: χ2* = 5.99

Testiranje: χ2 > χ2* tj. 47.669 >> 5.99 H0 se odbacuje, a H1 se prihvaća, a

vjerojatnost za H0 je P < 0.001.

Odgovor: Razlike u prisutnosti albumina u urinu triju skupina osoba (zdrave

osobe, nefrološki i kardiološki bolesnici) su značajne (df = 2, χ2* = 5.99 za α =

0.05, χ2 = 47.669, P < 0.001). Kao što je za očekivati, nefrološki bolesnici

najčešće imaju albumin u urinu.

Page 68: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Primjer 9. Alfa-1-antitripsin. Kod bolesnika oboljelih od bronhijalne astme

(N=30) i grupe oboljelih od obstruktivnog bronhitisa (N=30), kao i kod zdravih

osoba (N=30) odreĎena je koncentracija α-1-antitripsina nefelometrijskom

metodom (vrijednosti su date u g/L). Sastaviti kontingencijsku tablicu, ako je

kod zdravih jedan rezultat bio iznad gornje granice referentnih vrijednosti, kod

bolesnika sa astmom je bilo 8, a kod bolesnika sa bronhitisom 5 povišenih

vrijednosti. χ2-testom se provjerava da li ima razlike u broju osoba koje imaju

povišene vrijednosti u odnosu na zdrave. Odrediti broj stupnjeva slobode.

---------------------------

Postupak:

a) podaci:

-tri nezavisna uzorka u skupu: uzorak 1 – oboljeli od bronhijalne astme, uzorak

2 – oboljeli od obstruktivnog bronhitisa, uzorak 3 – zdrave osobe χ2-test

homogenosti skupa, gdje se ispituje postoji li značajna razlika izmeĎu tri uzorka

ispitanika s obzirom na normalnu odnosno povišenu koncentraciju

α-1-antitripsina u krvi.

-varijable: zdravstveno stanje (nominalna) s tri vrijednosti (oboljeli od

bronhijalne astme, oboljeli od obstruktivnog bronhitisa, zdrave osobe);

prisutnost α-1-antitripsina u krvi (nominalna) s dvije vrijednosti (normalna i

povišena) kontingencijska tablica tipa 3×2

Page 69: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

b) traţe se:

-kontingencijska tablica opaţenih vrijednosti

-broj stupnjeva slobode

Izračunavanje:

I) Izrada kontingencijske tablice opaţenih vrijednosti, povodeći se istim

pravilima kao u Primjeru 1.

Koncentracija α-1-antitripsina

Zdravstveno stanje normalna povišena Ukupno

oboljeli od bronhijalne

astme

22 8 30

oboljeli od obstruktivnog

brohnitisa

25 5 30

zdrave osobe 29 1 30

Ukupno 76 14 90 -izračunavanje brojeva za prazne ćelije:

30 + 30 + 30 = 90 30 - 8 = 22 30 - 5 = 25 30 - 1 = 29

33 + 30 + 30 = 90 8 + 5 + 1 = 14

90 - 14 = 76 ili 22 + 25 + 29 = 76

-provjera računa:

horizontalno: 22 + 8 = 30 25 +5 = 30 29 + 1 = 30 76 + 14 = 90

vertikalno: 22 + 25 + 29 = 76 8 + 5 + 1 = 14 30 + 30 + 30 = 90

Page 70: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

II) Računanje broja stupnjeva slobode df:

df = (broj redova - 1) × (broj stupaca - 1) = (3 - 1)×(2 -1) = 2

Odgovor: Broj stup. slobode df = 2. Kontingencijska tablica opaţenih vrijednosti:

Koncentracija α-1-antitripsina

Zdravstveno stanje normalna povišena Ukupno

oboljeli od bronhijalne

astme

22 8 30

oboljeli od obstruktivnog

brohnitisa

25 5 30

zdrave osobe 29 1 30

Ukupno 76 14 90

Primjer 10. Alfa-1-antitripsin 2. Nastavljajući se na problem u Primjeru 9, na

osnovi izraĎene kontingencijske tablice dobivena je vrijednost χ2 = 6.259.

Testirati hipotezu da postoji značajna razlika izmeĎu triju skupina osoba u

prisutnosti α-1-antitripsina u krvi, za α = 0.05 i df = 2. Podaci za χ2-raspodjelu:

df vjerojatnost α

0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001

2 0.10 0.21 0.45 0.71 1.39 2.41 3.22 4.60 5.99 9.21 13.82

Page 71: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

---------------------------

Postupak:

a) podaci:

-razina statističke značajnosti: α = 0.05

-broj stupnjeva slobode: df = 2

-χ2-vrijednost: χ2 = 6.259

-statistička hipoteza:

Nul-hipoteza (H0): Nema značajne razlike u prisutnosti α-1-antitripsina u krvi

triju skupina osoba. slijedno tome je:

Alternativna, suprotna hipoteza (H1): Postoje značajne razlike u prisutnosti

α-1-antitripsina u krvi triju skupina osoba.

b) traţi se:

-testirati hipotezu H0 i odlučiti koja će se zadrţati, H0 ili H1; u tu svrhu treba

pronaći odgovarajuću kritičnu vrijednost u tablici χ2-raspodjele

Izračunavanje:

Kritična χ2-vrijednost: χ2* = 5.99

Testiranje: χ2 > χ2* tj. 6.259 > 5.99 H0 se odbacuje, a H1 se prihvaća, a

vjerojatnost za H0 je P < 0.05.

Odgovor: Razlike u koncentraciji α-1-antitripsina u krvi triju skupina osoba

(oboljeli od bronhijalne astme, oboljeli od obstruktivnog bronhitisa, zdrave

osobe) su značajne (df = 2, χ2* = 5.99 za α = 0.05, χ2 = 6.259, P < 0.05). Kao

što je za očekivati, plućni bolesnici imaju značajnu koncentraciju ovog enzima.

Page 72: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Primjer 11. Pušenje i spol. U jednom anketiranju studenata o zastupljenosti

pušača dobiveni su slijedeći rezultati u tablici dolje, za koju je potrebno sastaviti

kontingencijsku tablicu opaţenih vrijednosti, sa svrhom da se χ2-testom utvrdi

postoje li značajne razlike u zastupljenosti pušača izmeĎu spolovima. Legenda

za tablicu: spol: 1 – muški, 2 – ţenski; pušenje: 1 – da, 2 – povremeno, 3 – ne.

Izračunati broj stupnjeva slobode.

spol pušenje spol pušenje spol pušenje

1 3 1 3 2 1

2 3 2 3 1 1

2 1 1 3 2 1

2 3 2 3 2 1

1 1 2 3 2 1

2 1 2 3 1 2

2 2 2 3 1 1

2 2 1 1 2 1

1 3 2 1 2 1

Page 73: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Status pušenja

Spol da povremeno ne Ukupno

muški 4 1 4 9

ženski 9 2 7 18

Ukupno 13 3 11 27

---------------------------

Postupak:

a) podaci:

-dva nezavisna uzorka u skupu: uzorak 1 – uzorak muških ispitanika, uzorak 2

– uzorak ţenskih ispitanika χ2-test homogenosti skupa, gdje se ispituje

postoji li značajna razlika izmeĎu dva uzorka ispitanika tj. spolova s obzirom na

status pušenja

-varijable: spol (nominalna) s dvije vrijednosti (muški i ţenski); status pušenja

(ordinalna) s tri vrijednosti (da, povremeno, ne) kontingenc. tablica tipa 2×3

b) traţi se:

-kontingencijska tablica opaţenih vrijednosti

Izračunavanje:

Izrada kontingencijske tablice opaţenih vrijednosti: prvo se načine

jednostavnija prebrajanja (brojevi u crnom) – po spolovima, zatim brojevi

povremenih pušača jer ih je malo, broj svih pušača i svih nepušača; zatim se

ostatak ćelija popuni iz razlika ili zbrojeva već upisanih brojeva (brojevi u

crvenom).

Page 74: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

II) Računanje broja stupnjeva slobode df:

df = (broj redova - 1) × (broj stupaca - 1) = (2 - 1)×(3 -1) = 2

Odgovor: Broj stupnjeva slobode je df = 2. Kontingencijska tablica opaţenih

vrijednosti je:

Status pušenja

Spol da povremeno ne Ukupno

muški 4 1 4 9

ženski 9 2 7 18

Ukupno 13 3 11 27

Primjer 12. Pušenje i spol 2. Nastavljajući se na problem u Primjeru 11, na

osnovi izraĎene kontingencijske tablice dobivena je vrijednost χ2 = 0.084, a s

Yatesovom korekcijom χ2 = 0.396. Testirati hipotezu da postoji značajna razlika

izmeĎu spolova s obzirom na status pušenja, za α = 0.05 i df = 2. Podaci za

χ2-raspodjelu:

df vjerojatnost α

0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001

2 0.10 0.21 0.45 0.71 1.39 2.41 3.22 4.60 5.99 9.21 13.82

Page 75: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

---------------------------

Postupak:

a) podaci:

-razina statističke značajnosti: α = 0.05

-broj stupnjeva slobode: df = 2

-χ2-vrijednost: χ2 = 0.084, s Yatesovom korekcijom χ2 = 0.396 zbog ćelija s

brojevima koji su manji od 5

-statistička hipoteza:

Nul-hipoteza (H0): Nema značajne razlike u statusu pušenja spolova.

slijedno tome je:

Alternativna, suprotna hipoteza (H1): Postoje značajne razlike u statusu pušenja

spolova.

b) traţi se:

-testirati hipotezu H0 i odlučiti koja će se zadrţati, H0 ili H1; u tu svrhu treba

pronaći odgovarajuću kritičnu vrijednost u tablici χ2-raspodjele

Izračunavanje:

Kritična χ2-vrijednost: χ2* = 5.99

Testiranje: χ2 < χ2* tj. 0.084 < 5.99 i 0.396 < 5.99 H0 se svakako zadrţava jer

se ne moţe odbaciti, a H1 se odbacuje, a vjerojatnost za H0 je P > 0.05.

Odgovor: Razlike u statusu pušenja spolova nisu značajne (df = 2, χ2* = 5.99 za

α = 0.05, χ2 = 0.084, χ2 = 0.396 s Yatesovom korekcijom, P > 0.05). Dakle,

studenti muškog i ţenskog spola podjednako puše odnosno ne puše.

Page 76: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Primjer 13. Stavovi o liječniku. U jednoj ustanovi provedena je anketa meĎu 23

djelatnika i 26 djelatnica te je ispitivan stav prema liječniku u ambulanti te

ustanove. Iz dobivenih odgovora moglo se zaključiti je li stav prema liječniku u

cjelini „pozitivan“ ili „negativan“. Budući da je liječnik u toj ambulanti bila ţena,

postavljeno je pitanje razlikuju li se muškarci od ţena u stavu prema toj liječnici.

Dobiveni su slijedeći rezultati:

Muškarci (N=23) Pozitivan stav 14 Negativan stav 9

Ţene (N=26) Pozitivan stav 9 Negativan stav 17

Sastaviti kontingencijsku tablicu opaţenih frekvencija, sa svrhom da bi se

χ2-testom moglo utvrditi postoje li značajne razlike u stavovima spolova prema

toj liječnici.

---------------------------

Postupak:

a) podaci:

-dva nezavisna uzorka u skupu: uzorak 1 – djelatnici muškarci, uzorak 2 –

djelatnici ţene χ2-test homogenosti skupa, gdje se ispituje postoji li značajna

razlika izmeĎu dva uzorka ispitanika s obzirom stav prema liječnici u ustanovi

-varijable: spol (nominalna) s dvije vrijednosti (muški zaposlenici, ţenski

zaposlenici); stav prema liječnici ustanove (nominalna) s dvije vrijednosti

(pozitivan stav i negativna stav) kontingencijska tablica tipa 2×2

-kontingencijska tablica opaţenih vrijednosti

Page 77: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Stav prema liječnici

Spol pozitivan negativan Ukupno

muški 14 9 23

ženski 9 17 26

Ukupno 23 26 49

Izračunavanje:

Izrada kontingencijske tablice opaţenih vrijednosti kao u Primjeru 1: prvo se

upišu zadani brojevi (brojevi u crnom), zatim se upišu preostali brojevi (brojevi u

crvenom) koji su u ovom slučaju zbrojevi nekih zadanih brojeva.

Računanje broja stupnjeva slobode df:

df = (broj redova - 1) × (broj stupaca - 1) = (2 - 1)×(2 -1) = 1

Odgovor: Broj stupnjeva slobode je df = 1 jer je tablica tipa 2×2.

Kontingencijska tablica opaţenih vrijednosti je slijedeća:

Stav prema liječnici

Spol pozitivan negativan Ukupno

muški 14 9 23

ženski 9 17 26

Ukupno 23 26 49

Page 78: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Primjer 14. Stavovi o liječniku 2. Nastavljajući se na problem u Primjeru 13, na

osnovi izraĎene kontingencijske tablice dobivena je vrijednost χ2 = 3.377, a s

Yatesovom korekcijom χ2 = 2.406. Testirati hipotezu da postoji značajna razlika

izmeĎu spolova s obzirom na stav prema liječnici ustanove, za α = 0.05 i df = 1.

Podaci za χ2-raspodjelu:

df vjerojatnost α

0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001

1 0.004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.64 10.83

---------------------------

Postupak:

a) podaci:

-razina statističke značajnosti: α = 0.05

-broj stupnjeva slobode: df = 1

-χ2-vrijednost: χ2 = 3.377, s Yatesovom korekcijom χ2 = 2.406 zbog tipa 2×2

-statistička hipoteza:

Nul-hipoteza (H0): Nema značajne razlike u stavu spolova prema liječnici

ustanove. slijedno tome je:

Alternativna, suprotna hipoteza (H1): Postoje značajne razlike u stavu spolova

prema liječnici ustanove.

b) traţi se:

-testirati hipotezu H0 i odlučiti koja će se zadrţati, H0 ili H1; u tu svrhu treba

pronaći odgovarajuću kritičnu vrijednost u tablici χ2-raspodjele

Page 79: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Izračunavanje:

Kritična χ2-vrijednost: χ2* = 3.84

Testiranje: χ2 < χ2* tj. 3.377 < 3.84 i 2.406 < 3.84 H0 se svakako zadrţava jer

se ne moţe odbaciti, a H1 se odbacuje, a vjerojatnost za H0 je P > 0.05.

Odgovor: Razlike u stavu spolova prema liječnici ustanove nisu značajne

(df = 2, χ2* = 3.84 za α = 0.05, χ2 = 3.377, χ2 = 2.406 s Yatesovom korekcijom,

P > 0.05).

Primjer 15. Epidemija gripe. Medicinski centar je izvršio analizu oboljenja od

gripe u ustanovama gdje su neki zaposlenici bili cijepljeni 11 mjeseci prije

epidemije, neki neposredno prije epidemije, a neki nisu bili uopće cijepljeni.

Dobiveni su sljedeći rezultati za ukupno 911 oboljelih i 8295 koji nisu oboljeli:

od 2899 necijepljenih samo 402 osobe su oboljele, a meĎu cijepljenima

neposredno prije epidemije samo 131 osoba je oboljelo a 2009 nije oboljelo.

Sastaviti kontingencijsku tablicu opaţenih frekvencija, sa svrhom da bi se

χ2-testom moglo utvrditi postoje li značajne razlike u zdravstvenom statusu

ispitanika s obzirom na njihov status cijepljenja. Izračunati broj stupnjeva

slobode.

---------------------------

Postupak:

a) podaci:

-tri nezavisna uzorka u skupu: uzorak 1 – necijepljeni, uzorak 2 – cijepljeni 11

mjeseci prije epidemije, uzorak 3 – cijepljeni neposredno prije epidemije

Page 80: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

χ2-test homogenosti skupa, gdje se ispituje postoji li značajna razlika meĎu

uzorcima s obzirom na status zdravlja za vrijeme epidemije gripe

-varijable: status cijepljenja (ordinalna) s tri vrijednosti (necijepljeni, cijepljeni 11

mjeseci prije epidemije i cijepljeni neposredno prije epidemije); zdravstveni

status (nominalna) s dvije vrijednosti (oboljeli od gripe i nisu oboljeli)

kontingencijska tablica tipa 3×2

b) traţe se:

-kontingencijska tablica opaţenih vrijednosti

-broj stupnjeva slobode

Izračunavanje:

I) Izrada kontingencijske tablice opaţenih vrijednosti, povodeći se istim

pravilima kao u Primjeru 1.

Zdravstveni status

Status cijepljenja oboljeli nisu oboljeli Ukupno

necijepljeni 402 2497 2899

cijepljeni 11 mjeseci prije epidemije 378 3789 4167

cijepljeni neposredni prije epidemije 131 2009 2140

Ukupno 911 8295 9206

Page 81: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

-izračunavanje brojeva za prazne ćelije:

911 - (131 + 402) = 378 2899 - 402 = 2497

131 + 2009 = 2140 911 + 8295 = 9206 8295 - (2009 + 2497) = 3789

378 + 3789 = 4167 ili 9206 - (2899 + 2140) = 4167

-provjera računa:

horizontalno:

402 + 2497 = 2899 378 + 3789 = 4167

131 + 2009 = 2140 911 + 8295 = 9206

vertikalno:

402 + 378 + 131 = 911 2497 + 3789 + 2009 = 8295

2899 + 4167 + 2140 = 9206

II) Računanje broja stupnjeva slobode df:

df = (broj redova - 1) × (broj stupaca - 1) = (3 - 1)×(2 -1) = 2

Odgovor: Broj stup. slob. df = 2. Kontingencijska tablica opaţenih vrijednosti:

Zdravstveni status

Status cijepljenja oboljeli nisu oboljeli Ukupno

necijepljeni 402 2497 2899

cijepljeni 11 mjeseci prije epidemije 378 3789 4167

cijepljeni neposredni prije epidemije 131 2009 2140

Ukupno 911 8295 9206

Page 82: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Primjer 16. Epidemija gripe 2. Nastavljajući se na problem u Primjeru 15, na

osnovi izraĎene kontingencijske tablice dobivena je vrijednost χ2 = 88.637.

Testirati hipotezu da postoji značajna razlika uzoraka s različitim statusom

cijepljenja s obzirom na njihov status zdravlja tijekom epidemije gripe, za

α = 0.001 i df = 2. Podaci za χ2-raspodjelu:

df vjerojatnost α

0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001

1 0.004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.64 10.83

---------------------------

Postupak:

a) podaci:

-razina statističke značajnosti: α = 0.001

-broj stupnjeva slobode: df = 2

-χ2-vrijednost: χ2 = 88.637

-statistička hipoteza:

Nul-hipoteza (H0): Nema značajne razlike u zdravstvenom statusu skupina s

obzirom na status cijepljenja. slijedno tome je:

Alternativna, suprotna hipoteza (H1): Postoje značajne razlike u zdravstvenom

statusu skupina s obzirom na status cijepljenja.

b) traţi se:

-testirati hipotezu H0 i odlučiti koja će se zadrţati, H0 ili H1; u tu svrhu treba

pronaći odgovarajuću kritičnu vrijednost u tablici χ2-raspodjele

Page 83: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Izračunavanje:

Kritična χ2-vrijednost: χ2* = 10.83

Testiranje: χ2 > χ2* tj. 88.637 >> 10.83 H0 se svakako ne moţe zadrţati pa se

odbacuje, a H1 se zadrţava, a vjerojatnost za H0 je P < 0.001.

Odgovor: Razlike u zdravstvenom statusu triju uzoraka su značajne (df = 2,

χ2* = 10.83 za α = 0.001, χ2 = 88.637, P < 0.001). Vidljivo je da meĎu

cijepljenima ima najmanje oboljelih.

Primjer 17. Stav prema doniranju organa. U istraţivanju o znanju i stanovnika

jedne hrvatske ţupanije o javnozdravstvenom značaju doniranja organa

dobiveni su slijedeći podaci. Anketirano je 82 osoba mlaĎe (18-35 g.), 77 zrelije

(36-55 g.) i 41 starije (55 i više g.) dobi. Na pitanje bi li donirali organe svojih

bliţnjih nakon njihove smrti, s DA odgovorilo je 80 ispitanika, s NE 44, a s NE

ZNAM 76 ispitanika. Tri najčešća odgovora su bila: NE ZNAM u mlaĎoj skupini

(44 osoba), DA u zreloj skupini (39 ispitanika), i DA opet u mlaĎoj skupini (24

osoba). Odgovor s najmanjoj frekvencijom je bio NE ZNAM u starijoj skupini (9

osoba). Sastaviti kontingencijsku tablicu opaţenih frekvencija i izračunati broj

stupnjeva slobode.

---------------------------

Postupak:

a) podaci:

-tri nezavisna uzorka u skupu: uzorak 1 – mlaĎi (18-35 g.) ispitanici, uzorak 2 –

zreliji (36-55 g.) ispitanici, uzorak 3 – stariji (55 i više g.) ispitanici

Page 84: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

χ2-test homogenosti skupa - ispituje se postoji li značajna razlika meĎu

uzorcima s obzirom na stav o doniranju organa svojih bliţnjih nakon njihove

smrti

-varijable: dob (ordinalna) s tri vrijednosti (mlaĎi, zreliji i stariji ispitanici); stav o

doniranju organa svojih bliţnjih (nominalna) s tri vrijednosti (DA, NE i NE

ZNAM) kontingencijska tablica tipa 3×3

b) traţe se:

-kontingencijska tablica opaţenih vrijednosti i broj stupnjeva slobode

Izračunavanje:

I) Izrada kontingencijske tablice opaţenih vrijednosti, povodeći se istim

pravilima kao u Primjeru 1.

82 + 77 + 41 = 200 80 - (24 + 39) = 17 82 - (24 + 44) = 14

76 - (44 + 9) = 23 41 - (17 + 9) = 15 44 - (14 + 15) = 15

II) Računanje broja stupnjeva slobode df:

df = (broj redova - 1) × (broj stupaca - 1) = (3 - 1)×(3 -1) = 4

Stav o doniranju organa bližnjih

Dob DA NE NE ZNAM Ukupno

18-35 g. 24 14 44 82

36-55 g. 39 15 23 77

> 55 g. 17 15 9 41

Ukupno 80 44 76 200

Page 85: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

-provjera računa:

horizontalno:

24 + 14 + 44 = 82 39 + 15 + 23 = 77

17 + 15 + 9 = 41 80 + 44 + 76 = 200

vertikalno:

24 + 39 + 17 = 80 14 + 15 + 15 = 44

44 + 23 + 9 = 76 82 + 77 + 41 = 200

Odgovor: Broj stup. slob. df = 4. Kontingencijska tablica opaţenih vrijednosti:

Stav o doniranju organa bližnjih

Dob DA NE NE ZNAM Ukupno

18-35 g. 24 14 44 82

36-55 g. 39 15 23 77

> 55 g. 17 15 9 41

Ukupno 80 44 76 200

Primjer 18. Stav prema doniranju organa 2. Nastavljajući se na problem u

Primjeru 17, na osnovi izraĎene kontingencijske tablice dobivena je vrijednost

χ2 = 19.067. Testirati hipotezu da postoji značajna razlika uzoraka (dobnih

skupina) s obzirom na njihov stav o doniranju organa bliţnjih. Uzeti kritičnu

vrijednost χ2* = 9.488 za α = 0.05 i df = 4.

---------------------------

Postupak:

Page 86: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

a) podaci:

-razina statističke značajnosti: α = 0.05

-broj stupnjeva slobode: df = 4

-χ2-vrijednost: χ2 = 9.488

-statistička hipoteza:

Nul-hipoteza (H0): Nema značajne razlike u stavu triju dobnih skupina o

doniranju organa bliţnjih. slijedno tome je:

Alternativna, suprotna hipoteza (H1): Postoje značajne razlike u stavu triju

dobnih skupina o doniranju organa bliţnjih.

b) traţi se:

-testirati hipotezu H0 i odlučiti koja će se zadrţati, H0 ili H1

Izračunavanje:

Kritična χ2-vrijednost: χ2* = 9.488

Testiranje: χ2 > χ2* tj. 19.067 > 9.488 H0 se ne moţe zadrţati pa se

odbacuje, a H1 se zadrţava, a vjerojatnost za H0 je P < 0.05.

Odgovor: Razlike u stavu triju dobnih skupina o doniranju organa bliţnjih su

značajne (df = 4, χ2* = 10.83 za α = 0.05, χ2 = 19.067, P < 0.05).

Primjer 19. Metabolički sindrom. Ispitane su dvije skupine – 100 shizofrenih

bolesnika u jednoj klinici za psihijatriju, te 100 zdravih osoba (kontrolna

skupina) na sistematskom pregledu. Cilj istraţivanja je bio utvrditi učestalost i

uzroke metaboličkog sindroma kod oboljelih od shizofrenije. OdreĎene su

Page 87: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

kritične vrijednosti pet sastavnica metaboličkog sindroma tj. opsega struka

(abdominalna pretilost), serumskih triglicerida (hipertrigliceridemija), serumskog

HDL-kolesterola (nizak HDL-kolesterol), krvnog tlaka (hipertenzija) i razine

glukoze u krvi (hiperglikemija). Dobiveni su slijedeći podaci za respektivno 0, 1,

2, 3, 4 i 5 sastavnica metaboličkog sindroma: 16, 16, 22, 29, 11 i 6 shizofrenih

bolesnika; 21, 22, 28, 17, 8 i 4 ispitanika iz kontrolne skupine. Sastaviti

kontingencijsku tablicu opaţenih frekvencija i izračunati broj stupnjeva slobode.

---------------------------

Postupak:

a) podaci:

-dva nezavisna uzorka u skupu: uzorak 1 – shizofreni bolesnici, uzorak 2 –

zdrave osobe (kontrolna skupina) χ2-test homogenosti skupa, gdje se ispituje

postoji li značajna razlika meĎu uzorcima s obzirom na broj sastavnica

metaboličkog sindroma

-varijable: zdravstveni status (nominalna) s dvije vrijednosti (shizofreni bolesnici

i zdravi ispitanici); broj sastavnica metaboličkog sindroma (diskretna) sa šest

vrijednosti (0, 1, 2, 3, 4 i 5) kontingencijska tablica tipa 2×6

b) traţe se:

-kontingencijska tablica opaţenih vrijednosti i broj stupnjeva slobode

Izračunavanje:

I) Izrada kontingencijske tablice opaţenih vrijednosti, upisujući vrijednosti u

odgovarajuće ćelije (brojevi u crnom) i računanje suma (brojevi u crvenom)

Page 88: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

II) Računanje broja stupnjeva slobode df:

df = (broj redova - 1) × (broj stupaca - 1) = (2 - 1)×(6 -1) = 5

Odgovor: Broj stup. slob. df = 5. Kontingencijska tablica opaţenih vrijednosti:

Broj sastavnica metaboličkog sindroma

Zdravstveni status 0 1 2 3 4 5 Ukupno

shizofreni bolesnici 16 16 22 29 11 6 100

zdravi ispitanici 21 22 28 17 8 4 100

Ukupno 37 38 50 46 19 10 200

Broj sastavnica metaboličkog sindroma

Zdravstveni status 0 1 2 3 4 5 Ukupno

shizofreni bolesnici 16 16 22 29 11 6 100

zdravi ispitanici 21 22 28 17 8 4 100

Ukupno 37 38 50 46 19 10 200

Primjer 20. Metabolički sindrom 2. Nastavljajući se na problem u Primjeru 19,

na osnovi izraĎene kontingencijske tablice dobivena je vrijednost χ2 = 6.347, s

Yatesovom korekcijom χ2 = 4.531. Testirati hipotezu da postoji značajna razlika

uzoraka (shizofrenih bolesnika i zdravih osoba) s obzirom broj sastavnica

metaboličkog sindroma. Uzeti kritičnu vrijednost χ2* = 11.070 za α = 0.05 i

df = 5.

Page 89: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

---------------------------

Postupak:

a) podaci:

-razina statističke značajnosti: α = 0.05

-broj stupnjeva slobode: df = 5

-χ2-vrijednost: χ2 = 6.347, s Yatesovom korekcijom χ2 = 4.531

-statistička hipoteza:

Nul-hipoteza (H0): Nema značajne razlike u broju sastavnica metaboličkog

sindroma izmeĎu shizofrenih bolesnika i zdravih ispitanika. slijedno tome je:

Alternativna, suprotna hipoteza (H1): Postoje značajne razlike u broju

sastavnica metaboličkog sindroma izmeĎu shizofrenih bolesnika i zdravih

ispitanika.

b) traţi se: testirati hipotezu H0 i odlučiti koja će se zadrţati, H0 ili H1

Izračunavanje:

Kritična χ2-vrijednost: χ2* = 11.070

Testiranje: χ2 < χ2* tj. 6.347 < 11.070 i 4.531 < 11.070 H0 se ne moţe odbaciti

pa se prihvaća, a H1 se odbacuje, a vjerojatnost za H0 je P > 0.05.

Odgovor: Razlike izmeĎu shizofrenih bolesnika i zdravih ispitanika u broju

sastavnica metaboličkog sindroma nisu značajne (df = 5, χ2* = 11.070 za

α = 0.05, χ2 = 6.347, s Yatesovom korekcijom χ2 = 4.531, P > 0.05). Broj

sastavnica metaboličkog sindroma je ovdje shvaćen kao kategorijska

(ordinalna) varijabla.

Page 90: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Primjer 21. Srčani udar.

Bolnički podaci za manju

skupinu bolesnika koji su

imali srčani udar su dani u

tablici desno. Varijable: spol

(M – muški, F – ţenski);

dijagnoza prema

meĎunarodnoj klasifikaciji

(41041, 51051 i 41091 prema

mjestu oštećenja srca);

dijagnostička grupa bolesnika

(121 – bolesnici koji su

preţivjeli s kardiovaskularnim

komplikacijama, 122 –

bolesnici koji su preţivjeli bez

kardiovaskularnih

komplikacija, 123 – umrli).

Sastaviti kontingecijsku

tablicu i odrediti df za

testiranje razlika spolova s

obzirom na dijagnozu i

dijagnostičke skupine.

Page 91: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

---------------------------

Postupak:

a) podaci:

-dva nezavisna uzorka u skupu: uzorak 1 – muškarci, uzorak 2 – ţene

χ2-test homogenosti skupa, gdje se ispituje postoji li značajna razlika meĎu

spolovima s obzirom na dijagnozu oštećenja srca i s obzirom na pripadnost

dijagnostičkoj grupi

-varijable: spol (nominalna) s dvije vrijednosti (muški i ţenski bolesnici);

dijagnoza oštećenja srca prema meĎunarodnoj klasifikaciji (nominalna) s tri

vrijednosti (41041, 41051 i 41091); dijagnostička grupa (nominalna) s tri

vrijednosti (121, 122 i 123) dvije kontingencijske tablice tipa 2×3

b) traţe se:

-dvije kontingencijske tablice opaţenih vrijednosti i broj stupnjeva slobode

Izračunavanje:

I) Izrada kontingencijskih tablica opaţenih vrijednosti (idući slajd), upisujući

vrijednosti u odgovarajuće ćelije (brojevi u crnom) i izračunavanje drugih

(brojevi u crvenom), povodeći se Primjerom 11. Potrebno je paţljivo prebrojiti

sve bolesnike po spolu, zatim po manjim skupinama, i izračunati preostale

brojeve, te na kraju provjeriti cijelu tablicu zbrajanjem po brojeva kao u

prethodnim primjerima.

II) Računanje broja stupnjeva slobode df koji je isti za obje tablice:

df = (broj redova - 1) × (broj stupaca - 1) = (2 - 1)×(3 -1) = 2

Page 92: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Dijagnoza oštećenja srca

Spol 41041 41051 41091 Ukupno

muški 6 3 6 15

ženski 6 3 7 16

Ukupno 12 6 13 31

Primjer popunjavanja ćelija:

6 - 3 = 3 31 - 15 = 16 31 - (6 + 13) = 12 12 - 6 = 6

15 - (6 + 3) = 6 13 - 6 = 7 ili 16 - (6 + 3 ) = 7

Dijagnostička grupa

Spol 121 122 123 Ukupno

muški 7 6 2 15

ženski 5 10 1 16

Ukupno 12 16 3 31

Primjer popunjavanja ćelija (plavo su označeni brojevi iz prethodne tablice):

31 - (16 + 3) = 12 16 - 10 = 6 16 - (10 + 1) = 5 12 - 5 = 7

Obje kontingencijske tablice su jednostavne za popuniti, a točnost

popunjavanja se jednostavno provjerava zbrajanjem brojeva po redovima i po

stupcima. Brojevne oznake razreda ovdje nemaju brojevne vrijednosti.

Napomena. Brojevi unutar kontingencijske tablice jesu uvijek svi brojevi

koji ne pripadaju stupcu ili redu pod nazivom „Ukupno”.

Page 93: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Odgovor: Broj stupnjeva slobode za obje kontingencijske tablice je df = 2.

Kontingencijske tablice opaţenih vrijednosti su:

Dijagnoza oštećenja srca

Spol 41041 41051 41091 Ukupno

muški 6 3 6 15

ženski 6 3 7 16

Ukupno 12 6 13 31

Dijagnostička grupa

Spol 121 122 123 Ukupno

muški 7 6 2 15

ženski 5 10 1 16

Ukupno 12 16 3 31

Napomena. Pod kontingencijskom tablicom koja sadrži dvije varijable se

podrazumijevaju ćelije koje sadrže vrijednosti tih varijabli. Popuniti takvu

kontingencijsku tablicu znači upisati brojeve u ove ćelije. Dodatan stupac

„Ukupno” i red „Ukupno” služe samo za provjeru točnosti upisa brojeva u

kontingencijsku tablicu, i nisu u pravom smislu sastavni dijelovi te

tablice.

Page 94: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Primjer 22. Srčani udar 2. Nastavljajući se na problem u Primjeru 21, na osnovi

izraĎene kontingencijske tablice dobivene su vrijednosti: χ2 = 0.045, s

Yatesovom korekcijom χ2 = 0.235 za varijable spol i dijagnoza oštećenja srca;

χ2 = 1.636, s Yatesovom korekcijom χ2 = 0.669 za varijable spol i dijagnostička

grupa. Testirati hipoteze da postoje značajne razlike spolova s obzirom na dvije

spomenute varijable, na razini statističke značajnosti α = 0.05 i za df = 2

(kritična vrijednost χ2* = 5.991).

---------------------------

Postupak:

a) podaci:

-razina statističke značajnosti: α = 0.05

-broj stupnjeva slobode: df = 2

-χ2-vrijednost: Test 1 --- χ2 = 0.045, s Yatesovom korekcijom χ2 = 0.235;

Test 2 --- χ2 = 1.636, s Yatesovom korekcijom χ2 = 0.669

-statističke hipoteze:

Test 1 --- H0: Nema značajne razlike spolova u dijagnozi oštećenja srca.

H1: Postoje značajne razlike spolova u dijagnozi oštećenja srca.

Test 2 --- H0: Nema značajne razlike spolova u pripadnosti dijagnostičkim

skupinama. H1: Postoje značajne razlike spolova u u pripadnosti

dijagnostičkim skupinama.

b) traţi se za oba testa: testirati hipotezu H0 i odlučiti koja će se hipoteza

zadrţati, H0 ili H1

Page 95: III.3. Primjer neparametrijskog testa: 2-test (hi-kvadrat

Izračunavanje:

Kritična χ2-vrijednost: χ2* = 5.991

Testiranje:

Test 1 --- χ2 << χ2* tj. 0.045 << 5.991 i 0.235 << 5.991 H0 se nikako ne moţe

odbaciti pa se prihvaća, a H1 se svakako odbacuje, a vjerojatnost za H0 je

P > 0.05.

Test 2 --- χ2 < χ2* tj. 1.636 < 5.991 i 0.669 < 5.991 H0 se ne moţe odbaciti pa

se prihvaća, a H1 se odbacuje, a vjerojatnost za H0 je P > 0.05.

Odgovor: Razlike meĎu spolovima nisu značajne ni s obzirom na dijagnozu

oštećenja srca (df = 2, χ2* = 5.991 za α = 0.05, χ2 = 0.045, s Yatesovom

korekcijom χ2 = 0.235, P > 0.05), niti s obzirom na pripadnost dijagnostičkoj

grupi (df = 2, χ2* = 5.991 za α = 0.05, χ2 = 1.636, s Yatesovom korekcijom

χ2 = 0.669, P > 0.05). Iako je učinjena Yatesova korekcija zbog najmanje 1/3

ćelija s vrijednostima manjim od 5, statističkim testiranjem su dobivene male

vrijednosti χ2 u odnosu na kritičnu vrijednosti. Drugim riječima, muškarci i ţene

koje su imale srčani udar podjednako su zastupljeni u svim dijagnozama

oštećenja srca i u pripadnosti dijagnostičkim skupinama.

Pošto se radilo o malo skupu (31 osoba), prebrojavanje zastupljenosti tj.

odreĎivanje apsolutnih frekvencija obavilo se ručno. U slučaju većih uzoraka

prebrojavanje se treba obaviti računalnim programom, tj. odreĎenim opcijama u

nekom od pogodnih programa (Excel, Word, SPSS i dr.).