기초통계와피험자수산출 : sample size and...

63
기초 통계와 피험자수 산출 : Sample size and pow 김호 서울대학교 보건대학원 2005/05/28

Upload: others

Post on 20-Jun-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

기초 통계와 피험자수 산출: Sample size and power

김 호

서울대학교 보건대학원2005/05/28

Page 2: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

P-value (1)

• 연구목적 : 관심변수의 (모)평균이 두 집단에서 다르다.

• 첫 번째 집단에서의 표본 평균

• 두 번째 집단에서의 표본 평균

• 만약 두 집단에서의 모평균이 같다고 하면

• 두 표본 평균은 비슷할 것이다.

• 표본평균의 차이를 반복적으로 구해보면

1Y

2Y

Page 3: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

P-value (2)

0

통계적으로 대단히 일어나기 어려운 사건

Page 4: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

P-value (3)

• P-value = 두 집단의 평균이 같다고 가정했을때 우리의 자료, 혹은 더 차이가 나는 자료를 얻을 확률

• 작은 p-value : 위의 확률이 작다

통계적으로 가능하지 않은 일이 일어났다.

두 집단의 평균이 같다는 가정에 문제가 있다.

두 집단의 평균은 같지 않다고 결론 내린다.

Page 5: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

P-value (3)

• 작지 않은 p-value : 두 집단의 평균이 같다고 가정하면 우리의 자료를 관측할 확률이 작지 않다.

두 집단의 평균이 같다는 가정에 문제가없다.

양쪽검정, 한쪽검정

Page 6: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

• A(얻은 자료) -> B (연구가설)

• -B -> -A

• 귀무가설 (-B) : 두 집단에 차이가 없다. (Ho)

• 대립가설 (B) : 두 집단에 차이가 있다. (Ha)

• 일종의 오류 : 옳은 귀무가설을 기각할 확률

= Pr (reject Ho | Ho is true)

• 이종의 오류 : 틀린 귀무가설을 받아들일 확률

= Pr (Not reject Ho | Ha is true)

• Power = 1- (있는 차이를 발견할 확률)

α

β

β

Page 7: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

Y ~

Fact

기각역

Bin(100, ) Ho: =1/2 vs. Ha: 1/ 2 p p p <

(0,1)(1 )Y p N

p pn

−−

type I error Pr(Reject Ho|Ho is true)

0.5= Pr 1.645 | 1/ 20.5*0.5

100Pr( 1.645) 0.05

Y p

Z

=

− < − =

= < − =

예제

< -1.645(1 )Y p

p pn

−−

~

Page 8: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

라는 자료를 얻었다면

검정통계량이 기각역에 들지 않으므로 귀무가설을기각할 수 없다.

P-value = Ho가 사실일 때 우리의 자료 혹은 더(대리가설 쪽으로) 차이가 나는 자료를 얻을 확률

45 /100 0.45 Y = =

Pr( 1)Z < − =

예제

~0.45 0.5 1 1.6450.5*0.5

100

− = − > −

Page 9: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

검정력을 구하려면

Fact 에서 p=1/2이 아니다

검정력을 계산하려면 대립 가설 하에서의 p값을 정확히 밝혀야 한다.

(0,1)(1 )Y p N

p pn

−−

Power Pr(Reject Ho|Ha is true)

0.5= Pr 1.645 | ?0.5*0.5

100

Y p

=

− < − =

예제

~

Page 10: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

정확한 문제 : Ha=1/3일 때의 검정력을 구하시오

Fact 13 (0,1)

1 1(1 )3 3

YN

n

Power Pr(Reject Ho|Ha is true)

0.5= Pr 1.645 | 1/ 30.5*0.5

100

Y p

=

− < − =

예제

~

Page 11: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

( )( )

Power Pr(Reject Ho|Ha is true)

0.5= Pr 1.645 | 1/ 30.5*0.5

100= Pr 0.5 1.645*0.05 | 1/ 3

= Pr 0.5 0.082 | 1/ 3

1/ 3 0.418 1/ 3= Pr | 1/ 31/ 3*2 / 3 1/ 3*2 / 3

100 100Pr( 1.796)

Y p

Y p

Y p

Y p

Z

=

− < − =

− < − =

< − =

− − < =

= < =

예제

Page 12: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

0

0 0

0.418Power Pr*(1 )

100

pZp p

−= < −

예제

일반적으로는

> p0= (0:50)/100> power=pnorm((0.418-p0)/sqrt(p0*(1-p0)/100))> plot(p0,power)

Page 13: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

모수적 방법과 비모수적 방법 (1)

3.5191,2,3,4,5,100

331,2,3,4,5

중앙값평균자료

• 중앙값(median)은 평균에 비하여 이상치에 대해서 둔감(robust)하다.

• 자료의 정규성 분포가정을 하면 평균과 분산을 통하여 모집단의 성질을 완전히 파악할수 있다. (모수적 방법)

Page 14: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

모수적 방법과 비모수적 방법 (2)

• 비모수적 방법은 자료의 (정규성) 분포가정을 하지 않는다

• 자료의 평균과 분산이 아닌 순위를 이용한 방법을 사용한다.

• 자료의 분포가정 (eg 정규성)이 만족되면효율이 떨어진다.

•Robust 한 결과를 준다. (outlier에 둔감)

Page 15: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

Likelihood and maximum likelihood estimator

• Likelihood

=Pr(getting our data|Given model)

e.g. 100명의 사람을 관찰했더니 30명의 환자를 관찰하였다.

Model : Y=100명의 사람 중 환자의 숫자

Binomial (n=100, p)

Page 16: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

Likelihood and maximum likelihood estimator

• 확률밀도함수

=Pr(Y=y|Given model)=

Maximum likelihood estimator

=확률밀도함수를 최대화 시켜주는 p

이 경우 MLE는 30/100=0.3 임을 보여줄 수있다.

100100(1 )y yp p

y−

Page 17: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

ex) 한 test 에서 유의수준이 인 test가 있다고 하자.

일반적으로 를

multiple comparison을 한다면

overall 는 0.05가 아니라 0.1855가 되므로 type I error가

Inflate 되었다.

α

∴∴∴

01 1 01 01

02 2 02 02

0 0 0 01 02

01

Let : 0, Pr(do not reject H H is true) 1

: 0, Pr(do not reject H H is true) 1

then Pr(do not reject ) where and

Pr(do not reject H and do no

H

H

H H H H H

α αα α

= = −

= = −

=

= 02 0

2

t reject )

(1- ) (1- ) (1- )

H H

α α α= =

1 2 3 0kα α α α= = = ⋅⋅⋅⋅ = =

4

(1 ) (1 )1 0.1855 0.8145 ( .95) .95

kα α− ≤ −− = = ≤

∴ α

Multiple Comparisons

Page 18: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

Bonferroni Correction : 만약 m개의 multiple comparison을 한다

면 각각의 유의수준을 로 하면 전체의 유의수준을 에 가깝게

할 수 있다.

예)m이 4인 경우

응용) 10개의 mean을 비교하는 경우

p값의 기준을 0.05로 하면 overall p값을 유지할 수 없으므로 각각

의 경우 를 기준으로 test를 실시한다.

이를 “Bonferroni corrected p-value”라고 한다.

mα α

40.05(1 ) 0.95 1 0.054

− ≅ = −

0.05 0.00510

=

Multiple Comparisons

Page 19: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

Terminology (Piantadosi)

• Phase I trial: a clinical trial designed to measure the distribution, metabolism, exertion, and toxicity of a new drug. DF

• Phase II trial: a clinical trial design to test the feasibility of, and level of activity of, a new agent or procedure SE

Page 20: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

Terminology

• Phase III trial: a clinical trial designed to estimate the relative efficacy of a treatment against a standard, alternative, or placebo. CTE

• Phase IV trial: a surveillance clinical trial design to estimate the frequency of uncommon side effects, toxicity, or interactions. ES

Page 21: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

Terminology

• DF (dose-finding): a type of drug development trial design that has as a primary objective identifying the optimal dose of drug to administer.

• SE (safety and efficacy): a type of trial design with safety and efficacy estimation as a primary objective.

Page 22: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

Terminology

• CTE (comparative treatment efficacy): a type of trial design which assesses the efficacy of a new treatment relative to an alternative, placebo, standard therapy, or no treatment.

• ES (expanded safety): a type of surveillance trial design that has a primary objective of estimating the frequency of uncommon side effects from a particular treatment.

Page 23: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

Terminology

• Parameter: a constant in a model, or a constant that wholly characterizes function or a probability distribution

Y=a+b x2( , )N µ σ

2

2

1 ( )exp22

x µσπσ

−−

Page 24: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

Terminology

2( , )N µ σ

분위수 : quantile

0.025

0.050

0.025

0.05

1.9601.645

ZZ

==

Page 25: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

표 4. 표준정규분포 하에서의 Z값

1.645 1.282 0.842

0.95 0.90 0.80

0.05 0.10 0.20

2.813 2.576 2.248 1.960 1.645 1.282 1.036 0.842 0.674

2.576 2.326 1.960 1.645 1.282 0.842 0.524 0.253 0.000

0.005 0.010 0.025 0.050 0.100 0.200 0.300 0.400 0.500

양측단측Zβ

검정력(power)

제2종 오류(β)

Zα제1종 오류(α)

Page 26: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

Get Motivated <예시1>

n++n+2n+1

n2+n22 52n21 48-

n1+n12 48n11 52+

Trt BTrt A

( )( )

( )( ) ( )

211 1 12 1 2 1 2

11 211

22

2

/,

1

52 100 100 / 2000.32, 0.05

100 100 100 100 / 200 199

n n n n n n n nvv n n

p

χ

χ

+ + ++ + + + +

++ ++

−= =

− ×= = >

× × × ×

Page 27: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을
Page 28: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

통계학에서의 표본수 계산

• 표본조사의 경우

- 목적 : 추정 (estimation)- 도구 : 표본오차

- 예 : 여론조사

• 임상시험의 경우

- 목적 : 검정 (testing)- 도구 : 제1종의 오류, 제2종의 오류

- 예 : 임상시험

Page 29: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

• 단순임의 추출(simple random sampling)에서

• N : 모집단의 크기, n :표본의 크기라면

( )1

2

2

22

2

ˆ /

1

1.96 ( ) 2 :1

, /4( -1)

n

ii

y y n

N nVar yn N

N nVar y Bn N

Nn D BN D

µ

σ

σ

σσ

=

= =

− = ⋅ −

−× ⋅ =−

= =+

95%신뢰구간 (표준오차)

Page 30: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

• 만약 가 0 혹은 1의 값을 가지게 되면,

는 비율이 되고,

이 경우 가 된다.

예1) N=2000, 95% 신뢰수준, B=0.05이라면 n은 ?

>> 사전정보가 없다면 p=q=0.5 대입

최소한 334명의 표본이 필요하다.

2 2/ 4 0.05 / 4 .0006252000 0.5 0.5 333.56

1999 .000625 0.5 0.5

D B

n

= = =× ×= =

× + ×

iyy

( 1)Npqn

N D pq=

− +

Page 31: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

연구대상수의 계산 시 고려할 사항• 어떠한 연구설계인가? (연구설계의 형태)• 처치 후 결과는 언제 나타나는가?

(처치효과의 지연기간)• 처치의 결과는 이산형인가 연속형인가?

(결과의 척도)• 연구기간을 얼마나 길게 할 것인가?

(예상되는 추적기간)• 중도에 탈락하는 사람은 얼마나 될 것인가?

(예상되는 추적손실)• 연구자의 지시대로 치료를 잘 받는가?

(예상되는 처치의 비순응율)• 할당비는 얼마로 할 것인가? (시험군 : 비교군)• 시험집단의 수는 몇 개로 할 것인가?

Page 32: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

연구설계의 형태

1) 고정형 연구설계 (Fixed sample size design)

임상시험을 시작하기 전에 연구자가 필요한 연구대상수

를 확정하는 방법.

2)연속형 연구설계(Sequential design)시험군과 비교군의 관찰된 결과의 차이가 미리 설정된 유

의한 범위를 벗어날 때까지 계속해서 연구대상을 모집

하여 진행하는 방법.

Page 33: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

결과변수의 척도• 연속형 변수

– 비척도(Ratio Scale) : 혈당량, 혈압, 적혈구수, 무게(mg, Ib등), 부피

(cc, m3 등), 비율, 시간의 길이

– 간격척도(Interval scale) : 온도(℃,℉), Circular scale(1년, 24시간, 방

위)

• 범주형변수

– 순위척도(Ordinal scale) : 암의 진행정도(제1기, 제2기, 제3기), 당뇨

의 정도(+, ++, +++) 등

– 명목척도(Nominal scale): 생사여부, 질병발생여부, 종교의 종류 등

Page 34: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

가설설정1) 귀무가설(null hypothesis, H0) : 시험의 효과가 없다

2) 대립가설(alternative hypothesis, Ha) 증명하고자 하는

가설.

예) 새로 개발된 항암제의 치료율(Pt)이 기존 약의 치료율(Pc)

보다 높을 것이라는 연구목적을 실험하고자 할 때

새로 개발된 소염제와 기존 소염제의 치료 후 관절염의

재발율에 차이가 있는 지를 보고자 할 때

• 동일한 와 를 사용하였을 경우 단측보다도 양측의

경우가 더 많은 연구대상수를 필요

α β

( ): , 0,a t c t cH P P P P≠ − ≠또는 양측가설

( ): , 0,a t c t cH P P P P> − >또는 단측가설

Page 35: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

• 표2. 가설검정시 발생 가능한 4가지 상황

옮음(검정력= )

제1종 오류( )H0 기각

제2종 오류( )옳음

H0 채택

H0 거짓(Ha 참)

H0 참

모집단의 진실표본을 이용한가설검정결과

(1 )α−

α 1 β−

β

Page 36: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

오류의 비교

• Ho : 두 약의 효과의 차이가 없다.

• Ha : 두 약의 효과에 차이가 있다.

• 제 1 종의 오류 = P(차이가 있다. |실제는 차이가

없다)

• 제 2 종의 오류 = P(차이가 없다. |실제는 차이가

있다)

Page 37: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

• 표3. 제1종 오류와 제 2종 오류의 설정기준

치료법이 새로운 방법이고, 비용이 많이 들고, 심각

한 부작용을 일으키는데 반하여 비교군의 처치방법

은 이미 널리 사용되고 있으며, 안전하고 효과적이

라고 알려져 있는 경우.

치료군의 비용이 비교적 저렴하고, 적용하기 쉬우

며, 알려져 있는 심각한 부작용이 없고 또한 비교군

의 처치 방법이 없는 경우.

치료군과 비교군이 모두 새로운 처치 방법이며, 처

치비용이 비슷하고, 모두 안전하다고 생각할 만한

충분한 이유가 있을 때.

적용기준와 의설정

α β=

α β>

α β<

α β

Page 38: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

이분형 결과에 대한 비교(비율을 비교하는 경우)

• 두 비율의 비교

2p̂

0 1 2 1 2 1 2

11

0

1 2 1 2

1

: ( ) . :ˆ ˆ Z= , ( ) / 2 , 12 /

Reject, , , :

ˆ , , , :

a

a

H P P P P vs H P Pp p p q p

pq nH if Z Z

P P Q Qp

= < >− = + = −

>

검정통계량

실제 관심이 있는 미지의 고정된 수(모수)

모수를 추정하기 위한 추정치2p̂

2p̂

2q̂1q̂

Page 39: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

( )

0 0

11 2

0

11 2

1

1 1 1 2 2

(Reject | is true)

ˆ2 /

| ~ (0,1)power (Reject | is true)

ˆ2 /

ˆ( | )ˆ( | ) ( ) /

a

a

a

a

a

a

P H H

pP Z Z P Ppq n

P Z Z Z NP H H

pP Z Z P P dpq n

E p H dVar p H PQ P Q n

α =

−= = > =

= >=

−= = > − =

− =− = +

2p̂

2p̂

2p̂

2p̂

Page 40: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

β

Z β

1 β−

1Z Zβ β−− =

β

Z β

β

Z β

1

1 1 2 1 2

1 21 1 2

1 1 2 2 1 1 2 2

1 2

1 1 2 2

1 2

1

ˆ* 0

2 /

ˆ( ( ) 2 / ( ) | 0)

ˆ 2 / ( )( ) 0( ) / ( ) /

2 / ( )0

( ) /

1

2 / ( )*

(

a

a

pP Z dpq n

P p P P Z pq n P P d

Z pq n P Pp P PP dPQ P Q n PQ P Q n

Z pq n P Pp Z d

PQ P Q n

Power

Z pq n P PP

α

α

α

β

− > >

= − − − > − − >

− −− − −= > > + + − −

= > > + = = −

− −

( )1 2 2

2

1 1 2 2

2

) /

2 ( )

ZQ P Q n

Z pq Z PQ P Qn

d

β

α β

= −+

+ +=

2p̂

2p̂

2p̂

Page 41: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

예) 신약의 부작용 발생률이 기존 약의 부작용 발생률(30%

로 알려져 있다고 하자)보다 5% 이상 작다는 것을 증명

하고자 하는 연구에서의 적절한 표본수는 ? 6개월 동안

추적손실은 5%이며 환자의 순응도는 90%라고 가정한다.

일종의 오류=5%, 검정력=80%

2

1.645, 0.840( )

(0.30 0.25)/2 0.275

1.645 2 0.275 0.725 0.840 0.3 0.7 0.25 0.75 983.900.05

Z Z

Pα β= =

= + =

× × + × + × =

단측검정

이며

Page 42: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

91215

101317

111418

111419

111419

111419

111418

101317

111419

121621

131722

141823

141824

141824

141823

131722

131722

151925

162128

172229

182330

182331

182330

172229

172128

192432

212735

232938

243040

243141

243141

243040

212735

253142

2873547

303851

324154

334256

334256

334256

273546

334356

384965

425472

455877

476080

486182

486182

384965

486282

577296

6481

108

6988

117

7393

124

7596

128

7697

129

5975

100

7899

133

95120161

108138184

119152203

128162217

133169226

136173231

110140187

156199266

197250334

231293392

258328439

280356476

295375502

305387518

342434581

539685916

7129041210

86010931462

98412491672

108313751840

115714691966

120615322050

.05

.10

.15

.20

.25

.30

.35

.40

0.500.450.400.350.300.250.200.150.100.05

Expected difference between P1 and P2Smaller of P1 and P2a

upper number : α = 0.05 (one-tailed) or α = 0.10 (two-tailed) ; β = 0.20middle number : α = 0.025 (one-tailed) or α = 0.05 (two-tailed) ; β = 0.20lower number : α = 0.005 (one-tailed) or α = 0.01 (two-tailed) ; β = 0.20

표5. 두집단의 비율 비교시의 표본수표(단형할당의 경우 각 집단별 표본수)

Page 43: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

91215

---

---

---

---

---

---

---

---

---

121621

111419

---

---

---

---

---

---

---

---

162128

151925

131722

---

---

---

---

---

---

---

232938

212735

192432

172128

---

---

---

---

---

---

324154

303851

283547

253142

212735

---

---

---

---

---

476080

455877

425472

384965

334356

273546

---

---

---

---

7596

128

7393

124

6988

117

6481

108

577296

486282

384965

---

---

---

136173231

133169226

128162217

119152203

108138184

95120161

7899

133

5975

100

---

---

308391523

305387518

295375502

280356476

258328439

231293392

197250334

156199266

110140187

---

123115632092

123115632092

120615322050

115714691966

108313751840

98412491672

86010931462

712904

1210

539685916

342434581

.45

.50

.55

.60

.65

.70

.75

.80

.85

.95

0.500.450.400.350.300.250.200.150.100.05

Page 44: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

추적 손실과 순응도를 고려하면 각 처리군 별로

984 1150.88 1151 .(1 0.05) 0.90

n = = ≅− ×

의 표본수를 얻는다

Page 45: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

이형할당인 경우

• 만약 이라면 이라고 하고

• 이면 단형할당과 동일

t cn nλ= ( ) /(1 )c tP P Pλ λ= + +

( )2

2

( 1) / /

1

c c t t

cA

Z PQ Z PQ PQn

α βλ λ λ

λ

+ + +=

=

Page 46: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

연속형 변수의 비교

예) 새로운 관절염 치료제의 치료효과에 대한 임상실험을

실시한다고 하자.

치료효과는 2주간 치료 후 혈중 Prostag-landing 양이 평균

10 , 표준편차 2 이면 치료가 된 것으로 간주한다. 치료 후

두 집단의 혈중 Prostaglandin 양의 변동이 20% 미만이면

두 치료제의 효과는 동등한 것으로 간주한다. 단측 검정

으로 연구 대상수를 구하시오. 또 동일한 가정으로 양측

검정의 결과와 비교하시오.

결과의 척도 :Prostaglandin농도 (연속형)

Page 47: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

( )2 2

2

1.645 , 1.282

2 1.645 1.282 2.017.13 18

2t c

Z Z

n n

α β= =

× + ×= = = ≅

2 2

2

2( )( )c

c t

Z Zn α β σ

µ µ+

=−

1 2 2 / (10 0.2) , 2.0 /A gm dl gm dlµ µ µ σ µ∆ = − = × =

Effective Size (=E/S)= 1 2( ) /µ µ σ−

Page 48: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

• 표 6. 두 집단의 평균 비교시의 표본수표(단형할당의 경우 각 집단별 표본수)

1237550309

19813777

493425

191512

1713762428

274190107

694835

272117

2165962541

346241135

876044

342722

1570698393

25117498

634432

251916

2102934526

336234131

845843

332621

25991155650

416289162

1047253

413226

23771038584

374260146

936548

362923

29771323744

476331186

1198361

473730

35631584891

570396223

1439973

564436

.10.15.20

.25

.30

.40

.50

.60

.70

.80

.901.00

0.200.100.050.200.100.050.200.100.05β=

E/Sa

0.050.10

0.0250.05

0.0050.01

One-tailed α =Two-tailed α =

Page 49: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

• 표6을 이용하면 E/S=2/2=1 , n=17한편 양측검정을 실시하면 이므로

표6를 이용하면 n=21

1.960Zα =

2 2

2

2 (1.960 1.282) 2.0 21.02 212t cn n × + ×= = = ≅

Page 50: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

시간형 결과의 비교 (생존분석 이용)모수적 방법 (지수분포 이용)

• 총 사건수

• 예) 검정력 90%를 가지고 위험비 2.0을 95% 유의수준의양쪽 검정으로 유의하게 감지할 수 있는 검정을 위해서는

즉 실험군 비교군 각각 44개의사건이 필요하게 된다.

표7 과 동일한 결과

2

2

( )4 ,

(log( ))Z Z

D α β

θ+

= ∆ =위험비

2

2

(1.96 1.282)4 87.50 88 .(log(2.0))

event+ = ≅ 가 필요하다

Page 51: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

• 표7. 로그 순위 검정을 이용한 비교를 위해 필요한 (두 집단의) 총표본수 표 (위:모수적, 아래:비모수적 방법)

496500

150154

8084

5256

3842

3034

630636

192196

100106

6670

4854

2842

688694

208214

110116

7278

5258

4248

844852

256262

134142

8894

6472

5058

1.25

1.50

1.75

2.00

2.25

2.50

α=0.10α=0.05α=0.10α=0.05⊿ 양측

β=0.2β=0.1

Page 52: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

시간형 결과의 비교 (생존분석 이용)

비모수적 방법 (로그순위 검정 이용)• 단형할당의 경우 총 사건수

• 예) 검정력 90%를 가지고 위험비 1.75를 95% 유의수준의

양쪽 검정으로 위험비 1로부터 유의하게 감지할 수 있는

검정을 위해서는

• 만약 30%가 실험 종료까지 사건이 발생하지 않는다면(event free) (중도절단비, censoring rate=30%),총표본수는 141/0.30=202로 주어진다.

2 2

2

( ) ( 1)4

( 1)Z Z

D α β θθ

+ +=

( )2 2

2

1.96 1.282 (1.75 1)141

(1.75 1)D event

+ += < >

−= 표7

Page 53: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

비율의 동등성 비교• 동등성(bioequivalence) 실험에서는 두 처리가 동등하는

가설을 증명하고자 하므로 전통적인 방법에서의 대립가설과 귀무가설을 바꾸어주어야 한다. 즉,

그런데 이는 너무 엄격한 증명이므로 많은 경우

를 검정하고자 한다. 이 경우에 를 가정하면임상적 동등성 시험의 표본수는 다음과 같이 주어진다.

0 1 2 1 2: . :aH p p vs H p p≠ =

0 1 2 1 2: . :aH p p vs H p pδ δ− > − ≤

1 2p p p= =

( ) ( )2

22

1 (1 )

( )

Z Z p pα β λ

λ ε

+ + −

Page 54: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

• 예제) Bradslow 등의 논문에서: 20% 보다 작은 차이는 동

등하다고 간주, 유의수준 90%, 80% 검정력, 반응률 50%

가정

• 즉 집단 당 78, 총 156의 표본수가 필요하다.

[ ][ ]

1 22

2

0.20, 1, 0.5(1.645 0.842) .5 .5 2

77.3 780.20

p p pε λ= = = = =

+ × ×= ≅

대입하면

Page 55: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

• 비열등성 임상시험의 경우에는 대신에 를 대입한

다.

예제) breast cancer의 치료를 위하여 mastectomy와 simple

removal of the lump의 방법을 비교하는데 최악의 경우라

도 lump removal이 mastectomy보다 10% 이상은 나쁘지는

않다는 것을 보이고 싶다. mastectomy 후 5년 후 생존률이

60% 라고 하고 lump removal이 50%이상 생존률을 보이기

위한 표본수 ?

( ) [ ][ ]

0.102

2

0.10, 1, =0.6 1.282

1.282 0.842 .6 .4 2216.5 217

0.10

p Zε λ= = =

+ × ×= ≅

대입, 단측검정 를 사용

2Zα Zα

Page 56: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

평균의 동등성 비교

• 각 처리군별 표본수

• 예) 특정 약을 투약한 환자들의 DBP의 평균이 96 mmHg,

대조군의 DBP 평균은 94 mmHg라고 가정을 하고, 또한

DBP의 SD가 근사적으로 8 mmHg라고 하자. 한 연구자가

혈압의 차이가 5 mmHg 이하라는 것을 보이고 싶다면,

(비열등성성 실험) 적절한 표본의 크기는 ? 80% 검정력과

5% 유의수준을 가정하자.

2 2

2

(1 )( )

c t

Z Zm α βσ λ

λ µ µ ε

+ +=

− −

Page 57: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

[ ]

1 2

20.95 0.8

22

1 2

94, 96, 5, 8 0.05, 1 0.80

( ) 6.183

8 2 6.183 87.9(96 94) 5

90 2 90 180

31.7 32 64

Z Z

m

N

m N

µ µ ε σα β

µ µ

= = = == − =

+ =

× ×= =− −

= × ==

= ≅ =

이고

한 쪽 검정으로

이고 이를 대입하면

대략 ,총합 을 얻는다.

만약 의 관계를 가정하면,

그룹 당 , 총 임을 보일 수 있다.

이므로

Page 58: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

연구대상수를 최소화하는 방법

1) 연속변수를 사용한다.예를 들면 혈압을 연속형(mmHg) vs. 이분형(고혈압 여부)

2) 변수를 보다 정밀하게 측정한다.분산 줄이기

3) 짝 측정치를 사용하라.4) 이형 할당법을 사용한다.5) 보다 일반적인 결과를 사용한다.

Page 59: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

Phase II trials• Fleming’s single-stage procedure

• : largest response proportion which clearly imply no investigation (=0.1, say)

• : smallest proportion for further investigation (=0.2, say)

• One-sided hypothesis are

versus

NEWπ

0π π≤ NEWπ π≥2

1 0 0 1Fleming 2

0

{ [ (1 )] [ (1 )]}( )

NEW NEW

NEW

Z ZN α βπ π π π

π π− −− + −

=−

Page 60: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

Phase II trials (example)

• Standard treatment : 35%

• From phase I : experimental trt is more toxic

• N ? For one-sided test is set at 5% and the power at 80%

• An investigator set

•• If then

0 0.3π = 0.5NEWπ =

Fleming 35N =

0.6NEWπ = Fleming 16N =

Page 61: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

Phase II trials• Gehan’s two-stage procedure

• : minimum requirement of efficacy

• Patients are recruited in two stages

• If no response in the 1st stage then no recruit in the 2nd stage

• If one or more in the 1st stage, then n(2nd

stage) is depend on n(1st)• Simon’s two stage design: minimize

(expected n for 1st and maximum n for 1 and 2 combined)

Page 62: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

참고서적1)Piantadosi, S. (1997), Clinical Trials, A methodological

perspectives, John Wiley & Sons, New York.

2)Machin, D. et al. (1987), Sample size tables for clinical

studies, Blackwell Sciences, London.

3)Schein-Chung Chow and Jen-pei Liu (1998), Design and

analysis of clinical trials: Concepts and methodologies,

Wiley

4)Schuster, J.J. (1993), Practical handbook of sample size

guidelines for clinical trials, CRC Press, Florida.

5)김 호 (2002), 적절한 연구대상수의 산출, 대한마취과학회지:

42(1), 1-10.

Page 63: 기초통계와피험자수산출 : Sample size and powerhosting03.snu.ac.kr/~hokim/seminar/ct20050528.pdf · 2005-05-24 · P-value (3) • P-value = 두집단의평균이같다고가정했을

Downloadable from

http://plaza.snu.ac.kr/~hokim

열린 강의실-세미나자료

임상시험에서의 피험자수 산출 : Sample

size and power (2005/05/28)