样本率和总体率计算公式
问题描述
- 精选答案
-
样本含量的计算公式各不相同,现分别介绍如下:一、现况研究现况研究包括普查和抽样调查两类,普查是根据研究目的,于一定时间内对一定范围的人群中每一个成员所作的调查,它是对总体的研究,不涉及样本大小的问题。
而抽样调查是从总体中随机抽取一定数量的观察单位组成样本,然后用样本信息来推断总体特征,因此抽样调查的设计中要考虑样本含量问题,以下我们分别介绍对均数和对率作抽样调查时样本含量的计算。一般来说,在确定样本含量时,先需要有这样几个参数:
①所容许的误差(d),如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。在率的调查中,确定样本的率(p)和总体率(P)的最大容许误差为多少。容许误差越小,需要样本量越大。
②确定控制容许误差的概率α,概据需要一般为0.05或0.01,α越小,所需样本量越大。
③总体标准差(s),如果不了解,则需要根据以往的资料或小规模预调查的结果进行估计。(一)、调查均数时所需样本量, 可按下列公式计算:n'=(Uas/d) (式16-1)n= n'/(1+n'/N) (式16-2)其中Ua为a值确定后的U值,可查表(16-1)获得,当a=0.05时, Ua=1.96,a=0.01时,Ua=2.58。如果为无限总体抽样,可直接用式(16-1)求出样本量。而我们在流行病学调查中,多为有限总体,即已经知道总体的数量N,这时将n'代入式(16-2)便可求出样本量n。如果n'/N很小,如小于0.05,可以省略式(16-2),直接用公式(16-1)求出n。例16.1:某厂有职工6500人,用简单随机抽样调查该厂职工白细胞水平,希望绝对误差不超过100个/mm 。根据该厂以往的资料,职工白细胞总数的标准差为950个/ mm ,若取a=0.05(双侧),问应调查多少人?N=6500 d=100个/mm s=950个/mma=0.05 Ua=1.96n'=(1.96×950/100) ≈347n=347/(1+347/6500)≈330(人)(二)、调查率时所需样本含量,用下式计算:n'=Ua PQ/d (式16-3)n=n'/(1+n'/N) (式16-4)其中P为总体的率,Q=1—P,如果P有若干个估计值可供参考时,应取接近0.5者,如果对总体的率一无所知,也可设P=0.5。如果采用相对容许误差r=d/P 的形式,即d=rP,例如,规定容许误差不大于0.1 P,即d=0.1P。则可计算n'=(Ua PQ)/(r P )=(Ua Q)/(r P) (式16-5)我们也可以用一个易记的公式粗略估计样本量,设α=0.05 ,Ua≈2,r=0.1时,则n=(4Q)/(0.1 P)=400Q/P (式16-6)当然应用这个公式估计样本量时要记住前提为a=0.05,r=0.1,如果要求的显著性水平提高或降低,容许误差提高和降低,结果将随之而变。例16.2:某地区现调查HBsAg阳性率,过去调查的结果为10%,本次调查容许误差不超过0.1P,a=0.05(双侧),估计应调查人数。P=0.1 r=0.1(或 d=0.01) a= 0.05 Ua=1.96根据公式(16-3)n'=1.96 ×0.1×0.9/0.01 =3457(人)根据公式(16-6)n'=400×0.9/0.1=3600(人)以上所述为简单随机抽样的计算方法。至于其它抽样方法样本含量的估计可参阅有关书籍的专用公式。