1、 随机抽样及随机分组童新元 中国人民解放军总医院设计类型干预试验 (动物实验,临床试验)观察研究 调查研究设计调查研究设计研究者无须或无法施加干预措施,而是对现场发生的实际情况进行观察,称为调查研究(Investigation Study),亦称观察研究(observation study)。例如:研究肥胖对冠心病的影响情况;研究当今中国儿童生长发育情况;研究分析经济危机形成的原因;。等。无法随机化分组组间不均衡存在混杂因素例如,肥胖对冠心病的影响研究中,研究者不可能象药物研究那样,随机地安排一部份人去肥胖,安排另一部人不肥胖。两组人群中存在着很多因素不均衡的因素混杂,从而需要特殊的统计学设计
2、和分析。调查研究资料的特点调查研究资料的特点调查方法根据调查的范围和调查对象的选择方式可分为:普查抽样调查普查(普查(overall survey)亦称全面调查(complete survey),将组成总体的所有观察单位全部加以调查普查一般都是用于了解总体某一特定“时点”的情况,如年中人口数、时点患病率等。如我国人口普查等。优点:理论上只有普查才能取得总体参数,因为普查没有抽样误差;普查能全面地了解总体的分布特征。缺点:普查工作量大,较费时费力;调查质量难以保证,系统误差大。抽样调查(抽样调查(sampling survey)抽样调查是从总体中随机抽取一定数量的观察对象组成样本,用样本信息推断
3、总体特征。抽样调查是统计学上第一次技术革命.抽样调查技术通过部分认识整体,同时,节省大量时间大量的人力,物力和成本。优缺点优点:费用较少,速度较快,覆盖面较大,正确性较高;许多医学问题只能作抽样调查,如药物疗效观察等。缺点:调查设计、实施及资料分析复杂,若样本达到总体75%时则直接采用普查。例如,在美国大选中,对1000名至3000名选民进行调查,来预测近1亿选民的投票情况,抽样误差不超过3%。抽样研究的两个重要问题抽样的样本大小怎样抽样 随机抽样方法简单随机抽样(simple random sampling)系统抽样(systematic sampling)分层抽样(stratified s
4、ampling)整群抽样(cluster sampling)简单随机抽样 P10简单随机抽样亦称单纯随机抽样要求每个观察对象有同等概率被选入样本。从有N个观察单位中抽取m个观察单位方法:先将N个观察单位编号,并且每个赋一个随机数。再将N个随机数排序,前m个随机数对应的观察单位编号即为所抽取。优缺点 简单随机抽样是最基本的抽样方法,优点是均数(或率)及其标准误的计算简便,缺点是当总体例数较多时,实施抽样比较困难。适用于小型调查。CHISS的实现例如,现在某校有500名研究生,要随机抽取10%,即50同学参加比赛,问:该如何抽取?CHISS实现1 编号建数据库编号建数据库 将将500学生的学号录入
5、数据库学生的学号录入数据库中中,建立数据库建立数据库,并每人给一个编号从并每人给一个编号从1,2,500.2 产生随机数产生随机数 点击点击 设计设计实验设计实验设计随机化方法随机化方法产生随机数产生随机数选择条件选择条件:正态分布正态分布,数据行数为数据行数为500,500,正态分布正态分布平均数为平均数为0,0,标准差为标准差为1 1 3 3 排序排序 按随机数从小到大排序按随机数从小到大排序,前前5050名即为所名即为所求求数据数据行编辑行编辑数据排序数据排序 选变量选变量:RND:RND正态正态数据数据练习题现在某班有20个同学,要从中随机抽取5名参加比赛,如何平公的进行抽取?系统抽样
6、系统抽样又称等距抽样或机械抽样。方法是按照一定顺序,机械地每隔若干个观察单位抽取一个观察单位组成样本。例如:要从1000户中抽取100户作样本,可先在门牌号1 10号之间随机抽取一户(假定为第5号住户),其后每间隔10号抽取一户,即抽取5、15、25、35、995,共100户组成样本。抽样间隔=总数/样本含量3.优缺点优缺点 优点是易于理解,简便易行,容易得到一个按比例分配的样本;缺点是一般情况下,虽然系统抽样的抽样误差小于简单随机抽样,但是在某些特殊情况下可能有偏性。例如:上述例子中我们抽取的住户均为单号,其住房可能都是一个朝向,若作采光等卫生学调查,将产生明显的偏性。典型案例:央视收视率调
7、查整群抽样先将总体划分为个群,每个群包括若干个 观 察 单 位,再 随 机 抽 取 t 个“群”(kt),并将被抽取t个群的全部观察单位组成样本。例如:要检查某学校学习情况时,随机抽取几个班,对几个班的全部同学进行考查。优缺点优缺点 优点是在大规模调查中,整群抽样易于组织,可节省人力物力,容易控制调查质量;缺点是一般来说各群间差异较大,所以抽样误差较大。分层抽样先按影响观察值变异较大的某种特征,将总体分为若干层(strata),再从每层内随机抽取一定数量的观察单位组成样本(样本含量为n)又称分类抽样。优缺点优缺点 抽样误差比较小;先要将总体分层,层内个体差异越小越好,层间个体差异越大越好,便于
8、对不同的层采用不同的抽样方法。CHISS的实现例如,某校有3个不同专业的研究班,每班10个同学,现要从每班各随机抽取3名同学参加比赛,如何抽取?CHISS实现步骤:1 编号建数据库编号建数据库 将将30学生的学号及班级录入数据学生的学号及班级录入数据库中库中,建立数据库建立数据库.2 产生随机数产生随机数 点击点击 设计设计实验设计实验设计随机化方法随机化方法分层抽样分层抽样选择分层变量选择分层变量:班级班级 每个班人数都赋值为每个班人数都赋值为3 3数据数据 查看抽样结果查看抽样结果:1:1标记为被抽取对象标记为被抽取对象练习题现某年级2个班,1班6名同学,2班9名同学,现要从1班随机抽取2
9、名同学,2班随机抽取3名同学参加比赛,如何抽取?各种抽样方法抽样误差的关系各种抽样方法的存在抽样误差,一般是:整群抽样单纯随机抽样系统抽样分层抽样。随机化分组随机化分组是试验设计的重要内容,常用的方法有三种:掷硬币、抽签、骰子;用查随机数字表;用计算机随机化程序。随机化分组方案随机化分组是首先将受试对象按某一特征编号,在每个编号下用随机化工具产生相应的随机数字,然后,再按照事先规定的分组原则进行合理的分组。统计软件利用计算机中的伪随机函数给每个编号产生一个随机数,然后将随机数排序,进行分组。1)完全随机分组设计从同一总体中随机抽取一定数目的受试对象,将受试对象随机地分配到每一个组中,各组分别接
10、受不同的处理。这样的设计分组称为完全随机分组设计。例 现有20个动物试验,分别采用5种不同的营养饲料方法进行喂养,考察其营养效果,采用完全随机分为5组。CHISS软件实现解步骤:1 进入试验设计模块点击 试验设计-设计方案-完全随机分组试验样本总例数:30,处理组数:21组例数:152组例数:15-确定2 进入结果模块 查看结果 点击 结果完全随机设计编号分组结果(总例数=20,处理组数=5)处理01 处理02 处理03 处理04 处理05 7 5 2 1 4 12 9 3 6 10 16 11 13 8 14 17 20 15 19 18 完全随机设计的优缺点优点:设计简单,易于实现;随机分
11、配能有效地避免某些非实验因素的影响,充分显示实验因素效应;随机分配增强比较组间的可比性;设立对照能有效控制非实验因素对实验因素的影响,从而有效控制偏倚和误差。缺点:对混杂因素只靠随机化进行控制,因而灵敏度较低;只能作单因素比较,不能分析多个因素,尤其因素间的交互作用。需要例数较多。2)配伍组设计)配伍组设计 如果实验因素有G(3个以上)水平组,事先将受试对象按某种重要的非实验因素进行分组,即配伍组或区组(block)。每个区组内有G个实验对象,采用完全随机地分配,每个实验对象接受一种不同的处理称为配伍组分组,亦称随机区组设计。配伍组是由若干特征相似的试验材料组成,如同一窝的动物,批号相同的试剂,体重相近的受试者等。例 要比较5种方法作用是否相同,现取7窝老鼠,每窝有5只老鼠,试进行配伍组分组。配伍组设计的优缺点优点:组间可比性增强,检验效率高;可以同时分析处理因素和个体差异对实验效应的影响;减少实验所需样本含量。缺点:区组内对象数与处理组数必须相等,匹配与分组较繁,当实验结果有观察值缺失时,信息损失较大,统计处理较麻烦,不能分析交互作用。