如何正确处理无法考察交互作用的三因素或四因素设计定量资料
【关键词】 统计学; 医学; 统计分析; 交互作用
Keywords: statistics; medicine; statistical analysis; interaction
1 引言
在实际科研工作中,研究者有专业知识为依据可认为多个因素间相互独立(不存在交互作用)或根据研究目的不需要考察多个因素之间的交互作用或受试验条件及样本量等的限制无法考察多因素间的交互作用时,往往需要采用一些比较特殊的试验设计类型。当试验涉及到3个或4个因素,而由于前述各项原因无法或不必要考察这些因素之间的交互作用时,可根据试验目的和试验因素等选用拉丁方设计、交叉设计、三因素或四因素嵌套设计。本文着重论述这几种试验设计的特点、区别、适用场合及如何根据资料的类型选用合适的统计分析方法,以期能帮助广大科研工作者提高处理无法考察交互作用的三因素或四因素设计定量资料的统计学水平。
2 3种试验设计的特点及适用场合
2.1 拉丁方设计的特点及适用场合 拉丁方设计可用来考察一个试验因素和多个区组因素(重要非试验因素)对观察结果的影响,要求这些因素水平数相同且相互之间不存在交互作用或交互作用可以忽略不计。根据试验涉及的区组因素的个数,可将拉丁方设计分为三因素拉丁方设计或四因素拉丁方设计。前者即通常所说的拉丁方设计(如无特殊说明,本文后面所讨论的拉丁方设计指三因素拉丁方设计),后者称希腊拉丁方设计或正交拉丁方设计。
2.1.1 拉丁方设计 拉丁方设计可安排一个试验因素和2个区组因素,视为随机区组设计的扩展,因为它比随机区组设计多考察一个区组因素对观测结果的影响。拉丁方设计要求3个因素之间不存在交互作用或交互作用可以忽略不计,要求3个因素水平数相同(以试验因素水平数为基准)。
2.1.2 希腊拉丁方设计 希腊拉丁方设计可安排一个试验因素和3个区组因素,要求4个因素之间不存在交互作用或交互作用可以忽略不计,要求4个因素水平数相同(以试验因素水平数为基准)。
2.1.3 适用场合 根据观测指标的获取与受试对象间的关系,拉丁方设计(含三因素拉丁方设计和四因素拉丁方设计)可分为2种情况:一是每个区组中的k个数据重复测自同一个受试对象,二是每个区组中的k个数据测自条件相近的k个受试对象。前者可大大减少所需受试对象个数,但由于“携带效应”(前一种处理对观测指标造成的影响在受试对象接受下一个处理时仍然存在)的存在,使其一般不适用于干预性试验研究,除非能保证试验因素各水平对观测指标的影响是短暂可逆的,即在设定的时间间隔内,前一种处理对观测指标的影响会消除,所以在处理对受试对象的影响易恢复到初始状态的观察性研究中应用拉丁方设计效果较好。后者由于某种原因不宜在同一受试对象上观察试验因素的不同水平对观测结果的影响,而选用条件相近的k个受试对象,这样做就不存在“携带效应”的影响了,但也是以“较大样本含量”为代价的。请注意,这2种情况下的拉丁方设计都要求试验涉及的3个或4个因素间的交互作用无统计学意义且各因素的水平数相同。
请读者思考并比较下面3种情况下应用拉丁方设计,其结论可信度的高低:一是用4台秤分别测量4个人的体质量,每台秤测量每个受试者1次,从而比较4台秤的测量结果是否一致;二是用4台血压计分别测量4个人的血压,每台血压计测量每个受试者1次,从而比较4台血压计的测量结果是否一致;三是比较4种降压药的疗效是否一致,选择4个受试对象,每个受试对象以不同的顺序服用这4种降压药,在同一受试对象服用不同的降压药中间隔一段时间以减少或排除前次服用的降压药对观测指标的影响。可以看出,上述3种情况下均采用了4×4拉丁方设计,但根据这3种设计所获得的定量资料进行正确的统计分析后,所得结论的可信度却不尽相同。第一种情况,人的体质量在短时间内是基本不变的,而不同的秤测量人的体质量也不会对体质量造成什么影响,此时采用拉丁方设计效果极好;第二种情况,虽然不同的血压计对受试者的血压不会造成什么影响,但由于血压本身易受人的情绪、心理等主观因素的影响,采用拉丁方设计的效果较第一种情况稍差;第三种情况,不同的降压药对人的血压会造成短时无法彻底清除的效应影响,即受试对象在服用下一种降压药时,其前一次服用的降压药造成的影响仍然存在,此时采用拉丁方设计效果很不好。
2.2 交叉设计的特点及适用场合 与拉丁方设计相似,交叉设计也是用来考察一个试验因素和2个区组因素对观测指标的影响,要求3个因素间的交互作用无统计学意义。根据涉及到的试验因素水平数和试验段数,可将交叉设计分为3类:二阶段交叉设计、三阶段交叉设计及3×3交叉设计。
2.2.1 二阶段交叉设计 当试验涉及的试验因素只有2个水平,且根据专业知识的需要,希望该试验因素的2个水平先后作用于同一个受试对象,此试验设计称为二阶段交叉设计或2×2交叉设计。根据观测指标的获取与受试对象之间的关系,可将其分为2类:配对二阶段交叉设计和成组二阶段交叉设计。前者是选择条件相近的受试者匹配成对,随机决定每个配对组中的一个受试对象接受2种处理的先后顺序,另一个受试对象接受处理的顺序相反,此设计是在配对设计的基础上多考虑了试验顺序可能对观测结果的影响。后者是将受试对象随机分成2组,随机决定一组受试对象接受2种处理的先后顺序,另一组受试对象接受处理的顺序相反,此设计是在成组设计的基础上多考虑了试验顺序可能对观测结果的影响。
2.2.2 三阶段交叉设计 当试验中涉及一个具有两水平的试验因素,根据专业知识的需要,希望该因素的2个水平要在3个阶段作用于同一受试对象,此试验设计称为三阶段交叉设计。同样,此设计可分为配对三阶段交叉设计和成组三阶段交叉设计。
2.2.3 3×3交叉设计 将3种处理分3个阶段先后施加给同一个受试对象,观察受试者接受每种处理后的反应,这样的设计称为3×3交叉设计。此设计用来考察一个具有三水平的试验因素和2个区组因素对观测结果的影响。
2.2.4 适用场合 交叉设计适用于考察一个试验因素和2个区组因素(个体差异和测量阶段)对观测指标的影响,要求3个因素间无交互作用或交互作用可以忽略,要求试验因素各水平对观测指标的影响是短暂可逆的且多个阶段之间必须有一定长度的时间间隔(洗脱期,使受试对象在接受下一个处理前,前一种处理对其观测指标的影响已经消除),从而消除“携带效应”。对于三阶段交叉设计,由于每一个受试对象接受2种处理的次数不等导致这种设计的均衡性不是很好,且对每一个受试对象而言,都有2个“洗脱期”,“携带效应”更加突出,应尽可能避免使用。
2.3 三因素或四因素嵌套设计的特点及适用场合 试验中涉及3个试验因素,且依据专业知识可认为3个试验因素对观测指标的影响有主次之分,主要因素各水平下嵌套着次要因素,次要因素各水平下又嵌套着更次要的因素,这样的实验设计称为三因素嵌套设计。
此设计可用于3个试验因素对观测指标的影响有主次之分的试验研究中,需要注意的是3个试验因素之间的主次关系要有专业依据,不能随意想象或规定,且讨论因素之间的交互作用无实际意义。
四因素嵌套设计与三因素嵌套设计相似,只是多了一重嵌套关系,可用于考察专业上认为有主次之分且考虑交互作用无实际意义的4个试验因素对观测指标的影响。
3 3种试验设计的联系与区别
3.1 联系 拉丁方设计(不含希腊拉丁方设计)与交叉设计均涉及一个试验因素和2个区组因素,且2种试验设计的标准型很相近,均可用表1表示。配对二阶段交叉设计的结构可视为多个2×2拉丁方设计纵向排列的结果。
表1 无法考察交互作用的三因素设计定量资料的标准型(不含三因素嵌套设计)(略)
试验因素C及其下标仅为示意试验设计而列出,不代表实际问题就可按此顺序分配处理。
若i=j=k,则试验因素C的各水平在表内各行或各列中均出现一次,此表即为拉丁方设计定量资料的标准型;若i>2且j=k=2,则试验因素C的各水平在表内各行中均出现一次,此表即为二阶段交叉设计定量资料的标准型;若i>3且j=k=3,则试验因素C的各水平在表内各行中均出现一次,此表即为3×3交叉设计定量资料的标准型;若i>2且j=3,k=2,则试验因素C的各水平在表内各行中可能出现一次或2次,此表即为三阶段交叉设计定量资料的标准型。所以,读者在鉴别拉丁方设计与交叉设计资料时,应注意观测各因素的水平数。
希腊拉丁方设计是在三因素拉丁方设计的基础上再多考察一个区组因素对观察指标的影响,其定量资料的标准型及三因素或四因素嵌套设计定量资料的标准型较为复杂,在此不再给出,读者可参阅[1]。另外,拉丁方设计、交叉设计和嵌套设计均要求因素间无交互作用或交互作用可以忽略。
3.2 区别 3种试验设计涉及的因素个数、因素水平数及因素性质不尽相同。拉丁方设计涉及一个k水平的试验因素和2个k水平的区组因素;希腊拉丁方设计涉及一个k水平的试验因素和3个k水平的区组因素;交叉设计涉及一个试验因素和2个区组因素,但不要求3个因素的水平数必须相等;三因素嵌套设计和四因素嵌套设计分别涉及3个或4个专业上认为对观测指标的影响有主次之分的试验因素,且对各级因素的水平数没有严格限制。
拉丁方设计、希腊拉丁方设计及交叉设计在全部因素组合而成的每一个试验条件下,若试验结果的变异度很小,则可以不做独立重复试验(各试验条件下有一个样本即可),但嵌套设计在全部因素组合而成的每一个试验条件下必须做独立重复试验(各试验条件下至少要有2个样本)。
4 正确分析无法考察交互作用的三因素或四因素设计定量资料
4.1 正确识别定量资料对应的试验设计类型并检查方差分析的前提条件
例1 某科研人员欲对3种短节段的内固定器械的抗旋转能力进行对比研究,选用3例新鲜成年男尸,平均年龄31岁(18~36岁),取T12~L4节段脊柱标本,摄X线片提示骨性结构良好。将3例标本均制成伴有三柱损伤的屈曲压缩骨折模型,分别于L1和L3椎弓根处打孔,置入骨针,X线检查证实定位准确,每个骨折模型分别以不同顺序接受AF钉、Dick钉及ARRIF钉的固定(3种钉的制造材料、螺纹和螺距均相同)且扭力矩保持一致,然后上机进行测试。每次试验均重复一次,数据取平均值。测试前,标本在实验机上预调2~3次。根据力矩?角度变化曲线,换算力矩变化条件下的角度变化值。部分试验结果见表2[2]。已知交互作用可忽略不计,请判断表2资料的设计类型,并说明应选用什么统计分析方法来处理此资料较为合适?
表2 伴有三柱损伤椎体压缩骨折在腰椎旋转2°负荷下的角度变化(略)
A:AF钉固定;B:Dick钉固定;C:ARRIF钉固定。
分析与解答 资料中说明每次试验均重复一次,数据取其平均值,可知此“重复”为重复观测,而非独立重复试验,因此样本数仍为3个。试验中涉及一个试验因素,即“固定器械种类”,它有3个水平;同时还涉及到2个区组因素:“受试者号”和“测定顺序”,均有3个水平,且交互作用可忽略不计,因此该资料应为3×3拉丁方设计定量资料。
先检查资料是否满足方差分析的前提条件,若满足,则可采用3×3拉丁方设计定量资料的方差分析;若不满足,则可采用适当的变量转换方法使转换后的资料满足方差分析的前提条件,然后再对转换后的资料采用3×3拉丁方设计定量资料的方差分析即可,也可直接采用3×3拉丁方设计定量资料的秩和检验。
例2 某研究者欲比较A、B两种闪烁液测定血浆中3H?cGMP含量的结果是否相同,选取10名受试者分别接受2种闪烁液的检测,采用随机的方式将10名受试者等分成2组,随机决定每组受试对象接受2种闪烁液检测的顺序,其中第Ⅰ阶段1、3、4、7、9号用A测定,2、5、6、8、10号用B测定;第Ⅱ阶段1、3、4、7、9号用B测定,2、5、6、8、10号用A测定。测量结果见表3[3]。请判断资料的设计类型,并说明如何进行统计分析?
表3 两种闪烁液测定血浆中3H?cGMP含量的试验结果(略)
分析与解答 本资料中有一个试验因素“闪烁液种类”,它有2个水平(A闪烁液和B闪烁液);同时还涉及到2个区组因素:“受试者编号”和“试验阶段”;观测指标为“血浆中3H?cGMP含量”。由于采用随机的方式将10名受试者随机等分成2组,再用随机的方法决定一组受试对象接受2种闪烁液测定的顺序,另一组按相反顺序测定血浆中3H?cGMP含量,故为成组二阶段交叉设计。若先按照某些条件将10名受试者配成5对,然后采用随机的方法决定每对中的一个受试对象接受2种闪烁液测定的顺序,另一个按相反顺序测定血浆中3H?cGMP含量。此时,就是配对二阶段交叉设计了。
先检查资料是否满足方差分析的前提条件,若满足此条件则可采用二阶段交叉设计定量资料的方差分析;若不满足此条件则可采用适当的变量转换方法使转换后的资料满足方差分析的前提条件,然后再对转换后的资料采用二阶段交叉设计定量资料的方差分析即可,也可直接采用二阶段交叉设计定量资料的秩和检验。此外,配对二阶段交叉设计和成组二阶段交叉设计只是在分配受试对象接受2种处理顺序的方式上存在一些差异,前者先按照某些条件将2n名受试者配成n对,然后采用随机的方法决定每对中的一个受试对象接受2种处理的顺序,另一个受试对象按相反顺序接受2种处理;后者先将所有的受试对象等分成2组,再随机决定2组受试对象接受2种处理的顺序。最终的结果都以受试对象为结果记录的标志,将每个受试对象接受2次处理的结果记录在一起,因此其统计分析方法相同。
例3 假定某研究者要研究A、B两种高血压方案的疗效之间的差别是否具有统计学意义,拟通过小规模的预实验来进行探索性研究。研究者从很多高血压患者中随机抽取12名,再用随机的方法让其中的6名患者在3个时期内按先A后B再A的顺序接受治疗,记为ABA;另外6名患者在3个时期内按先B后A再B的顺序接受治疗,记为BAB。观测的指标是血压下降值(kPa),结果见表4[1]。请问:它是什么试验设计类型?应采用何种统计分析方法?
表4 高血压患者在3个时期接受A、B两种方案治疗的血压下降值(略)
分析与解答 本资料涉及一个2水平的试验因素(治疗方案),其2个水平分别为A方案与B方案;2个区组因素分别为时期因素和患者号。2种治疗方案在3个时期内交叉作用于2组受试者,因此这是成组三阶段交叉设计。若按照病情、性别和年龄等非实验因素将12名高血压患者配成6对,再用随机的方法让每对中的一名患者在3个时期内按先A后B再A的顺序接受治疗,另一名患者在3个时期内按先B后A再B的顺序接受治疗,则这2种治疗顺序在条件相近的同一对受试者中交叉实施,其设计类型为配对三阶段交叉设计。值得注意的是,假定2种治疗方案对血压值的影响是暂时的且血压值可很快恢复到原先的水平,否则,这样设计试验所得结论的可信度不高。
根据资料是否满足参数检验的前提条件,决定是选用交叉设计定量资料的方差分析还是对原始数据进行适当的变量变换或直接采用交叉设计定量资料的秩和检验。
例4 氯雷他定是新一代的非镇静性抗组胺药,最早由国外公司开发,目前已在生产和销售,由于该药物疗效好,药物不良反应轻微,一推出后即广受患者欢迎。国内某制药公司研制了氯雷他定片剂和胶囊剂,欲作为4类新药报批,进行了2种剂型与参比品对照的生物等效性研究,以评价2种试验制剂和参比制剂在主要药代动力学参数上是否存在生物等效性,旨在为临床安全、有效用药提供试验依据。由于3种制剂共组合有6种给药方案,故选用18名健康男性受试者,随机等分成6组,并随机决定每组受试者接受3种制剂的顺序。部分试验结果见表5[4]。请鉴别本资料的类型并给出正确的统计分析方法?
表5 18名受试者使用不同制剂的血药峰值浓度结果(略)
A:氯雷他定片剂;B:氯雷他定胶囊剂;R:氯雷他定参比制剂。
分析与解答 本试验涉及一个3水平的试验因素(制剂种类),其3个水平分别为氯雷他定片剂、氯雷他定胶囊剂和氯雷他定参比制剂;同时涉及2个区组因素:受试者号和时期因素。根据受试对象的分组方法和试验因素的水平数可知,此资料应为“3×3交叉设计定量资料”。
先检查资料是否满足方差分析的前提条件,若满足此条件则可采用三阶段交叉设计定量资料的方差分析;若不满足此条件则可采用适当的变量转换方法(本资料可采用对数变换)使转换后的资料满足方差分析的前提条件,然后再对转换后的资料采用三阶段交叉设计定量资料的方差分析即可,也可直接采用三阶段交叉设计定量资料的秩和检验。
例5 在某城市调查某种疾病的患病率,调查时在地区因素A上分为3个水平:A1(工厂区)、A2(文化区)、A3(市区);在年龄因素B上分为2个水平:B1(儿童)、B2(成人);性别因素C上有2个水平:C1(男性)、C2(女性)。三因素各水平下都重复2次调查,每次都调查足够数量的人。假定由专业知识得知,地区对该疾病的影响作用最大,年龄次之,性别最小,调查结果见表6[5]。请判断此资料所取自的试验设计类型,并对资料做相应的统计分析。
表6 地区、年龄、性别对某种疾病患病率的影响(略)
分析与解答 本试验涉及3个试验因素:年龄、性别和地区。观察指标为患病率,由于受试对象为特定地区、特定年龄段及特定性别定义下的人群,对每一个特定人群(本例中的观察单位)均可观测到一个患病率,因此该资料(以特定人群为观察单位)为定量资料。由专业知识得知,3个因素对患病率的影响存在主次之分,所以此资料应为三因素嵌套设计定量资料。
若资料满足方差分析的前提条件,可采用三因素嵌套设计定量资料的方差分析。反之,可进行适当的变量变换或采用三因素嵌套设计定量资料的秩和检验。
4.2 切勿随意“切割”原始资料,进行两两比较 对无法考察交互作用的三因素或四因素设计定量资料,虽然其因素间不存在交互作用,但也不能随意“切割”而进行多次两两比较。因为这会割裂试验设计的整体性,导致信息利用度的降低,而且未经校正的多次两两比较会导致犯假阳性错误概率的增加。如对某试验设计资料进行假设检验,将其可能会犯的假阳性错误发生率控制在α=0.05水平之下,但若以6次两两比较取代对原试验资料的整体分析,则可能犯假阳性错误的概率就会变成[1-(1-0.05)6],达到了0.265的程度。所以,对资料的统计分析应根据研究者的研究目的和资料所对应的试验设计类型等选择相应的统计分析方法,不可随意以多次单因素分析取代多因素分析。
【】
1 Hu LP. Application of triple?type theory of statistics in experimental design. Beijing: People's Military Medical Press. 2006: 77?84. Chinese.
胡良平. 统计学三型理论在实验设计中的应用. 北京: 人民军医出版社. 2006: 77?84.
2 Tan YJ, Pan XM, Quan Y, et al. Application of latin square experimental designing principle in spinal biomechanical contract study. Zhongguo Lin Chuang Kang Fu. 2003; 7(26): 3572?3573. Chinese with abstract in English.
谭映军, 潘显明, 权毅, 等. 拉丁方设计在脊柱生物力学对比试验中的应用. 中国临床康复. 2003; 7(26): 3572?3573.
3 Li QH, Xia JL. MI and MIANALYZE for 2×2 cross?over design with missing data. Zhongguo Wei Sheng Tong Ji. 2005; 22(5): 290?292. Chinese with abstract in English.
李清华, 夏结来. 有缺失数据的2×2交叉设计的多重填补与分析. 中国卫生统计. 2005; 22(5): 290?292.
4 Liu YX, Yao C, Chen F, et al. Equivalence analysis for multiple cross?over design of bioavailability trials. Zhongguo Lin Chuang Yao Li Xue Za Zhi. 2002; 18(3): 219?223. Chinese with abstract in English.
刘玉秀, 姚晨, 陈峰, 等. 多交叉设计生物利用度试验的等效性分析. 中国临床药杂志. 2002; 18(3): 219?223.
5 Hu LP. Applied course of statistical analysis by Windows SAS 6.12 & 8.0. Beijing: Press of Military Medical Sciences. 2001: 170?171. Chinese.
胡良平. Windows SAS 6.12 & 8.0实用统计分析教程. 北京: 军事医学出版社. 2001: 170?171.











