中医药治疗中风研究文献的质量评价

来源:岁月联盟 作者:佚名 时间:2010-07-12

  摘要:目的:对中风的中医药临床性进行科研设计质量的分析。方法:按照临床流行病学/DME原则,制订《中风中医药临床研究文献评价表》,经测试其重复性较好(主要条目Kappa值为0.46~0.48,中度一致);用其对1992~1996年间的中风中医药临床治疗性文献进行评价。结果:28.4%的研究采用了随机对照方法,但随机的质量和可信度较差;盲法极少被采用;其他需要注意的问题还有组间基线均衡性的比较、结局指标的选择、发表性偏倚等方面。并对中风病结局指标的选择、中医药临床研究在方法学上的难点与解决方法进行了讨论。


  

  Quality Analysis of Literature of Traditional Chinese Medicine on Clinical Study of Stroke


  Abstract:To evaluate the quality of TCM literature on clinical study of stroke,the evaluating scale for TCM literature on clinical study of stroke with good reproducibility was designed (Kappa of the main item varies from 0.46 to 0.48) and was used to evaluate TCM literature on clinical study of stroke from 1992 to 1996.Randomized controlled clinical trial was adopted in 28.4%,but the quality and credibility of randomization was relatively poor.Blinded methods were seldom u sed and some problems were noticed in the baseline comparison,the choice of the outcome indicator,publishing bias,etc.The choice of the outcome indicator of stroke and the methodological difficulties of TCM clinical study,and its possible resolutions were also discussed.


  Key words:STROKE/TCM therapy;STROKE/TCD therapy;STROKE/TCM-WM therapy;MED PHARMACOL LITERATURE TCM;QUALITY,ACQUIREMENT,EVLVATION;@EVIDENCE-BASED MEDICINE


  医学文献的系统分析(Systematic Reviews)是建立在临床流行病学(Clinical Epidemiology)和循证医学(Evidence_Based Medicine)基础上的新的医学科研方法。近20年来,发达国家医学界越来越重视这一工作在临床科研中的应用。系统分析不同于传统的医学文献综述即描述性综述(Traditional Narrative Review),它是对某一课题或项目所有的研究进行全面、系统的质量评估的定性分析,对符合条件的研究论文再进行定量的Meta分析,以较全面准确地掌握该项研究的现状、临床疗效的真实程度及其可应用性,以指导临床决策。


  中风是严重威胁人类健康的疾病之一,中医药用于治疗中风的临床研究近年来比较多,也取得了不少成绩,但应该指出的是,中医药学的临床研究对方法学的应用仍不够重视,临床试验的规范性亦较差,在一定程度上影响了研究结论的真实性,研究结果难以得医学界的承认,导致研究结果难以推广、应用。为了全面了解中风中医药临床研究中科研方法学的应用状况、存在问题,对研究质量的总体水平作出评估;并在此基础上,对中医药和中西医结合治疗中风病的有效性作出较客观的评估,我们做了以下研究。


  1 资料与方法


  1.1 研究对象的选择 本次研究文献的纳入标准为:1992~1996年发表在国内各种医学期刊上的中医药疗法或中西医结合疗法治疗中风病急性期、恢复期的随机对照临床研究文献。为力求全面覆盖各种文献,我们选择了国内医学界较为权威的生物医学文献光盘数据库(中国医学院情报所,CBMdisk)和中医药领域国内较权威的中国中医药科技文献数据库(中国中医研究院图书情报研究所,TCMLRS),检索人均为中医药信息情报领域具有高级职称的专家。两库各检出题录623条、516条,所有题录进行合并剔除重复部分及后遗症、中风先兆、综述、经验、理论探讨等部分后,得到初步纳入的文献题录数为480条,实际获取原文数为464篇,资料占有率为97%(464/480)。经初步研读,再一次剔除文摘/短文型、合并症(以中风合并症为主要治疗目的)、病例数小于10例的文献(更宜称为病例报告)共165篇,初步纳入研究文献为299篇,在其中首先选出有对照组的临床研究文献,共130篇,占全部纳入临床研究文献的43%;其中随机对照临床试验(Randomized Clinical Trials,RCT,按Cochrane Collaboration的标准[1],凡文章中写到“随机分配病人”的均视为RCT)共有85篇,占28.4%,与詹思延等报道的《中国中西医结合杂志》1991~1996年间全文型RCT所占的比例(24.5%)大致相当[2]。


  1.2 评价方法、工具和内容


  1.2.1 评价方法 按照临床流行病学/DME方法学的原则和方法,组织数名临床流行病学专家和接受过DME培训的临床医生进行集体讨论,经过数次的试用及改编,编制了统一、规范的《中风中医药临床研究文献评价表》(简称《评价表》),对其进行评定者间的一致性检验,经证实其具有较好的信度(重复性)后,由一位主要评价人员用其对85篇随机对照文献进行评价。


  1.2.2 《评价表》的主要内容及其信度 内容共分9个部分,87个条目,包括了临床科研设计的重要原则及根据中风病特点所制订的特异性问题,如疾病的一般情况、纳入排除标准、对照的情况、样本含量、组间均衡性及对照药使用情况、随机的情况、盲法运用的情况、统计学方法的使用、受试因素的标准化、疗效判定标准、退出与失访病例的分析、不良反应的记录及分析、结论推导及其合理性等。正式进行评价前先由项目负责人选出10篇具有代表性的文献,由两名评价者独立进行评价后,进行各条目的一致性评价。结果:主要条目的一致率为76.6%,随机、对照、统计学评价部分条目一致性评价的Kappa值及加权Kappa值为0.46~0.48,根据Landis和Koch[3,4]提出的一致性强度的判断原则,可以认为本评价表对评价中风临床试验的科研设计质量重复性较好(中度一致)。


  1.3 统计分析方法 用dbase IV建立数据库,进行数据的录入和管理;用Epi Info 6.04中的EPITABLE模块进行一致性检验Kappa值的,加权Kappa值的计算按公式(Module 16:Clinical Disagreement.Phase Ⅱ Training Program of Department of Clinical Epidemiology: Clinical Epidemiology Course.华西医科大学翻印,1997)手工进行。


  2 结果


  2.1 一般情况 临床研究80篇,临床加实验(指动物实验)研究5篇,有实验室指标的研究占42%(36/85)。研究单位以省市级以上及研究院所(包括各医药院校及附院)为主(79%);县区级医院及其他基层单位占 21%;未见临床多中心协作研究的报道。58%的文章无文献。


  2.2 所研究疾病的情况 单纯研究缺血性中风的占53%(45/85),单纯研究出血性中风的占20%(17/85),二者都有的占23.5%(20/85),未明确区分二者的占3.5%(3/85);绝大部分研究(83%)未能明确病因分类,能明确病因的只有16%(14/85),其中高血压性5篇,动脉硬化性6篇,两种兼有的3篇;有临床分期说明的占79%(67/85),其中研究急性期中风的有49篇(72%),急性期和恢复期都有的有18篇(28%),没有单独研究恢复期中风的文献。在研究脑出血的38篇文献中,有出血部位说明的占53%(20/85),有出血量多少的占 37%(14/38);在研究缺血性中风的68篇文献中,有梗塞部位说明的仅有11篇(占16%),有梗塞面积大小说明的更少(5/68,占7%)。


  66%的文献(58/85)未说明中医病类,27篇有此说明的文献中单纯研究中经络的有5篇(18.5%),单纯研究中脏腑的有5篇(18.5%),二者均进行研究的有17篇(63%);在中医证型的说明中,小部分文献进行了中医证型的说明(28/85,34%),其中研究单一证型的占21%(6/28),研究多证型的占79%(22/28)。


  2.3 诊断、纳入和排除标准


  2.3.1 诊断标准 绝大部分研究有统一的诊断标准(81/85),单纯应用西医诊断标准的占53%,远远超过单纯用中医诊断标准的20%和中西医标准都用的27%。有2篇应用的是自订的中医诊断标准。


  65篇有说明西医诊断标准的文献中,使用国际标准1篇,国家标准43篇(43/65,66%),其他标准(如地方标准、临床诊断加CT核实)的有21篇(21/65,32%)。


  2.3.2 纳入和排除标准 80% 的文章(67/85)未说明纳入与排除标准。


  2.4 疗效判定标准 89%(76/85)的文献有疗效判定标准,其中采用国家级学会标准的最多,有52篇,占68%;其次就是自订的标准,有21篇,占28%;10.5%(9/85)的研究无明确的疗效判定标准。


  2.5 科研方案设计的质量


  2.5.1 对照 70%(60/85)的研究采用的是标准对照;30%采用的是实验/复合对照。


  2.5.2 样本含量 多数研究的样本含量在30~60例之间。其中试验组样本例数为10~30、31~60、61~100及100以上的研究分别为16、38、13和18个,各占总数的19%、45%、15%和21%。


  2.5.3 组间均衡性比较 虽然87%(75/85)的研究简单陈述了各组的情况,也罗列了一些数据(如各组的平均年龄、平均病程等),但很难讲他们进行了组间均衡性的比较,因为其中只有24%(18/75)的作者明确说明了“有可比性”等字样。


  2.5.4 随机化的质量 只有极少数的文献(7篇,占8%)对随机化方法进行了简单描述,其中只有4篇简单地描述了随机的具体步骤;在这7篇文章中,基本正确地运用了随机化的方法的只有1篇,其余6篇要么不是真正的随机化(如文中写着“按就诊先后顺序”、“采用单双号随机分配方法选择病例”、“按其性别、年龄、病情轻重,随机分为三组”),要么是两组样本例数相差过大,让人难以相信是真正随机化的结果(两组例数分别为42∶23、172∶60、40∶14)。“随机化方法基本正确”的一篇也只是在简述随机化方法时简单地写明“采用随机表法”。


  2.5.5 盲法的运用 运用盲法的文献只有4篇(5%),其中单盲、双盲各2篇。


  2.5.6 所研究的疗法 研究中医药疗法的有60篇,中西医结合疗法的有25篇。在试验用药的标准化方面,我们从方药组成、剂型、用量、用法、疗程等几个方面进行了评价,初步认为标准化较好的占64%(54/85),标准化一般的为25%(21/85),标准化差的为11%(10/85)。


  19%采用的中医药疗法为对照。在西医药治疗的具体疗法上,按应用的频率高低,依次为:防治脑水肿(33)、对证处理(30)、血液稀释疗法(25)、脑代谢活化剂(18)、血管扩张剂(17)、止血剂(14)、抗血小板药物(4)、钙拮抗剂(2)。


  2.5.7 统计学方法 98%的文献(83/85)对数据进行了统计学处理,未进行统计学处理的有2篇(2%)。所用的方法有卡方检验、t检验、Ridit分析和秩和检验等。可能由于篇幅或专业的原因,对数据的描述、分析过少(如数据类型、分布类型、是否方差齐等),大部分(49/83,59%)未能从文章中判断统计方法的正确与否;据我们的判断,其他34篇(41%)的统计学方法使用基本正确。81%的研究给出了统计所需的原始数据,但只有23%的研究给出了检验统计量值,仅有一篇给出了具体的P值。


  2.5.8 退出与失访病例的记录与分析 只有1篇文献报告了退出、失访或剔除病例,但也只报告了病例数,未能进一步对退出失访原因进行分析、无基线特征的分析、无追踪,在统计学处理和研究结论的推导时也未能用意想治疗分析法(Intention_to_treat Analysis,国内有译预期分析、意图分析、实效分析等)分析其可能造成的影响(灵敏度分析)。


  2.5.9 不良反应(ADR)的记录 有24%(20/85)的研究提到了不良反应的观察问题,其中5篇全部给出了具体报告,2篇给出了部分具体报告,全部20篇中有65%的研究(13/20)报告未发现不良反应。


  3 讨论


  近些年来临床流行病学/DME方法学在中医临床、科研人员中的推广与普及取得了很大的成效,中医界临床科研的质量也有了很大的改善。本研究结果显示,已经有越来越多的人在进行临床科研时采用论证强度最高的随机对照临床试验(RCT),但仍有不少问题存在,主要有随机化的实施、结局指标的选择、组间基线均衡性的比较等方面。&nb sp;


  本次文献分析中,我们发现最大的问题是随机化的问题。随机化分配病人到治疗组和对照组,在临床科研设计中,是一个极为重要的问题,这一点在过去的DME培训与推广中被一再强调,表面上这一点已经较为研究者所重视(66%有对照的临床研究都采用了RCT),但随机化的可信度及其质量确实令人忧虑。基线水平均衡这个重要问题也面临着同样的境况。看来真正令每位临床医生和临床科研人员都掌握扎实的DME方法,还有待进一步努力。


  终点指标的选择也是目前一个重要和争议较多的问题。曾有国外学者指出:中国的学术杂志发表的临床研究99%有效,针灸的临床研究更是100%有效,并对此提出了较尖锐的批评[5]。虽然我们尚未对此现象进行深层次的分析,但结局指标选择的不同可能是其中一个原因。以中风为例,国外的主要判效指标(终点指标)是早期病死率、远期病死率、神经功能缺损计分和日常生活活动能力(ADL),以及新近采用的生存质量(QOL)等,一般有1年以上的随访期,在分析时采用意想治疗(Intention_to_treat)分析法,故其临床研究极少有阳性结果的报道;而国内主要采用的是中西医两个学会制订的标准,将神经功能、生活能力等几个方面综合起来,评为痊愈、显效、有效、无效、恶化等。尚有一部分研究采用自订标准;在功能评价方面,ADL尚较少采用等。究竟应该采用什么样的结局指标才科学、客观,现行疗效评价指标体系有哪些缺陷,都需要进一步的研究。


  发表性偏倚也是一个应该引起重视的问题。阳性结果的研究容易被编辑采纳和发表,称为发表性偏倚(Publication Bias)。我们对采用清开灵注射液治疗急性期中风的7篇文献(含1992年前1篇)的疗效进行了漏斗图分析,结果亦提示:此类研究存在着较明显的发表性偏倚。这与其他学者的类似报道一致[2]。


  国内临床试验往往忽略退出与失访病例的记录与分析,这一点与国外存在较大的差距,需引起足够的重视。


  中医临床研究有一定的特殊性,如以汤剂为主的治疗很难实现双盲,一方到底的单方研究难以符合辨证论治精神,治疗方案标准化与辨证施治、灵活变化相矛盾等等。这也给临床科研方法学提出了一些新的课题。但只要在研究方法学上下功夫,还是可以找出既适合中医特色,又具有较高科学性的方法的。如中医以汤剂为主的治疗盲法的采用,可以在疗效评价时采用不知情的人员独立进行盲法的疗效评价等。

 

 


  :


  [1]李静,罗德成,方芳,等译.Cochrane Collaboration Handbook.Cochrane中心培训教材[M].华西医科大学,1998.10


  [2]詹思延,唐金陵,谢立亚,等.中医药学术期刊随机对照临床试验文章评阅及建议[J].中国中西医结合杂志,1999,19(9):568


  [3]王家良主编.临床流行病学[M].上海:上海科技出版社,1992.137


  [4]Landis J R,Koch G G.The measurement of observer agreement for categorical datas[M].Biometrics,1977,33:159


  [5]Vickers A,Goyal N,Harland R,et al.Do certain countries produce only positive results? A systematic review of controlled trials[J].Controlled Clin Trials,1998,19:159