时间:2023-03-17 18:12:31
引言:寻求写作上的突破?我们特意为您精选了4篇军事医学论文范文,希望这些范文能够成为您写作时的参考,帮助您的文章更加丰富和深入。
2结果
患者使用抗菌药的天数均为5~14d。抗菌药中使用的频率较高的有:头孢类、盐酸洛美沙星注射液、克拉霉素片、甲硝唑和替硝唑、阿奇霉素片等。使用不合理的占40%,主要存在的问题在于:给药的次数不合理、药物的联合使用不当、药物剂量的不准确、溶媒不合理等。
3讨论
3.1抗菌药的使用情况
临床上,头孢菌素的使用率一直是处于领先地位,而喹诺酮类和氨基糖苷类在逐年的增长。青霉素的使用率稍有下降。临床上常用的广谱抗菌药。由于青霉素耐药性增强,在临床使用中受到限制。头孢菌素因品种较多,在我院一直居于主导位置。但是头孢一代的头孢唑啉钠,因为耐药性增加,所以在医院的使用量正在慢慢的下降。然而第三代头孢类,价格便宜,使用效果较好,所以用量正在逐渐上升,例如:头孢他啶针对绿脓杆菌的效果十分明显。氨基糖苷类也是属于一类抗菌药,尤其是针对革兰氏阴性菌的效果特别的明显。该药在临床上的副作用主要是影响耳、肾的功能。喹诺酮类属于广谱抗菌药,口服的吸收性较好,该药的组织浓度较高,耐药性较低,加之新品种的不断出现,尤其是:左氧氟沙星、氟罗沙星等,在临床上的使用越来越广泛。
3.2抗菌药的联合使用
抗菌药的使用主要是单用和联合使用,在我院抗菌药的联合使用率为21.5%。用药时要注意两个方面:用药的目的和联合使用抗菌药的指征。
3.2.1要明确用药的目的
要增强药物之间的协同作用,加强疗效;扩大药物之间的抗菌谱,快速发挥药物低毒、高效的作用,及早的控制混合性的感染;预防、阻止耐药株的产生,从而保证临床用药的安全性。
3.2.2联合使用药物的指征
危及患者的生命的严重性感染,或者是病患呈严重的败血症时,需要采取联合使用药物;当单用某种抗菌药时并不能控制其感染时,应该联合用药;在受到感染的部位用单一的抗菌药不能渗入发挥药效时,联合用药;当患者对某种抗菌药产生严重的耐药性时,病灶更加恶化要联合用药;为了降低某种药物的毒副作用等,需要联合用药。
3.3药物的选用不合理
在我院,抗菌药的不合理使用主要体现在以下几个方面:首先,盐酸洛美沙星注射液联合使用替硝唑/甲硝唑在妇科中的使用较广泛,主要是针对阴道炎,甚至是崩漏的病患。阴道炎分为四种:细菌性、阿米巴性、滴虫性和念珠菌性,前三种是以甲硝唑为主要的抗菌消炎药,最后一种主要是应用咪唑类的抗真菌性的药物。针对崩漏,主要是止血,少数使用盐酸洛美沙星或者是克拉霉素进行治疗。然而在剂型的选择上,最好是口服,吸收性较全,进行早晚给药。其次,若是诊断为上呼吸道的疾病,即可使用头孢类的抗菌药进行治疗。通常情况下,上呼吸道主要是以病毒的感染为主,若无并发症,一般在4~7d即可痊愈,多饮水、对症治疗、多休息,通常情况不使用预防性的应用抗菌药。最后,没有指征性的使用药物:例如甲癣使用克拉霉素、肋痛使用阿莫西林、皮炎使用阿奇霉素等。
3.4给药的频率、剂量和溶媒不当
【关键词】 方差分析;效应量;标准均数差;假设检验
0引言
效应量(effect size)是一类用来描述处理效应的统计量. 在20世纪60年代,生物统计学家(Cohen, 1965; Hays,1963)就强调效应量的应用,认为效应量是假设检验的补充[1]. 然而医学领域的绝大多数的研究者在报道结果时,往往仅提供假设检验的P值[2-3]. 1996年美国心理学会(APA)的统计推断机构TFSI建议报道研究结果时应同时提供处理效应的方向、大小及其的可信区间[4]. 1998年Wilkinson和TFSI 建议对于主要结果必须报道效应量,即报道P值时同时应报道效应量[5]. 2001年美国心理学会(APA)科研手册上规定:论文的结果部分必须报道效应量[6]. 至今已有24种心理学、医学期刊要求研究者投稿时报道效应量[7]. 国内教科书对Meta分析所涉及的效应量作了简单介绍,但对效应量的系统研究很少. 依资料类型和研究设计的不同,效应量又有很多种类,我们主要研究方差分析(ANOVA)模型中常用的一类效应量-标准均数差(standardized mean difference).
1材料和方法
1.1材料为研究不同的实验设计类型的标准均数差的计算方法,我们采用了Bauman等[1]人的实验数据(表1). 该实验采用前后测量设计研究了66名四年级学生不同阅读习惯对理解能力的影响. 阅读习惯(研究干预)分为:单纯朗读(TA),阅读并积极思考(DRTA),阅读(DRA),其中DRA为对照组. 理解能力用错误检测任务(EDT)的得分表示,干预前后两次测量结果用EDT1, EDT2表示. 该研究考虑了一个控制因素(即研究前的理解能力):各组前两列的学生研究前理解能力较低,后两列理解能力较高.
1.2方法在统计分析中,需要解决均数的对比(contrast)问题,即一个研究有J个处理组,则均数的对比可以表示为:
Ψ=c1μ1+c2μ2+…+cJμJ(1)
其中, c1+c2+…+cJ=0. Ψ=μi-μj是最常见的对比. 对比含有量纲,与反应变量的量纲相同,不能直接用于不同研究间比较;而标准均数差无量纲,可用于不同研究间比较的效应量. 按反应变量的不同,可将标准均数差分为单变量和多变量标准均数差. 不同设计标准均数差计算方法如下:表166名四年级学生接受不同干预后EDT得分情况
1.2.1单变量标准均数差
1.2.1.1单因素完全随机设计该设计的处理因素有J个水平,实验拟研究的问题可表示为对比(1),其标准均数差为:
δ=Ψ〖〗σ(2)
总体参数δ的估计方法:用样本均数x估计总体均数μ, σ可以用准则一中的一种方法进行估计. 准则一:a设计中的某个处理组的标准差,常用对照组的标准差;b对比中所有处理组的合并标准差;c设计中所有处理组的合并标准差.
当对比中包含所有的处理组时,b, c得到的σ估计值相同,并与ANOVA分析中误差均方(MSE)正的平方根相等. 当所有处理组满足方差齐性条件时,c法是估计σ的最佳方法;当不满足时,用a法估计. Hedges指出按照准则一估计的标准均数差是δ的有偏估计,需要乘以系数1-3/(4df-1)进行校正,其中df为用于估计σ的标准差或合并标准差的自由度[8].
1.2.1.2多因素设计该设计的因素可为干预因素(处理因素)和控制因素(非研究因素、混杂因素). 当所有因素均为干预因素时,标准均数差的计算与单因素完全随机设计相同. 多因素实验中若含有控制因素,如将控制因素与干预因素不加区别,按照准则一计算标准均数差时,会出现相同干预的效应量在不同实验设计间不可比的问题[1]. 根据所研究对比的特征,标准均数差的计算方法不同,如以2×2析因设计为例,见表2. 设实验含有:处理因素A(a1,a2),控制因素B(b1,b2).
表2含有控制因素的多因素设计标准均数差的计算方法
分析目的〖〗对比〖〗标准均数差的计算方法干预因素A的主效应〖〗Ψ=1〖〗2(μa1,b1+μa1,b2)-1〖〗2(μa2,b1+μa2,b2)〖〗准则二:a. 按照干预因素分组,计算各组的标准差;b. 用准则一中的一种方法估计σ.干预因素A在b1水平
的单独效应〖〗Ψ=μa1,b1-μa2,b1〖〗同准则二.因素A与B的交互作用〖〗Ψ=(μa1,b1-μa2,b1)-(μa1,b2-μa2,b2)〖〗同准则二.控制因素B的主效应〖〗Ψ=1〖〗2(μa1,b1+μa2,b1)-1〖〗2(μa1,b2+μa2,b2)〖〗准则三:a. 按照干预因素及对比中含有的控制因素分组,计算各组的标准差;b. 用准则一中的一种方法估计σ. 控制因素B在a1水平的
单独效应〖〗Ψ=μa1,b1-μa1,b2〖〗同准则三.
多因素实验研究的对比可能仅含有控制因素,不含有处理因素,如在2×2×2析因设计中,对比为:
Ψ=1〖〗2(μb1,c1+μb1,c2)-1〖〗2(μb2,c1+μb2,c2)(3)
其中,A为处理因素,B, C为控制因素. 仅含有控制因素对比的标准均数差计算方法:a按照实验研究的控制因素分组,计算各组的标准差,在对比(3)中,按照因素B分组;b用准则一估计σ.
1.2.1.3含有协变量的多因素设计协方差分析(ANOCVA)通过建立协变量与反应变量的线性回归关系,对各组的反应变量的均数进行校正后,再进行假设检验. ANOCVA标准均数差的计算方法为:用样本校正均数xc估计总体均数μ,将协变量作为控制因素,按照准则二来估计σ.
1.2.1.4含有重复测量因素的多因素设计含有重复测量因素的设计可分为:①仅含有1个或多个重复测量因素的设计;②含有重复测量因素和观测间因素的设计. 因为重复测量因素为处理因素,所以①中不存在控制因素引起的相同处理的效应量在不同实验设计间不可比的问题,标准均数差的计算方法,与因素为处理因素的设计相同. 含有重复测量因素和观测间因素的设计计算标准均数差时,将重复测量因素作为处理因素,如观测间因素含有控制因素按照表2中准则二或三计算.
1.2.2多变量标准均数差马氏距离在多元方差分析中即是一种多变量标准均数差. 马氏距离公式为:
D=d′R-1d
其中,d为单变量标准均数差向量,R为合并的组内相关矩阵. 实际计算中,马氏距离可以由多元检验统计量Wilkss Λ计算得到:
D=df(1-Λ)Σk〖〗i=1c2i/ni〖〗Λ(4)
其中:k为处理组数, ci, ni分别为i组对比系数和样本量. df的计算公式为:df=Σni-k.
1.2.3标准均数差的解释标准均数差的解释准则不多,因为医学研究领域所涉及的内容很广泛,想给出普遍适用的准则,需要冒很大风险. Cohen建议标准均数差为0.2时,效应为小,0.5为中等,0.8为大. 如果样本满足正态分布,总体间重叠的比例(percent of overlap, OL%),有助于标准均数差的解释. 若处理组与对照组的标准均数差为0.70,那么可认为处理组50%的研究对象反应变量值大于对照组76%的研究对象的值(图1).
图1标准均数差与OL%示意图
2结果
Bauman等人的研究关心阅读方法TA和DRTA的平均效应与DRA的差别(对比Ψ1)以及阅读方法TA与DRTA的差别(对比Ψ2).
Ψ1=1〖〗2(μTA+μDRTA)-μDRA, Ψ2=μDRTA-μTA.
若仅考虑EDT2和干预因素(阅读习惯),本例的研究设计为单因素完全随机设计. 表3为各组的均数和标准差,表4为对比Ψ1, Ψ2的标准均数差. 按照Cohen准则,两对比均为中等效应. 校正后Ψ2的效应量为0.697,可认为50%阅读并积极思考的学生的EDT成绩高于76%的单纯朗读的学生成绩.表3各组EDT1, EDT2成绩表4单因素完全随机设计标准均数差
若将EDT2作为研究的反应变量,考虑干预因素A和控制因素B(阅读能力),本例为析因设计. 为了便于公式的演算,假设干预因素为两水平(TA, DRTA),本例研究干预因素、控制因素的主效应、单独效应及两因素的交互作用. 这些效应的可以用表2中相应的对比表示,其标准均数差的计算见表5.表5多因素设计各组EDT2成绩及标准均数差
若将EDT2作为研究的反应变量,考虑干预因素,并将干预前的测量结果EDT1作为协变量,本例为含有协变量的单因素设计(协方差设计). 通过协方差分析,各组校正后的均数见表6. 按照校正均数计算对比Ψ1, Ψ2的标准均数差,见表6.
将EDT作为研究的反应变量,考虑干预因素和重复测量因素,干预前后EDT做了两次,重复测量因素有两水平,本例为含有1个重复测量因素的两因素设计. 不同阅读方式的效应用两次测量的差值表示,两对比Ψ1, Ψ2可以表示为:表6各组EDT2成绩及标准均数差
Ψ1=1〖〗2(μEDT2,TA-μEDT1,TA)+1〖〗2(μEDT2,DRTA-μEDT1,DRTA)-(μEDT2,DRA-μEDT1,DRA),
Ψ2=(μEDT2,DRTA-μEDT1,DRTA)-(μEDT2,TA-μEDT1,TA).
根据表3,可计算对比Ψ1, Ψ2的标准均数差分别为1.018, 0.439.
将EDT1, EDT2作为研究的反应变量,考虑干预因素,本例为多元单因素完全随机设计. 对比Ψ1,Ψ2中的μ为均数向量,检验统计量Wilkss Λ,可以用SAS/GLM CONTRAST计算得到[9]. 由公式(4)可计算对比Ψ1,Ψ2的多元标准均数差D分别为1.228, 0.689.
3讨论
标准均数差是方差分析模型中常用的一类效应量,也是目前心理学、医学研究领域和Meta分析中最常用到的效应量. 本文按照不同的实验设计,考虑相同干预不同设计间效应量的可比性,介绍了标准均数差的计算方法,总结给出了相应的计算准则,并给出了实例. Meta分析常遇到研究干预相同、研究设计不同的情况下,效应量的计算问题. 本文介绍的标准均数差的计算方法可以很好的解决这一问题. 另外,本文介绍的标准均数差的计算可适用于两组和多分组的情况,有些资料和文献上针对两组资料的比较对标准均数差进行介绍. 专用于两组比较的标准均数差有:Cohens d,Glasss Δ,Hedgess g和Cohens f2 [10].
尽管APA和24种期刊要求研究者进行假设检验时,必须报道一种或多种效应量作为其补充,但是对效应量能否帮助研究者或读者提供有关干预效应有无实际意义的信息,也有统计学家提出疑问[1]. Cohen对标准均数差解释制定的准则,能否适用医学研究领域,也存在争议. Cohen也建议统计学者制定其他的准则来解释标准均数差. 目前,国内的生物医学期刊还未要求报道效应量,国外对效应量的研究和报道较多,尤其是在心理测量领域的研究,并有关于效应量误用的分析报道,因此我国生物医学论文要求报道效应量是未来的发展趋势.
【参考文献】
[1] Olejnik S, Algina J. Measures of effect size for comparative studies: Applications, interpretations, and limitations[J]. Contemp Educ Psychol, 2000,25(3):241-286.
[2] Glaser DN. The controversy of significance testing: Misconceptions and alternatives[J]. Am J Crit Care, 1999,8(5):291-296.
[3] Cohen J. The earth is round (P
[4] apa.org/science/tfsi.html.
[5] Wilkinson L. Task force on statistical inference APA board of scientific affairs. Statistical methods in psychology journals: Guidelines and Explanations[J]. Am Psychol, 1999,54(8):594-604.
[6] American Psychological Association. Publication manual of the American Psychological Association[M]. 5th ed. Washington: American Psychological Association Press,2001:1-5.
[7] coe.tamu.edu/bthompson.
科研设计包括专业设计和统计研究设计。专业设计主要包括基本常识和专业知识的正确、全面、巧妙地运用;而统计研究设计包括实验设计、临床试验设计和调查设计。值得注意的是:在很多科研人员所做的科研课题中,不仅严重忽视统计研究设计,就连专业设计也有严重错误,主要表现在犯了基本常识错误和违背专业知识错误。这类错误所发生的频率还相当高,是一种不能容忍的不正常现象!
在统计研究设计所包含的3种研究设计中,实验设计是最重要的,因为很多关键性的内容都包含在其中,其核心内容是“三要素”、“四原则”和“设计类型”。所谓“三要素”就是受试对象(或调查对象)、影响因素(包括试验因素和重要的非试验因素)和实验效应(通过具体的观测指标来体现);所谓“四原则”就是随机、对照、重复和均衡原则,它们在选取和分配受试对象、控制重要非试验因素对观测结果的干扰和影响、提高组间均衡性、提高结论的可靠性和说服力等方面将起到“保驾护航”的作用;所谓“设计类型”就是实验中因素及其水平如何合理搭配而形成的一种结构,它决定了能否多快好省且又经济可靠地实现研究目标。科研人员若对重要非试验因素考虑不周到、对照组选择不合理、设计类型选择不当或辨别不清,导致科研课题的科研设计千疮百孔、数据分析滥竽充数、结果解释稀里糊涂、结论陈述啼笑皆非。下面笔者就“实验设计”环节存在的问题辨析如下。
1 在分析定量资料前未明确交代所对应的实验设计类型
人们在处理定量资料前未明确交代定量资料所对应的实验设计,对数千篇稿件进行审阅后发现,大多数人都是盲目套用统计分析方法,其结论的正确性如何是可想而知的。这是一条出现非常频繁的错误,应当引起广大科研工作者的高度重视。
2 临床试验设计中一个极易被忽视的问题——按重要非试验因素进行分层随机化
例1:原文题目为《气管舒合剂治疗支气管哮喘的临床观察》。原作者写到:“全部病例均来源于本院呼吸专科门诊和普通门诊,随机分为治疗组40例和对照组30例。其中治疗组男21例,女19例;年龄21~55岁,平均(36.28±9.36)岁;病程2~23年,平均(10.31±17.48)年;病情轻度者16例,中度24例。对照组30例,男16例,女14例;年龄20~53岁,平均(35.78±9.53)岁;病程3~24年,平均(11.05±6.47)年;病情轻度者13例,中度者17例。两组间情况差异无显著性,具有可比性。”请问这样随机化,其组间具有可比性吗?
对差错的辨析与释疑:显然,研究者在试验设计时未对重要非试验因素采用分层随机保证各组之间的可比性。这条错误的严重程度为不可逆,出现不可逆错误意味着原作者的试验设计具有无法改正的错误,必须重做实验!究其原因,主要是原作者未理解统计学上随机的概念。统计学上随机化的目的是尽可能去掉人为因素对观测结果的干扰和影响,让重要的非试验因素在组间达到平衡。稍微留意一下原作者随机化分组,明显带有人为的痕迹,治疗组40人比对照组30人多出10人;治疗组病程的标准差17.48是对照组病程的标准差6.47的近3倍。笔者很疑惑怎样的随机化才能达到如此的不平衡?事实上随机化有4种:子总体内随机、完全随机、分层随机和按不平衡指数最小原则所进行的随机,原文条件下应当选用分层随机,即以两个重要的非试验因素(性别和病情)水平组合形成4个小组(男轻,女轻,男中,女中),然后把每个小组内的患者再随机均分到治疗组和对照组中去,这样分层随机的最终结果一定是治疗组和对照组各35人,且使2组间非试验因素的影响达到尽可能的平衡,从而可大大提高组间的可比性。在本例中,若“病程”对观测结果有重要影响,在进行分层随机化时,在按“性别”和“病情”分组的基础上,还应再按“病程”(设分为短、中、长)分组,即共形成12个小组,将每个小组中的患者随机均分入治疗组与对照组中去,这是使“性别、病情、病程”3个重要非试验因素对观测结果的影响在治疗组与对照组之间达到平衡的重要举措,也是所有临床试验研究成败与否的最关键环节!
3 实验设计类型判断错误
例2:某作者欲观察甘草酸、泼尼松对慢性马兜铃酸肾病(AAN)肾损害的干预作用,于是,进行了实验,数据见表1。原作者经过用甘草酸和泼尼松分别与同期正常对照组和模型组比较,一个P<0.05,另一个P<0.01,于是得到甘草酸、泼尼松对慢性AAN肾损害具有一定程度的保护作用,且泼尼松的效果更佳。请问原作者的结论可信吗?表1 各组大鼠血BUN及SCr变化比较(略)注:与正常对照组同期比较,*P<0.05,**P<0.01;与模型组同期比较,P<0.05,P<0.01
对差错的辨析与释疑:本例错误极为典型,通常科研工作者欲观察某种药物是否有效,习惯上会建立正常对照组、模型组(即该药物拟治疗的病态组)和在模型组基础上的用药组(如本例中甘草酸组和泼尼松组)。这样的设计本身并没有错,但这仅仅是专业上的“实验安排(可称为多因素非平衡组合实验[1])”,而并非是统计学中所说的某种标准实验设计类型。写在“组别”之下的4个组,并非是一个因素的4个水平,而是2个因素水平的部分组合。这2个因素分别是“是否建模(即正常与模型2个水平)”和“用药种类[即不用药(相当于安慰剂)、用甘草酸和用泼尼松3个水平]”。2个因素共有6种水平组合,即“组别”之下缺少了“正常基础上用甘草酸”和“正常基础上用泼尼松”。这样设计的实验才可能反映出“是否建模”与“用药种类”2个因素之间是否存在交互作用。
在本课题研究中,由于未在实验前作出正确的实验设计,处理数据时错误就悄然产生了。具体到本例,从原作者在表1的注解中可以看出,通过单因素方差分析分别比较同期(即相同观测时间点)的甘草酸组和泼尼松组与正常对照组和模型组之间的差别是否有统计学意义。这样的做法有3个严重错误:第一,严格地说,在模型组基础上的用药组是不适合直接与正常对照组相比较的,因为这样的比较解释不清到底是药物的作用还是由于模型未建成功而造成的假象;第二,将各个时间点割裂开分别比较破坏了原先的整体设计,数据利用率降低,误差估计不准确,导致结论的可信度降低。将一个重复测量实验的各个时间点割裂开来考察,就等于在各个片段上估计实验误差、作出统计推断,好像盲人摸象一样,摸出来的结果差别何其之大;第三,要想说明两种药物哪个效果更佳,在得出差别具有统计学意义的基础上,衡量的标准是应看组间平均值的差量的大小而不应看P值是否足够地小,不能说P<0.01时就比P<0.05时更有效,这种忽视实验误差、忽视绝对数量和脱离专业知识的想法和做法都是不妥当的。
如何正确处理表1中的实验资料呢?关键要正确判定该定量资料所对应的是什么实验设计类型。由前面的分析可知,表1定量资料对应的是“多因素非平衡组合实验”,而不是某种标准的多因素实验设计类型。明智的做法是对“组别”进行合理拆分,即根据专业知识和统计学知识,对“组别”之下的所有组重新进行组合,应使每种组合对应着一个标准的实验设计类型。正确地拆分结果分别见表2和表3。表2 正常对照组与模型组大鼠血BUN及SCr变化的测定结果(略)表3 模型组和2个用药组大鼠血BUN及SCr变化的测定结果(略)
事实上,由科研习惯形成的这一套实验方案笔者形象地称之为多因素非平衡的组合实验,或者说,它是实验设计的表现型。通常可以进行统计分析的都必须是标准型(即统计学上所说的某种实验设计类型),因此需要能看出代表表现型本质的原型(本例中组别之下应该有6个组,这6个组构成一个2×3析因设计结构,但原作者少设计了2个组)。通常需要将表现型或/和原型拆分成标准型后再选择合适的统计分析方法进行数据分析。本例根据原作者的意图,可以将表1拆分成2个标准型,形成2个具有一个重复测量的两因素设计定量资料,见表2和表3。相应的统计分析方法就是具有一个重复测量的两因素设计定量资料的方差分析。此处请读者注意:第一,具有一个重复测量的两因素设计定量资料的方差分析和一般的方差分析虽然都叫方差分析,但它们的计算公式却有本质区别,绝不可混用;第二,重复测量因素(本例中为时间)不要与实验分组因素(表2中叫“是否建模”;表3中叫“药物种类”)同时列入左边,它们是本质不同的两种因素,一般应该把“重复测量因素”放到表头横线下方。
通过本例可以看出,在实验前明确实验设计是多么重要的一件事情。试想,若让本例原作者写明他的实验设计类型,他必然就会对基本的实验设计类型作一番调查和学习,自然就能发现他所“设计”的实验并不是统计学上相应的实验设计。那么通过咨询相关人士必能做出比较正确的实验设计,不仅可以提高科研设计水平,而且可以大大提高科研课题和论文质量。
例3:原文题目为《土荆芥-水团花对胃溃疡大鼠黏膜保护作用的研究》。原作者使用单因素多水平设计定量资料方差分析处理表4中的数据。请问原作者这样做对吗?表4 各组黏膜肌层宽度、再生黏膜厚度变化(略)注:与正常组比较,aP<0.05;与NS组比较,bP<0.05;与CP 10 mg·kg-1 组比较,cP<0.05
对差错的辨析与释疑:本例涉及到统计学三型理论[1]中的一些概念,简单地说就是可以直接进行统计分析的来自标准设计的数据表叫标准型,反映问题本质但并非是标准型的数据表叫原型,而掩盖了原型信息的数据表叫表现型。“组别”之下的6个组,似乎是某个因素的6个水平,其实不然!这6个组涉及到多个试验因素,应对“组别”拆分重新组合后,再分别判定各种组合所对应的实验设计类型,并选用相应的统计分析方法。组合1:空白对照组(正常)、阴性对照组(NS),这是单因素两水平设计(简称为成组设计)。由于正常组无实验数据,故该组合无法进行统计分析;组合2:NS组、RA组、CP(20/mg·kg-1)组,这是单因素3水平设计,因素的名称叫“药物种类”;组合3:NS组、CP(10/mg·kg-1)组、CP(15/mg·kg-1)组、CP(20/mg·kg-1)组,这是单因素4水平设计,因素名称叫CP的剂量(其中,NS组可视为CP的剂量为0)。
对于组合2和组合3,若定量资料满足参数检验的前提条件,可选用相应设计定量资料的方差分析,否则,需要改用相应设计定量资料的秩和检验。
4 人为改变设计类型且数据利用不全
例4:某作者使用表5中的数据进行分析,欲比较治疗组和对照组在治疗后的各个时间点的疗效情况,使用的分析方法为一般卡方检验,请问原作者这样做对吗?
对差错的辨析与释疑:从给出的统计表可以看出,该作者有意或者无意之间收集了一类相当复杂的实验设计类型下的定性资料,结果变量为多值有序变量的具有一个重复测量的两因素设计定性资料,处理这个设计下收集的定性资料要使用相应设计定性资料的统计模型分析法。由于上述方法过于复杂,因此,通常在实际运用中,实际工作者将重复测量因素武断地视为实验分组因素,从而使该资料变为结果变量为多值有序变量的三维列联表资料。在已经出错的前提下,原本应当使用CMH校正的秩和检验或者有序变量的多重logistic回归分析处理资料。然而,该作者显然在此基础上进一步合并了数据,将结果变量变成二值变量(有效、无效),也就是说,原作者实际使用的仅仅是最后一列数据(即总有效率),并且最为严重的错误是将三维列联表资料强行降维成二维列联表资料,使用一般χ2检验进行分析。经过一系列的简化与错误合并,最后结论的可信度还剩下多少呢?表5 原作者对2组疗效比较的试验设计及数据表达(略)注:与对照组同期比较,*P<0.05
由于篇幅所限,这类错误笔者只给出1例,实际上此类例子在很多杂志中普遍存在。这说明在进行实验设计时,很多研究人员并未做到心中有数;分析数据时,按自己熟悉的简单统计分析方法所能解决的数据结构强硬地改造数据,严格地说,在用表格表达实验资料的那一刹那就已人为改变了资料所对应的实验设计类型,这种做法的科学性和得出结论的正确性都将受到质疑[2]。
5 正交设计及数据处理方面的错误
人们在进行正交设计和对正交设计定量资料进行统计分析时,常存在下列3个误区:很多人过分强调用正交设计可以大大减少实验次数,因此,无论各实验条件(正交表中的每一行)下的实验结果波动有多大,都不做重复实验,这是第1个误区;将正交表各列上都排满试验因素,用对实验结果影响最小的试验因素所对应的标准误作为分析其他因素是否具有统计学意义的误差项,导致误差项的自由度较小,结论的可信度较低,这是第2个误区;在对正交设计定量资料进行方差分析后,即使存在多个无统计学意义的因素,仍对少数几个有统计学意义的因素进行解释,未将无统计学意义的因素合并到误差项中去重新估计实验误差,以获得具有较大自由度的误差项,这是第3个误区。
2.研究方法
2.1对数据库医药卫生类期刊分类类目按“中图法”调整
为了得出4个数据库各库及各类所收录的医药卫生期刊总数,同类别不同数据库期刊收录重复数,对CBM与CNKI、万方、维普以及CNKI、万方、维普全文库之间的期刊收录重复数据的统计,是以各库分类的期刊为统计基础的。由于4个数据库的期刊分类类目存在一定的差异,因此,以CBM数据库的“中国图书馆分类法——医药卫生类”为蓝本,对数据库中医药卫生分类出人较大的类目进行了适当调整,使其分类基本相近,便于统计分析,得出较可信的结果。
CBM数据库:“生物学”、“生物化学”、“分子生物学”类期刊、“实验医学、医学实验”及“与医学相关”类期刊归人“基础医学类”。
CNKI数据库:“泌尿科学”并入“外科学”类;“消化医学”、“感染性疾病及传染病”、“心血管系统疾病”、“呼吸系统疾病”、“消化系统疾病”、“内分泌腺及全身疾病”均人“内科”;“眼科与耳鼻喉科”分为:“眼科”和“耳鼻喉科”;“军事医学与卫生”并人“特种医学”;“急救医学”人“临床医学”,属于内科急救的期刊重复人“内科”。“神经病学”和“精神病学”合并为“神经病与精神病学”;“生物医学工程”入“基础医学”;“医学卫生方针政策与法律法规研究”和“医学教育与医学边缘学科”均入“医学与其它”;“医药卫生综合”入“综合类医学期刊”;“中药学”和“中西医结合”均入“中国医学”。万方数据库:“五官科学”分为“耳鼻喉科”、“眼科”和“口腔医学"类;“妇产科与儿科学”分为“妇产科”和“儿科学”类;“医疗保健”人“预防医学、卫生学”类。维普数据库:“外国民族医学”入“综合类医学期刊”。“学报及综合类”中的学报入“大学学报”,综合类入“综合类医学期刊”。
2.2归集各库收录的刊名变更的同一期刊
4个数据库中收录的期刊随着时间的推移,一些期刊的刊名在不断的变更中,甚至有的刊名变更了数次,出现了同一种期刊有三、四种刊名。为了便于统计,将不同刊名的同一期刊进行归集统计,即将不同刊名实属同一期刊的归集为一种期刊进行统计。
2.3采用EXCEL表进行期刊数据的筛选
统计利用EXCEL表,为不同目的对基础数据做多次不同标记的标识,然后进行数十次的筛选、统计并反复进行核对和修正,力求数据准确。对四库的统计时间为2012年4月。整个研究过程达1个半月。
2.4采用2008版《中文核心期刊要目总览》——医药卫生类做核心期刊的统计
根据2008版<中文核心期刊要目总览》——医药卫生类的期刊目录,将四库各库收录的核心期刊筛选统计,然后再进行CBM库与CNKI、万方、维普之间的重复核心期刊及_、万方、维普之间的重复核心期刊数的统计和比较。
3.四大文献数据库医药卫生期刊资源比较
3.1各库各类期刊收录数及重复状况
3.1.1各库各类期刊收录比较
为了得出较细致的统计数据,笔者从四库各库的医药卫生各类收录的期刊着手统计,获得各库各类收录期刊数及各库各类收录期刊重复数。根据表1统计结果得知:在四库所收医药卫生各类期刊中,CBM数据库所收录的期刊在综合类医学、大学学报、预防医学、卫生学、中国医学、基础医学、内科学、外科学类数量为最多,维普数据库在临床医学类所收期刊的数量为最多,CNKI数据库在预防医学卫生学收录期刊数量为最少,万方数据库在综合类医学、中国医学、基础医学、妇产科学、儿科学类所收期刊数量最少,CBM和维普数据库在特种医学和药学类所收期刊数量较多,CNKI和万方数据库在特种医学和药学类所收期刊数量要少很多。
3.1.2各库各类期刊收录重复比较
根据表2统计结果得知:CBM与维普数据库在综合类医学期刊、大学学报、预防医学卫生学、中国医学、临床医学、内科学、外科学、神经病学与精神病学、皮肤病学与性病学、眼科学、口腔医学、特种医学、药学类所收期刊重复率均为最髙。CNKI与万方数据库在预防医学卫生学和皮肤病学与性病学类所收期刊重复率最低。万方与维普数据库在综合类医学期刊重复率最低。CNKI、万方、维普三库同时收录医药卫生各类期刊重复数量与CBM、_、万方、维普四库同时收录医药卫生各类期刊重复数量差别很小,但数量均少于各类最低数。
M、CN1Q、万方3数据库所收核心期刊数差别不大,均在94%以上。维普数据库收录核心期刊数略少一些,为88.8%。
3.3 各库期刊、核心期刊重复收录状况
3.3.1各库收录期刊重复比较
表4的统计数据为各库期刊重复收录数与百分比及核心期刊重复收录数与百分比,四库收录期刊去重总数为255Sf^,CBM与CNK3收录期刊重复数为1022种,CBM与万方收录期刊重复数为915种,CBM与维普收录的期刊重复数为1468种,CNH、万方和维普三库之间的两两重复刊有800多种,CNKI、万方和维普三库与CBM、CNKI、万方和维普四库同时收录期刊重复数差别不大,重复刊有700多种。结果是:CBM与维普数据库所收期刊重复量最大,达到57.4%,其次是CBM与CNKI所收期刊重复量达到40%。_、万方、维普三库间收录期刊重复率与四库收录期刊重复率均在30%左右(见表4)。
3.3.2各库收录核心期刊重复比较
四库各库核心期刊收录重复情况分别为:CBM与万方、CBM与CNKI、CNKI与万方重复数差别不大分别是239种、235种、233种,所占比例分别为:95.2%、93.6%、92.8%。CBM与维普、万方与维普、CNKI与维普重复数差别不大,分别是222种、221种、217种,所占比例分别为:88.4%、88.0%^86.5%。CNKI、万方、维普三库所收核心期刊重复与四库所收核心期刊重复情况几乎相同(见表4)。
4.四库特点比较
除了上述各库医药卫生期刊资源收录情况各有不同外,各库其它方面的特点也存在一些差异。
4.1 检索途後比较
CBM数据库的检索界面简洁清楚,主题标引严谨,中医主题词采用《中国中医药学主题词表》标引,西医主题词采用美国国立医学图书馆编制的“MeSH”主题词表标弓I,主题词规范,主题检索功能强大,可以减少基本检索同义词使用不全带来的文献漏检的损失,同时可以通过主题词上下位及同位的关系选择主题词或进行族性检索。CBM主题检索途径是其最大的优点。万方、维普数据库未设主题检索途径,CNKI设有主题检索字段,但不规范,检索功能不能与CBM主题检索功能相提并论。
CBM数据库的主题标引和分类标引通过主题字段和分类字段反映文献的中心内容,万方、CNKI和维普数据库仅有关键词字段反映文献的关键词,不能反映文献的中心内容,相比之下该方面差很多。
CBM数据库检索史更加方便检索式之间的灵活组配。万方、CN1Q和维普数据库没有该方面的功能,万方、维普甚至没有检索史。
CBM、维普分类检索途径采用的是“中图法”,我国许多髙校和科研单位以及多数图书馆以《中图法》类分图书和文献已有相当长的时间。《中图法》经过多次修订和完善,分类体系及类目设置更加合理,它的交替类目和复分表使用更加方便、准确。CBM、维普分类途径因检索的查全率和查准率都较低,所以较少使用。CNKI虽设置了分类检索途径但很粗略,使用不便。万方未设分类检索途径。4个库的分类检索功能均需进一步完善。
万方、CNKI和维普数据库之间的检索途径相比,CNH和维普较好,均有髙级检索,万方所设检索功能稍差一些,期刊论文检索提供的输入框较少,检索不便。未设髙级检索,虽然设置了专业检索,但当检索式较长时检索会出错,且一般检索者使用起来有一定难度。
维普数据库髙级检索中的关键词字段提供同义词的检索,该功能是CBM、万方和_数据库所没有的。维普的这一功能能够解决获取同义词的困难,但是它所提供的同义词不是很全很准确,亦需进一步完善。
CNKI数据库的期刊导航提供核心期刊导航,为读者向核心期刊投稿提供信息,除此之外还提供学位论文,工具书和翻译助手。
CBM与CNKI都设有文献检索结果分析研究途径,该途径对于从亊文献检索以及科技工作者对文献信息的分析研究提供了较大的便利,万方和维普未设该功能。
4.2 文献收录方面比较
CBM数据库收录医药卫生期刊最多(2348种),维普次之(1706#),CNH为第三(1165种),万方较少(948种)。CBM与维普期刊重复达到57.4%,CBM与CNKI收录期刊重复达到40%,CBM与万方期刊重复35.8%,CNH、万方和维普三库之间以及四库重复刊占30%左右。四库所收核心期刊数相差不大,CBM收录的最多(243种),万方收录次之(241种),CNKI第三(236种)、维普为(223种),但四库所收核心期刊重复量较大,在217~230种左右。CNH、万方、维普三库与四库所收核心期刊重复数完全相同,为215种(详情见表4)。
虽然数据库之间收录期刊重复数量较大,但情况不尽相同,在CNKI数据库中有些刊的收录在近几年停止了,但万方数据库却继续收录。维普数据库回溯时间最长,这也是它的长处所在。
4.3 提供全文及更新时间方面比较
补充。目前只有将这4个数据库全査,重复文献只有通过去除,尽管给査新工作带来非常麻烦和费时的烦恼,除此之外,未见有何好的方法和捷径。科技査新工作不仅要检索中文数据库,还要检索博硕士学位论文数据库和外文文献数据库,以得出客观的查新结论,跨学科査新更要注重对综合数据库的检索利用。
在数据库建设方面,各数据库商以及数据库的建设工作者应开展联合协作,加大对数据库的建设和调整力度,尽量减少重复,加快信息更新速度。或将数据库合并,研究建设信息量更加丰富、检索功能更加强大、服务更加全面和检索更加准确的数据库。或者数据库商提供一个具有一站式检索功能、可以去除重复文献信息的平台,使读者和科技査新工作者获取信息更加方便和准确,以推动我国医药卫生科技体系创新和医药卫生改革,开创医学信息服务的新局面。
CBM是文摘型数据库,现虽然有全文推送,但是它毕竟不是全文数据库,有一定数量的文献未附带全文。CNH、万方和维普是全文数据库,提供的全文还是较CBM多。
5.研究总结
虽然目前CBM、CNH、万方和维普数据库之间期刊收录和核心期刊收录重复严重,但四库中没有任何一个数据库可以被替代,因为没有哪两个数据库期刊收录完全重复。