临床实践食管癌的危险因素寻找之旅

大家好!我是Bob!今天分享的文章来自于Gastroenterology(IF=18.39),主要内容是基于患者临床流行病学特征和基因变异特点,预测患者发展为Barrett食管和食管腺癌的风险。该文我们可以在自己的临床实践中,很好地借鉴此案例。

问题提出套路(Introduction)

一01

流行病学描述(强调所研究疾病的重要性):过去四十年中,食管腺癌的发病率在西方人群中出现了大幅上升,尽管近几年推行了一些早期诊断的措施,但是由于食管腺癌的五年生存率依然很低,因此其依然是不容忽视的公共卫生问题!(ps:凸显所研究疾病具有一定的或者重大的公共卫生意义,因此审稿人自然就认为该疾病具有研究的必要和价值)

02

描述当前的临床情形(直接或者间接的指出其不足):Barrett食管(BE)是食管腺癌(EAC)的一种癌前病变。现行的主要预防措施是食管内视镜检查BE或者从患有胃食管反流症的患者中筛选BE患者。但是,仅有5-7%的食管腺癌患者在癌症发生前被诊断出BE,因此当前的方法仍然存在非常大的局限性!(ps:这一句看似理所当然,实则非常重要!如果当前的方法已经是金标准,你的研究还有何价值?必须直截了当的告诉审稿人当前的不足!)

03

引出文章主题(对前人的类似研究做一个简单的描述):一种替代的筛检方式是综合利用肿瘤患者的人口学信息、临床特征、基因标志物以及其他因素建立风险预测模型,以此来预测肿瘤发生的风险。(ps:此处就是典型的临床流行病学设计,通过收集肿瘤患者的信息[这是可以从临床上收集的,因此资料是完全可及的,具体收集方法详见下文],利用统计学方法,建立预测模型。)基于此设想,前人做了哪些类似的工作。但是,没有一项研究探索过基于遗传因素的风险预测模型(联合或者不联合非遗传因素),在BE和食管腺癌中的临床应用。(ps:第二个However,自然而然的引出了本文的主题。既然前面的研究都不完美,那么,我们要干点什么呢?再次凸显出文章的重要性!让reviewer欲罢不能……)

04

描述本文工作:BE和食管腺癌是多基因疾病。通过前人的GWAS研究所发现的易感基因,我们创建了一个指标:多基因风险评分(polygenicriskscore,PRS),并以此为基础建立了一个BE和食管腺癌的临床风险预测模型。

方法(Methods)

01

Studypopulation

本文的研究对象来自于多个研究项目,包括BEACONGWAS项目,UKBarrett’sEsophagusGeneStudy,以及UKStomachandOesophagealCancerStudy(ps:为了凑一个理想的样本量,国外经常开展这种多中心研究,对于常见的消化道肿瘤,比如食管鳞癌,在国内似乎没有开展多中心的必要,当然,这个视自身的情况而定)。通过一些纳入排除标准,最终纳入了名BE患者,名食管腺癌患者,以及名正常对照(ps:很多文章在描述研究对象的纳入过程时,喜欢画一张流程图,当然本文并没有)。每个纳入的研究都满足了机构审查委员会的要求,每一名纳入的患者均是知情同意的。(ps:所谓的伦理学要求,在临床研究中,特别特别重要!几乎所有杂志都要求临床研究提供相应的伦理学证明和知情同意书!)

02

GeneticVariantselection,Genotyping,andImputation

通过之前已经发表的GWAS文献,选择与BE和GWAS相关的SNP(ps:这是一种搭便车的方式,GWAS费时费力费钱,如果前人已经开展了相应的GWAS研究,其发现的易感基因,可以直接拿来用,作为本文中的遗传因素)。最终共有23个遗传突变纳入研究(详细见文章的附录表1),用于计算PRS。

既然已经选定了要测定的遗传突变,那么显然下一步就是对所有纳入的研究对象进行相应基因型的确定。此处作者描述了具体的实验平台和基因型确定的标准。

03

PRS的计算

基于第二步,每一个纳入对象的相应SNP基因型已经确定了,接下来就是利用基因型进行PRS的计算。此处作者计算PRS的方法并不复杂,简单的说就是这样的:对于每一个位点的SNP,研究对象可能有0个,1个或者2个危险等位基因,则分别得分0分、1分或者2分,以此作为评分基础,并以该SNP的OR值作为权重(显然,SNP的OR值是来自于前人的GWAS研究),即得分乘以权重,然后将23个SNP的得分相加,再除以23,得到每个研究对象的平均加权得分。最终,以文中纳入的control人群作为对照,将所有患者的平均加权得分转化成Z分(ps:这是数据标准化的一种方式,目的是减少数据的方差)。

04

Demographic,Lifestyle,andClinicalFactors

文中患者的人口学信息、生活方式以及临床因素均是在疾病诊断前一小段时间内或者疾病诊断时通过问卷调查收集的(ps:在疾病诊断时收集患者的流行病学资料,有利于减少回忆偏倚,并且可以降低时间效应,此中资料一般在患者入院时就可收集!)。此处作者详述了一些疾病或症状的定义(即此研究中应用的诊断标准)。值得注意的是,作者收集患者BMI(kg/m2)时采用的方法:由于患者发病后,尤其是肿瘤患者,均可能伴随着一定程度的体重下降,因此如果选择患者发病时的体重来计算其BMI,必然导致BMI偏低,就失去了其作为预测变量的功能(Why?这是因为作者的目的是想利用患者的资料,建立一个疾病预测模型,而预测的对象是谁?显然不再是已经确诊的患者,而是正常人群!因此必须使用正常体重计算BMI,作为预测因子)。基于此考虑,作者选择的是患者正常时的体重,如果正常体重不可及,则选择使用其1年前、5年前或者20年前的体重作为其体重。

05

Statisticalanalysis

本文的统计学方法相对简单,作者首先构建了一个包含7个变量的(包括年龄、性别、PRS、吸烟、BMI等)logistic回归模型,获得了每一个变量的OR值及其95%CI。到这就完事了?显然不是!

作者紧接着利用Hosmer-Lemeshow统计量衡量了模型的拟合优度,再通过10折交叉验证和重抽样法验证了模型的内部可靠性(ps:10折交叉验证和重抽样法是模型验证中最常用的方法,其原理比较类似,简单来说,就是不断的从原始数据中抽取一定比例的样本,以此作为训练集,用于构建预测模型,剩下的样本作为测试集,用于测试模型的可靠性。所以此处验证的是模型的内部可靠性,而非外部可靠性,因为没有利用外部数据进行模型验证,如果有条件,建议开展外部验证,这样结果更加漂亮!),并构建了ROC曲线,利用ROC曲线下面积评估模型的优劣。作者利用此种思想,同时构建了几个不同的模型(纳入的预测变量不同),并用最大似然检验比较不同模型的拟合优度。

如果这个文章到这就结束了,那也发不了GAS。作者的主要目的是想研究一下PRS在临床预测的价值,因此,在统计方法的最后阶段,作者描述了如何定量PRS效应的方法。他们构建了一个新的指标,叫做netreclassificationindex(NRI),各位看官,千万别被作者唬住了,这个指标其实相当简单,其具体计算方法等到结果中再详述。

总而言之,作者拿到了一棵白菜,想法设法的将它炒出了一盘珍馐的感觉,目的就是把审稿人唬住。

结果(Results)

了解了作者的套路后,看结果就相对简单了,下面我们以图表为导向,向读者介绍本文的简要结果。

表1是人口学特征的描述,简单明了。而且大家可能发现,与一些文章动辄占地一整页的table1相比,本研究纳入的流行病学因素相对较少。

表2列出了PRS在不同模型中对于BE和EAC的效应(即OR值)。作者除了将PRS作为连续型变量建模外,也将其进行了离散化(Q1~Q4)。可见PRS的效应是显著的!

表3列出了不同模型的拟合优度。大家可以看出,10折交叉验证和重抽样法得到的AUC曲线下面积与原始模型的曲线下面积十分接近,这表明,作者构建的模型比较稳健,而且随着纳入预测变量的增加,AUC也在增加。与表3对应的是图1.

表4展示的就是NRI。上半部分是针对BE的结果,下半部分针对的是EAC的结果。表4的结构其实是一个配对的表格,以BE的结果为例,列变量展示的是没有纳入PRS的模型中,每个患者的风险分级,而行变量展示的是纳入了PRS的模型中,每个患者的风险分级,以此构建了一个4×4的表格。表格右边的riskreclassification指的是纳入PRS时,同不纳入PRS相比,有多少患者的风险等级发生了改变,即riskreclassification。最终作者得到的结论是,纳入PRS后,BE的风险预测模型整体提高了3.0%,EAC整体提高了5.6%。

总结

本文优势

纳入的样本量较大,在东亚人群中,BE和食管腺癌很罕见,更多的是食管鳞癌,因此如果想在中国开展此类研究,应对研究疾病的流行病学情况有较多的了解;

对每一个纳入的研究对象进行了流行病学资料的收集和SNP资料收集,并将二者综合考虑,构建疾病预测模型。

本文不足

模型构建的方法不够新颖,目前机器学习方法十分普遍,且更加适合用于建立预测模型。

没有外部验证人群,在样本量较大的情况下,与其把所有研究对象作为内部人群构建模型,还不如取其中一部分作为外部人群进行模型的外部验证!当然,抽取外部人群并不能随机抽取,最好的方式是以某个中心的患者作为模型训练集,而以另外一个中心的患者作为训练集。

征稿启事

「医学方」现正式向粉丝们公开征稿!内容须原创首发,与科研相关,一经采用,会奉上丰厚稿酬(-元),详情请戳。

“医学方”始终致力于服务“医学人”,将最前沿、最有价值的临床、科研原创文章推送给各位临床医师、科研人员。

医学方已推出“实验室那些事儿”“SCI写作技巧”“文献精读与解析”“医学英语轻松学”“国自然基金申请”“临床数据挖掘”、“基因数据挖掘”、“R语言教程”、“医学统计学”、“微创动物实验培训”等多个专题课程,如需了解课程详细推文,可







































白癜风治疗花费
中科让您告别白癜风秀健康



转载请注明:http://www.fdnnc.com/bsgzd/9195.html

当前时间: