之前说到,我们试着做了一个临床预测模型,想将“真正“能从手术中获益的晚期肺癌患者“捞”出来,让患者的利益最大化,减少“白挨一刀”的情况:
IV期肺癌手术最佳获益人群的筛选——各种预测模型研究的进阶
科学研究的思路设计是可以“移植”、“推广”的,尤其是预测模型,从单一肿瘤,到泛癌肿的普适应,会进一步证明预测模型的准确性和稳健性。
近期,小梁(广医附一院胸外科)的好兄弟小刘(医院)也对这个模型思路,又试着“推展”做了个姐妹篇研究。同样的模型思路,竟梅开二度——在晚期食管癌患者中,也可以成功预测手术获益人群!
这个预测模型的思路,是在前人众多预测模型研究玩法上做的一个小创新。在此分享其姐妹篇,欢迎批评指正。
背景:食管癌位居全球恶性肿瘤发病第7位,死亡第6位。对于转移性的晚期食管癌,预后较差。晚期食管癌的治疗方案有限,主要以化疗等系统性治疗为主。因为晚期肿瘤患者的肿瘤负荷大、有远处转移,这类患者的重点和目标是疾病控制和缓解,而不是彻底治愈,因此一般不考虑对原发肿瘤部位进行手术切除。
但有个别研究发现,晚期食管癌原发肿瘤的局部干预,与生存预后改善相关。但又并非所有的晚期食管癌患者都能从手术中得到生存获益,具体谁能获益?这个就不清楚了,因此我们做了一个预测模型,挑出真正能从手术中获益的晚期食管癌患者。
方法:数据来源→美国SEER数据库中所有的IV期食管癌患者(研究流程见下图)
在这里,简单再解释一下研究思路:
1、首先匹配基线资料(排除混杂因素对手术的影响),证明手术组(Surgerygroup)vs.非手术组(No-Surgerygroup)存在生存获益.
2、在手术组中,发现有部分人的生存预后比“非手术组”的中位生存期还短,说的通俗点,这类人等于白做手术了,因为手术没有带来获益,还不如单纯做化疗就好了。
3、然后在手术组中,利用“非手术组”的中位生存期(9个月)作为标准来区分两类人群:手术获益人群(Surgerybeneficialgroup)和手术不获益人群(Surgerynon-beneficialgroup)。
最后通过Logistic回归,把术前的一些临床变量指标纳入模型,转化成一个Nomogram(列线图——1种可视化模型),然后验证其准确性。
结果:
生存分析:手术可以给晚期食管癌患者带来获益
在匹配人群中,进行生存K-M分析和Log-rank检验,发现接受原发肿瘤切除的食管癌患者的CSS(肿瘤特异性生存)延长(HR0.52,95%CI:0.44–0.60;中位生存CSS:19月vs.9月)。
另外,在所有亚组中,食管癌切除术都存在获益(更小的HR)。多因素Cox回归模型也进一步证实,手术是晚期食管癌患者的独立预后保护因素(HR0.47;95%CI,0.41–0.55)
预测模型的建立
未接受手术的患者中位CSS时间为9个月(Cut-off)。按照上述研究设计,对实际接受了手术的人群:将生存时间超过9个月的患者归为手术获益组,而中位CSS时间较短(少于9个月)的患者归为手术不获益组。
将手术人群分为7:3,分别是建模训练组(training)和内部验证组(internalvalidation),基于多元logistic回归,我们建立了Nomogram模型(列线图)来预测IV期食管癌患者的手术获益概率。该模型显示肿瘤的年龄、位置、组织类型、T分期是影响预后的主要因素。通过将每个选定变量的分数相加,可以简单地计算出各个患者的手术获益概率。
预测模型的验证——实践是检验真理的唯一标准
该nomogram模型在训练集的AUC为0.72(95%CI:0.66–0.78),在内部验证集的AUC为0.70(95%CI:0.61–0.79)。nomogram模型的训练集和内部验证集的校准图说明该模型的的预测值与实际观测值之间的具有良好相关性。决策曲线分析法也同样证明,该预测模型具有较好的临床预测价值。
最后,我们做个一个更加直观的对比验证,把人分成三组:非手术组(蓝色曲线),手术中模型预估不获益的人(黄色);手术组中模型预估获益的人(红色)。
结果简单来说:不管是在训练组还是验证组中,我们的模型评估为手术不能获益的人,生存预后就和没做手术一样,做了也白做。
结论:这个临床预测模型,有助于将真正能从手术中获益的晚期食管癌患者“挑”出来。
备注:
在实际临床中,晚期肿瘤做手术的比例非常低,所以我们还没有自己的外部队列来验证。但1年前小编恰好碰到一例晚期食管癌患者(cT2N3M1)(原发性胸中下段食管癌鳞癌,颈后三角淋巴结转移)。由于已经远处转移,医生一般不会推荐手术治疗。但这名患者是在化疗1个周期后强烈要求手术,在签署了知情同意的情况下,完成了McKeown手术+三野淋巴结清扫。最近一次复查已是术后12个月(无复发,无死亡)。根据我们的这个模型,这位患者是的获益概率是85%,被归类为手术获益组。那么这名患者,也确实达到了模型的最初估计,活的更长。未来还需要更多的数据来支持进一步的研究优化。
题外话——背后的故事:
这个预测模型系列虽然是小研究,背后的故事却是3年前两个本科生“闲着没事干”的瞎捣鼓。这也是我们真正意义上,科研能力成长的开端:年的1月,两名本科生(小梁和小刘同学)看到SEER数据库被挖掘了各种各样的套路,居然还有推出教学课程售卖。这俩人嗤之以鼻,立志要学会预测模型的思路和操作(其实是没钱买教学资料…),于是,这俩开始摸爬滚打的学习预测模型。
科研能力的学习成长,并非容易。很感谢学习的过程中,有伙伴能够一起掉坑、一起研究如何爬出来。在这个课题过程中,我们作为临床本科医学生,从0开始,通过百度/谷歌途径,互相交流,自学SEER数据库、学习生存图绘制、学习R语言、如何改代码、做PSM匹配、建立预测模型、验证等等。在这曲折的过程中,我们掌握了临床研究中最常见的统计方法、图表绘制。这也为我两人后来开展其他研究,打下了重要的能力基础。
小梁和小刘在虽然最早就开始做这个预测模型的课题,但其实我们在学习的过程中,又得益于学习的技能,完成了并发表了其他研究。当然,做人要不忘初心,我们重新拾起“初恋”再续前缘,最终也是发表了出来,也算是给自己最初的目标,打上完美的结束句。
做科研切忌独自闭门造车,小梁和小刘的故事告诉我们,找一个志同道合的伙伴,共同学习,合作共赢,才能在科研的路上愉快的玩耍。
喜欢我们就多一个,多一次吧!
预览时标签不可点收录于话题#个上一篇下一篇