正确理解临床试验中的风险比(HR)


风险比(HR)清淡用于通知肿瘤学随机临床试验的终局。然而,它们照样是临床大夫最疑心的概念之一。在新式靶向和免疫治疗钻研挺进习以为常的今天,由于匮乏头对头对比,临床大夫往往经历间接比较设计相近钻研(如ALK一线对比克唑替尼的CROWN、ALEX、ALTA-1L和eXalt-3钻研)的HR值以窥疗效优劣,所以更必要足够晓畅HR,以有效注释医学文献,从而做出主要的治疗决策。今天,跟行家翻译分享一篇2011年发外在J Thorac Oncol的经典文献《What a Clinician Ought to Know: Hazard Ratios》,为临床大夫挑供如何正当注释HR的清晰指南。

一、是什么?在肿瘤学随机临床试验(RCT)中,频繁操纵风险比(HR)来推想至事件发生时间尽头的治疗效率,如总生存期(OS)和无挺进生存期(PFS)。HR挑供了整个钻研期间试验组和对照组之间风险率比值的推想值。而风险率指的是钻研中每个治疗组在短时间阻隔内发生关注事件(包括物化亡、不息监测或停留监测)的患者比例。这个概念能够经历一个倘若的例子来表明:外1所示为一项有两个治疗组和一个主要尽头OS的RCT钻研。第一周,对照组的物化亡率(0.04)高于试验组(0.03)。第二周,患者物化亡率是第一周的两倍:对照组为0.08,试验组为0.06。经历将试验组的患者物化亡率除以对照组的患者物化亡率,计算每周的HR(试验组与对照组)。尽管风险率随时间转折,但每周的HR大致恒定(0.75)(外1)。所以,本RCT通知的HR为0.75。

图片

HR清淡按照肿瘤学RCT平分析生存尽头的标准手段之一Cox比例风险模型计算。简化来说,HR=1意味着试验和对照处理的等效性(图1);如试验处理(i)优于对照,则HR<1;如(ii)劣于对照,则HR>1。

图片

二、为什么有效?对数秩和Wilcoxon检验清淡用于比较试验期间治疗组之间的整个生存数据,然而仅生成p值而非治疗效答幅度或倾向的推想值。也就是说,对数秩和Wilcoxon检验仅确定治疗是否分别,但不外明一栽治疗的水平优于或劣于另一栽。推想RCT生存终局幅度和倾向的三栽主要手段包括(i)HR,(ii)通知每个治疗组的中位生存期,(iii)时间点分析(如1年OS率),后两者清淡由KM分析生成。然而,HR与其他两栽指标在以下方面存在迥异。最先,HR囊括了整个KM生存弯线中的所有新闻,所以总结了RCT整个不息时间内的治疗效率。相比之下,中位生存期仅关注治疗组生存弯线上的一个点,最众代外“组平均年龄”,行为个体患者疾病限制不息时间或OS的指标过于浅易。其次,HR挑供了治疗组之间相对疗效的推想值(例如,OS尽头的HR = 0.75,意味着试验组的物化亡风险相比对照组降矮约25%)。第三,由于上述两栽特性,提出基于HR而非中位生存期或特准时间点的生存概率作出优效性和非劣效性声明。末了,能够计算校正和未校正的HR。未校正的HR按照单变量Cox比例风险模型计算,而校正的HR清淡操纵众变量Cox模型进走,即其还包含将校正的协变量,例如年龄、性别、疾病分期和体能状态。与之相对的是,按照KM生存弯线推导的中位生存期和特准时间点(如1年OS率)的生存概率往往未进走校正。三、有哪些限制性?HR的正确注释是基于以下倘若:钻研期间每个时间阻隔的风险率比值近似恒定,这也被称为“比例风险”(PH)倘若。可经历正式的统计检验和图外(例如,Martingale残差、Schoenfeld残差与时间的有关图和log-negative-log plots)来确定PH倘若是否成立。然而,清淡经历回顾KM生存弯线的形状来竖立倘若,所以正式检验的终局在文献中很少报道。

图片

图片

倘若弯线之间的别离随时间维持,则PH倘若能够成立(图3A)。随着时间的推移,别离度的轻度降矮或增补能够细幼忤逆PH倘若(图3B)。鉴于大无数癌症的生存率较矮,倘若试验不息有余长的时间,KM弯线清淡会荟萃在一首,由于晚期癌症清淡无法治愈,大无数患者已经物化亡或删失。幸运的是,大无数肿瘤学临床试验产生的KM生存弯线与PH倘若相等相反。值得一挑的是,欧宝首页还答进走Cox模型的拟相符优度评估。四、如何注释?1、正当的注释倘若一项评价OS的试验的HR为0.75,且PH倘若成立(图3A),则能够注释为:试验期间的任何时间点,与对照组相比,试验组的物化亡风险平均降矮约25%或生存时间平均改善约33%。请仔细,这是平均值(倘若生存数据呈指数分布),所以答在集体KM弯线的背景下注释此类生存期改善或风险降矮。

图片

2、不正当的注释和常见舛讹2.1 交叉生存弯线倘若KM弯线主要违背PH倘若(图3C),则不正当注释总体HR,由于HR随时间的转折专门隐微。在这栽情况下,答经历亚组分析探讨是否存在定性交互作用驱动KM弯线在整幼我群中展现交叉(例如,男性的HR是否倾向相逆,是否与女性的HR存在统计学隐微迥异)。倘若发现隐微的定性交互作用,则答分析单个亚组的KM弯线,以确定PH倘若在这些子荟萃是否成立。此外,还答避免对所有随机化患者人群的疗效声明。与任何亚组分析相通,除非预先规定亚组分析,不悦目察到统计学隐微的相互作用,并且有足够实在证性证据验证亚组效答,否则不及在患者亚组内声称优效性。2.2 临床意义HR是相对指标。所以,能够获得与HR= 0.75有关的具有统计学意义的p值(p < 0.05),这能够意味着(i)试验治疗优于或劣于对照组,或(ii)倘若治疗之间异国迥异,则最众有5%的机会不悦目察到该幅度或更极端的效答。这对患者来说益似是一个积极的终局,然而是否具有临床意义也有待评价。为此,临床大夫必要结相符绝对指标追求具有相反临床意义的改善,例如特准时间点的生存概率和中位生存期。例如,倘若HR = 0.75对答晚期NSCLC试验中治疗组之间的1年和2年OS率别离增补10%和20%,能够被认为是有临床意义的改善。倘若考虑组间中位生存期迥异,则50天的改善也可视为具有临床意义,而约10天的改善能够不具有临床意义。只有当描述性绝对指标表现出具有相反临床意义的改善,具备统计学意义的HR才被称为临床挺进。2.3 超出钻研不息时间的HR外推操纵RCT通知的HR展望钻研不息时间(从第1例患者随机分配至末次患者访视)后发生的情况答专门郑重,清淡不选举操纵。在匮乏后续新闻的情况下,无法确定比例风险倘若是否不息成立。不光这样,后续治疗或纵容治疗也将主要影响患者的生存概率。

图片

操纵Cox比例风险模型分析RCT生存数据,可挑供评估试验组与对照组相对疗效的HR。与临床医学中的其他总共相通,检验统计倘若和预估治疗效率答首终考虑到是否具有相反的临床意义。毕竟,所有这些统计学检验只是为了达到展现原形和改善患者生活的崇高现在的,挑供有效的治疗,避免不消要的袒露于无效或疑似有效的治疗。 

参考原料:

Barraclough H, Simms L, Govindan R. Biostatistics primer: what a clinician ought to know: hazard ratios. J Thorac Oncol. 2011 Jun;6(6):978-82. doi: 10.1097/JTO.0b013e31821b10ab. Erratum in: J Thorac Oncol. 2011 Aug;6(8):1454. PMID: 21623277.

图片

点亮“在望”,益文相伴

图片