适应生物标志物错误分类的富集设计

对疾病机制异质性的进一步了解使我们进入了临床肿瘤学分子靶向治疗(mta)的时代。mta通过识别和攻击特定的生物标志物途径来阻断癌细胞的生长,这些生物标志物途径仅在一小部分患者中被解除调控,并且只能预期有效治疗某一部分患者(标记阳性)。因此,为了明确评价mta的治疗效果,将试验入组限制在肿瘤表达目标生物标志物的标记阳性亚组患者中是公平和明智的。在此基础上,提出了浓缩设计方案。如图1所示,在富集设计下,根据患者的生物标志物状态将患者分为标记物阳性和标记物阴性亚组,只有标记物阳性的患者随机接受不同的治疗,包括MTA和标准治疗。

图1所示。浓缩设计示意图

图1所示。浓缩设计示意图

实现富集设计的一个实际障碍是,生物标志物状态的精确测量通常非常昂贵,或者至少对一部分患者来说在逻辑上是不可行的。虽然一种廉价且易于获得的替代标记物通常对所有患者都是可行的,并且可以用来预测生物标志物的真实状态,但这种替代标记物往往容易出现生物标志物的错误分类。生物标记物分类错误的后果通常是严重的。从试验实施的角度来看,由于生物标志物的错误分类,富集试验可能会错误地纳入(排除)标记阴性(阳性)患者,这将破坏试验的伦理性。从数据分析的角度来看,错误分类会造成偏差,使推理结果失真。因此,适当的住宿是必要的,也是迫切需要的。

我们提出了一个两阶段设计来解决这个问题。特别地,我们开发了一个最小化误分类率的最优规则。基于最优规则,我们进行了两阶段设计。在第一阶段,我们测量精确和替代标记信息,然后将该阶段的患者均匀随机化,接受不同的治疗。在第二阶段,我们只度量代理标记,然后使用最优规则进行标记分类。被分类为“标记物阳性”的患者随后被纳入试验,并进一步随机分配到不同的治疗组,而被分类为“标记物阴性”的患者则被排除在治疗方案之外。因此,最优规则保证第二阶段患者犯标记物分类错误的机会最小。

除了适应试验实施,我们还研究了如何相应地调整数据分析。但在此之前,我们量化了由生物标志物错误分类引起的偏差。我们的推导表明,无论MTA的有效性如何,偏差总是存在的。因此,无论MTA是否有前景,生物标志物的错误分类都会扭曲富集试验的结论。为了纠正偏差,我们开发了似然比检验。为了应用似然比检验,我们需要应答率的最大似然估计(MLEs)。然而,由于第二阶段缺少标记信息,这些mle很难直接推导出来。为了解决这一问题,我们依赖于“期望最大化”算法,这是一种众所周知的统计方法来处理缺失数据并导出最大似然值。在插入基于EM算法的mle后,我们可以确定检验的p值。最后,该p值用于评估生物标志物误分类富集试验下的mta。 We conducted comprehensive simulation studies to investigate the operating characteristics of the two-stage design and the results confirmed the desirable performance of the proposed design.

永藏1贝贝郭2
1佛罗里达大西洋大学数学科学系,美国佛罗里达州博卡拉顿
2路易斯安那州立大学实验统计学系,巴吞鲁日,洛杉矶,美国

出版

优化两阶段富集设计纠正生物标志物错误分类。
张勇,郭斌
统计方法医学杂志2015年11月26日

脸谱网 推特 linkedin 邮件 脸谱网 推特 linkedin 邮件

留言回复