岑少宇:主流医学变风向?中医药等来个大机遇?

来源:观察者网

2020-10-16 07:36

岑少宇

岑少宇作者

留澳科普作者,《生物学的足迹》

【文/ 观察者网专栏作者 岑少宇】

最近,医学界已讨论多年的“真实世界研究”(Real World Study,RWS)终于渐渐进入民间医学爱好者的视野,有些中医爱好者“恍然大悟”:似乎RWS可以为中医药“背书”?

RWS的推广,确实为中医药的发展提供了契机,但如何用好这个工具,并不简单。

什么是“真实世界研究”(RWS)?

第一次听说“真实世界研究”的朋友,可能会纳闷,难道平时医生们做的研究,都不是“真实世界”,都是假人?

当然不是。

只不过呢,很多研究里条条框框比较多,规矩比较严,你用什么方法治疗都规定好。简单地说,可以理解为常见的“控制变量”思维。

而“真实世界研究”允许医生根据实际情况,选择治疗方法。这样数据会更“乱”,很多RWS就用比一般的临床试验更大的样本量去解决问题,大力出奇迹。(但注意,RWS并非必须样本量巨大,可参考下面的对照表。)

另外,RWS往往还会跟踪更久的时间,对指标的选择也可能与过去的临床试验有些差异。

看某些狭义的论述,似乎RWS都站在了随机对照试验(RCT)的反面,比如非随机,干预措施和临床一样而且可改变,不使用安慰剂等等,或者强调对“真实病例”的观察。

这是不是意味着,RWS只有观察性研究?是不是真的排除了随机对照试验?

其实在中国研究人员编写的《真实世界研究指南2018年版》里,也有容易引起歧义的地方。

比如一边在表格里对比RCT与RWS,并说“RWS与RCT是互补的关系,并不对立”,好像是两回事;可一边又明确指出,RWS包括观察性研究与试验性研究,后者就是实效性随机对照试验(pragmatic randomized controlled trial,简称pRCT)。

说到实效性随机对照试验,不得不提下解释性随机对照试验(eRCT)。

有些专家认为,解释性随机对照试验的目的,通常是评价某种干预措施在理想的、严格控制环境下的效力(efficacy),实效性随机对照试验则是衡量某治疗方法在常规临床实践中的疗效或效果(effectiveness)。

指南中,则把这种“效力”与“效果”的比较,同样放在了RCT与RWS头上。

然而,实践中eRCT与pRCT并没有分得那么清楚:

“eRCT和pRCT的区分并非黑与白这样明显的差异。更多时候,两者之间的区分是一个连续性的变化过程。很多时候,eRCT也会融入pRCT的特征;相反,pRCT可能考虑一些严格的设定(如加强随访、控制干预的变异)。现实中几乎不存在纯粹的eRCT或纯粹的pRCT,任何临床试验都介于这两者间,即兼顾两种设计的部分属性,只是因研究目的不同,各试验偏向解释性或实效性设计的程度有所差异。”

上面这些,可能会让读者有点晕,但恰恰反映出RWS还在发展过程中,概念上仍然有模糊的地方。

总体而言,支持者也只是认为RWS会成为主流证据源“之一”,都承认只是RCT的补充,“弥补不足”,或强调“不对立”。

中国循证医学中心主任、ISPOR华西分会主席孙鑫教授更是明确表示,“一提到真实世界研究,很多人马上会想到它只能是一个观察性研究,这是当前关于真实世界研究最主要的误区之一。

换言之,医学界对RWS的重视,完全不是要否定RCT。

而且,循证医学体系显然包括了“真实世界研究”,比如第三级“设有对照组但未用随机方法分组的研究”,第四级“无对照的系列病例观察”。

我估计,RWS如果要成为一个像循证医学那样更有影响力的体系,恐怕还会进一步模糊eRCT与pRCT的差别,本来在实践上也不一定能完全分开。

那样的话,广义的RWS实质上可以包罗万象,像循证医学一样,真的成为一个“体系”。

等到那时再看,和循证医学还有差别吗?

还是有的。

主要差别就在证据的等级上。

循证医学体系里,这些“真实世界研究”的证据等级比较低,而RWS的主张者不同意。2011年,英国制药工业协会表示,真实世界证据与随机对照试验产生的证据是相互补充的关系,两者在证据等级中处于“平等地位”。

在原来的体系里,“真实世界研究”认为有效,但高等级的随机对照试验做出来无效,如果试验本身没问题,多个试验都是差不多的结果,那么就可能形成主流共识,导致“真实世界研究”被“推翻”,比如某些药物或疗法,在临床指导里就不会再受推荐。

但如果RWS成为一个主导体系,局面可能就不同了,某些药物或疗法被推翻的可能性也许会大大减少。

“真实世界研究”到底好不好?

好处当然是大大的。

最直接的,就是有些领域不大方便用随机对照试验,比如外科手术,可以用RWS里的其他手段作为主要的评价体系,不要再纠结于缺乏“高等级”证据了。

为什么说是“不方便”,而不是“不能”用随机对照呢?

其实理论上讲,外科当然可以用随机对照试验,也可以对患者、对疗效评价者、对研究者用盲法,特别是在病因、病灶比较明确、稳定的情况下,像两种手术方案的比较,还是可以做一做的。

主刀医生没法“盲”,但他只需担任操刀的工作,真正负责后续工作与数据采集、分析的研究人员,都可以用盲法。

但有些方法就不行,比如在医学伦理上不允许你做个只切开、不操作的“假手术”;新冠疫情来袭,至少在还没有充分认识病毒的初期,不好给病人安慰剂;也没有人敢对狂犬病人用安慰剂。

在这些受医学伦理限制比较多的地方,RWS当然有非常大的作用。

还有一个好处,就是有助于研究成果的推广。

很多RCT的条件比较严格,分析起来相对容易,也方便研究人员继续深挖,但在临床上可能变成劣势,导致“内部真实性”高,“外部真实性”反而下降。

也就是说,我在研究的病例里,效果挺好,但放到“真实世界”的病例里,好像没那么好了。

这主要是因为现实世界里的病人,可能与入组病人有很多差别,导致效果出现偏差。此时,RWS的观察性研究就能起到补充的作用,因为本来数据就来自于千差万别的病人。

当然,从长远来看,RWS的“补充”也只是个“过渡”。

为什么这么说呢?

我们先看看RCT的“外部真实性”为什么下降。

这与其说是“打脸”,不如说是医生们在应用结论时,突破了RCT研究的病人“边界”,你的病人可能和研究里的病人差别太大了。学自然科学的人都应该明白实验条件这个边界的重要性。

理论上来说,发现边界的突破,就应该给边界外的人重新研究,但那样做研究成本要把人逼疯。

在人类最美好的畅想中,医生们能够根据每个人的个体情况施治,甚至能考虑非常小的个体差别,可那得分成多少组,才能一点点研究出来啊……

RWS的“补充”,其实也只是在目前技术条件下,对现实的妥协,而不是终极方案,甚至都不是通向终极方案的直接路径(这个路径以后有机会再详细探讨)。因为你目前在“真实世界”里的医学应用,不管是仪器检查还是望闻问切,其实考虑进去的个体差别都是很有限的。

那么,假如完全依赖“真实世界研究”,有没有问题呢?

显然是有的。比如说,安慰剂效应客观存在,只是我们不清楚特定的药、针对特定的疾病(有时还要考虑特定的人群),有多强的安慰剂效应,可能很强,甚至到30-40%,也可能没有。

有些“神药”,那是在几乎所有病人身上,都立竿见影,就算没有双盲,大家当然也都抢着用。但很遗憾,许多药物的疗效其实都有一点“暧昧”。

在双盲随机对照试验里,容易发现安慰剂效应,但在狭义的“真实世界研究”里,是很难浮现出来的,毕竟“真实世界”连一致的安慰剂都没有。

当然,有人会想,安慰剂能看好部分人的病,不也很好吗?

但治病救人只是最基本的要求,好的医生肯定也希望能够让病人少花钱,就看好病。

如果要达到安慰剂的效果,用可忽略不计的成本就能达到,还可以避免副作用;而RWS认为有效的药物,不管是现代药物,还是传统药物,却未必那么便宜,同时,最多也只能剔除严重副作用,很难完全避免。

还有一类现象,医护人员对实验组特别“关注”,有时会导致对实验组有利的偏差,这也是盲法有可能剔除的。

有些“真实世界研究”的支持者认为,这同样是“真实世界”环境下治疗的一部分,所以没什么大问题。

但很容易就能想到,即使来自“真实世界”,一个医生对新药应用的关注程度,与使用两三年后很可能不同,这种效应在“真实世界”里也许不久就基本消退了。

这个现象如果不用双盲,恐怕也很难处理好。

套用一句俗话,在整个疗效评价体系里,双盲不是万能的,没有双盲是万万不能的。

而且“真实世界研究”数据分析的难度也更大。

不仅是规模大,你可以获得的临床数据种类也很多,但有些呢又未必完整,比如某个数据可能这个医院有,那个医院没有,真的只是一把抓,不就成了一团乱麻吗?

所以RWS里面,RCT依然极为重要。

而且即使非RCT的观察性研究,也只是放松,并不是“放纵”。

正因为RWS随时有“垮掉”的风险,所以要强调:“由于其数据来源广,易出现数据质量差的情况,故在实际研究的过程中,应着重管理数据质量,保证研究结果的真实性。主要包括相关性和可靠性。”

而且医学界也提出了“真实世界证据”(Real World Evidence,RWE)的概念,也就是RWS并不天然地能够成为医学“证据”。

还有个问题是,有些药企在过去的临床试验中,存在“隐瞒”部分数据的情况,比如只把最好的数据展现出来,不好的数据给审批部门备案,不公开,如果都纳入进来看,虽然还是有效,但数据没有那么“好看”。

RWS的观察性研究因为样本规模往往更大,而且是更“普通”的病人,有些人认为好像更难作假、隐瞒。

但说实话,当RWS真正铺开后,他们恐怕还是有办法把自己的利益最大化。防人之心不可无,对于企业的研究还是要留个心眼,在这方面引入RWS绝非万事大吉。

第三届中华医学事务年会上发布了《真实世界研究实践专家共识》,里面写道:“在真实世界研究中没有任何一种设计一定优于其他设计,也没有任何一种研究设计能回答所有的研究问题。”

“研究设计的选择首先要基于研究问题,针对问题,何种研究设计能最准确、最精确地回答该科学问题。”

我想,这用来作为对“真实世界研究”利弊问题的结论,很合适。

第一就是不要迷信任何方法,而是有问题意识,该用试验性研究就用试验性研究,该用观察性研究就用观察性研究,该上双盲就上双盲,从问题出发判断方法的适用性,不能片面地说证据一定都是“平级”的。

第二就是把研究设计好并做好,否则漏洞很多的研究,不管用什么方法,都会被同行挑出毛病,难以服人,“证据”的效力也减弱了。

“真实世界研究”是中医药界的风口?

有些中医爱好者在接触到“真实世界研究”后,非常看好,认为很多传统医药都是经历过几百年、上千年,在无数人身上应用的成果,是“大数据”,是RWS。

不过这里要泼点冷水。这个历史应用的过程,按照现代统计学的标准看,连RWS都不是,更不要说是RWE。

统计学里有个行话,数据如果垃圾,那么就是“垃圾进,垃圾出”(Garbage in, Garbage out),而传统医药的所谓“历史大数据”,其实连数据都没有。

有的人会以为,数据在医学里的本质就是筛选,帮助去芜存菁,那么经过长期应用,留存的方子虽然不是数据形式的,但不也起到了这样的效果吗?

很遗憾,历史上的去芜存菁当然有不少,可强度远远不够。我以前就提过,很多不合理的方子,是在建国后才集中整理筛掉的。

新中国大大改造了传统医学,美化帝制时代的传统医学史,变相矮化新中国的作用,说穿了也是一种历史虚无主义。

更经典的例子是青蒿素。

屠呦呦整理的《抗疟单验方集》,包含640多种草药,虽然根据药物出现的频率,能够梳理出常山、青蒿等几种作为备选,但传统医学止步于此,终究还是难有定论。

比如胡椒一度很有希望,但只能抑制疟原虫的裂变繁殖,灭杀效果不理想。

多药材或多组分确实存在效果更好的可能性,传统医学也试图总结一些“配伍”的经验,但在具体抗疟的问题上,各种方子依然五花八门。

反过来看,如果传统医学自己去芜存菁的能力足够,也不需要新中国花那么大的力气搞“中草药运动”,去民间搜集方子。

事实就是,传统医学不能确保经典著作里收集的都是好方子,也不能确保民间方子里没有好的。新中国干脆都扫一遍,自己来去芜存菁。

《肘后方》也不是受到广泛推崇的经典著作,不然屠呦呦也不必再翻一遍古书,而是很快就能找到线索。

不靠现代医学的力量,《肘后方》的青蒿方子并没有脱颖而出,更不要说青蒿素了。

同样地,安慰剂效应与自愈现象,单靠传统医学的积累,可以说受到时代的局限,压根没有发现,就更不要说排除了。

从安全性上看,传统医学的随访与资料积累也比较薄弱,可以发现急性的或短期的中毒,但很难真正跟踪慢性的毒理变化。比如配伍可以降低药里马兜铃酸的含量,避免急性中毒,但致癌的问题还是很难办。

古代的医生通常也不会就一个问题随访患者数年,而行医范围以及与同行交流方面,受客观条件限制,也不可能积累大量病例资料来比对。

总而言之,一个方子纵使流传至今,依然离RWS相去甚远。

当然,我们不能唯学术论,要考虑到医学实践的社会属性,政府也是一贯综合考虑科学性与社会效益。比如很多药品,在说明书上有各种不明,依然沿用下来,那会儿都还没“RWS”什么事儿呢。又比如公布《中药经典名方复方制剂简化注册审批管理规定》,也是认可占比例极低的“少数经典名方”,而不是认为大部分中药都经过了RWS的检验。

中国的相关管理部门在中医药方面已经做了大量工作,但有着自己的节奏,即使RWS继续发展,也未必会单单因此而放开,还是会根据自己的认识来。

药企也要摆正自己的位置。

很多药企和医疗器械企业已经围绕RWS行动起来,比如2018年2月,罗氏以19亿美元收购了美国癌症数据公司。赛诺菲早早地就建立了RWE项目平台(RWE&CO)。

而且,像前面提到的英国制药工业协会积极主张,真实世界证据与随机对照试验的证据是“平级”的,这固然可以视作学术争论中的一种主张,但考虑到RCT特别是大规模双盲RCT的成本问题,这里面是否也有药企的私心呢?

当然,医疗是个社会问题,成本是必须考虑的重要因素,就怕药企们一番操作,成本降了,药价没降,治疗效果未必提高多少,却混入些昂贵的“安慰剂”。

对于国内中药企业,是踏踏实实设计RWS的研究,推动对中医药的认识与改进,造福人民,还是借RWS的风口,鼓吹放松标准,靠低质量RWS研究蒙混过关,反过来成为阻碍中医药发展的障碍?这是需要深思的问题。

现代医药集团确实是庞大的利益团体,饱受批评,但国内有些人往往忽略了,中医药集团也是巨无霸,从民众的利益讲,同样需要严格的监管。

对于研究者,RWS确实也是一个机会,如果RWS受到更多青睐,有助于中医药研究得到更多呼应。但RWS要面对更繁杂的数据,对研究设计与数据处理可以说提出了更高的要求,学界是否做好了准备?这又是一个大问题。

RCT目前已成为主流,甚至中医药界也已经拥抱RCT与双盲,虽然有些研究质量还不高,但高水平的还是在逐渐增加的,趋势是明显的。这样的局面,引发了一些人的不满,甚至认为新中国的中医药发展,就“不是中医”了。

在这种背景下,正在崛起的RWS,成为它们攻击RCT与双盲的工具,有的人还设想是不是能借助RWS的风口,让中医走上让他们满意的“老路”,最好能夸大“历史积累”的作用,直接冒充RWS,在审批和学术上蒙混过关。

但如前所述,在医学界看来,RWS与RCT或盲法不是“对立的”。医学的发展,归根结底是为了治病救人,不是为了弘扬或贬抑某种传统、某种文化。就像RCT与双盲一样,RWS也只是一种中性的工具,要清醒地认识其优缺点,做出高水平的RWS研究,才能让它帮助中医药发展。

本文系观察者网独家稿件,文章内容纯属作者个人观点,不代表平台观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guanchacn,每日阅读趣味文章。

责任编辑:陈轩甫
医学 循证医学 双盲试验
观察者APP,更好阅读体验

“严看死守,光干部餐食费就十多万,最后还是烧了”

“我们美国说要做的事,中国人已经做到了”

荷兰“拼了”:阿斯麦,别走!

“嫌犯从乌克兰获大量资金和加密货币,有确凿数据”

美方对俄隐瞒了部分信息?克宫回应