[导读] 十多年前,有过一轮电脑取代人脑的讨论,如今重提但仍然无多进展。
▌作者:王维格 复旦大学附属肿瘤医院;王晟 芝加哥大学丰田研究院
前言
人工智能并非一新鲜的概念与技术,它概念上的雏形在很早很早的年代业已诞生,然而在很长的一段时间内进步缓慢,曾记否当年蹩脚的金山输入法语音识别,还有金山快译的山寨翻译?抑或image J的不靠谱?但是近年人工智能算法的突飞猛进使得其功能今非昔比,一日千里。短短一年内,多篇权威研究论文发表人工智能打败病理学/影像学传统学科的研究,一石激起千层浪,圈内圈外纷纷不寒而栗感叹病理学/影像学结构性危机即将到来。实际上在另一个低调敏感的领域,人工智能图像识别远远走在前列:卫星遥感与侦测,卫星照片大数据人工无法一一处理,需要依赖于图像识别筛选出有价值的像素人工加以解读。作为病理诊断与疾病研究的从业人员,本人在早些年也关注到人工智能的发展,与算法工程师、数学家也有密切的合作,故撰写此文简谈本人的一二陋见。首先,表明观点:人工智能不会颠覆病理学科,但是善于运用人工智能将极大解放病理医生的脑力。
人工智能图像识别做诊断不论背后的算法是怎样,其核心在于机器学习,简而言之就是教机器学习,用一组事先人工标记上诊断“标签”的病例再由人工决定提取需要学习的要素再一定算法的指导下,让机器建立判别模型去判定未知病例某一诊断的可能性。因此,对于一个有规律性的事物,无论其复杂性,只要人类可以通过学习掌握,机器也一定会掌握,而且机器的学习不知疲倦,通过大数据的训练其学习效果非常残暴。但是它的缺点也非常明显,对于不规律的事物就无能无力了,举个例子:人工智能可以战胜围棋高手,那是因为围棋有规律,但是对于买大买小随机无规律游戏,人工智能无用武之地。在此前提下,人工智能之所以目前不能颠覆病理学原因主要有以下八点。
1. 医学的学习素材永远是“一潭浑水”,需要人类在实践中淘金:如前所述,人工智能首先需要通过素材的学习才能建立判别模型。但是医学与其他领域不同,医学的素材充斥着假冒伪劣,文献、教科书中各种信息真真假假十分复杂,而病理诊断基于了错误的信息,做出的诊断必然是不恰当的,在这些真真假假的浑水中淘金需要一大群人类的智力劳动筛选出经得起考验的信息。
2. 目前人工智能主攻二分类的诊断领域,多分类领域乏善可陈:目前人工智能主要对良性/恶性,转移/未转移等加以判别,因为二分类的情境中,往往可以划分出明确的界限,而学习量和学习的素材较为简单。但是,实际上病理诊断是一项多分类的工作,进入多分类的流程后,分类彼此之间界限会更加隐晦,而疾病分类的复杂性使得机器学习的难度指数级的增加。
3. 疾病分类/诊断并非非黑即白,而是移行的谱系:疾病的分类及界定并不是一刀两断,而是移行谱系存在灰区,病理诊断面临大量的问题就是处理这类模棱两可的病例。人类纠结为难的病例,人工智能也一定会为难,或强行给一个诊断,或提供各个诊断可能性的分值。如果在训练机器的阶段仅仅提供疾病谱系两端最典型的病例,那么机器在遇到灰区移行病例是必然失灵;如果在机器学习阶段提供移行灰区病例,但是这些移行灰区病理本身的诊断“标签”就是模棱两可十分尴尬,会造成机器学习也十分尴尬的悖论。
4. 病理诊断是一权重投票,采纳哪些选票,每一选票的权重如何没有规律:本质上病理诊断就是利用各种信息作为选票,通过投票确定诊断。各种情况下,各项参数权重不一,有时会格外看中某一张选票有时候又会有意的忽略某一选票。如,经常会听到“形态学与免疫组化不符合,相信形态学”这样的警句,但是有时又会出现形态学与组化结果相悖大跌眼镜,医生却愿意相信免疫组化的情境。又如,EBV感染在诊断某些肿瘤的时候毫无价值,而在有些情境下却有一锤定音。再如,骨髓累犯这一临床参数对于大部分淋巴瘤的诊断确定没有价值,但是对于确定浆母淋巴瘤和间变性浆细胞肿瘤来说,一票否决。还有淋巴瘤的异型有时体现为细胞单形性如Burkitt淋巴瘤,套细胞淋巴瘤,有时又又体现为多形型如间变大。这种无规律性正是医学的艺术所在,一方面是医学发展的障碍,另一方面也是阻挡人工智能的铜墙铁壁。
5. 需要对各种人工假象,辅助诊断的假阳性/假阴性予以识别:这点不用详细展开了,每个病理医生都在和各种人工假想和辅助检测的陷阱斗智斗勇,最关键的是,各种想不到奇葩的事情都会发生,而且没有规律,这一点机器通过学习建立算法。
6. 决定做哪些辅助检测,尽管有规律,但是更多取决于医生的经验、心态、习惯:辅助诊断体系中,做哪些指标,取决于医生先决经验,也不具备太多的规律性人工智能大可以基于“鸟枪”法做诊断,但是实际上辅助检测做的越多,越是一头雾水,肿瘤不按规律出牌,画蛇添足做检测搬起石头砸自己的脚。经常可以见到死记硬背所谓“免疫组化套餐”最后自己也不知道该相信哪一个标记的结果了。而且,为了达到某个目的,有多个平行可用的标记供选择,选择哪一个或者彼此组合完全是就事论事,也无规律。这种无规律性也是机器学习的天敌。
7. 病理并非墨守陈规做诊断,更高的职责在于制定标准,优化疾病分类:,病理以形态学为基础,但不局限于形态学,而疾病分类不仅参考形态学参数更包括从免疫、遗传再到分子,还有临床参数,上述指标共同定义疾病。病理从业者当然需要天天机械操作搬砖,更需要在繁杂的实践中开发和优化形态-免疫-遗传-分子-临床参数,定义及修正疾病的定义。人工智能的无差别运用会导致形态-免疫-遗传-分子-临床与疾病诊断之间的暗箱黑盒,使得疾病分类的进步停滞
8. 人类智力活动的多样性:病理诊断是疾病诊断体系中,最后的防线,往往需要多位医生不同的经验和态度做保障,用医生经验学识的多样性去覆盖疾病的多样性,诊断在争论与妥协中得出,某种意义上病理诊断是英美司法体系中陪审团断案。就如人工智能大可以替代大陆法系的审判,但是却无法替代英美司法体系庶民的决断一样。
那么目前来看人工智能的优势和主要功能主要发挥在以下方面:
1. 二分类的诊断如细胞学、切缘累犯、淋巴结转移:由于二分类参数简单,彼此之间界限清晰明了,人工智能可以较好的胜任。细胞学由于参数单一,需要采集的信息也相对较少,是人工智能主攻方向。虽然很多细胞学报告系统貌似并非是二分类,但实质上是一个良性到恶性可能性增高的逐级系统,这正好是人工智能给出判别可能性的优势所在。
2. 智力含量低,耗时耗力的诊断如搜索淋巴结转移,脉管浸润等:利用机器不知疲倦,状态稳定的特性在此方面可堪重用。
3. 参数简单的诊断如FISH EBER-ISH。
4. 利用人工智能高敏感性做筛查。
5. 稳定性低的判读如分级:在确定诊断的情况下进行肿瘤分级存在较多不稳定性及观察者间和观察者内的差异,而这项工作十分具有规律性,所以人工智能可以较好的克服此类问题。不过实际操作中还需要细化对机器的训练,如如何不把FDC当作centrablast算入滤泡性淋巴瘤的分级系统中。
总结与展望
基于以上观点和原因,我们认为人工智能可以解放病理医生一大部分的低端机械劳动,但是无法也没必要驾驭人类的智力。由于资本的涌入,会在舆论上造势,使得人工智能成为洪水猛兽。在此背景下,病理医生需要了解、运用并且驾驭人工智能,解放手脚。
共0条评论