最近几年,关于 " 人工智能将在各个领域取代人类 " 的预测,简直如同寓言 " 狼来了 ",让人提心吊胆又满怀期望。这不,去年 12 月中旬,谷歌又宣布,它研发的乳腺癌监测深度学习模型击败了 6 名全日制放射科医生,对于早期乳腺癌诊断取得了更为精确的成果,并登上了大名鼎鼎的《自然》(Nature)杂志。相信很多吃瓜群众看到这条新闻的第一反应是:这匹狼,是不是真的要来了?

报道说,谷歌研发的这种乳腺癌钼靶影像深度学习系统,是由谷歌健康团队,谷歌下属 AI 技术公司 DeepMind,以及英国皇家萨里郡医院,美国西北大学等机构一起合作完成的。它能使用癌症检测算法,自动评估淋巴结活检结果,有效减少了乳腺癌被错误识别或遗漏的情况(在利用该模型对全美 3000 名疑似患者影像进行评估时,误报率下降了 9.4%)并在转移性乳腺癌检测方面,能达到 99% 的准确率。
值得注意的是,谷歌此次研发的这种深度学习模式,整合了三种不同的神经网络,等于同时有三位 "" 人工智能大夫 " 在为病人会诊。而三种神经网络,都在以不同的方式识别乳房 X 光检查影像中可疑的区域,并对这些发现进行分析,最终进行概率判定,产生一个从 0(非癌症)到 1(确诊癌症)的分数代表存在癌症的可能性。

AI 为什么和乳腺癌杠上了?
为什么谷歌选择了乳腺癌作为 AI 诊断的突破口?这是因为乳腺癌,已经是全球女性最容易罹患的癌症类型。在欧美国家,乳腺癌已经占据了女性恶性肿瘤发病率的 25% — 30%。在中国,乳腺癌更是女性发病率最高的恶性肿瘤类型。在现阶段,尽早筛查是提高早期诊断率、病人生存率及生存质量最为有效的方法。作为最主要的筛查方式,乳腺 X 线钼靶筛查已经被证实能有效降低乳腺癌死亡率。因此,谷歌健康研究团队,把提高影像筛查诊断能力,作为重点研究方向,力图借助 AI 技术,在这个 " 防御薄弱点 " 上实现突破。

1992 年美国放射学会提出的 " 乳腺影像报告和数据系统 "(breast imaging reporting and data system ,BI - RADS),确立了乳腺 X 线报告规范,有效减少了医护人员对影像描写的混淆,确立乳腺癌普查监测标准。根据这一规范,乳腺癌发病的常见征象包括: 1. 病变肿块的形态、边缘和密度 2. 病变钙化的大小、分布和位置 3. 非明显病变的结构扭曲、非对称,乳腺内淋巴结显示异常
在明确这三种病变特征后,医护人员就可以根据这些征象进行总体评估分级,乳腺 BI-RADS 分级是一种乳腺影像诊断分类评估方法,共分为 6 级,诊断标准如下:

这个大夫很 " 偏科 "
那么,既然谷歌 AI 深度学习诊断系统取得了不俗的成绩,是否就证明它能在乳腺癌诊断领域完全替代真人医生呢?答案是否定的。虽然总体上,AI 的诊断正确率似乎高于真人临床医师,但是 AI 却在一些人工诊断表现优异的领域表现不佳。具体来说,就是在判断侵润性乳腺癌(癌细胞已经扩散至乳叶与乳腺管之外)时,AI 表现优于人工诊断,而在判定非侵润性乳腺癌 ( 癌细胞仅存在于乳叶与乳腺管 ) 时,人工诊断则优于 AI。谷歌的研究人员发现,现有的神经网络,更擅长于发现和识别侵润性乳腺癌在钼靶 X 线影像中呈现的分叶征、钙化、大导管相、牛角征、毛刺征等特征。换句话说,如果将谷歌 AI 拟人化为一位临床医生,那么这位大夫无疑是有点 " 偏科 "。

所以我们不难得出这样一个结论,人工早期诊断和 AI 诊断并非是 " 非此即彼 " 的替代关系,而应该是互相取长补短的合作关系。谷歌开发人员也承认,AI 诊断不能作为判定病人是否罹患乳腺癌的单一证据,临床医生只能把它当做决策的辅助工具。为此,Google 分别在《自然材料》和《美国医学会杂志》(JAMA)上为医学 AI 开发人员和医生发布了详细的 AI 诊断工具使用指南。
当然,机器学习在医学领域的辅助性作用已经得到了越来越多的认可。谷歌这乳腺癌人工智能诊断法,虽然依旧瑕疵不断,但依旧为我们揭示了 AI 医疗应用场景的无限潜力。在未来,随着数据收集的不断丰富与算法优化以及模型迭代,相信人工智能最终会变成临床一线医护人员的得力助手,使得临床决策规则更为简明便捷,挽救更多的生命。
参考文献
[ 1 ] https://jamanetwork.com/journals/jama/article-abstract/2754798?guestAccessKey=fd274bef-2813-446f-bb10-e5134640922f
[ 2 ] https://www.nature.com/articles/s41563-019-0345-0
作者:郎超
编辑:朱步冲
一个 AI
人机搭配,才能干活不累

如有需要请联系 sns@guokr.com