人工智能(AI)总是在突破创新或创造“神话”。6月30日,神经影像AI辅助诊断系统“BioMind天医智”与25名从全国选拔出来的人类医生在北京进行了神经影像判读大赛,AI系统以绝对优势胜出。
大赛分AB组进行。A组共225道题,15位人类医生每人答15题,而AI系统独自判读所有题;B组的10位医生则是每人答30题,AI系统同样回答30题。两组都以最终正确率进行比拼。从两组比赛的最终结果是,A组的225例判读,AI用时15分钟准确率87%、15位医生用时30分钟准确率66%;B组:AI用时15分钟准确率83%,10位医生用时30分钟准确率63%。无论时间还是准确率,AI完胜。早在2011年,国际商业机器公司(IBM)的沃森医生与人类医生的比拼就显示在某一方面战胜了人类医生,前者的诊断达到了73%的可信度,人类医生的可信度是70%或更低。
可以说,在某种或某类疾病的诊断上,经过深度学习的计算机软件会比人类医生更快、更准确或更稳定。然而也正因程序设计上的精确限制,AI能满足人们对技术的某些单一和表面需求,但尚无法对人类提供情感和复杂的技术需求。
“BioMind天医智”在神经影像判读中更胜人类医生一筹,因为它系统学习了北京天坛医院近十年来接诊的数万神经系统相关疾病病例影像,对脑膜瘤、胶质瘤等常见病领域的磁共振影像诊断能力相当于一个高级职称医师的水平或更高。并且,对于每种肿瘤,它都学习了1000个病例,目前基本上已经掌握了50种颅脑肿瘤,这是任何一名医生都难以实现的。因此,它在肿瘤影像诊断上胜过人类医生并不令人惊讶。此外,以“BioMind天医智”目前的读片速度,一位人类医生一天的工作量,它只需要不到10分钟就完成,如果让AI来读片,核磁结果基本上立等可取。
但是,即便AI医生的读片又准又快,在满足人类的技术需求上,依然无法令人满意。“BioMind天医智”有强大的学习能力,准确率应该在90%以上,但事实上,它并没有达到这个水准,这说明在技术上,AI的学习和功能还有待提升。
同时,AI医生的强大和准确是建立在对已知的病例、特征、表象等的学习之上,如果接诊的病例中有稍微不同于既有的肿瘤特征和表象的,AI医生就会不知所措。因为,离开了人们教给它的已知内容和运行程序,AI医生要么无法诊断,要么是错误诊断。
更重要的是,即便是技术服务,对于人类来说也是一个复杂的系统。“BioMind天医智”胜过人类医生只是在神经影像的判读上面,但是,神经影像需要人类医生来操作和摄取,仅仅在什么地方、部位和角度摄取,获得的影像无论在表象和结果上都会不一样。此外,在诊断肿瘤以及其他疾病方面,判读影像只是一种方式,还需要其他更多的只有人类医生才能掌握和胜任的复杂的知识和综合运用技术的能力。
人类医生需要结合其他诊断技术,如听诊、体格检查、化验来综合判断病情,还要问询病人的病史并结合病史来分析,更需要查阅关于某一肿瘤或疾病的大量文献来进行对比研判。更重要的是,如果遇到似是而非的复杂病例,就需要调动人类医生的所有经验甚至直觉来分析判断,有时还要求人类医生以超越技术和不用技术的简单方式来诊断。
另一方面,AI医生所拥有的技术上的优势和长处,也并不能解决医学所面临的人与人关系中的情感和人文关怀问题——AI医生目前尚无法察颜观色,也无法善解人意并安慰人鼓励人。这一点,才是人类医生的长处。所有的人类医生都知道,特鲁多医生的墓志铭,也是医生的座右铭之一:有时是治愈;常常是帮助;总是去安慰!
不必否认AI医生的快速、准确,这些优点可以让它们作为人类医生的助手,例如让“BioMind天医智”专门解读影像照片,而人类医生则需要不只是看AI医生的结论,还要结合更多的诊断手段、病史来诊治疾病。并且,在现阶段,AI医生并没有取得法人地位或行医资格,所以真正负责的还是人类医生!
(责任编辑:李焱)