在医疗服务中,首先要明晰的是人工智能的可信度
文|《财经》记者 辛颖
编|王小
在多个社交平台上,医生和患者纷纷晒出自己的“问诊经历”,找人工智能(AI)看病成为一股热潮。
2025年2月25日上午,北京一家三甲医院肿瘤科的医生在住院部查病时,遇到一个患者拿着手机版DeepSeek给出的治疗方案来问,为什么和医生给出的治疗方案有些不同,“这样的患者越来越多,DeepSeek并不都是准确的,但像上午的这个患者,拿的方案整体上和我们的差不多”。
问题是,AI有开处方的权利吗?
一则“禁令”给出了部分答案。2月19日,湖南省医保局发布《关于进一步加强基本医疗保障定点零售药店管理的通知》,提出互联网医院须按规定接入省医保电子处方中心,并进行电子处方流转,处方行为须严格执行有关规定,应与患者或患者家属进行有效、充分的沟通问诊,严禁使用人工智能等自动生成处方。
这份地方规范延续了国家卫健委的一贯要求,也对在一段时期内,AI医生究竟能走多远给出了一个大致的方向。
无论是患者还是医务人员,对医疗AI技术水平再上一台阶充满期待,即便当下AI仍不可能代替医生,但行业已经开始为新的医疗分工秩序在做准备。
然而,在这个满屏都是AI的时代,不仅要判断当下众多AI医疗系统有多少含金量,到底有没有开处方的水平?还应思考AI有没有能力承担开处方的责任,利用AI能干什么不能干什么的界线?
大模型涌入医院
2月26日,在上海,一位患者因为DeepSeek的分析决定在深夜赶去医院急诊。这位患有冠心病的老人晚上突然感觉到有些背痛,但并不算严重,本来想熬到天亮再去医院。
但患者的女儿拿着手机在DeepSeek软件上描述症状后,DeepSeek分析认为,60%-70%的可能是急性冠脉综合症(ACS),20%-30%的可能是主动脉夹层,还有10%-20%的可能是肌肉骨骼痛、肺栓塞等原因。由于大概率可能是急性凶险疾病,一番纠结后,女儿还是在凌晨三点把患者叫醒到医院去看急诊。
“到医院后,急诊医生也很紧张,马上安排心电图、血常规、胸痛等一系例检查。医生给的初步结论是,暂时排除急性心梗风险,还是高度怀疑ACS,和DeepSeek判断一致。当天已经住院了,等做完血管造影才能进一步确诊。”患者家属非常庆幸先咨询了“AI医生”,如果等到早上八点再到医院看专家号,白天检查速度又慢,住院也得延后。
也有医生“败给”AI。不久前,一位广州的医学院博主直言“天都塌了”,因病人查询DeepSeek后,质疑他的治疗方案,气得他又查了一遍指南,结果发现指南更新了,而他不知道。
上述肿瘤科医生觉得现在AI的靠谱程度提高了一点,“原来在遇到疑难病例时,有时需要查寻病案研究,以前是搜索出来一篇论文,得自己花半个多小时才能看完,现在AI不仅2分中就能看完,还能和其他的病案做对比总结,帮助提升很大”。
也不乏因为AI而误诊的“反面教材”,有人在社交平台上发帖说,听DeepSeek推荐吃药,最后药物过敏进了ICU,本来想快点好,反而更难受。
但这并不影响医院想要更紧密的接触AI系统。据不完全公开统计,自2025年春节,已有近100家医院宣布已本地化部署、接入DeepSeek。京东的京医千询大模型、蚂蚁的安诊儿医疗健康应用,也都推出接入DeepSeek后的新版本。
AI的一个集中应用场景就是优化智能问诊,在医生接诊前,通过AI收集形成患者的病例,来减轻医生的工作。
不过,现有的AI还不够智能,因此,“对医院业务还没有起到突破性的作用,只是借助DeepSeek这类通用模型的思路,更好地训练已有的医疗AI。”一位医疗行业人士对《财经》说。
医疗难容AI幻想
虽然AI能干的活在增多,但一条不变的红线就是AI不能独立提供诊疗服务。
“此次湖南医保部门的文件中强调严禁AI开处方,原因有在药品销售过程中,行业存在利用AI违规开处方的现象,需要明确法律界限。”上海联合律师事务所高级律师卢意光对《财经》说。
这样的问题,主要出现在处方药销售中,遇到一些没有处方的患者,就有药店利用互联网医院给患者提供处方,其中有互联网医院为了降低成本,直接使用AI开处方,脱离了医生,触碰了法律红线。
此前,阿里健康、京东健康均曾公开回应,没有人工智能自动生成处方业务。《财经》了解到,在京东互联网医院,一些线上医生通过AI来获得更多的支持,有超80%的医生问诊单使用了包括“AI诊疗助手2.0”在内的工具,以此来帮助医生降低误诊风险,并且,医生也能腾出更多的精力放在临床上。
其实,专业版的“AI开方助手”早在医院应用了。一些医院现有的智能系统,已经可以在医生诊断患者有某种疾病时,提供相应的药物处方建议,并提醒医生要注意某些药物的副作用,最终由医生确认后生成处方。
这样的AI系统还能指出医生的错误,警示和拦截风险处方。
从上述肿瘤科医生使用DeepSeek的经验来看,“对于一些既有文字内容的解读分析,它基本没什么问题,但是对于一些前沿的医学发展和判断,它的能力还是不行的。但是这种能力的不足,主要是来自于学习数据的不全面,而不是分析能力的不足。”
其实,在数据相对容易获取的医疗细分领域,AI已经展现出超过人类医生水平的苗头。比如在2018年,解放军南京总医院准备了100例有肺结节病变的CT片,找了126位初、中、高级影像科医生,以及一款AI辅助诊断系统测试,从准确性、敏感性等四个维度比较。
最终,第一名仍是人类医生,但AI超过了126位医生的平均水平。
若论在已有的知识体系中与人类竞争,AI的优势很显著。近期,澳大利亚西澳大学、新南威尔士大学和印度尼西亚哈萨努丁大学的团队,利用印度尼西亚一家医院的200次颅骨CT 扫描,训练并测试了三种基于深度学习的大模型,其对颅骨性别的分类准确率可达97%,显著高于人类观察者的82%。
然而,在对事关生命的医疗领域,丝毫的偏差都难以被接受。即便仅从技术角度看,AI也不能独立开处方,以DeepSeek为例,多位测试者发现,其存在比较明显的幻想。如原人民日报海外版总编辑詹国枢在借助DeepSeek撰写文章的过程中,发现DeepSeek把《平凡的世界》这本书的作者,从路遥改成了自己的老班长朱大建。
美国生成式AI服务平台Vectara在2月公布的大模型测评排行中,DeepSeek-V2.5的幻觉率是2.4% ,而DeepSeek-R1的幻觉率达到14.3%;谷歌的 Gemini-2.0-Flash-001,以低幻觉率位居榜首,显示出其在处理文档时几乎没有引入虚假信息,但还是有0.7% 的幻觉率。
可见,AI幻觉问题是一个行业痛点。“我们可以理解为今天的大模型技术,还是一个‘学生’,我们可以通过拉长推理过程,不断让他自己反复校验,能够达到一个更好的结果。”京东健康探索研究院(JDH XLab)首席科学家王国鑫表示,从技术层面这不是不能解决的问题,AI会无限逼近那个准确性。
AI医生更近了?
“即便AI的能力得到认可,但如果不能承担法律责任,也就难以替代人类。”上述业内人士说。
大约十年前,手术机器人的发展曾将医疗中AI的法律责任的探讨引致小高潮。有人提出的观点是,如果AI能够达到一定水平,是否在医疗纠纷中,AI作为独立的责任主体,也就是生厂商的责任,当然这和质量问题无关的情况下。
“显然对这个话题的探讨,如今还是太早,到今天,我们仍然明确的要求,只有专业的医务人员有资质操作手术机器人,并且机器人只作为医生使用一种医疗器械工具。”卢意光说。
不过,对技术一向持保守态度的卢意光也说,“我也并没有想到像自动驾驶能够这么快的发展,与之类似,相关的法律问题,会随着AI本身的发展逐步解决。
据媒体报道,2025年1月,美国亚利桑那地区下院议员大卫•施瓦科特提出了人工智能可以开药物的法案。如果法案通过,在没有人类医生介入的情况下,AI将确认患者状态,并自行开具药物处方。
根据美国现行法律,只有“法律许可的工作人员”,即医生才能开药。只有在医生亲自开处方或药剂师根据口头处方开具文件的情况下才有效。
此次提议的法案将“法律许可的工作人员”概念扩大到AI和机器学习技术。不过,这位议员在2023年也提出了同样内容的法案,但未经委员会讨论就自动废除。
1月6日,美国食品和药品监督管理局(FDA)发布了一份《使用人工智能支持药品和生物制品监管决策的注意事项》指南草案,对有关在药品全生命周期内使用AI生成信息或数据的规范给出建议,并要求确定人工智能模型的应用场景,评估人工智能模型的风险。
简单来说,就是明晰人工智能的可信度。
制药业存在的顾虑,在医疗界则会被放的更大。目前,AI不能替代人类医生是共识。但医生们也都或多或少的想过,自己的“饭碗”是否会被抢走。一位北京三甲医院的医生认为,“肿瘤科的医生挺危险,内科医生不用好AI也危险。”
AI医生最先冲击是市场化的全科服务,因为又可以标准化,又没沟通的风险,
“还有内分泌等十分依赖化验、检验的科室。”一位皮肤科医生对《财经》分析,内分泌科医生还是需要和患者沟通,这部分是目前AI做不了的。
引入AI的初级阶段,在于是否能用好的AI。“在国内,有些医院的本地算力不足,还难以支撑使用DeepSeek,但大量医院的快速表态接入AI,这是少见的,这也为医疗AI的推进释放一个不错的信号。”上述医疗行业人士说。
现在医疗系统开展了一系列的AI培训课,医生们在努力成为好的AI使用者。上述肿瘤科医生接下来的课题项目就是,结合医院的病历数据库,开发肿瘤分级和治疗方案的AI产品,这需要相当庞大的数据和时间来完成训练。
虽然他并不知道,是否能获取到自己医院之外的,更多的数据来完善自己的产品,但是至少在他看来,未来这样的产品就可以帮助一些初级的医生,准确判断肿瘤患者的病情。也就是将高级医生的经验快速普及下去。
这正是AI破局好医生不够用最重要的一步。一些顶尖的医院将注意力放在罕见病上,因为这是“优质医生”资源紧缺的领域。
2025年2月,北京协和医院与中国科学院自动化研究所共同研发的“协和·太初”罕见病大模型,正式进入临床应用阶段。此外,国家儿童医学中心北京儿童医院上线应用“AI儿科医生”,承担的主要职责之一就是辅助医生进行疑难罕见病的诊断和治疗。
王国鑫认为,在未来3年-5年,是一个医疗大模型突破的一个关键时间点,当然结果也取决于打破医疗数据壁垒的程度。
他希望,未来有更强大的大模型,通过少数病例就能提升学习能力,也更接近人的大脑。
还没有评论,来说两句吧...