【小哈划重点:清华大学这个虚拟医院,采用的是一种MedAgent-Zero(无参数策略)的自我进化方法。这些数据集将该AI医生框定在了呼吸系统疾病领域,病人只会得呼吸道疾病,所以这个虚拟医院,其实更像一个理想条件下的专科医院。】
最近,来自清华大学的研究团队,把医院搬到了AI世界。他们设计了一个模拟医院,其中的医生、护士、患者全部由大语言模型驱动,可以自主完成发病、分诊、挂号、问诊、检查、诊断、开药、康复以及患者随访全过程。
研究结果发现,AI医生在几天内,就完成了数以万计的病例的治疗。而同样的情况,人类医生大约需要2年时间(按照一周治疗约100名病人计算)。更重要的是,在诊疗了上万名虚拟病人后,AI医生在MedQA数据集呼吸道疾病子集上,达到了93.06%的准确率1。要知道,中国培养一个医生,基本沿用“5+3”模式,即5年本科、3年规培(住院医师规范化培训),至少8年时间,才能成为一名合格的专科医师。而清华大学这个虚拟医院,在几天内就让AI智能体成了呼吸道疾病专家,还是7x24小时全年无休。
AI虚拟医院
这种AI医生去哪里找?根据论文说明,手搓一个虚拟医院,大致可以分为三步。
第一步,先来个“全家福”。由GPT-3.5生成医生(14名)、护士(4名)、居民的全部信息,且可以无限扩展。借助大语言模型生成的人物,从左向右、从上到下分别是:1号患者肯尼斯,35岁,患有急性鼻炎和高血压病史,主诉腹泻、持续呕吐、淋巴结肿大、反复发烧等。2号内科医生伊莉斯,32岁,富有同理心,擅长与病人沟通,主要职责是为患有急性、慢性病的成年患者提供诊断、治疗和预防保健服务。3号放射科专家赵磊,58岁,主要通过X光、MRI、CT等各种医学图像,作出诊断。4号接待员法图玛塔,48岁,负责预约安排、患者登记等工作。
第二步,去生病,去治疗。在这个虚拟世界里,居民会随机出现生病症状,并成为患者。
1号患者肯尼斯出现皮肤病症状,他先在分诊台咨询,这个症状应该挂哪个科室,随后登记挂号。紧接着他被安排由皮肤科医生进行问诊,该医生询问过简单问题之后,安排他进行检查,再根据检查结果做出诊断,并开具药方,最终肯尼斯在吃药恢复之后,再回到医院完成随访,是为完成诊疗。整个过程,完全复刻了一个人在医院就诊的流程——该挂哪个科,医生会根据询问以及验血、CT等检查结果,判断患者病症,并提出治疗方法。
第三步,进阶的AI医生。从一个医学生进化为一个合格的医生,需要跨越从医学知识到临床实践的高山。因为同一种症状,可能对应着不同的病灶,只会照本宣科完全不够,丰富的临床经验才更宝贵。此前在训练医疗大模型时,通常是先把医学数据(生理学、病理学、各种专科知识、病例等)“喂”给大模型,再借助检索增强生成(RAG)、高质量的人工标注进行迭代,让AI医生可以“按图索骥”。
这种训练方法的“别扭”之处在于,医疗大模型可以提升效率,但失之毫厘,差的可能就是一条命;而要是加入人工标注,效率又成了绊脚石。
不过,清华大学这个虚拟医院,采用的是一种MedAgent-Zero(无参数策略)的自我进化方法。即从患者发病,到医生诊断,再到最后的治疗结果,整个过程不依赖人工标注数据,AI医生只需要通过学习(阅读医学文献)和实践(与虚拟患者交互,作出诊疗决策,并从治疗成功或失败中积累经验)就能不断“进化”,提升医疗能力。
这意味着,AI医生也能积攒“临床经验”了。但这样的AI医生,能代替真实的医疗专家吗?
AI医疗的想象力
先说结论,眼下的医疗大模型,主要集中在疾病预防、辅助诊断、健康指导等生病的前期和后期。到生病的时候,AI只能打辅助,真正的问诊、治疗,还需要人类医生来进行。原因除了医疗大模型需要人为干预和标注来提升准确度之外,患者这边,对AI医生也缺乏足够的信任。
清华大学这个可以自主进化的AI医生,也有一定的局限性。从训练数据集来看,这个AI医生的“知识库”,主要来自第八版《传染病》中8种呼吸系统疾病的数据,包括每种疾病的症状、实验室检查、检查结果和治疗计划,共计大约10000条记录。还有一些从医学新闻网站、默克手册网站搜集的医疗文献和案例,以及后续患者的反馈,相当于“经验库”。这些数据集将该AI医生框定在了呼吸系统疾病领域,病人只会得呼吸道疾病,这大大简化了实际的医疗过程。因为有时候,头疼不一定是头的问题,也可能是颈椎的问题,或者心理的问题。所以这个虚拟医院,其实更像一个理想条件下的专科医院。
但研究提出的MedAgent-Zero自我进化机制,再加上更为庞大的医疗数据集,假以时日,AI医生或许真的可以做一些基础的问诊工作,为人类医生留出更多时间和精力,做更高深的研究,提供更有人情味的医疗服务。
其实,除了清华大学的虚拟医院,AI在医疗领域的应用,或许已经超过了很多人的认知。
在疾病预防领域,AI算法可以根据电子病历、基因数据等,预测心脏病、中风风险;一些糖尿病之类的慢性疾病,AI还可以提供实时监控和动态建议,用于个人健康管理。
在影像学领域,AI分析X光片、CT扫描、MRI等,不仅效率更高,还能更准确地检测到异常,如肿瘤、骨折、脑出血等,提高早期病变的检出率。2020年,谷歌DeepMind开发的乳腺癌AI筛查系统,就在发现乳腺癌方面,准确率超过了医生,登上了Nature。
还有AI加码的基因编辑,已经可以改写人类的DNA;Alphafold3的问世,更是为新药研发按下了快进键。甚至有的AI生成病例、AI心理治疗等等,比人类的效率还要更高,效果也更好。
虽然现阶段,AI在医疗领域的应用,还存在隐私、伦理以及人类信任度等等问题,但不可否认的是,AI正在以前所未有的方式,重塑着医疗健康领域。
当人人都有电子健康档案,当大数据能够更早发现身体病变,当AI医生能更准确、更体贴地给出治疗方法,相当于人人都可以拥有自己的家庭医生,甚至私人医生,那么医疗资源的不均衡或许就能被打破。
当新药研发更快,当基因编辑技术可以解决基因缺陷导致的病变,当智能机器人可以辅助人类完成更精细的手术,甚至是远程外科手术,那么,人人都健康地活着,或许也不再是奢求。当然,这一切都是完美的设想。
但随着AI技术的日渐成熟,随着老龄化不可避免地到来,随着人们对高质量健康的不断追求,这一天的到来,或许并不遥远。
文章原题:清华大学“手搓”智能体,只需几天,速成医学专家
https://www.163.com/dy/article/J3703FCJ0511BCOA.html