医联MedGPT丨“诊断”直播测评!治疗方案与真人医生96%一致

2023-08-08 14:10:27 来源:哔哩哔哩

据消息,医联研发的国内首个医疗大模型:MedGPT,已经在“接诊”患者了。

不可否认的是,MedGPT还有些问题需要调整,几位专家指出它会出现偶尔过度给出治疗建议、重复推荐检查项目、某些概念表述不准确,以及无法实现查体等局限——要想MedGPT更加可用,这些意见一定程度比正面评价还要重要。


(资料图片)

但总的来说,首个医疗大模型的公开首秀的结果还算不错。

总结下来,首先是大模型的基本能力都有,语义理解、多轮对话、多模态识别等,还能像OpenAI那样通过插件商店链接到各种行业应用。

还有通用大模型被广为诟病的对齐和准确性问题,MedGPT整个流程结果也不输真人医生。

再从行业维度来看,确实能真正从医学角度为医生提供有效帮助,提升患者疾病管理效率。

此次真实测试过程中可以看到,它能基于有效问诊以及医学检查数据,MedGPT得以进行准确的疾病诊断,并为患者设计疾病治疗方案。

甚至在诊后,MedGPT还会在患者收到药品后进行用药指导与管理、智能随访复诊、康复指导等智能化疾病管理工作。

目前它基本覆盖ICD10的60%疾病病种,这意味着常见病症都能Hold住还能7*24小时不间断干活,一旦规模化落地辅助医生诊疗,能大大提升医疗效率,对于分级诊疗,医疗资源普惠,都能够发挥一定作用。

首个医疗大模型如何炼成?

医疗向来是AI落地中专业性最强、壁垒性最高,对安全要求最高的领域之一。

以往用户们会习惯性使用信息搜索来帮助自己做一些初步的疾病判断,但信息鱼龙混杂,普通用户缺乏专业知识无法进行有效筛选,最终导致往往会收效甚微。

但又因为这个领域牵涉到每个人的生命健康,市场需求和社会价值一直很大。

因此自ChatGPT诞生以来,关于何时能在医疗领域“上岗”发挥作用,就备受产学研各界专家的关注。

诚如“弱智吧”成为检验各个通用大模型能力的Benchmark一样,各个大模型的医疗能力也在美国执业医师资格考试USMLE中摩拳擦掌。

早些时候, 哈佛大学教授曾亲自下场测试ChatGPT辅助诊断的表现。

结果显示,ChatGPT在45个案例中39个诊断正确,并为30个案例提供适当的分诊建议。这样的表现已经超过现有机器诊断水平,接近医生。

另一个代表,谷歌健康团队打造的Med-PaLM 2,它能回答各种医学问题,据称是首个在美国医疗执照考试中达到专家水平的大语言模型。

标签:
x 广告
x 广告

Copyright ©  2015-2022 每日云南网版权所有  备案号:京ICP备12018864号-37   联系邮箱:291 323 6@qq.com