行业新闻早知道,点赞关注不迷路!AI治病,跟机械飞升有什么区别?时间来到2023年下半年,GPT带来的AI狂潮已经渐渐稳定下来了。各个大厂和巨头,大模型一周目也已经差不多通关了,战绩先不论,起码跑完了全流程。毕竟有GPT在,通用大模型这个流派没什么竞争的意义了,早已是赢家通吃。现在各位玩家都进入了二周目阶段——大模型落地。有的看准了金融方向,有的往办公方向使劲,有的则是相中了自动驾驶,还有的打算搞搞医疗。说的就是谷歌。最近,谷歌Research和DeepMind发布论文,公布了一款名为Med-PaLM M的多模态模型。如果真如官方所说,那用AI看病指日可待了。这何尝不是一种“赛博朋克”?医疗大模型,谷歌来真的?
这个所谓的全科医疗大模型,是由谷歌旗下的Research和DeepMind的研究团队联合发表的,名为名为Med-PaLM M 的多模态模型。据资料显示,Med-PaLM M 可以灵活地编码和解释生物医学数据,还能读懂临床语言、看懂影像,也懂基因组学。Med-PaLM M 不是谷歌第一个搞出来的医疗大模型,在他之前还有Med-PaLM、Med-PaLM 2。
其实早在5月的谷歌I/O大会上,谷歌就发布了Med-PaLM的升级版Med-PaLM 2,在当时谷歌宣传其医疗水平已经有了专家的层次。然后在前段时间,有消息称Med-PaLM 2,已经“偷偷”在医疗诊所实习很久了。《华尔街日报》爆料,在Med-PaLM 2发布之前,谷歌就开始了在多家诊所内的测试。负责的工作包括回答医疗问题、总结文件或处理医疗大数据等。谷歌曾经表示,在医疗领域,Med-PaLM 2的效果优于Bard、Bing、ChatGPT等通用大模型。那么现在这个Med-PaLM M,又是什么来头?谷歌的Med-PaLM M,其实是在他们自己建立的一套多模态医学测试基准MultiMedBench上面微调得来的。而这个新模型里的“M”就代表了多模态。
谷歌自己对Med-PaLM M给出了评价:这是通用医学人工智能史上的一个里程碑。经过评估,在14项测试任务中,Med-PaLM M均接近或超过现有SOTA。而在246份真实胸部X光片中,临床医生表示,在高达40.50%的病例中,Med-PaLM M生成的报告都要比专业放射科医生的更受采纳,这表明Med-PaLM M并非“纸上谈兵”,用于临床指日可待。不光做运动员,还要做裁判
你以为谷歌就只搞了一个Med-PaLM M模型吗?那就太低估谷歌的野心了。在推出Med-PaLM2的时候,谷歌就搞了一个配套的基准测试——MultiMedQA,其中涵盖了医学考试、医学研究等领域的问题和回答。该基准结合了六个现有医疗问答数据集(MedQA 、MedMCQA 、PubMedQA、LiveQA 、MedicationQA和MMLU),涵盖专业医学、研究和消费者查询等多个方面,以及一个全新的在线搜索医疗问题库数据集HealthSearchQA,力图从多方面把AI培养成一名合格的医生。
此外,该团队提出了一个基于人类评估的框架模型,该模型包括多个维度,例如事实、理解、推理,以及可能的偏见。该团队在MultiMedQA上对拥有5400亿参数的谷歌大型语言模型PaLM(Pathways Language Model)及其变体Flan-PaLM进行了评估。在实验中,研究人员采用了提示策略组合,Flan-PaLM在每个MultiMedQA多选题数据集上都达到了极高的准确率,其中在MedQA(美国医学执照考试类型问题)上的准确率为67.6%,比之前的技术水平高出17%以上。除了这个基准测试,还有之前提到的MultiMedBench。该基准由12个开源数据集和14个单独的任务组成,用于测量通用生物医学AI执行各种临床任务的能力。其中12个数据集共包含了六种生物医学数据模式(文本、放射学(CT、MRI和X光)、病理学、皮肤病学、乳房X光检查和基因组学),14个任务则涵盖五种类型(问题回答、报告生成和摘要、视觉问题回答、医学图像分类和基因组变体调用)。谷歌的野望,不光是要做医疗赛道的头号种子选手,还要制定规则。以后但凡想在这个赛道上跟我对标的,都得拿我的标准来测试。就你西医有?我中医不服!
不管Med-PaLM M也好,还是Med-PaLM、Med-PaLM2,都是现在西方医学的大模型。那中医有吗?还真有。最近一个名叫“岐黄问道”的中医大模型出现了。据了解,该中医大模型一共有三个子模型,基于已确诊疾病的临床诊疗大模型;仅仅基于症状、体征的临床诊疗大模型;中医养生调理大模型。除了这个,还有之前出现过的中医大模型——Huatuo-LLaMA。它就是一个基于中文的医学数据在 LLaMA-7B 开源模型基础上,微调参数得到的模型。据说,作者团队参考 cMeKG,采用公开和自建的中文医学知识库构建训练数据。医学知识库围绕疾病、药物、检查指标等构建,字段包括并发症,高危因素,组织学检查,临床症状,药物治疗,辅助治疗等。写在最后
如果上述的评估和成绩属实,那么AI初步替代医生进行病情指导,完全是有可能的。虽然还存在一些这样和那样的问题,但总体的进步和效果值得期待。不过,现在AI的“幻觉”问题还没有得到很好的解决,所以风险还是有的。如果AI医生真的开始应用,你敢找它们看病吗? ▼最新活动▲

▼精彩视频▲

戳“阅读原文”报名OFweek 2023(第八届)物联网产业大会