医疗大模型，告别“镀金时代”

发布时间：2026-06-13 16:19 作者：鹿尧阅读量：17.1W

新眸原创·作者 | 鹿尧

几年前，大模型浪潮席卷而来时，医疗几乎是被谈论最多的垂直场景。

逻辑很简单，国内临床诊疗场景体量庞大，每天产生海量的病历、影像和检验数据，诊疗链条中任何一个环节的效率提升，都对应着真实的经济价值。

时至今日，这个赛道出现了一些有趣的分化。宣布推出医疗大模型的公司不在少数，但真正能在临床场景中被医生日常使用的产品却屈指可数。大部分"医疗大模型"沿着同一条路径——选一个通用底座，用公开医学文本做几轮微调，拿几个医学考试数据集跑分，然后开发布会。

这条路径在客服、营销等场景或许够用，但在临床医疗场景遭遇了结构性的适配困难。医疗对准确性的要求高，对多模态信息融合的要求远超文本对话范畴，对推理可解释性的需求在其他行业找不到参照。

日前，讯飞医疗发布了基于全国产算力训练的星火医疗大模型V3.5。从公开技术指标来看，这次升级传达了一个方向性变化——多项能力跨过实用门槛：病历生成医生采纳率达91%，影像报告采纳率达75%，病历书写时间缩短52%，推理吞吐量提升4.5倍。

业界此前普遍认为，医疗大模型的竞争焦点将逐渐从“有没有模型”转向“能不能真正用起来”。如今，这一转折已成现实。相比以往粗放地追求参数与刷榜，专业纵深、临床闭环和规模化落地的能力，才是当下真正值得关注的重点。

通用底座为什么做不了医疗

先回答一个基础问题：为什么"通用底座+行业微调"的模式，在医疗领域行不通？

通用大模型的训练逻辑，是在海量互联网文本上学习语言统计规律，追求一种“通才”能力。但医疗场景本质上是反“通才”的，真实的临床世界没有标准答案，且充满复杂变量，它需要的是在不确定条件下，做出高确定性判断的专业能力。

通用模型习惯“直接给结论”，但这套逻辑很难适应临床诊疗中“逐步收敛不确定性”的思维方式。相比之下，垂类医疗模型遵循真实的诊疗思维，通过多轮交互补全必要信息，从而把模糊的表述一步步转化为明确的诊断依据，从源头降低误判风险。

更关键的差异在模态层面。现实中的诊疗过程不会仅靠纯文本，医生需要同时处理患者的语音描述、检验报告上的数值、CT影像中的病灶形态、心电图的波形特征，并在这些异构信息之间建立关联推理。

毫不夸张地说，一个只能处理文本的模型，在诊室里连第一步都迈不出去。

而这，也是星火医疗大模型V3.5这次升级的核心特征之一——将医疗语音识别、影像辅诊和医学语义理解做了底层融合，多模态能力全球领先。

具体来说，它解决了这样一个全球性问题：在真实的诊室环境中，远场拾音设备同时捕捉到医患双方的多角色对话，系统需要完成从声学信号到医学语义的端到端映射，包括识别说话人角色、提取关键医学信息、生成符合书写规范的结构化病历。

可以这么理解，整个过程不是只靠语音转文字再加一个大模型做总结，而是从信号到语义的一体化处理链路。

在技术架构上，星火医疗大模型V3.5在国产算力平台上实现了DSA（动态稀疏注意力）与MTP（多Token预测）的长文本高效训练，医疗长上下文场景推理吞吐量提升4.5倍。

看似是底层的技术突破，却能直接决定模型能否在几秒钟内，从一个患者的数年健康档案、既往病史和最新检查报告中，抽丝剥茧，形成精准的判断。

这也是通用模型的“微调”难能企及的另一个点，它需要的是从数据采集、清洗到训练、推理的全链路“医工交融”。

那么，支撑这种深度技术创新的原材料是什么？

自然是海量的、高质量的真实临床数据。据了解，星火医疗大模型依托脱敏处理后的16 亿人次医疗语音数据、超12亿次真实诊疗数据，同时叠加每日持续汇聚的超220万份语音、影像、病历类临床资料，数据体量保持动态增长。

不过，这些数据真正的价值不止于规模大，更在于“真实性的密度”，它们覆盖了从基层到头部三甲的完整诊疗链条，包含真实临床场景中的噪声、口音、缩写和非标准化表达。恰恰是这些来自真实世界的数据，塑造了模型在真实场景中的鲁棒性。

试想一下，基于这样的模式，就能够催化出一个行业独有的“数据飞轮”，越多的医院和医生使用，越多的真实数据，模型迭代越快、效果越好。而通用大模型往往很难短时间获取这种扎根于中国医疗体系、横跨语音影像文本的多模态数据资产。

IDC、上海人工智能实验室MedBench等权威第三方评测数据显示，当评测体系由基础医学知识核验升级至辅助诊疗、结构化病历生成等真实临床场景后，星火医疗大模型的垂直适配效能与落地表现业界领先。差异化竞争优势的核心支撑正是体系化沉淀的高质量临床数据资产。

循证诊疗助理智能体：

从工具到临床生产节点

如果说数据与算力是底层支撑，那对临床场景的理解和再造，就是医疗AI能否被医生真正接受的关键。

此前的AI医疗产品，大多停留在“患者问-模型答”的浅层交互，或是单点的影像识别。而V3.5升级中最具想象力的部分，是面向临床医生的“循证诊疗助理智能体”——它标志着医疗AI从“辅助工具”，进化为嵌入临床工作流的“生产节点”。

行业会把它跟美国的OpenEvidence做对比，后者能在医生提问后，从权威文献里找证据、给溯源链接，循证诊疗助理智能体同样共享“循证+溯源”的核心逻辑，但中美医疗体系有个根本差异：

美国医生多为独立执业，可以自由选择用什么工具；中国医生在公立医院体系里，任何新工具都得经过医院评估、采购，还得跟现有电子病历系统打通，兼容中西医两套体系，覆盖门诊、住院、出院全流程。

这意味着中国的循证诊疗助理智能体不仅要解决“答案可信”的问题，还要解决“融入临床工作流”的问题，讯飞医疗的循证诊疗助理智能体，正是围绕这一核心逻辑设计：

在星火医疗大模型V3.5的支撑下，它整合了权威文献、诊疗指南和专家共识，能进行多步推理、自我校验，并给出完整的证据来源，它的价值已经渗透到诊疗的各个节点：

医生问诊时，它能实时转写医患对话，把口语化的描述整理成结构化主诉；遇到模糊表述，会主动提示医生补充追问。问诊结束，病历已经自动填好了大半，既往史、家族史等常规项也被补全，医生只需要审核确认。

诊断环节，它不直接给结论，而是把推理过程摆出来：基于哪条指南支持某个判断，又有哪些证据排除了其他可能。每条依据都可点击溯源。开检查时，它会推荐最必要的项目，避免过度医疗；检验结果出来后，自动标出异常项并解释临床意义。

用药安全上，它会交叉比对诊断、过敏史、肝肾功能和正在服用的其他药物，发现相互作用或剂量问题就预警。患者出院后，它还会生成个性化健康指导推送到手机，患者拍药盒问用法、上传血压血糖数据，系统都能识别、记录，异常时自动提醒医生。

从门诊到住院再到居家，循证诊疗助理智能体把原本一个个孤立的环节串联起来，并且形成闭环。

这样一来，AI本身就不仅仅是一个“问答机器”，而是一个能真正嵌入每一个临床工作节点，辅助医生、提供决策支持的“AI同事”。

在MedBench智能体评测中，星火医疗大模型以98.9分登顶，在医疗场景感知与交互、医疗多智能体协作、医疗安全伦理与合规等多项核心能力位居第一——某种程度上，这也验证了讯飞医疗的方向是对的，医疗AI的终极形态，可能不是更聪明的“答题者”，而是更可靠的“协作者”。

也正因此，比起只是做一个中国版OpenEvidence的工具，讯飞的循证诊疗助理智能体正在成为临床生产体系中不可或缺的一部分。

中国医疗体系需要一次系统性升级

技术实力决定一家公司能走多快，规模化落地能力决定它能走多远。然而，在医疗大模型这条赛道，两者之间的鸿沟比大多数行业都要宽。

单点技术突破值得兴奋，但真正能带来结构性变化的，是把技术铺到足够广、扎到足够深。当一家公司做到这一点，它改变的就不再只是某个医院的效率，而是整个医疗体系的资源配置逻辑。

讯飞医疗正在做的，其实就是这件事。

先看一组容易被忽略的数字：全国400多万执业医师，每年承担的诊疗人次超过80亿。这个数字背后，是医生群体长期超负荷运转的现实。而病历书写是其中最繁重也最隐蔽的负担。

星火医疗大模型V3.5把病历书写时间缩短了52%，放在全国医生的基数下，每年释放出来的有效诊疗供给，相当于凭空多出数亿人次的接诊能力。这是来自供给侧的释放——在短期内无法大幅增加医生数量的前提下，AI正在成为缓解医疗资源短缺的一条现实路径。

但这还只是起点。更深层的改变，是这套技术正在重塑中国医疗资源的分布格局。

长期以来，优质医疗资源往往高度集中于大城市的三甲医院，基层医疗机构的服务能力参差不齐。患者用脚投票，小病也往大医院跑，进一步加剧了资源错配。

截至目前，讯飞医疗的智医助理已经覆盖了全国31个省份806个区县、超过7.7万家基层医疗机构。这意味着，在那些资源有限的偏远乡镇，AI正在成为基层医生的“第二双眼睛”和“第二个大脑”。

换句话说，诊疗建议不再是医生个人经验的孤军奋战，有了接近三甲水平的专业支撑，优质医疗资源就不再被困在城市的围墙内，且通过AI能力下沉到了每个角落。

如果说基层覆盖解决的是“有没有”的问题，那么区域互联解决的是“通不通”的问题。安徽省影像云平台接入近2000家医疗机构，累计开展远程影像会诊超1200万次，日均远程会诊超12000例，数据流转控制在亚秒级。

这套系统在做的，是拆除医院之间的数据围墙：过去基层医生遇到拿不准的影像，只能建议患者去省城；现在几分钟内就能完成省级专家的在线会诊。

更进一步的是医保支付端的打通。广西医保影像云启动仅三个月，就接入了372家医疗机构，具备交付条件的二级以上医疗机构接入率100%。患者跨院复诊无需重复拍片，医生几秒内可调阅全部历史影像。

这件事的意义远远超出了“方便”。

重复检查、信息孤岛是中国医疗体系长期以来的顽疾，既加重了患者的经济负担，也造成了医保基金的无效支出。当影像数据能够在区域乃至全国层面互联互通，检查结果互认就有了技术基础。这不仅带来医院的效率提升，也系统性降低了整个医疗的运行成本。

从基层覆盖到区域互联，再到医保支付端的绑定，这三层叠在一起，呈现出一个清晰的图景：相比一个个孤立的软件，讯飞医疗构建的，是一张覆盖中国医疗体系的AI基础设施网络，也正是这张网，把整个医疗体系的能力底板整体抬高。

过去几年，医疗大模型行业的竞争焦点一直在变：先是比参数规模，再是比榜单排名，后来比谁的发布会更有声势。但真正决定终局的，是谁能把技术铺进真实的诊疗流程，谁能在基层、在区域、在医保支付这些关键节点上扎下根。

讯飞医疗构建的是一套随着规模化进程不断自我强化的系统——每天新增超过220万份真实数据，让数据飞轮持续转动；标杆医院的验证为复制推广提供了信用基础；政策层面，国家唯一的“AI+基层医疗”中试基地项目落在这里，方向与国家医改深度咬合。

过去的“镀金时代”，行业比拼的是谁的故事更好听。进入淘汰赛阶段，比的是啃下临床硬骨头、真正扎根到医疗体系深处的能力。讯飞医疗走了一条难而慢的路，但这条路正在越走越宽。

当这套体系足够庞大，它带来的改变将足够深刻：数据多跑路，群众少跑腿，基层医生不再孤立无援，重复检查逐步成为历史。最终指向的，是中国医疗体系的系统性升级——用技术填平资源落差，让优质医疗服务触达每一个角落。

评论

最新评论

Copyright © 2020-2021 苏州凌石信息咨询有限公司版权所有 | 苏ICP备2021005624号

评论

最新评论

Copyright © 2020-2021 苏州凌石信息咨询有限公司 版权所有 | 苏ICP备2021005624号

Copyright © 2020-2021 苏州凌石信息咨询有限公司版权所有 | 苏ICP备2021005624号