采写/方青青
编辑 /万天南
我们每个人身边,或许都有一个关于“看病难”的故事。
一位西北内陆的朋友,为挂上北京某医院专家号,花了近2000元买黄牛票,还要协调假期、长途跋涉——优质医疗资源供给不足且分布不均,导致“小医院看不好,大医院挤不进”。
如果医生有不知疲倦的“分身”,如果顶尖的诊疗经验可以跨越山海与时差,7×24小时在线……
互联网公司一直试图找到解药——但早期的入局者,如春雨医生、好大夫在线、微医等,其核心思路大多是解决医患之间的“信息差”,本质还是“连接” 。
然而,这一模式很快触及天花板,因为它并未解决优质医疗服务短缺的根本问题。
直到AI入场,“AI医生”获得候补资格,随时等待“上场补位”——在智能导诊、报告解读、影像判断、临床决策支持,“赋能”并“扩容”仍显短缺的医疗供给。
最近两年,大厂相继加入了A医疗大模型的团战。
腾讯于2023年9月上线“腾讯医疗大模型” ,发力智能导诊、电子病历等;京东健康依托其在医药供应链和互联网医疗领域的既有优势,于2023年7月发布了模型“京医千询”,补全其服务生态的AI能力 ;平安好医生作为保险巨头平安集团旗下的医疗健康平台,推出平安医博通,探索“医疗+保险”的协同模式;科大讯飞发布“星火医疗大模型”等,旗下“智医助理”率先通过了国家执业医师资格测试……
在与海外AI大模型比拼时,中国企业似乎也没输阵——比如,今年6月,斯坦福大学发布了一项有关临床医疗 AI 模型的全面评测,显示DeepSeek R1以66% 的胜率和0.75的宏观平均分,在九个前沿大模型中脱颖而出,成为全球冠军。
在这条高门槛、长周期的赛道上,同出一脉的蚂蚁集团与阿里旗下夸克,也在今年先后亮出了各自的王牌:
蚂蚁集团推出独立App“蚂蚁AQ”,定位为C端AI健康管家,上线十个月已累计服务超过1亿用户,近期还登上苹果商店医疗榜第一。
夸克则选择更轻量的入口,将健康大模型集成在AI搜索框中,并成功通过中国12门核心学科主任医师笔试,成为国内首家主任医生级AI,力图成为用户AI健康信息的首选入口。
两者的对比,清晰地揭示了医疗大模型落地的两种核心路径:做深服务的“健康管家”、盘踞线上的“健康入口”。
在这场医疗大模型的团战中,大厂战略分野,同向但不同路。
一
体验有差异:夸克给“答案”,AQ出“方案”
为了比较蚂蚁AQ和夸克在医疗大模型上的差异,我们以自己最近的睡眠问题为例,分别在两个平台上进行了完整问诊。
先看蚂蚁AQ,给了我近似“医生面对面”版的问诊体验。
打开AQ智能体,会看到一个干净清爽的页面。中央是对话框,用户可选择“智能思考”“深度思考”或“极速模式”;下方则是“AI诊室”“拍报告”“医保码”“拍药盒”“找医生”等快捷服务入口。
页面左侧还设有个人信息页,包括“健康档案”“消息”“对话历史”以及“不同智能体”入口,可关联硬件设备以实现长期健康数据监测。
正式进入AI健康咨询阶段。当我输入我的问题后,AQ启动深度思考模式,快速生成了一份结合医学文献的初步报告。内容涵盖了可能的病因分析、生活方式建议和调理方案,并且严谨地在每条建议后附上了文献出处。
但坦白说,尽管这些信息完整、专业,但偏向于普适性常识,如睡前避免使用手机、保持黑暗环境等,对症但不够个性化。
这正是许多医疗大模型产品面临的体验瓶颈:能够“泛泛而答”,却难以“深入追问”。针对这一瓶颈,蚂蚁AQ设计了“AI诊室”功能,通过多轮追问来模拟真实医生的问诊过程。
接下来,蚂蚁AI诊室基于我的初始问题,发起了一连串高达10至15个的连贯提问,旨在系统性地收集病情信息、厘清细节 。为提升交互的透明度,其界面会展示“提问进度”,并解释每个问题的“提问目的”——整个交互从“答题”变成“对话”,让我这个很少在网上看病的人相信,这不是模板化的对话,而是我在与一位医生建立对话关系,他正在为我进行一对一的诊断。
问诊结束后,系统自动汇总生成一份完整的诊疗建议报告。这份报告的结构逻辑清晰,契合了患者就医时的核心关切点:医生我这是什么问题、是否严重,为什么会得这个病呢;那该怎么治、调理?后续回去要注意什么?
在这些基础上,AQ还增加了两条就诊路径:
•线下就医:系统自动匹配医院和科室,依据地理距离、医保接入、专科评级等维度排序,缓解了“去哪看”的决策压力。
•线上问诊:列出相关科室医生,可跳转至“好大夫在线”等平台,全国范围内名医资源,一触即达提供诊疗支持。
从体验看,AQ不仅给出了问题的解释,也推动后续行动安排,试图将“AI问诊”延展为一整套诊疗流程——不仅给“答案”,也在给“方案”。
再看夸克,给我一种“搜索即问诊”的轻量级体验。
夸克健康大模型嵌入在搜索栏内,我直接在搜索框输入同样的问题,系统会调用模型生成结构化回答。
夸克同样展现了AI医生应有的深度与慢思考能力,最终给出的诊断意见也相当全面,内容覆盖:可能的原因、就医判断、建议科室、可能的检查项目、可能的治疗方案以及日常调理建议。回答的底部还附有医生问答参考链接,方便我进一步查阅、参考。
在“深度思考”模式下,模型一次性生成完整内容,还支持多轮交互。这种设计相对高效,对于已有明确症状、希望快速了解相关信息的用户而言,具备一定便利性。
整个过程最值得注意的是,尽管夸克健康大模型已通过12个核心学科的主任医师级别评测,但整个回答能明显感觉到夸克的谨慎和克制——不会直接下结论,而是多用“可能”“建议就医”等措辞,系统对某些不确定问题会主动拒答,或仅提供一般建议,不涉及诊断。
这或许和医疗大模型的长尾效应有关,即一个负面的应用个例就会对整个行业前景产生质疑。对此,夸克官方曾表示,夸克健康在训练中引入了“慢思考”推理机制,以提高推理的合理性与答案的解释性,同时设置多道校验机制以降低幻觉率。
从用户体验上看,夸克更像是我在挂号之前的“助理医生”,帮助我了解症状与可能路径,是否需要就医、去哪个科室等,但不参与诊疗流程的具体环节——给出大致的“答案”,但不出整体“方案”。
总得来看,蚂蚁AQ与夸克健康在医疗大模型的赛道上选择了不同的路径。夸克偏向于成为一个高效、可靠的“信息入口”,而蚂蚁AQ则致力于打造一个深度介入的“诊疗中台”。
个体端的感受之外,我们同样关注这两者在医疗实际落地的应用。
蚂蚁AQ相关人士告诉我们,截至目前,蚂蚁AQ已完成专业医疗大模型的核心研发与验证,具备“深度推理+多模态”能力,能理解文本、处理图像、语音与视频,训练规模超过万亿tokens。
除了推出面向C端用户的独立应用外,蚂蚁AQ和B端(机构和医院侧)主要在合作与赋能阶段,尚未直接进入诊断一线替代医生诊断,主要还是提供诊前—诊中—诊后的辅助服务。
B端落地上,蚂蚁AQ与上海仁济医院共建专科数据集,探索模型在真实临床场景中的应用;参与浙江卫健委“安诊儿”项目,携手硬件与数字医疗厂商推进模型部署等。
蚂蚁AQ还打造了一系列AI工具辅助医生工作,包括医生工作站、病例管家和电子病历生成工具等。
据悉,目前蚂蚁AQ的智能体系统已进入多个专病管理领域,如联合浙大二院,为心脏瓣膜病患者提供术后管理服务;与杭州市七院合作推出睡眠智能体,已覆盖全国342个城市、服务用户超500万。
也就是说,除了在C端的影响力外,蚂蚁AQ在B端也正在从技术平台走向“系统能力提供者”,B、C端齐头并进。
和蚂蚁AQ相同,目前夸克健康大模型也没有深入到临床一线诊断治疗环节的合作,主要是在健康知识提供、医学思维训练及辅助诊疗决策等方面发挥作用。
从行业格局看,夸克更偏向于“医疗AI信息基础设施+健康搜索入口”的打法。为此,他们纳入400多位副主任医师及以上级别专家,深度参与模型训练,以此提升医疗大模型的精准度。
在北京大学人民医院皮肤科主任李厚敏为代表的多位专家看来,夸克的回答“像一个医生在思考”。尤其是在优质医疗人才短缺、同时诊治疾病较为多元的基层全科诊疗中,夸克可作为医生的辅助工具,为其补充跨学科知识、提供治疗建议,提升诊疗准确性与效率等。
不过,无论AQ还是夸克,其定位还是“辅助”医生,而非“替代”医生。
二
同向不同路:服务闭环VS信息入口
两种体验的背后,是两条泾渭分明的战略路线。
蚂蚁AQ选择了一条“重”且“深”的服务闭环之路,而夸克则选择了一条“轻”而“广”的信息入口之路。
先看蚂蚁AQ。
蚂蚁布局医疗大模型,其内部认为是“水到渠成”——从解决患者的支付困难到接入医院帮患者挂号,再到打通医保体系,支付宝不断强化其一站式医疗服务平台的站位。进入大模型时代,蚂蚁将AI嵌入医疗“前端”,贯穿医生诊断和医院就诊全流程。
AQ智能体通过学习顶级专家诊疗思路,辅助医生处理病例,实现“分级诊疗”:80%的基础问题由智能体解决,复杂的20%由线下专家跟进。它负责分诊、导诊和服务联动,构建完整服务闭环。
一个被AI重塑的就医路径就这样诞生了:用户在感到不适时,先可在AQ咨询。若为轻症,AQ直接给出建议;若复杂或重症,或用户需要线下就诊,AQ根据距离、科室、医生等需求推荐医院并完成导诊、分诊。之后还能协助支付和医保报销。
就诊结束后,AQ还根据用户体检和就诊情况,提供健康护理建议,如饮食、复诊时间。用户还能绑定智能硬件,实现日常健康监测和管理。
由此,AQ智能体贯穿患者“诊前—诊中—诊后”全流程,甚至延伸至日常健康管理——此时,AQ要做的是一个“AI私人医生+健康助手”,助力医疗资源扩容。
AI赋能医疗服务众多环节
资料来源:甲子光年,招商银行研究院
但要实现这一角色,仅靠一个“工具型小程序”是不够的,蚂蚁因此选择独立App这条“重”路径。在蚂蚁AQ看来,真正的健康管家需要主动触达和及时交互。例如,当智能硬件监测到血糖异常时,AQ须能立刻预警。而支付宝内的小程序推送易被淹没,入口路径深,用户感知受限。
此外,做健康管家还需在医疗生态产业链掌握主动权。蚂蚁整合了支付宝十余年积累的医疗生态,包括医保、医院系统、商保渠道,以及年初收购的“好大夫”平台。AQ还接入269个医生智能体、200多家金融机构、华为、鱼跃等硬件厂商,形成院内外全周期健康管理闭环。
这种生态联动,或许将成为AQ智能体的核心壁垒,是纯技术公司短期内难以复制的。
相比蚂蚁AQ在医疗供给侧的深耕,夸克选择了一条轻量、非侵入、强调权威信息的路径。
作为国内首个通过12门核心学科主任医师评测的AI大模型,夸克健康大模型更像一个线上的“专业顾问”——它不承担诊疗任务,也不构建服务闭环,而是通过“主任医生级AI”能力,为用户提供可信易懂的健康知识解答。
这条“轻”路径,与其在阿里体系中的战略角色高度一致。
阿里2025财年第三季财报电话会上,阿里巴巴集团CEO吴泳铭明确阿里未来三年将围绕AI做三大投入:一是AI和云计算的基础设施建设,二是AI基础模型平台与AI原生应用,三是现有业务的AI转型升级。
其中,夸克被视为“模型能力外放的第一入口”。财报会结束一个月后,阿里把夸克正式确立为“AI旗舰应用”,产品形态升级为无边界的“AI超级框”,并宣布未来通义系列大模型的最新能力将第一时间接入夸克。
作为阿里钦点的“AI旗舰应用”,夸克的目标成为AI时代的“超级入口”。健康大模型是夸克“多智能体矩阵”中的关键子Agent:通过深度参与医疗场景这个对专业门槛要求最高的领域,夯实平台的可信认知,进而完成向教育、办公等领域的能力迁移。
因此,夸克并不追求诊疗闭环,而是强调“专业可信+内容可读”。它搭建了完整的“数据—模型—产品”体系,用“慢思考”“思维链”等技术提升推理质量,确保输出内容的准确性与可理解性。
对此,夸克方面向《财经故事荟》透露:未来,团队的重点仍将是内容质量与用户满意度,比如回答更精准、输出的内容更容易让用户理解。总之,短期内并不追求医疗服务闭环,也不急于商业化落地。
三
寻找“新支柱”与抢夺“AI船票”
将视线拉高,两条路线的选择,最终都服务于各自母公司在AI时代的宏大棋局。
目前,“普惠医疗健康”已被正式纳入蚂蚁集团五大主业,与“普惠金融”并列。对蚂蚁而言,医疗的价值不仅体现在新业务本身,也体现在与现有体系的协同效应上。
一个高频、高信任度的健康服务入口,既能拉升支付宝平台黏性(协同数字支付与生活服务),又为保险等金融产品创造数据驱动的个性化场景(协同数智普惠金融),同时还能作为集团AI能力的最佳范例,向政企端输出模型能力(协同科技产业化)。
尤其是金融和健康医疗的协调,参考平安好医生曾推动的“医疗+保险”打包增值路径,未来AQ所沉淀的用户健康档案、慢性病行为数据,或许能反哺到保险产品的定价和风控,形成“健康管理+风险保障”的闭环协同——眼下答案尚不明确,但模式不难想象。
如果说蚂蚁押注“普惠医疗”,是为了夯实新业务地基、拉动生态协同、寻找第二条增长曲线。那么夸克切入医疗并不只是押注某一个垂类场景,而是为了抢占AI时代的“船票”——建立一个AI时代真正意义上的超级入口。
在电商增长趋缓、平台红利见顶的背景下,阿里面临的是从交易平台向AI平台转型的结构性挑战。这个转型绕不开一个前提:必须有一个能承载大模型能力、与用户保持高频互动的通用入口。
正如普华永道中国AI咨询主管张为峰所言,AI“超级入口”将重构下一代的流量控制权。一方面,它是用户与智能服务的“第一触点”;另一方面,它也是重构商业模式的关键支点——从广告到订阅,从一次性交易到多轮互动,从平台分发到任务驱动,都是围绕入口重新排布。
AI时代的“超级入口”之争已经打响。PC时代,百度主导信息流;移动时代,微信掌控社交;而在AI时代,谁先占据用户心智,谁就能重构平台价值分配的规则。
被钦定为“AI旗舰应用”的夸克,要承担起打造国内首个DAU破亿AI超级App的使命。阿里巴巴智能信息事业群总裁吴嘉希望将夸克打造为“机器猫的口袋”——“一是Smart(聪明),二是专业,三是万能,要All in one”,成为“每个人都可以用的工具”。
而健康咨询几乎算得上全民刚需,且一旦建立信任,用户黏性极强。如果能在这一高门槛场景中建立起专业权威的品牌形象,就有机会将信任迁移至教育、办公、搜索等更多领域,从工作到学习,抢占AI时代的“默认入口”。
四
中美有差距:星辰与泥泞
医疗大模型唯有与当前的医疗服务体系结合,才能充分释放潜力。
对此,上海某三甲医院院长告诉《财经故事荟》,“不夸张地说,医生可能是最乐意拥抱新技术的群体。我们不讲新旧,有用我们就想用就爱用。”
在他的微信朋友圈里,几乎每隔两三天,就会转发AI大模型相关内容,“医疗服务体系的任何环节,AI大模型都有机会切入”。
据中国医疗大模型行业白皮书披露,2019—2023年,中国医疗大模型市场规模从27亿元增长至107亿元,预计2028年将达到976亿元。
资料来源:《中国医疗大模型行业白皮书:精准医疗,智能未来》,招商银行研究院
但在抵达这片星辰大海之前,所有玩家都必须正视并穿越一片由数据、技术、伦理和法规构成的“泥泞”地带。
正如前述院长所提醒的,“在医疗领域,我们固然要迎接AI、用好AI,但不能夸大,必须先经过严苛的临床验证。”
这并非一句空话。相比之下,国际头部医疗大模型在进入临床前,其验证的广度与深度已为我们设立了极高的标杆。
例如,梅奥诊所(Mayo Clinic)的AI心血管风险预测系统,在获批前通过了覆盖全球17个国家、136家医院的联合验证,累计病例高达23万例。这种工业级的、大规模的严谨验证,正是国内模型需要补上的第一课,也是必须跋涉穿越的“泥泞”。
近期举办的世界人工智能大会医疗论坛上,国内外多位顶尖院士和专家坦言,当前医疗大模型要从“可见”走向“可靠”,仍需克服三大核心困境:
一是,“开放”与“安全”的冲突。
数据是模型的燃料,也是最敏感的资产,尤其在医疗领域。德国科学院院士Roland Eils教授指出,尽管技术上AI已在多项能力上超越人类,但大语言模型在临床的落地率仅有5%,核心瓶颈就在于数据隐私的严格限制。
这背后是《中华人民共和国网络安全法》《中华人民共和国数据安全法》和《中华人民共和国个人信息保护法》构筑的数据安全红线。如何在这道红线之上,破解医疗数据流通不畅的难题,已成为政策的焦点。
好消息是,从国家层面来看,2023年设立的数据局以及计划于2025年启动的国家数据集团,体现了国家对数据未来价值的认可与重视,医疗健康领域数据商业化政策雏形渐显,各地也开始积极进行医疗数据商业化的尝试。
政策持续加码推动医疗数据智能化应用
资料来源:政府官网、招商银行研究院
二是,“通用”与“专用”的技术鸿沟。
正如我们前面所说,医疗大模型领域一个负面例子足以引起公众对整个行业的质疑——医疗不是一个通用大模型可以轻易征服的领域。
它需要专科化模型,像医生分科室一样,针对特定器官和疾病进行深度训练,才能减少“算法幻觉”,真正提升临床的精准度和实用性。这意味着,从通用技术到专用产品的转化,仍有很长的路要走。
三是,“技术”与“温度”的伦理考验。
医疗的终点是服务于人。
中国科学院院士葛均波认为,AI作为临床诊疗的得力助手,其伦理规范问题亟待厘清。这不仅是指算法的公平性、可解释性和对隐私的保护,更是指如何将冰冷的技术融入充满情感与信任的诊疗关系中。
这些现实困境,最终都指向一个核心原则:至少很长一段时间,AI医生的角色只能是“辅助”,而非独立的决策者。诊断决策仍然牢牢掌握在人类医生手中。
从横向对比来看,中国医疗大模型落地的速度和深度,相对美国,还有明显差距——既有 技术的差距,还有从临床验证、系统整合到信任建立的系统性差距。
首先,在商业模式上,欧美逐渐形成了“价值驱动”的良性循环。
据天翼智库发布的报告, 欧美头部玩家已在医疗文书自动化、重症管理、肿瘤精准诊疗等高价值领域,成功构建了“临床信任→常态化使用→价值创造→商业付费”的闭环。AI不再仅仅是降本增效的工具,而是能够直接参与价值创造并获得回报的生产力平台。
其次,在应用深度与广度上,差距体现在“系统平台”与“单点工具”的分野上。
•应用广度失衡:欧美医疗大模型已均衡覆盖诊疗全流程,其中诊断类占38%,治疗规划类占29%,预后监测类也达到了21%。以MD安德森癌症中心为例,其AI系统已覆盖从筛查到个性化治疗的全链条。相比之下,国内三甲医院的AI应用中,影像诊断类占比高达82%,而在治疗和预后等核心环节的渗透严重不足。
•整合深度不足:国际标杆项目展现出真正的“人机协同”。梅奥诊所的AI术前规划系统,可实现从自动调取数据(准确率98%)、智能生成方案(符合率91%)到术中实时导航(误差<0.5mm)的全流程支持。而国内同类应用多停留在提供术前静态建议,导致实际采用率不足40%,未能深度融入临床工作流。
中美差距还直观地反映在临床采纳与信任度上。
在美国顶级医疗机构中,高达87%的科室已实现AI工具的常态化使用(每周>50次),其中放射科、病理科的采纳率更是达到了95%。医生对AI的信任已经转化为日常工作习惯。
要填平中美医疗大模型之间的系统性差距,蚂蚁和夸克们必须联手中国医疗机构,一起加速追赶了。