大语言模型 – 冯金伟博客园

对21种大语言模型研究表明：AI尚不具备独立临床诊疗的能力

财联社4月14日电，尽管人工智能（AI）在医疗领域的应用日益增多，但其“像医生一样思考”的能力仍存在明显短板。由美国麻省总医院MESH孵化器团队开展的一项最新研究发现，生成式AI在临床推理关键环节仍显 … 继续阅读对21种大语言模型研究表明：AI尚不具备独立临床诊疗的能力

4月4日消息，发布仅1天的千问新模型Qwen3.6-Plus，冲上全球知名大模型API调用平台OpenRouter的日榜榜首，数据显示，Qwen3.6-Plus的日调用量突破1.4万亿Token，打破 … 继续阅读千问3.6Plus大模型登顶全球模型调用排行榜首，日调用量破万亿

Token（词元），正在成为AI（人工智能）时代衡量生产力的新货币。 4月2日，在火山引擎“AI创新巡展・武汉站”活动上，火山引擎总裁谭待对外宣布，截至今年3月，豆包大模型日均Tokens使用量已突破 … 继续阅读豆包日均120万亿Tokens放量增长，Seedance 2.0企业公测落地，火山引擎打响MaaS“卡位战”

4月3日，小米官宣MiMo大模型首个Token Plan，面向开发者和养虾用户的 AI 大模型调用套餐。MiMo Token Plan 提供四档方案：Lite（¥39/月）、Standard（¥99/ … 继续阅读小米MiMo大模型首次推出Token Plan

每经AI快讯，4月2日，阿里云公众号消息，阿里新一代大语言模型Qwen3.6-Plus正式发布。较之上一代模型，千问3.6整体性能提升明显，尤其是编程Coding能力、智能体Agent能力和工具调用能 … 继续阅读阿里发布新一代大语言模型Qwen3.6-Plus

12月17日，腾讯调整AI大模型研发架构，宣布新成立AI Infra（人工智能基础设施）部、AI Data（人工智能数据）部，以及数据计算平台部。任命前Open AI研究员姚顺雨（Vinces Ya … 继续阅读 27岁前OpenAI研究员加入腾讯，领衔大语言模型研发

12月2日，据报道，OpenAI正在开发大语言模型“Garlic”。

财联社11月7日电，在最新一期《自然·机器智能》发表的一篇论文中，美国斯坦福大学研究提醒：大语言模型（LLM）在识别用户错误信念方面存在明显局限性，仍无法可靠区分信念还是事实。研究表明，当用户的个人信 … 继续阅读大语言模型仍无法可靠区分信念与事实

财联社9月10日讯（编辑史正丞）全球人工智能算力芯片龙头英伟达周二宣布，推出专为长上下文工作负载设计的专用GPU Rubin CPX，用于翻倍提升当前AI推理运算的工作效率，特别是编程、视频生成等需 … 继续阅读英伟达发布超长上下文推理芯片Rubin CPX 算力效率拉爆当前旗舰

在大模型时代，拥有的AI（人工智能）芯片数量，决定了一家AI厂商的竞争力。如今，阿里也被曝出正自研AI芯片。显然，在这一轮科技产业变革中，AI芯片已经成为大型AI厂商的“必答题”。没有足够的AI芯 … 继续阅读阿里“破芯”之路：一场不能输的科技突围战