百度发布文心大模型5.1:搜索能力位列国内首位,预训练成本仅为业界6%

IT之家 5 月 9 日消息,百度发布了新一代基础大模型 —— 文心大模型 5.1。目前文心 5.1 已在百度千帆模型广场、文心一言官网同步上线,面向企业用户和开发者开放体验。 据百度官方介绍,该模型 … 继续阅读 百度发布文心大模型5.1:搜索能力位列国内首位,预训练成本仅为业界6%

曝DeepSeek融资500亿,梁文锋或自投200亿

DeepSeek-V4.1或将在6月发布。 编译 | 陈骏达 编辑 | 李水青 智东西5月8日消息,今天,据The Information报道,两位知情人士透露,DeepSeek创始人兼CEO梁文锋可 … 继续阅读 曝DeepSeek融资500亿,梁文锋或自投200亿

AI有嘴了!OpenAI连发三语音模型

昨天凌晨,OpenAI发布了三款音频模型:GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper。 OpenAI官网的表述是,新模型可以让 … 继续阅读 AI有嘴了!OpenAI连发三语音模型

云知声山海知医慧保大模型重磅发布

医疗数据知识浩如烟海,医疗保险业务规则纷繁庞杂。医保(社保中的医疗保险)、商保(商业医疗保险,如医疗险、重疾险等)均为国计民生高价值场景,关乎基金安全、公共利益与群众切身权益,对精准性、合规性、安全性 … 继续阅读 云知声山海知医慧保大模型重磅发布

ChatGPT免费模型升级了:幻觉砍半/记忆更强/回答更简洁

ChatGPT默认模型,今天大升级。 新版本GPT-5.5 Instant, 结合了5.5的基础智力 + 极速回复。 免费用户也能用。 最关键的四点: 幻觉减少了52.5%。 新增“记忆来源”,展示过 … 继续阅读 ChatGPT免费模型升级了:幻觉砍半/记忆更强/回答更简洁

斯坦福HAI大重组!李飞飞升任校长顾问

新智元报道 编辑:犀牛 所罗门 【新智元导读】斯坦福把HAI与Data Science合并,李飞飞升任校长顾问。这是顶级大学在AI新阶段押注「组织力」的全面换挡。 刚刚,斯坦福进行了一项重磅重组。 5 … 继续阅读 斯坦福HAI大重组!李飞飞升任校长顾问

谷歌Gemma 4深度评测:最强端侧模型并不完美,但很适合手机

近期,谷歌发布新一代开源模型Gemma 4,包括E2B、E4B、26B、31B四个规格,其中两个「小模型」E2B和E4B,可以直接在智能手机、树莓派等端侧设备部署和离线运行。 谷歌Gemma 4两款「 … 继续阅读 谷歌Gemma 4深度评测:最强端侧模型并不完美,但很适合手机

深扒GPT Image 2:疑似“吞”下了GPT-4o,OpenAI没把它当“生图”模型训练

作者|樊雅婷 邮箱|fanyating@pingwest.com GPT Image 2 凭什么这么强? 是扩散模型又迭代了一版?是把 DiT 的参数量从 7B 扩到 20B?是训了更多高质量数据? … 继续阅读 深扒GPT Image 2:疑似“吞”下了GPT-4o,OpenAI没把它当“生图”模型训练

AI大模型的“中文税”:中文比英文更费Token,为什么?

作者|汤一涛 编辑|靖宇 Opus 4.7 刚发布那几天,X 上怨声载道。有人说一次对话就把她的 session 额度用光了,有人说同一段代码跑完的成本比上周翻了一倍多;还有人晒出自己 200 美元 … 继续阅读 AI大模型的“中文税”:中文比英文更费Token,为什么?

DeepSeek V4最大的遗憾

henry 发自 凹非寺 量子位 | 公众号 QbitAI DeepSeekV4的技术报告里有mHC,有CSA,有HCA,有Muon,有FP4…… 唯独没有Engram。 Engram去哪了? 这个话 … 继续阅读 DeepSeek V4最大的遗憾