推理 – 第 2 页 – 冯金伟博客园

OpenAI下一款AI模型或将具备“极端的”推理能力

据报道，OpenAI的下一款AI模型将具备“极端的”推理能力。

2026年是“十五五”开局之年，建议统筹建设公共推理算力集群，将低成本推理算力纳入国家新型基础设施布局，集约化建设一批高能效推理中心，像水电煤一样提供普惠、稳定的算力供给，构建效能评价体系与示范样板， … 继续阅读云天励飞董事长兼CEO陈宁：建议统筹建设公共推理算力集群推动AI普惠

每经AI快讯，3月4日，阶跃星辰官微宣布开源Step3.5 Flash的预训练权重（Base）、中训练权重（Midtrain）以及配套的Steptron训练框架。据了解，Step3.5 Flash采用 … 继续阅读阶跃星辰全面开源Step3.5 Flash

《科创板日报》4日讯，中国大模型创业公司阶跃星辰继开源 Step 3.5 Flash 模型后，又开源了这款 Agent 基座模型的预训练权重（Base）、中训练权重（Midtrain）以及配套的 St … 继续阅读阶跃星辰全面开源 Step 3.5 Flash：预训练+训练框架全放出冲上 OpenClaw Top2

财联社3月4日电，加拿大滑铁卢大学科学家领导的国际科研团队，提出了一套训练人工智能（AI）大语言模型使其更具“人类智慧”的新方法，探索了支持明智推理的新型架构，同时提出了衡量AI智慧的基准。相关论文发 … 继续阅读新方法训练AI模型更具“人类智慧”

《科创板日报》3月1日讯（编辑宋子乔）当地时间2月28日，据金融时报报道，DeepSeek将于下周发布其最新的大模型V4。据两位知情人士透露，这是一款具备图片、视频和文本生成功能的多模态模型。在 … 继续阅读 DeepSeek V4下周上线？原生多模态架构技术报告同步开放

当地时间2月27日，据报道，英伟达计划推出新型芯片以加速人工智能处理。英伟达正设计一套用于“推理”计算的新型系统，这种计算形式能让人工智能模型对查询请求作出响应。

财联社2月28日电，英伟达计划推出新芯片以加速人工智能处理，英伟达正设计一套用于“推理”计算的新型系统，这种计算形式能让人工智能模型对查询请求作出响应。

近日，DeepSeek团队联合清华大学、北京大学计算机学院发表名为《DualPath：突破智能体LLM推理中的存储带宽瓶颈》的论文。针对智能体LLM推理中的KV-Cache存储瓶颈，论文提出DualP … 继续阅读 DeepSeek团队联合清北发布DualPath系统，打破智能体推理存储瓶颈