3月9日,界面新闻获悉,智元联合北京航空航天大学提出的ACoT-VLA(Action Chain-of-Thought)架构入选视觉领域国际顶级会议CVPR 2026。该研究打破了传统VLA模型“语义 … 继续阅读 智元联合北航推出ACoT-VLA入选CVPR 2026
标签: 新论文
DeepSeek V4下周上线?原生多模态架构 技术报告同步开放
《科创板日报》3月1日讯(编辑 宋子乔) 当地时间2月28日,据金融时报报道,DeepSeek将于下周发布其最新的大模型V4。 据两位知情人士透露,这是一款具备图片、视频和文本生成功能的多模态模型。在 … 继续阅读 DeepSeek V4下周上线?原生多模态架构 技术报告同步开放
DeepSeek又一论文上新
财联社2月27日电,在业界对新一代旗舰模型DeepSeek V4的翘首期盼中,DeepSeek团队却悄然放出了一篇新的学术论文。这篇论文由DeepSeek联合北大、清华共同撰写,将研究方向投向了决定大 … 继续阅读 DeepSeek又一论文上新
MiniMax成Token调用第一之后 模型厂商的下一个必争高地显现
《科创板日报》2月27日讯(编辑 宋子乔) 最近,大模型token调用量井喷成为关注点。OpenRouter最新数据显示,各大模型的token调用量自2026年1月下旬出现明显跃升。 与此同时,国产大 … 继续阅读 MiniMax成Token调用第一之后 模型厂商的下一个必争高地显现
Anthropic发布新AI模型Claude Sonnet 4.6
当地时间2月17日,Anthropic宣布推出人工智能模型Claude Sonnet 4.6,称该模型在编码能力、计算机操作、长上下文推理、代理规划、知识工作及设计领域实现了全面升级。测试版还包含10 … 继续阅读 Anthropic发布新AI模型Claude Sonnet 4.6
阿里发布新一代基模千问3.5,每百万Token低至0.8元
《科创板日报》2月16日讯(记者 黄心怡)除夕当天,阿里巴巴开源全新一代大模型千问Qwen3.5-Plus,总参数为3970亿,激活仅170亿,性能超过万亿参数的Qwen3-Max模型,部署显存占用降 … 继续阅读 阿里发布新一代基模千问3.5,每百万Token低至0.8元
DeepSeek:正测试新的长文本模型结构 支持1M上下文
《科创板日报》13日讯,DeepSeek官方助手在开发者交流群中表示:DeepSeek 网页/APP正在测试新的长文本模型结构,支持1M上下文。而API 服务不变,仍为V3.2,仅支持128K上下文。 … 继续阅读 DeepSeek:正测试新的长文本模型结构 支持1M上下文
你追我赶!国产大模型春节档密集上新
《科创板日报》2月12日讯(记者 黄心怡)国产AI大模型春节档密集发布。 在智谱正式推出新一代旗舰模型GLM-5,Minimax亦上线Minimax 2.5。同时,DeepSeek已在网页及App端进 … 继续阅读 你追我赶!国产大模型春节档密集上新
DeepSeek模型更新!上下文提升至百万Token 可处理三体小说全集
《科创板日报》2月11日讯(记者 黄心怡 编辑 宋子乔)DeepSeek传闻中的V4尚未正式发布。2月11日,多位用户反馈DeepSeek已在网页及App端进行版本更新,上下文窗口由原有的128K直接 … 继续阅读 DeepSeek模型更新!上下文提升至百万Token 可处理三体小说全集
OpenAI推出GPT-5.3-Codex
OpenAI当地时间2月5日推出编码模型GPT-5.3-Codex,该模型在GPT‑5.2-Codex的编码性能基础上,融合了GPT‑5.2的推理与专业知识能力,实现性能双飞跃,同时运行速度提升25% … 继续阅读 OpenAI推出GPT-5.3-Codex

