DeepSeek 最新版 V3.1 被多名开发者实测发现,会在完全不该出现的地方插入「极 / 極 / extreme」等 token。 `time.Second` 变成 `time.Se 极`,版本号 … Continue reading DeepSeek V3.1 突现离谱 Bug:极字满屏乱蹦,开发者一脸懵逼
标签: token
阿里云百炼宣布部分模型上下文缓存降价
8月26日,阿里云大模型服务平台百炼发布部分模型上下文缓存降价通知,本次调价后,当请求部分模型命中缓存时,命中的输入Token将按cached_token计费,单价从调价前input_token单价的 … Continue reading 阿里云百炼宣布部分模型上下文缓存降价
华为数据存储AI SSD新品发布会本月27日举行,或支持显存扩充
IT之家 8月25日消息,华硕数据存储今日宣布华为数据存储AI SSD新品发布会将于8月27日14:00在华为上海练秋湖研发中心召开。 大会介绍写道: AI 重塑千行万业,以“Token”为核心的智能 … Continue reading 华为数据存储AI SSD新品发布会本月27日举行,或支持显存扩充
大模型究竟是怎么思考的?这可能是近期最有趣的高质量AI访谈
编译 | 程茜 编辑 | 心缘 智东西8月20日报道,8月16日,Anthropic最新一期官方油管视频上线,三位AI研究员抽丝剥茧,深入探讨AI研究不应避开的一个关键“谜团”——大模型究竟是怎么思考 … Continue reading 大模型究竟是怎么思考的?这可能是近期最有趣的高质量AI访谈
比GPT-5还准?AIME25飙到99.9%刷屏,开源模型首次
编辑:定慧 好困 【新智元导读】DeepConf由Meta AI与加州大学圣地亚哥分校提出,核心思路是让大模型在推理过程中实时监控置信度,低置信度路径被动态淘汰,高置信度路径则加权投票,从而兼顾准确率 … Continue reading 比GPT-5还准?AIME25飙到99.9%刷屏,开源模型首次
字节首次开源推理模型,连夺7项第一
作者 | 陈骏达 编辑 | 心缘 智东西8月21日报道,今天,字节跳动Seed团队开源了Seed-OSS系列模型,这些模型专为长上下文、推理、Agent和通用场景设计,将上下文窗口扩展至512k,是业 … Continue reading 字节首次开源推理模型,连夺7项第一
仅0.27B参数!谷歌开源史上最小Gemma 3,手机能跑,25次对话耗电不到1%
作者 | 李水青 编辑 | 云鹏 智东西8月15日消息,今天,谷歌推出史上最小Gemma 3开源模型,一个拥有2.7亿个参数的轻量级模型,底层设计以特定任务微调为目标,具备强大的指令跟踪和文本能力。 … Continue reading 仅0.27B参数!谷歌开源史上最小Gemma 3,手机能跑,25次对话耗电不到1%
刚刚,华为AI推理大招终于来了!10倍级上下文扩展,性价比暴涨
作者 | ZeR0 编辑 | 漠影 智东西8月12日报道,今日,华为推出AI推理创新技术——推理记忆数据管理器UCM,通过多级缓存显著优化AI推理体验与性价比。 UCM是一款以KV Cache和记忆管 … Continue reading 刚刚,华为AI推理大招终于来了!10倍级上下文扩展,性价比暴涨
倒反天罡!OpenAI用GPT-5给7亿用户戒“网瘾”?附GPT-5深度测评
OpenAI万万没想到,训练时长两年半的GPT-5刚发布,就给自己先上了一课——步子跨太大容易伤身体。用户也万万没有想到,期待已久的GPT-5,是来给自己戒网瘾的。 1个多小时的发布会之后,网友上手一 … Continue reading 倒反天罡!OpenAI用GPT-5给7亿用户戒“网瘾”?附GPT-5深度测评
通义千问官方宣布Qwen Code免费用:token无限制,每天2000次
凤凰网科技讯 8月12日,通义千问官方宣布,Qwen Code每天可享2,000次免费调用,无token额度限制,并分享了免费体验方法。 据了解,Qwen3-Coder原生支持256K上下文,可通过Y … Continue reading 通义千问官方宣布Qwen Code免费用:token无限制,每天2000次