编译 | 程茜 编辑 | 心缘 阿联酋的高性能推理模型,刚刚开源! 智东西9月10日消息,今日上午,阿布扎比穆罕默德·本·扎耶德人工智能大学(MBZUAI)联合AI创企G4 … Continue reading 阿联酋开源“最快推理模型”,撞名Kimi,基于阿里Qwen,用上全球最大芯片
标签: token
Token将是未来最重要的资源
在人类文明的历史长河中,每一次生产力的飞跃,都伴随着核心生产力要素的更迭。 从蒸汽动力时代的煤炭,到现代的电力,再到信息时代的芯片和数据,莫不如此。 要素的革鼎,在潜移默化之间,重塑了整个世界的社会生 … Continue reading Token将是未来最重要的资源
OpenAI的命门,决定了大模型公司的未来
如果Scaling Law是指导大模型能力提升最重要的标尺,那么“算力成本控制”就是大模型行业发展和商业化的基石。 年初DeepSeek在国外开源社区首先爆火,一个很重要的原因就是,DeepSeek几 … Continue reading OpenAI的命门,决定了大模型公司的未来
英伟达将于2026年3月16日举行2026年GTC大会
凤凰网科技讯 9月2日,英伟达官网发布预告,将于2026年3月16日至19日在美国圣何塞举行2026年GTC大会。 在2025年的GTC大会上,该公司首席执行官黄仁勋分享了英伟达在人工智能领域的最新战 … Continue reading 英伟达将于2026年3月16日举行2026年GTC大会
美团首个开源大模型来了!5600亿个参数,推理速度比DeepSeek-V3快50%
作者 | 陈骏达 编辑 | 云鹏 智东西9月1日报道,昨日,美团发布了其首款开源大模型LongCat-Flash,这是一款拥有5600亿个总参数的MoE(混合专家)模型。 推理速度是这一模型最大的特点 … Continue reading 美团首个开源大模型来了!5600亿个参数,推理速度比DeepSeek-V3快50%
美国版“人工智能+”,当前正面临怎样的主要矛盾?
本文系基于公开资料撰写,仅作为信息交流之用,不构成任何投资建议。 昨日(8月26日)盘后,中国AI产业顶层设计《关于深入实施“人工智能+”行动的意见》正式公布,基本明确了未来5年中国人工智能产业的整体 … Continue reading 美国版“人工智能+”,当前正面临怎样的主要矛盾?
代码里突然蹦出“极”!DeepSeek V3.1被曝Bug,随机生成奇怪的Token
整理 | 屠敏 出品 | CSDN(ID:CSDNnews) 几天前,DeepSeek V3.1 版本低调上线。这一次升级虽然算是小版本更新,但亮点也不少:它采用了混合推理架构,一个模型同时支持“思考 … Continue reading 代码里突然蹦出“极”!DeepSeek V3.1被曝Bug,随机生成奇怪的Token
DeepSeek V3.1 突现离谱 Bug:极字满屏乱蹦,开发者一脸懵逼
DeepSeek 最新版 V3.1 被多名开发者实测发现,会在完全不该出现的地方插入「极 / 極 / extreme」等 token。 `time.Second` 变成 `time.Se 极`,版本号 … Continue reading DeepSeek V3.1 突现离谱 Bug:极字满屏乱蹦,开发者一脸懵逼
阿里云百炼宣布部分模型上下文缓存降价
8月26日,阿里云大模型服务平台百炼发布部分模型上下文缓存降价通知,本次调价后,当请求部分模型命中缓存时,命中的输入Token将按cached_token计费,单价从调价前input_token单价的 … Continue reading 阿里云百炼宣布部分模型上下文缓存降价
华为数据存储AI SSD新品发布会本月27日举行,或支持显存扩充
IT之家 8月25日消息,华硕数据存储今日宣布华为数据存储AI SSD新品发布会将于8月27日14:00在华为上海练秋湖研发中心召开。 大会介绍写道: AI 重塑千行万业,以“Token”为核心的智能 … Continue reading 华为数据存储AI SSD新品发布会本月27日举行,或支持显存扩充

