阿联酋开源“最快推理模型”,撞名Kimi,基于阿里Qwen,用上全球最大芯片

编译 | 程茜 编辑 | 心缘 阿联酋的高性能推理模型,刚刚开源! 智东西9月10日消息,今日上午,阿布扎比穆罕默德·本·扎耶德人工智能大学(MBZUAI)联合AI创企G4 … Continue reading 阿联酋开源“最快推理模型”,撞名Kimi,基于阿里Qwen,用上全球最大芯片

Token将是未来最重要的资源

在人类文明的历史长河中,每一次生产力的飞跃,都伴随着核心生产力要素的更迭。 从蒸汽动力时代的煤炭,到现代的电力,再到信息时代的芯片和数据,莫不如此。 要素的革鼎,在潜移默化之间,重塑了整个世界的社会生 … Continue reading Token将是未来最重要的资源

OpenAI的命门,决定了大模型公司的未来

如果Scaling Law是指导大模型能力提升最重要的标尺,那么“算力成本控制”就是大模型行业发展和商业化的基石。 年初DeepSeek在国外开源社区首先爆火,一个很重要的原因就是,DeepSeek几 … Continue reading OpenAI的命门,决定了大模型公司的未来

美团首个开源大模型来了!5600亿个参数,推理速度比DeepSeek-V3快50%

作者 | 陈骏达 编辑 | 云鹏 智东西9月1日报道,昨日,美团发布了其首款开源大模型LongCat-Flash,这是一款拥有5600亿个总参数的MoE(混合专家)模型。 推理速度是这一模型最大的特点 … Continue reading 美团首个开源大模型来了!5600亿个参数,推理速度比DeepSeek-V3快50%

美国版“人工智能+”,当前正面临怎样的主要矛盾?

本文系基于公开资料撰写,仅作为信息交流之用,不构成任何投资建议。 昨日(8月26日)盘后,中国AI产业顶层设计《关于深入实施“人工智能+”行动的意见》正式公布,基本明确了未来5年中国人工智能产业的整体 … Continue reading 美国版“人工智能+”,当前正面临怎样的主要矛盾?

代码里突然蹦出“极”!DeepSeek V3.1被曝Bug,随机生成奇怪的Token

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) 几天前,DeepSeek V3.1 版本低调上线。这一次升级虽然算是小版本更新,但亮点也不少:它采用了混合推理架构,一个模型同时支持“思考 … Continue reading 代码里突然蹦出“极”!DeepSeek V3.1被曝Bug,随机生成奇怪的Token

华为数据存储AI SSD新品发布会本月27日举行,或支持显存扩充

IT之家 8月25日消息,华硕数据存储今日宣布华为数据存储AI SSD新品发布会将于8月27日14:00在华为上海练秋湖研发中心召开。 大会介绍写道: AI 重塑千行万业,以“Token”为核心的智能 … Continue reading 华为数据存储AI SSD新品发布会本月27日举行,或支持显存扩充