天眼查App显示,近日,小米汽车科技有限公司申请的“一种三维场景感知方法、装置、电子设备以及存储介质”专利公布。 摘要显示,本专利涉及自动驾驶技术领域,所述三维场景感知方法包括:获取车辆周围环境的多个 … Continue reading 小米汽车公布三维场景感知专利
标签: 深度思考模型
宇树开源UnifoLM-WMA-0
9月15日,宇树宣布开源UnifoLM-WMA-0。UnifoLM-WMA-0是宇树科技跨多类机器人本体的开源世界模型-动作架构,专为通用机器人学习而设计,其核心成分在于一个可以理解机器人与环境交互物 … Continue reading 宇树开源UnifoLM-WMA-0
阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍
每经杭州9月12日电(记者叶晓丹)9月12日,阿里通义发布下一代基础模型架构Qwen3-Next。Qwen3-Next针对大模型在上下文长度和总参数两方面不断扩展(Scaling)的未来趋势而设计,采 … Continue reading 阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍
腾讯混元将发布原生多模态图像生成模型
9月9日晚间,腾讯混元最新的生图模型“混元图像2.1(HunyuanImage 2.1)”正式发布,支持最长达1000个tokens的提示词,支持原生2K生图。此外,腾讯混元方面透露,“混元原生多模态 … Continue reading 腾讯混元将发布原生多模态图像生成模型
字节跳动发布Seedream 4.0 图像创作从文生图进入多模态交互新阶段
每经北京9月9日电(记者李宇彤)9月9日,字节跳动Seed团队宣布推出豆包图像创作模型Seedream 4.0。据介绍,该模型支持文生图、图像编辑及多图参考等功能,具备多模态生图效果。Seedream … Continue reading 字节跳动发布Seedream 4.0 图像创作从文生图进入多模态交互新阶段
通义千问发布Qwen3-Max-Preview,参数量超1万亿
每经AI快讯,9月6日,阿里巴巴旗下通义千问Qwen上线新模型 Qwen3-Max-Preview (Instruct),“这是我们迄今为止最大的模型,参数量超1万亿!”据介绍,Qwen3-Max-P … Continue reading 通义千问发布Qwen3-Max-Preview,参数量超1万亿
阿里通义千问发布迄今最大模型——Qwen3-Max-Preview
《科创板日报》6日讯,《科创板日报》记者获悉,阿里巴巴旗下通义千问已推出Qwen3-Max-Preview(Instruct),参数量达到1T,为其迄今为止最大的模型,在中英文理解、复杂指令遵循、工具 … Continue reading 阿里通义千问发布迄今最大模型——Qwen3-Max-Preview
3D打印火出圈了?一众网友秀“成果” 幕后推手竟是这款AI模型
《科创板日报》9月1日讯 一张三维建模图、一个手办模型、一个印有“Nano-banana”字样的包装盒……在刚刚过去的周末,朋友圈突然涌现出大量雷同的“3D打印手办”图片。这些手办或是明星角色,或是家 … Continue reading 3D打印火出圈了?一众网友秀“成果” 幕后推手竟是这款AI模型
OpenAI发布GPT-Realtime语音对话模型
每经AI快讯,OpenAI发布语音模型GPT–realtime。GPT–realtime是一个专用于语音AI Agent的多模态模型,能够生成更加自然流畅的语音,完美模仿人类丰 … Continue reading OpenAI发布GPT-Realtime语音对话模型
面壁智能开源8B参数的多模态模型MiniCPM-V 4.5
8月26日,面壁智能正式开源8B参数的MiniCPM-V 4.5多模态模型,具备“高刷”视频理解能力。据介绍,该模型高刷视频理解同级SOTA且性能超过Qwen2.5-VL 72B;同等视觉token开 … Continue reading 面壁智能开源8B参数的多模态模型MiniCPM-V 4.5