小米斩获CVPR 2026 NTIRE赛事三项奖项,影像算法取得技术突破

IT之家 5 月 19 日消息,小米技术官方宣布,近日,小米在 CVPR 2026 NTIRE 赛事中获三项奖项。其中,小米玄戒多媒体算法团队夺得高效超分辨率赛道冠军,小米大模型应用团队获人像修复赛道 … 继续阅读 小米斩获CVPR 2026 NTIRE赛事三项奖项,影像算法取得技术突破

别让AI抓住你的把柄,它可能真会威胁你

跟大模型聊天的时候他到底在想什么? 是真想稳稳地「把我接住」,还是背后在蛐蛐「用户怒了」。 看思维链?有用,但还不够。 前些天,一个复旦大学的研究团队对 9 个模型进行了安全测试。 结果发现,常规条件 … 继续阅读 别让AI抓住你的把柄,它可能真会威胁你

苹果发布LiTo大模型:单图生成3D对象,AI高度还原多视角光影

IT之家 3 月 17 日消息,科技媒体 9to5Mac 昨日(3 月 16 日)发布博文,报道称苹果 AI 研究团队发布研究报告,攻克了 3D 重建领域的一项核心难题:仅通过单张平面图像,就能重建出 … 继续阅读 苹果发布LiTo大模型:单图生成3D对象,AI高度还原多视角光影

蚂蚁灵波开源高精度空间感知模型!机器人在透明、反光场景不掉链子

拿捏机器人找准位置不迷路难题,代码、检查点已开源。 作者 | 程茜 编辑 | 漠影 机器人前瞻1月27日报道,今日,蚂蚁集团旗下具身智能公司灵波科技正式开源高精度空间感知模型LingBot-Depth … 继续阅读 蚂蚁灵波开源高精度空间感知模型!机器人在透明、反光场景不掉链子

DeepSeek又拿第一!首创“因果流”视觉推理,超越Gemini

编辑:定慧 好困 【新智元导读】DeepSeek开源DeepSeek-OCR2,引入了全新的DeepEncoder V2视觉编码器。该架构打破了传统模型按固定顺序(从左上到右下)扫描图像的限制,转而模 … 继续阅读 DeepSeek又拿第一!首创“因果流”视觉推理,超越Gemini

DeepSeek最新王炸模型:VLM架构重磅突破,AI像人一样读图

▲头图由AI生成 这一框架可用于集成额外文本、语音和视觉等多种模态。 作者 | 陈骏达 编辑 | 云鹏 智东西1月27日报道,刚刚,DeepSeek开源了其面向OCR场景的专用模型DeepSeek-O … 继续阅读 DeepSeek最新王炸模型:VLM架构重磅突破,AI像人一样读图

雷军官宣小米多项AI创新成果入选国际顶级会议ICASSP 2026

IT之家 1 月 22 日消息,小米创办人、董事长兼 CEO 雷军今日宣布,小米多项 AI 创新成果入选国际顶级会议 ICASSP 2026,包括音频理解、音乐生成评估、通用音频 – 文本 … 继续阅读 雷军官宣小米多项AI创新成果入选国际顶级会议ICASSP 2026

谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

AI变聪明的真相居然是正在“脑内群聊”?! 谷歌最新研究表明,DeepSeek-R1这类顶尖推理模型在解题时,内部会自发“分裂”出不同性格的虚拟人格,比如外向的、严谨的、多疑的…… 大模型的解题推理过 … 继续阅读 谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

不得了,这个新技术把视频压缩到了0.02%

感谢AI! 原生1个G的视频,现在只需要传200K数据就能看了—— 视频数据的压缩率干到了0.02%,但依旧能保持画面的高清、连贯和画面细节。 或许你会问,这又有什么用呢? 想象一下,你身处于太平洋的 … 继续阅读 不得了,这个新技术把视频压缩到了0.02%