编码器 – 冯金伟博客园

小米斩获CVPR 2026 NTIRE赛事三项奖项，影像算法取得技术突破

IT之家 5 月 19 日消息，小米技术官方宣布，近日，小米在 CVPR 2026 NTIRE 赛事中获三项奖项。其中，小米玄戒多媒体算法团队夺得高效超分辨率赛道冠军，小米大模型应用团队获人像修复赛道 … 继续阅读小米斩获CVPR 2026 NTIRE赛事三项奖项，影像算法取得技术突破

跟大模型聊天的时候他到底在想什么？是真想稳稳地「把我接住」，还是背后在蛐蛐「用户怒了」。看思维链？有用，但还不够。前些天，一个复旦大学的研究团队对 9 个模型进行了安全测试。结果发现，常规条件 … 继续阅读别让AI抓住你的把柄，它可能真会威胁你

IT之家 3 月 17 日消息，科技媒体 9to5Mac 昨日（3 月 16 日）发布博文，报道称苹果 AI 研究团队发布研究报告，攻克了 3D 重建领域的一项核心难题：仅通过单张平面图像，就能重建出 … 继续阅读苹果发布LiTo大模型：单图生成3D对象，AI高度还原多视角光影

IT之家 2 月 9 日消息，宁美旗下名龙星球现已上线新款无线游戏鼠标 MX301 PRO。这一型号采用复合碳纤维材质，三维 120.9×62.7×38.2 (mm)，重 57 … 继续阅读名龙星球上线MX301 PRO鼠标：复合碳纤材质，原相3315传感器

拿捏机器人找准位置不迷路难题，代码、检查点已开源。作者 | 程茜编辑 | 漠影机器人前瞻1月27日报道，今日，蚂蚁集团旗下具身智能公司灵波科技正式开源高精度空间感知模型LingBot-Depth … 继续阅读蚂蚁灵波开源高精度空间感知模型！机器人在透明、反光场景不掉链子

编辑：定慧好困【新智元导读】DeepSeek开源DeepSeek-OCR2，引入了全新的DeepEncoder V2视觉编码器。该架构打破了传统模型按固定顺序（从左上到右下）扫描图像的限制，转而模 … 继续阅读 DeepSeek又拿第一！首创“因果流”视觉推理，超越Gemini

▲头图由AI生成这一框架可用于集成额外文本、语音和视觉等多种模态。作者 | 陈骏达编辑 | 云鹏智东西1月27日报道，刚刚，DeepSeek开源了其面向OCR场景的专用模型DeepSeek-O … 继续阅读 DeepSeek最新王炸模型：VLM架构重磅突破，AI像人一样读图

IT之家 1 月 22 日消息，小米创办人、董事长兼 CEO 雷军今日宣布，小米多项 AI 创新成果入选国际顶级会议 ICASSP 2026，包括音频理解、音乐生成评估、通用音频 – 文本 … 继续阅读雷军官宣小米多项AI创新成果入选国际顶级会议ICASSP 2026

AI变聪明的真相居然是正在“脑内群聊”？！谷歌最新研究表明，DeepSeek-R1这类顶尖推理模型在解题时，内部会自发“分裂”出不同性格的虚拟人格，比如外向的、严谨的、多疑的…… 大模型的解题推理过 … 继续阅读谷歌新发现：DeepSeek推理分裂出多重人格，左右脑互搏越来越聪明

感谢AI！原生1个G的视频，现在只需要传200K数据就能看了—— 视频数据的压缩率干到了0.02%，但依旧能保持画面的高清、连贯和画面细节。或许你会问，这又有什么用呢？想象一下，你身处于太平洋的 … 继续阅读不得了，这个新技术把视频压缩到了0.02%