凤凰网科技讯 8月6日,商汤科技官方宣布“日日新”大模型交互平台“商量”已探索性接入小米AI眼镜,帮助用户在生活与工作的真实场景中,实现“看、说、记、想”一体化,具备全双工实时音视频交互能力。
据介绍,传统智能设备的交互体验,常受限于响应延迟、语境断裂与单向输入。小米AI眼镜×商汤日日新组合的亮点之一,在于其全双工实时音视频交互能力。这并非简单的语音指令接龙或“一问一答”的半双工拼接,而是构建了类似人与人对话的自然、流畅、不间断的交互闭环,例如逛街逛展进行实时识别,化身问答小百科;出国旅游又能成为翻译助手,在这些场景均展现了强大的实力:
毫秒级响应,思考即交流:依托“日日新”强大的模型推理能力与底层优化,交互延迟被压缩至毫秒级,用户言语未落,理解已经开始,回应几乎实时生成。
语境连续不中断:“日日新”大模型能深度理解上下文,精准跟踪对话脉络,支持随时打断、纠偏和深入追问,对话如同与真人助手般自然流畅。
复杂环境反馈超稳定:即使在嘈杂的展馆人潮或喧闹的街头,其抗噪性能升级也能确保指令被精准捕捉、理解无误。
深度分析,记忆加持:结合音视频记忆与检索技术,系统能即时关联历史沟通细节(如在向客户复述方案时),提供极具针对性的信息支持。
据此前WAIC 2025大模型论坛上商汤科技发布的信息,商汤“日日新V6.5”大模型更新后,交互性能也大幅提升,多模态交互能力超越Gemini 2.5 Flash和GPT-4o,各方面性能突出。