实时音视频交互、毫秒级响应，商汤“日日新”大模型交互平台接入小米AI眼镜

凤凰网科技讯 8月6日，商汤科技官方宣布“日日新”大模型交互平台“商量”已探索性接入小米 AI 眼镜，帮助用户在生活与工作的真实场景中，实现“看、说、记、想”一体化，具备全双工实时音视频交互能力。

据介绍，传统智能设备的交互体验，常受限于响应延迟、语境断裂与单向输入。小米 AI眼镜×商汤日日新组合的亮点之一，在于其全双工实时音视频交互能力。这并非简单的语音指令接龙或“一问一答”的半双工拼接，而是构建了类似人与人对话的自然、流畅、不间断的交互闭环，例如逛街逛展进行实时识别，化身问答小百科；出国旅游又能成为翻译助手，在这些场景均展现了强大的实力：

毫秒级响应，思考即交流：依托“日日新”强大的模型推理能力与底层优化，交互延迟被压缩至毫秒级，用户言语未落，理解已经开始，回应几乎实时生成。

语境连续不中断：“日日新”大模型能深度理解上下文，精准跟踪对话脉络，支持随时打断、纠偏和深入追问，对话如同与真人助手般自然流畅。

复杂环境反馈超稳定：即使在嘈杂的展馆人潮或喧闹的街头，其抗噪性能升级也能确保指令被精准捕捉、理解无误。

深度分析，记忆加持：结合音视频记忆与检索技术，系统能即时关联历史沟通细节（如在向客户复述方案时），提供极具针对性的信息支持。

实时音视频交互、毫秒级响应，商汤“日日新”大模型交互平台接入小米AI眼镜

据此前WAIC 2025大模型论坛上商汤科技发布的信息，商汤“日日新V6.5”大模型更新后，交互性能也大幅提升，多模态交互能力超越Gemini 2.5 Flash和GPT-4o，各方面性能突出。

实时音视频交互、毫秒级响应，商汤“日日新”大模型交互平台接入小米AI眼镜

实时音视频交互、毫秒级响应，商汤“日日新”大模型交互平台接入小米AI眼镜

Published by

风君子

最新文章

标签

书签