编辑|刘毓坤 在中关村论坛的分论坛间隙,智象未来(HiDream.ai)联合创始人兼CTO姚霆坐在一间就近的会议室里,用极快的语速和极高的信息密度,讲述了一家AI视频创业公司在"字节-快手& … 继续阅读 智象未来姚霆:在双寡头格局下,一家AI视频创业公司的生存法则与Agentic未来
标签: 语速
谷歌干掉“请再说一次”!Gemini 3.1毫秒级接话,实时Agent时代来了
编辑:元宇 【新智元导读】语音AI最烦人的一句话,可能终于要被谷歌干掉了。Gemini 3.1 Flash Live 正在逼近「像人与人说话那样响应」的体验:不仅更快、更自然,连在交通声、电视声这样的 … 继续阅读 谷歌干掉“请再说一次”!Gemini 3.1毫秒级接话,实时Agent时代来了
阿里通义语音双模型发布:一句话即可自由生成
凤凰网科技讯 3月2日,阿里通义实验室语音团队发布两款支持FreeStyle指令生成的模型Fun-CosyVoice3.5与Fun-AudioGen-VD。 官方宣称,无论是精细控制声音表达,还是从零 … 继续阅读 阿里通义语音双模型发布:一句话即可自由生成
春晚机器人卖爆了,我们离“人手一台”还有多远?
1996年“春晚”,小品演员郭达往舞台上推了一只写着“ABCD”,印着“丰田”标志的货箱,箱子里藏着一个名叫“缺心眼子”的“进口机器人”。 那时的“机器人”是国人对未来的一种诙谐想象。在大家眼里,“机 … 继续阅读 春晚机器人卖爆了,我们离“人手一台”还有多远?
我们采访了春晚秀武术的宇树机器人,发现它还挺有人味儿的…
跑酷、跳马、后空翻、双截棍、醉拳。。。如果只看这几个关键词,你八成以为这是哪家武术学校的招生简章。 但这回,差评君说的是春晚节目《 武 BOT 》。 几十个机器人依次排开,动作连贯、节奏紧凑,上台就是 … 继续阅读 我们采访了春晚秀武术的宇树机器人,发现它还挺有人味儿的…
性能对标Gemini 2.5 Pro!蚂蚁开源新一代全模态大模型Ming-Flash-Omni 2.0
快科技2月11日消息 今日,蚂蚁集团开源发布全模态大模型 Ming-Flash-Omni 2.0。 在多项公开基准测试中,该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出,部分指标 … 继续阅读 性能对标Gemini 2.5 Pro!蚂蚁开源新一代全模态大模型Ming-Flash-Omni 2.0
中国首款“三全”脑机接口成功完成首例临床试验
在12月13日举办的2025天桥脑科学研究院脑机接口与人工智能论坛上,上海脑虎科技有限公司(以下简称:脑虎科技)宣布了一项里程碑式成果:其自主研发的国内首款、国际第二款内置电池的“三全”(全植入、全无 … 继续阅读 中国首款“三全”脑机接口成功完成首例临床试验
豆包输入法上线,用了两天我在微信聊天不想再打字
如果你用过一些手机系统自带输入法,一定懂那种它好像没学过中文的无力感。 正因如此,第三方输入法才得以遍地开花。 当官方输入法不好用,用户自然会用脚投票。最近字节推出了豆包输入法 1.0 版本,要用 A … 继续阅读 豆包输入法上线,用了两天我在微信聊天不想再打字
微软365 Copilot能“唠嗑”了:移动端上线语音对话功能
IT之家 11 月 5 日消息,微软已正式在 Microsoft 365 Copilot 移动应用中推出语音对话功能,意味着用户可以自然地与 AI 助手进行语音交互,中途打断其回答,并实时获得语音回复 … 继续阅读 微软365 Copilot能“唠嗑”了:移动端上线语音对话功能
刚刚,豆包连发多款大模型:让 DeepSeek更好用,音频版 Sora 惊艳全场
该说不说,都 2025 年了,我问 AI 一个问题,体验却常常两极分化。 简单的事,它秒回,但答得跟没答一样。 复杂的事,让它深度思考,它又要琢磨 30 秒以上。 而每一次回答,AI 都在不断「燃烧」 … 继续阅读 刚刚,豆包连发多款大模型:让 DeepSeek更好用,音频版 Sora 惊艳全场

