语速 – 冯金伟博客园

罗振宇实测的这款AI工具，正在重塑口播视频创作的竞争格局

日渐复杂的短视频创作工具正在逐步杀死普通人的表达欲。随便问一个普通人：“你上周发过视频吗？”答案大概率是没有。不是不想，是不会。不是没内容，是一想到要背稿、要录、要剪、要做封面，那点表达欲就死了。 … 继续阅读罗振宇实测的这款AI工具，正在重塑口播视频创作的竞争格局

编辑｜刘毓坤在中关村论坛的分论坛间隙，智象未来（HiDream.ai）联合创始人兼CTO姚霆坐在一间就近的会议室里，用极快的语速和极高的信息密度，讲述了一家AI视频创业公司在"字节-快手& … 继续阅读智象未来姚霆：在双寡头格局下，一家AI视频创业公司的生存法则与Agentic未来

编辑：元宇【新智元导读】语音AI最烦人的一句话，可能终于要被谷歌干掉了。Gemini 3.1 Flash Live 正在逼近「像人与人说话那样响应」的体验：不仅更快、更自然，连在交通声、电视声这样的 … 继续阅读谷歌干掉“请再说一次”！Gemini 3.1毫秒级接话，实时Agent时代来了

凤凰网科技讯 3月2日，阿里通义实验室语音团队发布两款支持FreeStyle指令生成的模型Fun-CosyVoice3.5与Fun-AudioGen-VD。官方宣称，无论是精细控制声音表达，还是从零 … 继续阅读阿里通义语音双模型发布：一句话即可自由生成

1996年“春晚”，小品演员郭达往舞台上推了一只写着“ABCD”，印着“丰田”标志的货箱，箱子里藏着一个名叫“缺心眼子”的“进口机器人”。那时的“机器人”是国人对未来的一种诙谐想象。在大家眼里，“机 … 继续阅读春晚机器人卖爆了，我们离“人手一台”还有多远？

跑酷、跳马、后空翻、双截棍、醉拳。。。如果只看这几个关键词，你八成以为这是哪家武术学校的招生简章。但这回，差评君说的是春晚节目《武 BOT 》。几十个机器人依次排开，动作连贯、节奏紧凑，上台就是 … 继续阅读我们采访了春晚秀武术的宇树机器人，发现它还挺有人味儿的…

快科技2月11日消息今日，蚂蚁集团开源发布全模态大模型 Ming-Flash-Omni 2.0。在多项公开基准测试中，该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出，部分指标 … 继续阅读性能对标Gemini 2.5 Pro！蚂蚁开源新一代全模态大模型Ming-Flash-Omni 2.0

在12月13日举办的2025天桥脑科学研究院脑机接口与人工智能论坛上，上海脑虎科技有限公司（以下简称：脑虎科技）宣布了一项里程碑式成果：其自主研发的国内首款、国际第二款内置电池的“三全”（全植入、全无 … 继续阅读中国首款“三全”脑机接口成功完成首例临床试验

如果你用过一些手机系统自带输入法，一定懂那种它好像没学过中文的无力感。正因如此，第三方输入法才得以遍地开花。当官方输入法不好用，用户自然会用脚投票。最近字节推出了豆包输入法 1.0 版本，要用 A … 继续阅读豆包输入法上线，用了两天我在微信聊天不想再打字

IT之家 11 月 5 日消息，微软已正式在 Microsoft 365 Copilot 移动应用中推出语音对话功能，意味着用户可以自然地与 AI 助手进行语音交互，中途打断其回答，并实时获得语音回复 … 继续阅读微软365 Copilot能“唠嗑”了：移动端上线语音对话功能