小米发布MiMo-V2.5-TTS/ASR语音大模型:通过自然语言指令调度声音表现

凤凰网科技讯 4月24日,继前一日MiMo-V2.5系列大模型公测后,小米技术团队今日再次加码,正式发布MiMo-V2.5-TTS系列与MiMo-V2.5-ASR,补齐语音输入与输出全链路。 其中,T … 继续阅读 小米发布MiMo-V2.5-TTS/ASR语音大模型:通过自然语言指令调度声音表现

如果有一天周杰伦用AI写歌,你还会听吗?

作者| Moonshot 编辑| 靖宇 三月的最后一周,中文互联网久违地热闹了一次,因为周杰伦发了新专辑《太阳之子》。 专辑一上线,吵得热闹非凡。乐评人挑剔编曲,路人感慨嗓音倒退,歌迷说旋律还是那个味 … 继续阅读 如果有一天周杰伦用AI写歌,你还会听吗?

阿里最强全模态模型登场!实测看懂50分钟《老友记》,全球评测215项SOTA

作者 | 陈骏达 编辑 | 李水青 智东西3月31日报道,昨天,阿里推出了最新一代全模态大模型Qwen3.5-Omni,这是一款能原生理解文本、图片、音频及音视频输入的模型,并能以文本和音频两种模态输 … 继续阅读 阿里最强全模态模型登场!实测看懂50分钟《老友记》,全球评测215项SOTA

大反转!以为是 DeepSeek V4,结果是小米

上周,两个没有署名的匿名模型悄然上架知名 API 聚合平台 OpenRouter,代号分别是「Hunter Alpha」和「Healer Alpha」。它们没有任何宣传,调用量却开始以一种不寻常的速度 … 继续阅读 大反转!以为是 DeepSeek V4,结果是小米

MiniMax为OpenClaw“小龙虾”推出新技能,实现定制音色、创作完整歌曲

IT之家 3 月 9 日消息,今日,MiniMax 宣布将 MiniMax Speech 语音模型和 Music 音乐模型的开放平台接口进行了深度封装,并正式上架到了 OpenClaw 生态中。 IT … 继续阅读 MiniMax为OpenClaw“小龙虾”推出新技能,实现定制音色、创作完整歌曲

阿里通义语音双模型发布:一句话即可自由生成

凤凰网科技讯 3月2日,阿里通义实验室语音团队发布两款支持FreeStyle指令生成的模型Fun-CosyVoice3.5与Fun-AudioGen-VD。 官方宣称,无论是精细控制声音表达,还是从零 … 继续阅读 阿里通义语音双模型发布:一句话即可自由生成

三星Galaxy Buds4/4 Pro无线耳机发布,1399元起

IT之家 2 月 26 日消息,在今日的三星 Galaxy Unpacked 发布会上,三星发布了 Galaxy Buds4 和 Galaxy Buds4 Pro 无线耳机,售价分别为 1399 元和 … 继续阅读 三星Galaxy Buds4/4 Pro无线耳机发布,1399元起

博主不会麻将靠AI眼镜一胡到底 网友建议麻将桌全面取消该设备

快科技2月18日消息,春节期间,麻将是不少家庭放松的保留项目。在AI席卷春节档的当下,一位不会麻将的博主仅凭AI智能眼镜自动算牌、记牌、预判听牌,开启”上帝视角”一把胡到底,引发热议。 有网友直呼这是 … 继续阅读 博主不会麻将靠AI眼镜一胡到底 网友建议麻将桌全面取消该设备

春晚揭秘!蔡明的“大孙子们”,背地里竟在干这些

Jay 发自 凹非寺 量子位 | 公众号 QbitAI 嚯!先是OpenClaw玩转互联网,这下春晚也被机器人占领了。 打开电视,到处都是机器人,简直成了一场硅基生物狂欢节。 宇树、魔法原子、银河通用 … 继续阅读 春晚揭秘!蔡明的“大孙子们”,背地里竟在干这些

性能对标Gemini 2.5 Pro!蚂蚁开源新一代全模态大模型Ming-Flash-Omni 2.0

快科技2月11日消息 今日,蚂蚁集团开源发布全模态大模型 Ming-Flash-Omni 2.0。 在多项公开基准测试中,该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出,部分指标 … 继续阅读 性能对标Gemini 2.5 Pro!蚂蚁开源新一代全模态大模型Ming-Flash-Omni 2.0