IT之家 12 月 31 日消息,阿里通义大模型今日开源发布 Qwen-Image-2512,聚焦于三大核心能力的飞跃式提升:更真实的人物质感、更细腻的自然纹理、更复杂的文字渲染,让生成的图像无限接近 … Continue reading AI人像以假乱真,阿里通义Qwen-Image-2512模型开源发布
标签: 语义
小红书开源InstanceAssemble:让AI精准还原复杂图像排版
IT之家 12 月 26 日消息,小红书携手复旦大学,联合推出布局控制生成(Layout-to-Image)领域的突破性方案 InstanceAssemble,通过创新“实例组装注意力”机制,实现了从 … Continue reading 小红书开源InstanceAssemble:让AI精准还原复杂图像排版
谷歌悄悄上线“AI剪映”,一夜颠覆短视频行业,剪辑师集体慌了
最近,科技圈又炸锅了。 就在上周,谷歌悄悄上线了一款名为 「YouTube Create」 的视频剪辑 App,定位直指 TikTok、Instagram Reels 甚至国内的“剪映”——但它最狠的 … Continue reading 谷歌悄悄上线“AI剪映”,一夜颠覆短视频行业,剪辑师集体慌了
WPS为AI装上“智能解析大脑”
图源:WPS官网 WPS派来的猴子,让复杂文档解析有救了! 人工智能进入大模型时代后,哪一个方向是最炙手可热、竞争最为激烈的赛道?答案可能不唯一,但利用多模态大模型进行文档智能解析绝对算一个。 自20 … Continue reading WPS为AI装上“智能解析大脑”
通义端到端语音交互模型Fun-Audio-Chat发布
凤凰网科技讯 12月23日 通义大模型发布新一代端到端语音交互模型Fun-Audio-Chat。这是通义百聆语音模型系列中,首个主打“语音对语音”交互能力的模型,支持用户直接通过语音与模型进行多轮对话 … Continue reading 通义端到端语音交互模型Fun-Audio-Chat发布
首个虚拟数字人中国标准发布!需精准判断用户喜悦、悲伤情绪
快科技12月18日消息,日前,我国虚拟数字人领域首个国家标准《信息技术 客服型虚拟数字人通用技术要求》正式发布。 据央视新闻报道,该标准的出台填补了行业技术规范空白,为客服型虚拟数字人的研发、生产和应 … Continue reading 首个虚拟数字人中国标准发布!需精准判断用户喜悦、悲伤情绪
新一代万相2.6系列模型发布:支持角色扮演、多镜头生成功能
凤凰网科技讯 12月16日,阿里巴巴旗下通义万相团队发布了新一代万相2.6系列模型。该版本被定义为国内首个支持角色扮演功能的视频生成模型,同时集成了音画同步、多镜头生成及声音驱动等能力。 据悉,万相2 … Continue reading 新一代万相2.6系列模型发布:支持角色扮演、多镜头生成功能
奥尔特曼回顾OpenAI十年之路:成就超预期,AGI不再是梦
IT之家 12 月 13 日消息,OpenAI 首席执行官山姆・奥尔特曼(Sam Altman)于 12 月 11 日在官网发文,回顾 OpenAI 十年间的突破、经验,以及迈向造福全人类的通用人工智 … Continue reading 奥尔特曼回顾OpenAI十年之路:成就超预期,AGI不再是梦
00后大模型实习生“扒光”豆包手机!千字实测揭秘
新智元报道 编辑:桃子 好困 【新智元导读】爆火的「豆包手机」,到底藏了什么狠活?一篇热帖,LLM工程师通过黑盒测试和论文推演,扒出了它的技术机密。 一部AI手机,火爆全网。 张嘴一句话,它在短短几秒 … Continue reading 00后大模型实习生“扒光”豆包手机!千字实测揭秘
麻省理工等用苹果Apple Watch数据开发AI模型,精准预测多种健康状况
IT之家 12 月 10 日消息,麻省理工学院与 Empirical Health 研究人员开展的一项新研究,利用 300 万“人-天”的 Apple Watch 数据,开发出一种基础模型,能够以高度 … Continue reading 麻省理工等用苹果Apple Watch数据开发AI模型,精准预测多种健康状况

