对标Nano Banana Pro,阿里、字节同一天发布图像生成模型,AI生图将迎来规模化应用市场?

中美AI竞速,角逐正酣。

2月10日,阿里和字节同一天发布了新图像生成模型,两家大厂均对标谷歌Nano Banana Pro。

其中,阿里Qwen-Image-2.0聚焦语义理解与实用编辑,统一生成与编辑架构,强化中文汉字渲染能力,可更好地理解超长、复杂的实用化指令;字节Seedream5.0 Preview则主打检索生图与精细调控,显著提升提示词理解准确率,支持更精细的纹理生成与可控调整,深度适配内容创作全流程。

2月11日,有算力运营商向《每日经济新闻》记者(以下简称每经记者)透露,目前AI在电商场景中有不少应用,一类是数字人对token(最小文本单元)的消耗量比较明显,另一类是电商AI生图的消耗。千问大模型高级解决方案架构师熊撼天在接受每经记者采访时表示,此次更新的Qwen-Image-2.0模型,也基于电商场景在商品生产细节和文字可控度、二次编辑等方面进行优化。

值得注意的是,当前AI生图已经不局限于视觉创作,更进一步走向企业级、规模化应用的赛道中。2025年图像生成技术逐步渗透到电商场景、漫剧市场中,随着AI生图技术进步,2026年能迎来规模化应用市场吗?

对标Nano Banana Pro,国产AI生图模型再进化

2月10日,阿里和字节都发布了图像生成模型。阿里千问发布新一代图像生成及编辑模型Qwen-Image-2.0,字节跳动旗下剪映、字节AI创作平台小云雀等平台上线图像生成模型Seedream5.0 Preview,两款模型都对标谷歌Nano Banana Pro。

据阿里千问方面介绍,Qwen-Image-2.0支持1K token的超长文字输入和2K高分辨率,可准确渲染复杂指令,轻松生成专业的PPT及信息图。同时,Qwen-Image-2.0在Qwen-Image和Qwen-Image-Edit两大模型基础上全新升级,首次将图像生成和编辑统一到一个模型中,以更轻量的模型架构,实现了生图和改图性能的大幅提升。

而字节方面则表示,Seedream 5.0 Preview的图像支持2K和4K分辨率输出,目前用户可以在即梦平台免费体验2K输出效果。

有上市公司资深研发高管向每经记者表示,此前也经常用AI生图技术制作PPT和企业产品图,但文字细节和图片的一致性等问题,仍存在一些瑕疵。

千问Qwen视觉生成负责人吴晨飞表示,AI生图文字细节崩溃主要是两方面原因。其一,当前图像生成模型普遍采用VAE(变分自动编码器)技术,而VAE的重构过程对图像中文字的处理影响显著,特别是小尺寸文字。这是由于VAE本质上是一种压缩机制,当图像中文字内容较多时,生成难度将显著提升,且受限于VAE的处理能力上限。其二,受限于图像生成模型的建模能力。VAE决定了模型的能力上限,而生成模型的建模能力则直接影响图像生成的真实度与细节还原质量。

AI生图离企业级应用还有多远?

目前,随着AI生图模型迭代,其在电商和漫剧市场的应用备受关注,资本市场上AI漫剧概念持续升温。

2月11日,艾媒咨询CEO兼首席分析师张毅在接受每经记者采访时表示,目前AI漫剧制作,主流途径是AI生成图片,由图片视频化,再搭配AI配音、字幕,来完成出片,这是目前行业比较标准的形态。

东吴证券就在研报中指出,AI可以使漫剧制作成本降低90%。中文在线AI动漫部总经理周立强此前曾表示,AI把传统漫剧的11个繁复制作流程,精简为剧本创作、图片生成、图转视频、后期加工4个步骤,大大提高生产速度。

而问题的症结之一是AI漫剧极为依赖抽卡生成模式。这一模式最大的问题在于,最终的生成效果几乎完全取决于AI自身的理解、推理能力,抽卡师唯一能做的只有打磨提示词。

iMedia Research(艾媒咨询)数据显示,多数用户肯定AI技术在降低制作成本(51.2%)与加快IP转化(47.7%)方面的价值。同时,近半数用户亦指出其在画面风格统一性(47.1%)与配音情感表现(46.7%)上存在明显不足。

张毅认为,当前AI漫剧市场迎来爆发式增长。AI技术对漫剧行业的影响兼具机遇与挑战,既通过降低制作成本、加快IP转化等推动行业生产效率与内容形态升级,也因画风统一度、配音质感及角色塑造等质量问题,倒逼行业在追求规模化的同时强化内容创意与品质把控。

AI漫剧之外,AI生图正在悄然改变的另一大市场是电商场景。

电商购物场景中存在大量图片使用需求。2月11日,有算力运营商向记者透露,AI生图是当前除数字人外,电商客户消耗token比较大的一个需求。

熊撼天向每经记者表示,电商场景是千问Qwen-Image模型落地的主流场景之一,此次更新的Qwen-Image-2.0也基于电商场景应用,在此前模型基础上进行了升级和优化,有望推动企业级应用落地。

以电商场景为例,熊撼天表示,商品详情页描述图、模特穿搭效果,可以更好地结合新的图像生成模型完成。相较于上一代图像生成模型需要通过二次编辑等完成可控的商品出图,新模型迭代将图片编辑和生成任务融合在一个模型中实现,从而实现电商卖家的效率提升。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平