新一代万相2.6系列模型发布：支持角色扮演、多镜头生成功能

凤凰网科技讯 12月16日，阿里巴巴旗下通义万相团队发布了新一代万相2.6系列模型。该版本被定义为国内首个支持角色扮演功能的视频生成模型，同时集成了音画同步、多镜头生成及声音驱动等能力。

据悉，万相2.6在技术层面通过多模态联合建模，可对输入视频的时序信息、主体特征及声学要素进行学习，旨在实现生成视频在画面与声音上的整体一致性。其分镜控制功能可依据语义理解，将原始素材构建为包含多镜头切换的专业叙事段落。

此次升级重点提升了画质、音效与指令遵循能力，单次生成视频时长最高支持15秒。新增的角色扮演功能允许用户上传个人视频并结合提示词，模型可自动完成分镜设计、角色演绎与配音，生成具备电影感运镜的短片。该能力主要面向广告设计、短剧制作等专业场景。

目前，万相模型家族已具备文生图、图像编辑、文生视频等十余种视觉创作能力。即日起，用户可通过官网体验万相2.6，企业用户也可通过阿里云百炼平台调用模型API。

新一代万相2.6系列模型发布：支持角色扮演、多镜头生成功能

Published by

风君子

独自遨游何稽首揭天掀地慰生平 View all posts by 风君子