新一代万相2.6系列模型发布:支持角色扮演、多镜头生成功能

凤凰网科技讯 12月16日,阿里巴巴旗下通义万相团队发布了新一代万相2.6系列模型。该版本定义为国内首个支持角色扮演功能视频生成模型,同时集成了音画同步、多镜头生成及声音驱动等能力

据悉,万相2.6在技术层面通过多模态联合建模,可对输入视频的时序信息主体特征声学要素进行学习,旨在实现生成视频在画面声音上的整体一致性。其分镜控制功能可依据语义理解,将原始素材构建为包含多镜头切换的专业叙事段落

此次升级重点提升了画质音效指令遵循能力,单次生成视频时长最高支持15秒。新增的角色扮演功能允许用户上传个人视频并结合提示词,模型可自动完成分镜设计、角色演绎与配音,生成具备电影感运镜的短片。该能力主要面向广告设计短剧制作等专业场景

目前,万相模型家族已具备文生图、图像编辑文生视频等十余种视觉创作能力。即日起,用户可通过官网体验万相2.6,企业用户也可通过阿里云百炼平台调用模型API。

新一代万相2.6系列模型发布:支持角色扮演、多镜头生成功能

Published by

风君子

独自遨游何稽首 揭天掀地慰生平