数字人直播的逼真度天花板,又被抬高了。
文 | 佘宗明
在吐槽西贝事件风波渐平后,9月22日,罗永浩又现身直播间了——这次依旧是真人不露相,露相的是数字人。
之所以说「依旧」,是因为:今年6月15日,罗永浩数字人就曾在百度优选开启直播首秀。究其效果之逼真,连罗永浩本人看了都直呼「把我自己都吓一跳」。
这次罗永浩数字人在百度优选再度开播,将数字人主播逼真度的天花板又往上抬了一截。看完之后,我的第一感受是:这场直播,真的毫无「预制感」。
都知道,前不久罗永浩VS西贝(贾国龙)掀起了预制菜之争,而之前在直播间里以呆板表情、机械反应沦为文字复读机的主播数字分身,未尝不是数字人版的「预制菜」。
如果说2D纸片人式的传统数字人承载不起为直播电商「降本增效」的厚望,那罗永浩数字人的再播,无疑让人看到了AI重塑直播电商的无限可能——在「高说服力数字人」的「高」字比Pro更Max时,用数字人将直播电商重做一遍的图景还会远吗?
01
说这场直播毫无「预制感」,是因其首次实现了无缝衔接式的AI换品——工作人员只需上传1张图,即可实现数字人带新品。
别小看这么个动作,它看起来似乎很简单,实则数字人直播场景的历史性突破。
要知道,传统数字人直播的核心桎梏就在于「内容预制不可变」,主播动作、商品展示均需提前通过固定规范进行录制。这意味着,只要涉及新品上架,便要重新搭建场景、拍摄动作,成本极高,周期很长。碰上快消、3C等品类,传统数字人的「慢半拍」反应,根本无法满足直播电商「快速上新,灵活选品」之需。
受制于既有短板,预制动作与新品形态适配度也经常不足,会出现诸如「音容不匹配、商品展示不自然」等问题。
但在9月22日的直播中,罗永浩数字人连续展示了多款从未带过的新品,切换丝滑,动作连贯,讲解自然,分明给人「数字人进化成精」的既视感。
▲罗永浩数字人9月22日的直播画面。
AI换品一气呵成,离不开慧播星背后的高一致性超拟真数字人长视频生成技术。
该技术基于数字人视频生成大模型,使用单张商品图即可实现极其自然、保持商品细节的人-商品交互视频生成,大幅降低成本,提升带新品效率。
02
说这场直播毫无「预制感」,还是因其显著强化了数字人的环境感知能力——通过融合实时时间轴与动态信息库,让互动回复兼具时效性与人格化特征。
为什么此前数字人直播的用户平均停留时长总是受限?有个重要原因就在于,直播电商的核心竞争力在于「实时互动感」,传统数字人却动辄深陷「有问无答」或「答非所问」的泥潭:一方面,是缺乏「时间与热点感知能力」,另一方面,是缺乏「人设关联能力」。
但在这次直播中,罗永浩数字人却能在用户评论「国庆前无心上班」时,立刻以「我上班时也不想上班」的罗氏口吻共情;当讲解到汾酒时,又能自然幽默地说「听说数字人要连播两场的微博发出后,百度股价涨了不少」的实时热点,同时还不忘推荐网友下单「很适合来一单汾酒庆祝一下」……简直是「老罗本罗」。
▲罗永浩数字人的直播风格堪称「老罗本罗」。
促成这点的,是百度慧播星对「时间感知+热点感知」双重能力的强化:在时间感知层面,系统内置「节日-赛事-热点」三级日历,可自动关联「国庆(中秋)放假」等话题;人设感知层面,实时抓取罗永浩微博、开播等信息,生成「个人动态记忆库」,继而让回复兼具时效性与人格化,而不是照模板答话。
就拿人设还原缺失难题来说,系统会通过对罗永浩过往直播和播客内容的海量学习,精准捕捉了其「硬核理性+适度幽默+真诚种草」的人设内核,实现「思维特征、幽默特质、语言风格」的复刻。
正因神形兼备的延展互动,罗永浩数字人此次直播,用户互动频次比3个月前的增长了21%,回复优质率暴涨107%。
在此过程中,罗永浩数字人在逻辑、幽默、带货三位一体的「超拟真」中承接了罗永浩IP的商业价值,解决了「数字人难延续IP影响力」的难题。这让刘润此前的判断来得愈发真切:我们正在见证全新商业模式的诞生,它就是IP as a Service(IP即服务)。
03
AI换品能力实现与问答互动能力升级,是百度慧播星数字人技术领先性的再加固。
过去几年,数字人直播面临的处境是:一边是外部期望很高,将其视作AI的下个规模化落地场景,一边是实际效果一般,看着那「帧漂移」的卡顿画面、台词跟表情错位的游离画风,很多人会忍不住将传统数字人跟「五毛特效」画等号。
但作为业界首个AI全栈式数字人直播解决方案的慧播星,凭着6月15日那几项「业内首次」,让很多人看到了李彦宏所说的「高说服力数字人」的魔力。
▲罗永浩数字人在百度优选的直播首秀,创造了N个「业界首次」。
「业内首次」,其一是首次实现超头主播用数字人直播带货;其二是首次突破多数字人同框直播;其三是首次将AI视频生成极限拉升至超6小时。
这背后是百度慧播星的路径革新:它没有沿袭传统数字人技术语言、语音、视觉三条线各自生成内容后再拼接的模式,而是利用剧本驱动的数字人多模协同、融合多模规划与深度思考的剧本生成、动态决策的实时交互、文本自控的语音合成、高一致性超拟真数字人长视频生成等创新技术,实现了数字人「神、形、音、容、话」的全模态高度统一。
因而首次亮相的罗永浩数字人能跳出传统数字人「预制脚本+机械动作」的初级阶段,凭着「剧本生成—动作调度—语音合成—交互决策」的全链路智能协同惊艳四座。
而此次罗永浩数字人直播,又在此基础上进行了核心能力升级,强化了数字人「实时决策+自然交互+商品共创」的能力,实现了从虚拟替身到智能主播的跨越。
在直播中,有个细节是:有观众留言十一去哪里玩的时候,罗永浩数字人接话「马上十一了,出去玩的朋友很适合带上我们这款面膜。这个品牌,懂得都懂,我就不多说了」。这表明,它能将话术拆解为「热点互动」与「带货的品质承诺」,再用能体现选品靠谱人设的适当逻辑延展回应。
▲罗永浩数字人果然是懂直播的。
它依托的,就是文心大模型4.5 Turbo的技术能力:高说服力数字人具备的多模协同、⾼表现⼒、复杂交互等特点,本就是语⾔、视觉、语⾳深度融合等⼤模型能⼒的集中展示。
04
得益于此,在Anthropic、OpenAI等国外AI巨头正投入巨资打造「虚拟员工」时,百度已经秀出了罗永浩数字人这类标杆性应用案例,率先实现数字人业务的规模化盈利,呈现了技术落地上的优势。
IDC报告显示,百度慧播星在技术能力、产品表现、平台合规与稳定性、客户服务四项指标中均位列行业第一,就是对这份优势的盖章确认。
从效果上看,无论是6月15日直播GMV突破5500万元,还是9月22日复播互动创新高,抑或是3C、食品等核心品类的带货单量超过以往,都表明了其可以超越真人的效果。
揆诸现实,百度慧播星的突破,正引发行业对「数字人价值」的重新认知。
以往多数数字人厂商仅提供单一技术模块(如视觉生成或语音合成),导致商家需对接多个供应商,面临「技术碎片化、整体适配难」的痛点。如今慧播星提供从模型训练、动作生成到互动决策的全流程服务,可以让企业的数字人多维需求得到一站式满足。
以往直播行业生态还停留在移动互联网阶段,现在慧播星则在带动上下游循着AI的方向升级:上游,素材服务商开始优化商品图片/视频的「AI适配性」;中游,催生出「数字人训练师」「AI脚本策划」等新职业;下游,品牌开始重构「数字人直播选品逻辑」。
而带动行业重新认识数字人价值的百度,也得到市场估价尺度的重新丈量。
9月22日直播当天,百度集团股价冲高至138美元,创近两年新高,近20个交易日累计涨幅超50%。
▲罗永浩数字人称百度股价因其大涨的消息上了热搜。
这跟百度高说服力数字人等代表性AI应用带动不无关系:在2024年以9.8%的市场份额位居中国AI数字人行业市场第一的基础上,其数字人业务仍在呈现高速增长态势——尤其是在罗永浩数字人等案例用「技术—产品—收入」的闭环打破了落地难的质疑后。
时至今日,数字人跟萝卜快跑等已成百度AI跑马场里跑出的典型性超级应用,也成了百度估值中枢上移、股价市值上涨的核心催化剂。
05
本质上,罗永浩数字人的成功,并非「技术替代人」的胜利,而是「技术解决痛点」的结果。
这里面,蕴含了百度对于「AI何为」的回答:技术进步的意义,不在于替代,而是通过解决痛点让商业回归「效率与价值」的本质。罗永浩数字人,就是这场变革的直观注脚。
百度慧播星数字人提升效率、创造价值的途径,就是以AI为支点,打破直播电商的「不可能三角」——低成本、长时长、高转化。
以前数字人直播虽然承载了降本增效的期许,但让市场看到的只是概念、故事和Demo,现在百度真正给出了「可落地、可盈利、可延续」的系统性解决方案,让「用数字人实现盈利」的冀望不再只是奢望。
随之而来的,是AI时代被人机共生新生态重塑的新直播电商图景。按刘润的说法就是,直播电商的「自动驾驶」时代正在到来。
当数字人可以妥善承接标准化、长时间、高体力的直播场景后,得到解放的真人主播也就可以聚焦深耕创意、选品、私域、品牌建设等高阶价值。这样的人机协作「1+1」模型(由凯文·凯利提出),也能更好地助益企业用直播电商这条路发掘增量。
当无数企业降本增效、直播行业规则改写被一根「用更低成本创造更大价值」的绳子串起,那超拟真数字人的价值释放必然会被更多人感知。
就此看,罗永浩数字人这张多米诺骨牌引发的连锁反应,才刚刚开始。