梦瑶 发自 凹非寺
量子位 | 公众号 QbitAI
李飞飞世界模型新成果又又又来了!
World Labs直接一口气放出了两款新模型:Marble 1.1和Marble 1.1-Plus。
主打一个——几分钟,就能把真实地点「搬」进3D世界~(开眼啦.jpg)
例如,随手拍几张房间的多视角照片然后喂给模型,我们就能得到一个能自由查看、带空间感的完整3D房间:

哪怕只有一张普通照片,它也能直接往外长出一个超超超大视野的3D世界,是不是有点VR眼镜的效果了!

还没完,因为除了能用平面生成3D世界外——
模型还能将原本高糊的画面提高清晰度,提高画面亮度对比度,最后生成一个视觉细节更丰富的视觉效果:

网友看到这效果,真·蚌埠住了,直言:这简直是每个室内设计师的梦想!!

(你还真别说,我第一反应也是感觉好适合家装行业用啊??)
Marble 1.1系列模型一手实测
虽说两款模型都属于Marble 1.1字辈儿的同系列模型,但是吧,俩模型在生成能力上还是各有侧重点的。
具体区别我也帮大家浅浅总结了一下:
*Marble 1.1模型:更偏向画质优化,重点提升光照和明暗对比,前代里常见的过曝、泛白这类问题会明显减少。
*Marble 1.1-Plus模型:更偏向空间生成,能在原有平面图基础上自动补出更大的3D覆盖范围,拉出一个更完整、更开阔的大世界。
(省流版:1.1更适合拿来提画质,1.1-Plus更适合拿来做更大范围的3D世界)

使用方法也非常简单,我们直接在Marble官网中选择对应的模型就可以使用了。
(而且我发现即便是新用户也默认有几千积分,大概可以生成个4次的样子??!!)

话不多说,我们直接实测走起,先来考一下Marble 1.1的画面处理能力如何!
这次我给Marble 1.1喂了一张ChatGPT生成的《我的世界》同款风格的视觉平面图,长这样子:

△ 参考图
大概等了3~5分钟,一个可以360度自由切换视角、空间感很强的3D游戏世界就被roll出来了,be like:

△ Marble 1.1输出效果
前面我们也提到过,Marble 1.1模型最大的亮点就是「画质」上的体现。
从这组输入输出的对比来看,成片后的分辨率并没有啥问题,而且几乎可以说是1:1还原,画面里也没有冒出特别明显的噪点。
不仅如此生成结果在色彩表现上更饱满一点,空间里的光感也更完整了,整体质感还是非常ok的!!
我们干脆趁热打铁,同一张图,我们再丢给Marble 1.1-Plus,康康模型会整出什么花活~
(狠狠吐槽一下:1.1-Plus模型的生成等待时间比1.1翻了一倍…)

(我等,我等,我狂等)

△ Marble 1.1-Plus输出效果
咋说呢,从整体的视觉延展度度确实感觉比1.1模型更好。
同样一张图,Marble 1.1-Plus拉出来的空间尺度会更大一些,画面往远处铺开的感觉也更明显。(大家觉着呢)
but——问题也来了。
和刚才1.1的结果放在一起对比之后,会发现1.1-Plus在画质细节上反而稍微吃亏一点,整体看上去有一点发糊??
(省流版:如果是单纯玩玩的话,建议大家那点免费的积分留着给Marble 1.1吧…)
官方和实测案例看过了,接下来我们看看网友们用两个模型都玩出了啥东西~
先看下面这位网友,直接用Marble 1.1把自己的工作室做成了一个超大3D空间,你别说,甚至有点像游戏里的密室逃脱游戏??

再看下面这位网友,直接生成了一个巨大无比的家居仓库,那种一眼望不到头的空间感一出来,压迫感居然还挺强,甚至有点惊悚片现场的意思了:

画风,朝着更离谱的方向发展了。
比如这位朋友,直接roll出来了个真实的拳击游戏竞技场,真实感狠狠拿捏住了(但这个巨型人头属实把我吓了一跳!):

当然除了实测效果外,大家很关心的「定价问题」也值得说说。
官方定价页面显示,Marble 1.1的生成消耗均为1,500积分,和上一代价格保持一致。
换句话说就是同样的积分,换来新一代模型,性价比明显更高??
但是对于需要生成更大视野范围的1.1-Plus来说嘛,则需要在原本积分基础上再消耗一些credit…

此外,关于如何上手这些模型官方也给出了一些建议——建议新用户直接从Marble 1.1开始使用。
所以我们也不难看出,World Labs自身也认为1.1已经能完全接替1.0标准版的位置了。(我猜)

API方面呢,目前默认调用的仍是上一代Marble 1.0,但官方表示后续会将默认模型切换为Marble 1.1,大家可以蹲蹲。
另外,此前的Marble-0.1-plus、Marble-0.1-mini等旧命名后续会逐步移除,并统一映射到1.0系列:

OMT
其实如果我们把这次新发布的Marble 1.1放回到World Labs自己的技术路线里看,它其实更接近他们这两年反复强调的一个关键词——spatial intelligence(空间智能)。
从这次发布的两个新模型的表现来看,也确实能感觉到模型在「空间能力」上的明显提升:
Marble 1.1让输出画质质量更强,Marble 1.1-Plus让空间覆盖范围更广,也算是对技术路线又一次比较具体的落地展现了。
当然了,问题嘛,也很明显。
大家也发现了,那就是现阶段的世界模型,似乎还很难完美兼顾 「大空间」与「高画质」……
像Marble 1.1-Plus这种能大范围扩展空间的模型,面对输入图之外的未知区域,本质上是在做智能脑补。
为了保证庞大场景的逻辑自洽,模型往往不得不采用更保守、平滑的生成策略,世界一旦做大,模型要处理的信息量就会成倍往上走。
那代价嘛,就是——《糊图》。

当然了,成本问题也是一方面,按照现在的定价,模型只能在空间范围和画质细节之间找平衡择其一了…
(期待有二者兼得的那一天…)
模型确实是好模型,也确实很好玩,感兴趣的友友可以直接上手试试~

