梦瑶 发自 凹非寺
李飞飞团队再次推出了世界模型的新成果。
这次他们一口气发布了Marble 1.1和Marble 1.1-Plus两个新版本的模型。
其中最引人注目的是,只需几分钟就能将真实场景转换成逼真的三维空间。
比如说,用户可以拍摄多角度的照片并输入到系统中,便能够生成一个完整的虚拟现实房间环境。
即使只有一张普通照片,模型也能扩展出一个广阔的3D世界,效果仿佛佩戴了VR设备一般。

除此之外,这两款新模型还具备提高图像清晰度和亮度对比的功能。

对于设计师而言,这样的技术简直就是梦寐以求的工具。
实际上,无论是Marble 1.1还是Marble 1.1-Plus,在各自的领域内都有着独特的优势。

具体来说,前者更注重提升图像的质量,而后者则擅长生成更大的三维空间范围。

用户可以轻松在官方网站上找到并使用这些模型,而且新用户还能获得一定数量的积分以免费体验。
通过实际操作测试,Marble 1.1对输入图进行了高质量的处理,不仅细节丰富还保持了原始图像的真实性。
相比之下,Marble 1.1-Plus虽然在空间延展上表现出色,但其生成的画面清晰度稍逊一筹。
在网友们的尝试中,这些模型被用来创建各种创意场景,例如超大的仓库或逼真的拳击赛场等。
考虑到实用性与成本效益,官方建议初学者可以先从Marble 1.1开始体验。
关于未来的规划,公司表示将逐渐淘汰旧版本,并推广新模型的使用。
这次的新发布进一步体现了World Labs在空间智能技术上的持续进步与发展。

尽管如此,在追求大范围三维重建的同时如何保持图像的质量仍是一个待解的问题。
然而,随着技术的进步和成本的降低,或许将来可以实现兼顾两者的效果。

目前这些模型已经在市场上引起了广泛关注,并受到了许多用户的喜爱。
这次我给Marble 1.1喂了一张ChatGPT生成的《我的世界》同款风格的视觉平面图,长这样子:

△ 参考图
大概等了3~5分钟,一个可以360度自由切换视角、空间感很强的3D游戏世界就被roll出来了,be like:

△ Marble 1.1输出效果
前面我们也提到过,Marble 1.1模型最大的亮点就是「画质」上的体现。
从这组输入输出的对比来看,成片后的分辨率并没有啥问题,而且几乎可以说是1:1还原,画面里也没有冒出特别明显的噪点。
不仅如此生成结果在色彩表现上更饱满一点,空间里的光感也更完整了,整体质感还是非常ok的!!
我们干脆趁热打铁,同一张图,我们再丢给Marble 1.1-Plus,康康模型会整出什么花活~
(狠狠吐槽一下:1.1-Plus模型的生成等待时间比1.1翻了一倍…)

(我等,我等,我狂等)

△ Marble 1.1-Plus输出效果
咋说呢,从整体的视觉延展度度确实感觉比1.1模型更好。
同样一张图,Marble 1.1-Plus拉出来的空间尺度会更大一些,画面往远处铺开的感觉也更明显。(大家觉着呢)
but——问题也来了。
和刚才1.1的结果放在一起对比之后,会发现1.1-Plus在画质细节上反而稍微吃亏一点,整体看上去有一点发糊??
(省流版:如果是单纯玩玩的话,建议大家那点免费的积分留着给Marble 1.1吧…)
官方和实测案例看过了,接下来我们看看网友们用两个模型都玩出了啥东西~
先看下面这位网友,直接用Marble 1.1把自己的工作室做成了一个超大3D空间,你别说,甚至有点像游戏里的密室逃脱游戏??

再看下面这位网友,直接生成了一个巨大无比的家居仓库,那种一眼望不到头的空间感一出来,压迫感居然还挺强,甚至有点惊悚片现场的意思了:

画风,朝着更离谱的方向发展了。
比如这位朋友,直接roll出来了个真实的拳击游戏竞技场,真实感狠狠拿捏住了(但这个巨型人头属实把我吓了一跳!):

当然除了实测效果外,大家很关心的「定价问题」也值得说说。
官方定价页面显示,Marble 1.1的生成消耗均为1,500积分,和上一代价格保持一致。
换句话说就是同样的积分,换来新一代模型,性价比明显更高??
但是对于需要生成更大视野范围的1.1-Plus来说嘛,则需要在原本积分基础上再消耗一些credit…

此外,关于如何上手这些模型官方也给出了一些建议——建议新用户直接从Marble 1.1开始使用。
所以我们也不难看出,World Labs自身也认为1.1已经能完全接替1.0标准版的位置了。(我猜)

API方面呢,目前默认调用的仍是上一代Marble 1.0,但官方表示后续会将默认模型切换为Marble 1.1,大家可以蹲蹲。
另外,此前的Marble-0.1-plus、Marble-0.1-mini等旧命名后续会逐步移除,并统一映射到1.0系列:

OMT
其实如果我们把这次新发布的Marble 1.1放回到World Labs自己的技术路线里看,它其实更接近他们这两年反复强调的一个关键词——spatial intelligence(空间智能)。
从这次发布的两个新模型的表现来看,也确实能感觉到模型在「空间能力」上的明显提升:
Marble 1.1让输出画质质量更强,Marble 1.1-Plus让空间覆盖范围更广,也算是对技术路线又一次比较具体的落地展现了。
当然了,问题嘛,也很明显。
大家也发现了,那就是现阶段的世界模型,似乎还很难完美兼顾 「大空间」与「高画质」……
像Marble 1.1-Plus这种能大范围扩展空间的模型,面对输入图之外的未知区域,本质上是在做智能脑补。
为了保证庞大场景的逻辑自洽,模型往往不得不采用更保守、平滑的生成策略,世界一旦做大,模型要处理的信息量就会成倍往上走。
那代价嘛,就是——《糊图》。

当然了,成本问题也是一方面,按照现在的定价,模型只能在空间范围和画质细节之间找平衡择其一了…
(期待有二者兼得的那一天…)
模型确实是好模型,也确实很好玩,感兴趣的友友可以直接上手试试~
