Jay 发自 凹非寺
QbitAI公众号报道了马斯克在抖音进行直播销售活动的消息。
直播间里摆满了老干妈产品,并且还摆放着一整面墙的火箭模型,这些模型是马斯克心爱的大火箭的一部分。
开播后不久,直播间就吸引了10万观众在线观看。

评论区热闹非凡,特斯拉车主们纷纷刷屏支持他们的CEO。
马斯克还与即将发布的《GTA-6》游戏产生了联系。

在游戏中,马斯克现身罪恶都市,并且SpaceX公司的办公楼也被植入到了游戏场景中。
玩家有机会在游戏中遇到马斯克,甚至可能被邀请参观他的办公室。
更令人惊讶的是,《奥特曼》中的角色也在游戏中亮相。

如果这些内容都是真实的,请求大家手下留情,不要打扰到Sam的正常生活。
在游戏里尽情发泄情绪就好,别再现实生活中骚扰他了。
现实中没有人进行过这样的直播活动,评论区中的互动也是虚构出来的。

等一下。
你真信了?
这些截图都是通过OpenAI最新发布的图像生成模型GPT Image 2制作的。
全!是!假!的!!!
AI技术的发展已经达到了一个新的水平。
“有图为证”的时代似乎已经成为过去。
GPT Image 2最令人惊叹的地方在于,初看时你可能不会觉得这些图片是由AI生成的。
这是因为大多数情况下,人们很难分辨出这些图像是由机器而非人类创造的。
当AI变得「无形」
直到你得知真相后,才会恍然大悟。
回过头来仔细观察,你会发现更难找到任何能证明图片是由AI生成的线索。
你会再次感到震惊——怎么也看不出这些是AI的作品?
越深入地查看细节,越会觉得不可思议。
无论是人物肖像、配饰还是背景设计,都与现实中看到的杂志封面无异。
游戏截图也是如此,资产形态完全符合《我的世界》的特点,各种状态栏也被完美复现。
连文档上的文字内容也都正确且富有逻辑性。
比如这张时尚海报。
下面展示一些纯文本的例子来感受GPT Image 2在文字生成方面的提升。

这是一份用韩文写的日记,虽然看不懂但构图和装订方式都十分逼真。
经翻译得知这是一位韩国高中生周日补习后的记录。

再来看看一份汉语字典,其信息量之大令人难以挑剔错误。
这项技术对于设计行业而言极其实用。

它可以用于制作游戏海报、电商海报等,甚至让没有经验的人也能轻松完成这些工作。
对于OpenAI来说,GPT Image 2的推出可能意味着更多的创新用途。
Codex用户之前批评过UI设计上的问题,但现在情况似乎有所改善。

OpenAI找到了一种与谷歌不同的方法来解决这个问题。
现在他们决定专注于模仿能力而非创造力。
有人猜测这可能是平行宇宙中的一种AI红利获取方式。
还有这张Windows桌面截图,初看时还以为是真实的用户界面。
实际上这是使用Image 2生成的图片。
来个双厨狂喜。

如果将这项技术与编程结合在一起,将会产生巨大的效果。

OpenAI曾透露正在开发一个超级应用程序来整合ChatGPT、Codex和Atlas等产品。

目前看来,Codex正朝着这一目标迈进。

最近OpenAI在浏览器内置了相关功能,使得vibe-coding更加直观便捷。
那就是前端设计。
GPT-image-1.5的加入也为UI设计提供了更好的支持。
这项新技术可以实现从概念到最终产品的无缝对接。
期待GPT Image 2的上线,这将大幅提高Codex前端开发体验。
尽管Sora已经被关闭了,但多模态技术对OpenAI而言仍然具有重要意义。

这是领英。

Codex可能在UI设计领域实现编程和图像生成的技术整合。

然而遗憾的是,目前这些功能并未向普通用户开放。
我们尝试使用侃爷的模仿马斯克直播的方式进行了一次测试,但结果令人失望。

同事们也没有参与灰度测试的机会。
对于那些想体验这项技术的人来说,可以试试LM Arena平台。
实际上,Image 2已经引起广泛关注有一段时间了。
然而大多数人只是感叹其令人惊叹的图像生成能力,却未能意识到背后更深远的意义。

这种程度的技术进步是否让人感到不安?
对于电信诈骗和视频谣言等网络安全问题来说,AI生图技术的发展可能带来新的挑战。
AI生图正在无声无息地跨越图灵测试的界限。
我们或许再也无法回到那个能轻易识别出AI痕迹的时代了。
这个世界正朝着虚拟与现实彻底融合的方向发展。
期待Image 2的上线,如此强大的UI模仿能力,无疑能让Codex的前端开发体验大幅升级。
这么看来,虽然Sora被关,但多模态这条路对OpenAI还是有价值的,Codex可能会在UI设计这个领域,将编程和图像生成垂直整合。
可惜的是,看完这些demo,我兴奋地打开GPT输入了prompt,然后失望地发现OpenAI并没有将这个模型向「尊贵」的Plus会员开放。
尝试用侃爷复刻了下马斯克同款抖音直播,额,有点无语……

同事们也都没被灰度测试到。
大家如果想试试的话,可以到LM Arena碰碰运气。
系好安全带吧
其实,Image 2已经火了一段时间了。
但我感觉很奇怪,很少有人察觉到这件事背后意味着什么,大部分人只是停留在:
噢,好厉害的生图模型。
确实提升巨大,也足够让人兴奋。但问题在于,这次好像有点跨过界限了。
细想一下,AI生图已经以假乱真到99%的人都看不出来了,这难道不让人毛骨悚然吗?
我不知道在视觉行业的人看来这些图片是什么水平,我本人对文字里的「AI味」还比较敏感,但现在AI生图的程度,已经能完全骗过我了。
电信诈骗、视频谣言……这些和Mythos的网络安全相比,或许是更和我们日常生活息息相关的场景。
AI生图的图灵测试,正在悄然无息地通过奇点。
我们可能再也回不到,那个还能拿着放大镜像抓贼一样抓AI,「AI味」人人喊打的时代了。
因为——
这将是一个虚拟与现实,彻底融合的世界。
