量子位公众号 QbitAI 发布了一篇关于马斯克的推文。
马斯克在抖音上进行了一场特别直播带货活动?
直播间的背景墙堆满了各式各样的商品,其中不乏大家熟悉的“老干妈”品牌。

开场不久便吸引了超过十万观众在线观看,可见其号召力之强。
观众们在评论区热烈讨论,特斯拉车主更是纷纷留言支持马斯克。

此后不久,令人意外的是,有传言称马斯克还与即将发布的游戏《GTA-6》有所关联。
马斯克现身罪恶都市,SpaceX公司的办公楼也被巧妙地植入到了游戏场景中。
未来玩家们或许可以在游戏中偶遇马斯克,并跟随他参观其办公室。

同时曝光的还有奥特曼的身影,让人不禁感叹科技的魅力无处不在。
希望某些网友能够手下留情,给Sam一些喘息的空间吧……
如果感到不满或委屈,建议大家在游戏中尽情释放情绪,避免对现实生活中的他人造成困扰。

等一下。
你真信了?
事实上,这些所谓的直播互动和游戏截图都是利用AI生成的假象。
全!是!假!的!!!
这些图像均出自OpenAI最新推出的GPT Image 2模型之手。
AI技术的发展已经到了一个新阶段,让人难以分辨真伪。
“有图为证”的时代可能即将结束。
GPT Image 2最引人注目的地方在于,其生成的图像初看并不令人惊叹。
当AI变得「无形」
而是在了解真相后,人们才会恍然大悟,并试图从中找出AI制造的痕迹。
经过仔细观察之后,大多数人会发现这些图片竟然毫无破绽,完全看不出是AI所为。
尤其是对像《我的世界》这样的游戏截图而言,连细节都完美还原了。
这种高度逼真的图像生成技术,在韩国高中生日记等文字内容上同样表现卓越。
该模型甚至可以准确无误地模拟出版物中的排版和字体效果。
面对如此强大的能力,设计师们或许会感受到一些压力。
使用AI生成的商品展示图片可能达到与顶级品牌相媲美的水平。
比如这张时尚海报。
对于OpenAI而言,Image 2的推出预示着未来更多创新应用的可能性。

GPT Image 2不仅提高了图像生成的质量,还在文字处理方面取得了显著进步。
这种技术革新使得设计工作变得更加简便高效,即使是初学者也能轻松上手。

尽管如此,一些人可能对此感到担忧,认为AI的发展已经跨越了伦理界限。
电信诈骗和视频谣言等问题日益严峻,而这些都与网络安全息息相关。

随着图像生成技术的不断进步,未来人类或许将进入一个真假难辨的世界。
再看个硬核点的吧,汉语字典。
这已经不是有没有乱码的问题了,信息密度实在太大,我都无心抓虫,你说这是哪个出版社的源文件我都信。

这真的是非常实用的一项技能点。
对于像设计这类场景来说,文字本身就是除视觉之外很重要的一个信息模态。
和纯视觉资产还不一样,这类应用更贴近实际生产,需要展示产品信息、活动详情等等。
所以,Image 2这次在文字上的升级,对于可用性而言是相当必要的。
想做个游戏海报,电商海报啥的,真的零门槛了,小白也能手拿把掐。
来个双厨狂喜。

甚至可以来个四厨狂喜。

纯商品就更轻轻松松了,感觉可以直出了,替设计行业的朋友们捏一把汗。

实在是太好用了啊,马上钻研副业做电商,AI生成的上架素材直接就能和全球顶尖品牌对齐了。

而对于OpenAI来说,Image 2的出现,或许有更具野心的用途。
那就是前端设计。
Codex用户都知道,GPT的UI设计能力就是一坨,总弄一堆丑陋的黄色滤镜小卡片,还要自己加些令人两眼一黑的「直接、不绕弯子」的文字说明。
但这次,OpenAI好像找到了一种和谷歌截然不同的解法。
干脆不走创造力路线了,就把鹦鹉学舌发挥到极致。
这是网友给OpenAI官网夺舍了,提前泄露的GPT-8。

这是领英。

这是平行宇宙中,另一种方式吃上AI红利的油管科技博主奥特曼。

还有这张Windows桌面,我看到时都愣了半天,寻思这人干嘛要放张截图上来。
然后才反应过来,哦,这是人家拿Image 2生成的。

这项能力如果和编程组合在一起,将会是一枚核弹。
还记得吗?之前一直有消息说,OpenAI在做一个超级APP,用来把ChatGPT、Codex、Atlas整合在一起。
如今看来,Codex正在成为这个想法的雏形。
前几天,OpenAI将浏览器内置了,现在vibe-coding言出法随更加直观,不用单独再开个浏览器窗口。

更关键的是,GPT-image-1.5也接入了Codex。
简单来说,这就是Google Stitch+Claude Code。
Codex把UI设计做成端到端了,无需在其他地方生成参考图片,然后再导出给coding Agent实现逻辑。
无需提前准备参考图,也无需收集数据资产,想要什么素材直接可以再Codex生成,并且交互逻辑也是一键顺便适配的。
而有了Image 1.5把关,GPT这次的UI能力应该会有保障许多,毕竟是基于图片开工。
期待Image 2的上线,如此强大的UI模仿能力,无疑能让Codex的前端开发体验大幅升级。
这么看来,虽然Sora被关,但多模态这条路对OpenAI还是有价值的,Codex可能会在UI设计这个领域,将编程和图像生成垂直整合。
可惜的是,看完这些demo,我兴奋地打开GPT输入了prompt,然后失望地发现OpenAI并没有将这个模型向「尊贵」的Plus会员开放。
尝试用侃爷复刻了下马斯克同款抖音直播,额,有点无语……

同事们也都没被灰度测试到。
大家如果想试试的话,可以到LM Arena碰碰运气。
系好安全带吧
其实,Image 2已经火了一段时间了。
但我感觉很奇怪,很少有人察觉到这件事背后意味着什么,大部分人只是停留在:
噢,好厉害的生图模型。
确实提升巨大,也足够让人兴奋。但问题在于,这次好像有点跨过界限了。
细想一下,AI生图已经以假乱真到99%的人都看不出来了,这难道不让人毛骨悚然吗?
我不知道在视觉行业的人看来这些图片是什么水平,我本人对文字里的「AI味」还比较敏感,但现在AI生图的程度,已经能完全骗过我了。
电信诈骗、视频谣言……这些和Mythos的网络安全相比,或许是更和我们日常生活息息相关的场景。
AI生图的图灵测试,正在悄然无息地通过奇点。
我们可能再也回不到,那个还能拿着放大镜像抓贼一样抓AI,「AI味」人人喊打的时代了。
因为——
这将是一个虚拟与现实,彻底融合的世界。
参考链接:
[1]https://x.com/johnAGI168/status/2044781168151724067
