
FlashAR:仅用0.05%数据,让预训练好的自回归图像模型飞起来
背景:自回归图像生成的崛起与推理瓶颈大语言模型的成功让 "next-token prediction" 这套范式从文本延伸到了图像领域。把图像用视觉分词器编码成离散 token,再一个接一个的预测出来 —— 这就是自回归(AR)图像生成的核心思路。从早期的 PixelCNN、iGPT、Parti,到近期的 Emu3.5、LlamaGen、Lumina-mGPT、GLM-Image,AR 模型的生成
共找到 10 篇相关文章

背景:自回归图像生成的崛起与推理瓶颈大语言模型的成功让 "next-token prediction" 这套范式从文本延伸到了图像领域。把图像用视觉分词器编码成离散 token,再一个接一个的预测出来 —— 这就是自回归(AR)图像生成的核心思路。从早期的 PixelCNN、iGPT、Parti,到近期的 Emu3.5、LlamaGen、Lumina-mGPT、GLM-Image,AR 模型的生成

据报道,当地时间5月5日,在曼哈顿联邦法院,出版商爱思唯尔、圣智、阿歇特、麦克米伦和麦格劳-希尔联合起诉了Meta Platforms。他们声称这家科技巨头在其人工智能模型Llama的训练过程中侵犯了他们的版权。这些出版机构及作家斯科特·图罗在一份拟议集体诉讼中指控Meta未经授权复制并使用了数百万部作品,包括教科书、科学论文和小说等,用于其大语言模型的训练。针对此事,Meta的一位发言人发表声

新智元报道一位中国开发者在横跨大西洋的长途飞行中,利用MacBook本地运行Llama 70B模型,在没有网络连接的情况下完成了一整套项目交付工作,并因此在网上引起了广泛关注。这位开发者的经历令人难以置信:他在长达11小时的航程里使用自己的笔记本电脑完成了客户的任务,而无需支付机上Wi-Fi费用。在整个过程中,他没有借助任何云端服务或API支持,只依靠一台MacBook Pro M4、一段个人编写
近日,国产大模型公司MiniMax宣布,其最新版本的MiniMax M2.7于4月12日在全球范围内开放源代码。华为昇腾、摩尔线程、沐曦、昆仑芯、NVIDIA等国内外芯片制造商以及TogetherAI、Fireworks、Ollama等多个推理平台,在开源首日便迅速完成了模型接入与推理适配工作。三周前,MiniMax M2.7正式上线。该版本具备自我进化的能力,并能够构建复杂的智能体控制框架(Ag

放弃了 Llama 这个出道即巅峰的项目,Meta 决定不再走弯路,投入数百亿美元创建了一个超级智能实验室。在 Meta 调整其 AI 策略之后,他们的第一款通用模型 Muse Spark 经过一年的研发,终于问世了。世超在第一时间尝试后发现,曾经的 Meta 只是跟跑者之一,在资金的支持下,如今可能已经成为了行业领导者。官方发布的跑分数据显示,Muse Spark 在多模态、文字推理、健康等多个

Meta团队耗时九个月打造的大规模语言模型终于问世了!这款新模型由余家辉、宋飏和Jason Wei等专家共同研发,旨在解决Llama系列之前的不足。 一水 2026-04-09 09:49:48 量子位

根据DefiLlama的数据,数字资产库企业在过去一个月的流入量减少到了约5.55亿美元,这是自2024年美国大选前夕以来的最低值。在美国大选前的一个月里,这些企业的资金流入仅为3240万美元。然而,在选举结果公布和加密货币监管环境转向利好之后,流入量迅速回升至超过123亿美元,DefiLlama的数据表明。2025年期间,数字资产库公司的资金流入继续减少,月度金额一直远低于100亿美元,并且在8

中美AI同步加速:47天内30次更新,中国最强主场究竟在哪里? 2026年的AI开局没有旁观者。 在硅谷那边,从1月1日Meta发布的Llama4 Swarm到Google最新的Gemini 3.1 Pro,每两三天就有一项新技术引发行业热议。 而在中国这边,据

清华大学数学系的杰出人才张鹏川加入OpenAI! 毕业于清华大学数学系的研究员张鹏川,曾在Meta FAIR工作了3年多,并领导过SAM与Llama等多个重要项目,现已正式离职。 Sora项目的资深领导者Aditya Ramesh也向他发来了欢迎的信息。 从专注

又一位清华大学杰出校友加入OpenAI!最近,毕业于清华大学数学系的张鹏川研究员宣布离开Meta FAIR(现为Meta超级智能实验室),结束了他长达3.75年的职业生涯。张鹏川曾在SAMLlama项目中担任关键角色,并主导了多项核心工作。如今,他将加入OpenAI,在世界模拟与机器人学领域开展研究。在他的推特上,张鹏川表达了他对探索视觉感知、世界模型和机