
VeRL-Omni:面向扩散和全模态生成模型的通用RL后训练框架
VeRL-Omni 是一个面向多模态生成模型的通用 RL 后训练框架,由VeRL-Omni 团队在 verl 与 vllm-omni 之上构建。覆盖扩散 transformer(Qwen-Image)、混合 AR-DiT(Qwen-Omni)、统一理解 + 生成(BAGEL、HunyuanImage-3.0)等架构。多模态 rollout 走 vLLM-Omni 的异步高吞吐 serving,VL

VeRL-Omni 是一个面向多模态生成模型的通用 RL 后训练框架,由VeRL-Omni 团队在 verl 与 vllm-omni 之上构建。覆盖扩散 transformer(Qwen-Image)、混合 AR-DiT(Qwen-Omni)、统一理解 + 生成(BAGEL、HunyuanImage-3.0)等架构。多模态 rollout 走 vLLM-Omni 的异步高吞吐 serving,VL

编辑部 整理自 AIGC2026量子位 | 公众号 QbitAIAI浪潮正从线上数字空间,全面涌向线下物理世界关注点也从单一流量入口的争夺,转向去中心化AI入口的创造。AI从数字技术融入物理世界的产业价值落地正逐步实现。所以,在AI Agent、Vibe Coding火热迭代的当下,京东科技JoyInside业务负责人戴文军提出另一种思路:当前我们正在经历一种全新的生活方式,人类不再需要去学习和适

机器人前瞻(公众号:robot_pro)作者 许丽思编辑 漠影机器人前瞻5月25日报道,近日,具脑磐石完成新一轮亿元级融资,本轮融资由具备深厚类脑与具身产业背景的顶尖产业资本领投,老股东及多家顶尖基金复投和跟投。同时,更新一轮融资也在同步交割中,多维资本担任独家财务顾问。这笔融资之所以值得关注,是因为具脑磐石押注的并不是国内常见的具身大脑主流技术路线,反而有点冷门——沿着JEPA的方向,基于类脑智

德适AI获三类医疗器械证,医疗AI产业化迎来新突破。过去十年,医疗AI做了一件矛盾的事:技术越成熟,商业化越焦虑。专病模型时代,一个病种、一个模型、一套审批,十年覆盖了35个项目——而全球医学影像检测项目约5000个。这个算术题,算不下去了。2026年5月20日,德适(02526.HK)AI AutoVision®染色体核型辅助诊断软件正式获得国家药监局第三类医疗器械注册证。这是史上获批速度最快的

智东西编译 江宇编辑 漠影智东西5月25日消息,近日,知名AI博主TestingCatalog透露,Anthropic正在为Claude测试一套全新的“双模记忆系统(Dual-mode Memory)”,其记忆能力的底层架构或将迎来“大翻新”。▲TestingCatalog曝料内容(图源:X)除了现有的“经典记忆(Classic Memory)”模式外,Claude未来还可能新增一种名为“Memo

阿里云在 520 峰会上,交出了第一张 Agentic 答卷。作者|郑玄5 月 19 日的 Google I/O 上,谷歌最重磅的发布是一款叫 Gemini Spark 的个人 Agent——跑在 Google Cloud 的专属虚拟机上,由 Gemini 3.5 和 Antigravity 框架驱动,深度接管用户的 Gmail 和 Workspace,24 小时在云端替人执行长任务。Sundar

估值重塑,数据与评测基础设施成为具身产业估值中心。作者|周悦具身智能的市场逻辑,正在变化。过去两年,行业谈具身智能,最关注模型和本体:谁的“大脑”更强,谁的人形机器人更像人,谁的动作更精准。这些构成了具身智能最直观的能力表现。这符合新兴产业的演进逻辑。每一个技术周期启动时,最先站在聚光灯下的,往往是最接近用户、最具想象力的公司。一如自动驾驶早期,市场首先聚焦于整车和Robotaxi;大模型爆发之初

近年来,大语言模型参数的持续膨胀,带来了极高的显存占用和算力需求,在 PC、手机和 IoT 等资源受限的端侧设备上部署前沿大模型十分困难。因此大语言模型轻量化的研究势在必行,量化(Quantization)成为主流的轻量化方案。然而,量化端侧部署目前受制于 “不可能三角”:后训练量化(PTQ)在极低比特下精度崩塌;量化感知训练(QAT)算力成本极高;而现有的量化感知蒸馏(QAD)又缺乏灵活性。由南

从 Codeium 到 Windsurf,再到 Google DeepMind 。现在,他选择离开。他叫 Ronak Malde。论名气,他还不是 AI 圈的大佬级人物,但在 AI Coding 赛道,他已是备受技术社区和 VC 圈关注的年轻一代核心工程人才。过去两年,他几乎踩中了 AI Coding 最热的一条主线:从 Codeium 起步,参与推出 Windsurf IDE,训练前沿 Agen

烧 token 在 YC 的语境里不是支出,是替代。作者|张勇毅2026 年 5 月 14 日,微软已经开始取消大部分员工的 Claude Code 内部许可。截止日期是 6 月 30 日——也是微软财年最后一天。仅仅 6 个月前,微软还在做完全相反的事——2025 年 12 月,它把 Claude Code 开放给数千名员工,包括工程师、产品经理、设计师,鼓励所有人都用 vibe coding

智东西作者 王涵编辑 漠影2026年,AI专用HBM内存价格暴涨超165%,显存/HBM正在成为模型扩展最昂贵、最稀缺的资源之一,模型公司的核心推理成本居高不下;而另一边,高端AI芯片对华出口管制反复横跳,让国产算力生态在面临高昂过路费与供应链安全风险的夹缝中艰难求生。两件事叠加,指向同一个问题:在硬件受限的情况下,国产模型厂商,该怎么继续做模型?智东西5月25日报道,在2026年5月23

智东西作者 刘煜编辑 陈骏达智东西5月25日报道,今天,OPPO推出两款Reno系列新手机:OPPO Reno16与OPPO Reno16 Pro。另外,OPPO还推出了Bubble潮玩自拍屏、OPPOPad 6、OPPOPad Air5以及OPPOEnco Air5s半入耳式耳机。OPPO Reno16全系列采用ColorOS 16系统,首次搭载AI实体按键,支持120Hz智能刷新率,同时标配I

文 | 逐浪Linkworld上周和一个GEO从业者聊。聊到一半他突然说了句:"四月底以后,群里每天都有人说不干了。"我问他大概什么规模。他想了想:“我待的三个行业群,加起来差不多一千人。还在正常接单的,可能不到三成。”这不是个别现象。我们最近接触了多家GEO服务商和他们的客户,信号高度一致:GEO行业正在经历第一波大规模死亡。自从我们发了「GEO卧底系列」,有非常多的读者在后台和评论区,让我们推


5月20日,石家庄市长安区桃园社区一家药店,社区居民体验5G智能筛查机器人。河北日报记者 常方圆摄扫描二维码,直视显示屏,用双手覆盖检测球的电极片,短短一两分钟后,就有一份包含70余项指标的健康筛查报告推送到手机上。5月20日上午,在石家庄市长安区桃园社区一家药店,69岁的陈文霞体验店内的5G智能筛查机器人后竖起大拇指:“这么快检查这么多项目,还不用抽血,真是太方便了。”这款5G智能筛查机器人由华

作者 | 董道力邮箱 | [email protected] Coding 的第一阶段,最容易被相信的故事是"原生模型 + 原生应用"的闭环优势。Claude Code 背靠 Anthropic,能最早用上最强的 Claude,模型能力、上下文窗口、工具调用都可以被端到端优化。训练数据、推理参数、工具协议,每一层都可以为 coding 场景专门调校,不需要迁就任何第三方API。相

新智元报道【新智元导读】刚刚,Claude「双记忆系统」首次爆出!全新「文件记忆」让AI一边聊天,一边自动做笔记。还有杀手级Conway Agent浮出水面,7x24小时永不下线。Claude长出「永久记忆」了!就在今天,著名AI追踪平台TestingCatalog爆出猛料:Anthropic正为Claude测试一套全新的「双模记忆系统」——一边是沿用至今的「经典记忆」,一边是全新的「文件记忆」(

AI应用风向标(公众号:ZhidxcomAI)作者|毕伟豪腾讯手搓APP的应用来了!智东西5月25日报道,最近腾讯应用宝悄悄上线了一款vibecoding应用:吐司,用户可以用自然语言创造可下载到本地的APP。听名字,好像和AI毫无关系,但实际体验过后就会发现,这个名字简直太有趣了。用户输入需求以后,产品、设计和研发三块吐司大厨就开始蹦蹦跳跳地干活了,它们分别负责产品规划、设计绘制以及最终研发编程

未来推理将吃掉70%算力,30%留给训练丨硅谷投资人张璐@AIGC2026 思邈 2026-05-25 09:51:37 量子位

华为具身大脑一号位创业,用认知科学造世界模型,获亿元级融资 思邈 2026-05-25 10:28:17 量子位 用“人类心智”重