
新范式研究挑战直觉:智能体能否通过世界模型预见未来?
该研究主要由伊利诺伊大学香槟分校的钱成博士牵头完成,他目前为二年级博士生,专注于大模型驱动智能体的研究领域,包括推理、交互和物理智能等方向。钱成的导师是季姮教授。近年来,Agent(代理)技术在2025年迎来落地元年,并于2026年开始见证世界模型技术的重大突破。与此同时,我们一方面享受着各种智能体应用带来的便利,另一方面也在努力提升世界模型的真实性和可靠性,以便为未来更精确的决策提供支持。深入剖
共找到 266 篇相关文章

该研究主要由伊利诺伊大学香槟分校的钱成博士牵头完成,他目前为二年级博士生,专注于大模型驱动智能体的研究领域,包括推理、交互和物理智能等方向。钱成的导师是季姮教授。近年来,Agent(代理)技术在2025年迎来落地元年,并于2026年开始见证世界模型技术的重大突破。与此同时,我们一方面享受着各种智能体应用带来的便利,另一方面也在努力提升世界模型的真实性和可靠性,以便为未来更精确的决策提供支持。深入剖

鹭羽 发自 凹非寺量子位公众号QbitAI发布了一篇关于智谱技术发展的博客文章。智谱团队在近期的工作中,面对大规模的挑战感到十分困扰和压力重重。最新发表的技术博客与以往不同,这次没有硬核的技术细节分享,而是详细描述了自GLM-5以来遇到的各种问题及解决方案。在这篇名为「Scaling Pain」的文章里,团队披露了推理基础设施正面临前所未有的挑战,每日需处理数亿次Coding Agent的请求。最

2026年4月21日至22日,“奔赴AGI 重塑未来”为主题的中国生成式AI大会(北京站)圆满落幕。大会汇聚了73位来自学界、业界及投资界的嘉宾,通过一场开幕式和多场专题论坛与技术研讨会的形式,全面解析了AI产业的脉络、创新模式以及Token经济等议题,并探讨了在中国市场的机会。会议内容广泛涵盖了大语言模型、多模态模型、世界模型、智能体到AI眼镜等一系列前沿技术和应用,同时也涉及数据处理、芯片设计

补充Agent在基础设施方面的知识。作者|田思奇自2025年以来,大型模型的应用已经从简单的聊天机器人发展成为能够独立执行任务和流程的“数字员工”。开源框架OpenClaw无疑是这次技术飞跃的关键推动力。然而,当各个行业满怀期待地将这些工具引入内部网络时,却发现它们在实际使用中存在不少问题,在企业级环境中显得不够完善甚至有些风险。它的高灵活性在企业的IT视角下被视为越权的风险;动态生成不可信代码随

最近,多家科技金融企业相继推出了关于人工智能(AI)代理支付的工具、测试项目以及接入方案,并分享了最新的发展动态。4月28日周二,蚂蚁国际宣布开源了一款名为“Agentic Mobile Protocol”的移动应用程序协议,该协议旨在促进商户、支付服务提供商和AI代理人之间在手机环境中的顺畅交易流程,从商品发现到支付确认一应俱全。在此之前,威士于4月8日发布了一份方案,为开发者和支付服务商提供

最近大家都在讨论Agent上车的话题,并且在最近两天的发布会以及整个车展中都有所体现,这似乎是一个大趋势。 一凡 2026-04-28 09:40:48 量子位

在4月25日的北京国际车展期间,东软集团发布了一系列与智能汽车互联相关的新产品和战略调整。这些新产品包括车载智能出行解决方案7.0、AI座舱软件平台以及子公司业务升级。本次发布会上,东软宣布其全球车载智能出行方案OneCoreGo已更新至第七代版本。此方案利用跨Agent协同能力的One Mate AI出行伙伴,整合了导航系统、车载AR技术、支付服务和车联网安全模块,致力于打破车载软件功能的孤立

新智元报道最近,DeepSeek-V4的技术报告引起了广泛关注,其直率的披露令人惊叹不已。V4发布的延迟背后隐藏着何种秘密?研究人员对此纷纷猜测,并对论文中详细描述Agent操作的方式表示认可。昨日堪称人工智能界的年度盛会。技术报告长达近六十页,详尽地展示了从架构设计到训练过程的每一个细节。与V2至V3仅耗时不足八个月相比,此次V4的研发周期竟达484天。这其中的原因究竟是什么?对这份报告进行了深

凤凰网科技 出品作者|董雨晴经过长时间的期待,4月24日上午,DeepSeek公司终于发布了其备受瞩目的全新系列模型DeepSeek-V4预览版,并宣布该版本将同时开源。据称,在代理能力、世界知识和推理性能方面,这款新模型已经达到了国内乃至全球开源领域的领先地位。在此之前一周的周一晚上,月之暗面公司也发布了他们的Kimi K2.6模型并实现了开源。这款模型着重于长程编码与Agent集群的能力,并在

新智元报道DeepSeek V4 引人注目,其参数量达到惊人的1.6万亿,并且在Codeforces竞赛中排名人类选手第二十三位,KV缓存仅前代的十分之一。在同一周内,Kimi K2.6也宣布开源,支持数百万token的上下文和300个子Agent协同工作,模型参数量更是达到了2.6万亿。两家公司在中国AI领域中的地位显赫,它们的技术进步与发布时间高度契合,似乎有意为之。回顾过去一年半的时间线,D

在面对人工智能浪潮时,涂鸦智能展现出了积极的态度和快速响应的能力。从智能家居到智能机器人,再到能源管理等领域,涂鸦智能都推出了创新的应用解决方案。这些AI应用的成功背后是涂鸦智能对技术架构的不断调整与优化。公司研发团队正在以全新的视角审视未来的开发流程,力求通过高效利用AI工具来提升整体效率和灵活性。▲AI潮玩陪伴产品涂鸦智能的核心优势在于其开放且强大的生态系统。自成立以来,该公司就致力于构建全球

新版本更实惠、更快,进一步推动Agent和国产替代的发展。作者|卫琳聪 周悦深度探索(DeepSeek)终于发布了它的V4版本。自上一个版本发布至今已过去了大约五个月时间,在这期间虽然有各种关于新版本的消息传出,但最终都是空欢喜一场。直到今天,人们才得以见证这一期待已久的更新。今年四月二十四日,DeepSeek-V4 的预览版正式上线,并同步开源了源代码,官方宣称将进入“百万上下文普惠时代”。此次

近日,OpenAI发布了一项名为工作区智能体(Workspace Agents)的新功能,该功能将为ChatGPT商业版、企业版、教育版及教师版的用户提供一个研究预览期,并将在2026年5月6日之后转为积分制付费模式。工作区智能体被描述为GPTs的一种“进化”,它使用Codex技术构建,能够在团队内部共享信息。这款工具设计旨在从正确的系统中收集上下文、遵循团队流程,并在需要时请求批准。此外,工作区

在凌晨时分,OpenAI发布了Workspace Agents,这标志着GPTs的进一步发展。该产品被视为是针对团队工作场景设计的新形态工具,其核心功能在于将可以重复执行的工作流程转化为能够共享和运行的智能代理。它基于Codex技术驱动,并拥有独立的工作空间,在此环境下能够访问文件、调用各种工具并持续进行后台任务处理。通过向ChatGPT描述团队内部常见的工作流,例如信息收集、决策制定及结果生成等

据报道,在最近的一次活动中,地平线在北京举行了面向2026年产品技术的发布会,会上发布了两项重要成果:“星空”系列的新一代舱驾整合芯片和搭载了“咖咖虾(KaKaClaw)”智能体的操作系统Agentic Car OS。这些创新旨在提升车载人工智能体验,使之从被动响应转向主动思考与服务。“咖咖虾”这款充满创意的智能体基于强大的星空系列芯片计算能力,专为日常生活和特定场景设计了一系列智能化服务,并具备

我们从一开始讨论AI吞噬软件的话题感到焦虑,但逐渐意识到这是一个全新的机会领域——为Agent开发工具和服务。作者|徐珊当我们首次探讨这个话题时,主要的担忧是AI技术的发展会取代传统的软件行业。但现在看来,AI和传统软件的关系更像是迭代升级而非替代。现在的观点转变成:AI不仅不会吞噬软件业,反而可能带来比现有市场大得多的新机遇。我们发现A2A(Agent to Agent)的交易模式将成为未来商业

近日,专注于医疗领域的AI公司AcuityMD宣布完成8000万美元的C轮融资,并推出了全新的AI Agent系统——AcuityAI,致力于解决医疗销售过程中数据查询难题。本轮融资由StepStone Group领投,Benchmark、Redpoint Ventures、ICONIQ和Atreides Management等机构跟投。目前,该公司的估值已达到9.55亿美元,累计融资总额超过1.

近日,千问APP宣布其AI PPT功能升级为“PPT Agent”。据悉,“PPT Agent”基于智能体架构设计,能够自主完成从构思到排版的全过程,用户只需输入简短的需求或上传文档即可快速获取完整的PPT文件,并可直接下载使用。目前,该功能已在千问PC端和网页版(qianwen.com)上免费提供,移动端版本正在开发中。同时,阿里巴巴还推出了一个数字人形象“小酒窝”,作为生态级AI助手来帮助用户

昨日下午,出门问问正式发布了企业级AI原生协作平台CodeBanana。据悉,这款平台旨在为开发者、设计师和产品经理提供一个实时的互动空间,使他们能够共同编写代码、调试程序,并构建产品原型。CodeBanana的一大亮点是Agent无处不在。每个项目都配备了专属的Agent,即便是私下的个人对话中也有它们的身影。出门问问的创始人兼CEO李志飞将CodeBanana视为超级组织的操作系统解决方案。李

克雷西 发自 凹非寺量子位 | 公众号 QbitAI目前,大型模型的更新速度之快令人目不暇接,但主要发展方向大致相同:规模更大、性能更强、运行更快。然而,Kimi最近一次的升级则采取了不同的路径。昨晚,月之暗面发布了其最新版本的K2.6模型,并将其开源。此次更新有两个关键点:一是增强了代码编写能力,包括软件工程和前端设计水平;二是提升了多智能体协作“集群”功能。先来看排行榜,Kimi K2.6在A