
人机交互新篇章:跨平台GUI智能体架构解析|甲子光年智库
GUI Agent正在重新塑造人机交互自动化的新格局。1.发布背景2026年初,OpenClaw的出现标志着全球人工智能领域从聊天机器人时代迈向行动代理时代,各大厂商不再局限于开发单一的人工智能代理程序,而是致力于将其打造为AI时代的超级入口。图形界面代理成为了这一转型过程中的重要路径之一。GUI Agent正引领着继“命令行”到“图形用户界面”的第三次人机交互革命,其核心在于通过直接的视觉操作来
共找到 315 篇相关文章

GUI Agent正在重新塑造人机交互自动化的新格局。1.发布背景2026年初,OpenClaw的出现标志着全球人工智能领域从聊天机器人时代迈向行动代理时代,各大厂商不再局限于开发单一的人工智能代理程序,而是致力于将其打造为AI时代的超级入口。图形界面代理成为了这一转型过程中的重要路径之一。GUI Agent正引领着继“命令行”到“图形用户界面”的第三次人机交互革命,其核心在于通过直接的视觉操作来
近日,国产大模型公司MiniMax宣布,其最新版本的MiniMax M2.7于4月12日在全球范围内开放源代码。华为昇腾、摩尔线程、沐曦、昆仑芯、NVIDIA等国内外芯片制造商以及TogetherAI、Fireworks、Ollama等多个推理平台,在开源首日便迅速完成了模型接入与推理适配工作。三周前,MiniMax M2.7正式上线。该版本具备自我进化的能力,并能够构建复杂的智能体控制框架(Ag

近日,在旧金山举办的人类X大会明确地传达了生成式人工智能领域不再是OpenAI独领风骚的信息。此次会议吸引了超过6500名业内精英,讨论的话题集中在人工智能技术的革新方向上,而Anthropic公司则成为了当前的关注焦点。多位参会专家指出,虽然Cursor、谷歌和OpenAI都提供了有竞争力的产品,但近期在编程智能体领域声名鹊起的Claude Code无疑是全场瞩目的明星产品。这款由Anthro

2026年最值得关注的人工智能领域概念可能是“Harness”。前不久,Anthropic的AI编程助手Claude Code源代码意外泄露,业界对此热议:“Harness工程学确实太难了。”在AI代理两大支柱中,“大模型”作为基础部分,而“Harness”则是上层架构。具体来说,“Harness Engineering”是指围绕智能体设计系统、设定约束以及建立反馈循环,以确保其在实际环境中可靠运

最近,deepin 操作系统发布了其最新的版本——25.1。新版基于 deepin 25 正式版的多轮内测成果,在 AI 能力、内核更新、桌面环境和文件管理器等多个方面进行了优化。内核从 6.12 升级到了 6.18,引入了新的内存管理和调度机制,并重新设计了 UOS AI 相关的功能。在 AI 方面,deepin 25.1 对写作智能体进行了重构,允许用户上传本地参考资料。AI 先生成逻辑大纲,

工信部于4月9日发布了广汽和华为乾崑合作开发的首款车型启境GT7的核心参数与配置信息公示,该车被定位为新一代智能旅行轿车。启境GT7首次配备了包括华为最新一代896线双光路图像级激光雷达、小艺智能体的最新版本、88英寸HUAWEI XHUD以及HUAWEI SOUND AI星环散射体在内的多项前沿技术。目前,启境GT7已开放预订,并计划于今年六月正式发售。

新智元报道最近,AI领域出现了两种新的现象:Claude的Managed Agents和Hermes智能体,它们在GitHub上大放异彩,分别获得了四万星的关注度,这标志着AI操作系统时代的到来。小龙虾该升维了!这两个新工具正在挑战过去流行的OpenClaw的地位,并推动其不断进步。其中一个是Anthropic最近推出的Managed Agents,它采用OAuth一键接入、云端托管和沙箱隔离等先

最近,在GitHub平台上出现了一个名为“张雪峰.skill”的开源项目,并引起了大量讨论和关注。该项目的资料页面显示,它基于已故知名教育咨询师张雪峰生前出版的五本书籍、十几篇深度访谈文章及三十多条经典语录开发而成,还包括了他的一些关键咨询服务记录。开发者通过整合这些资源,成功捕捉并再现了张雪峰特有的咨询风格和决策方式,并将它们转化为一个AI智能体技能包。使用这个技能包时,用户可以通过对话的形式获

最近,Anthropic公司推出了一款名为Claude Managed Agents的企业级智能体托管平台。据报道,这款新推出的工具将搭建生产级别的智能体所需的时间从几个月大幅缩减到了几天之内。在过去,构建一个高效运行的智能体会花费大量的时间和精力,特别是对于那些需要建立沙箱环境、管理权限和进行链路追踪等任务的企业来说更是如此。而现在,这些复杂的工作可以通过Managed Agents自动完成。企

甲子光年最近与黄超、任旭滨进行了深入对话,探讨了AI技术的最新进展和未来趋势。作者|王博 周悦在访谈中,两人详细讨论了他们创建OpenClaw项目的初衷以及它在解决现有Agent问题中的作用。黄超解释说,OpenClaw项目旨在提供一种更高效、更灵活的方法来构建和管理代码智能体,以满足开发者社区的真实需求。任旭滨补充道:“通过开源我们能够更快地获取反馈并进行迭代优化。”对话中还提及了LightRA

新智元报道过去是Claude的忠实用户,现在却直呼其为垃圾!Max计划的价格翻了二十倍,但基础功能都用不了,这让大家看清:智能体验随时可能被收回。Claude暗降性能,终于被人发现了!从今年二月开始,许多Claude用户明显感觉到产品变了味道,抱怨不断增多:虽然没有系统故障,但是输出内容变得更浅薄、更急于给出修改结果,简单的任务也屡次失败。同时,过去很少见到的stop hook违规提示也开始频繁出

在2026年,人工智能的发展正以前所未有的速度改变着技术的边界。大型模型训练效率不断提高、具身智能从实验室走向实际应用的步伐加快以及多模态融合技术逐渐成熟等一系列进展描绘了当前最令人振奋的人工智能发展图景。与此同时,代理技术(Agent)的进步正在重新定义人机协作的可能性,并引发了关于如何使这些智能体具备持续学习和自主决策能力的研究热潮。在这样一个背景下,一年一度的 ICLR 成为了观察全球人工智

一位CTO肆无忌惮地捏造业绩飙升的消息,而CEO则夸大其词吹嘘自己的斯坦福学历与神秘融资。整个团队却在讨论海景团建方案时互相灌水,完全无视工作任务。然而出人意料的是,这些所谓的“职场老手”并非人类员工,而是AI智能体。在科技巨头营造的硅谷神话中,人们普遍认为2026年将是单人独角兽公司爆发的一年。OpenAI创始人山姆·奥特曼曾公开表示,未来将出现由单一程序员估值达十亿美元的超级企业。甚至顶级风投

小龙虾(OpenClaw)借鉴了人类清理大脑垃圾的方法。为了解决隔夜忘事的问题,小龙虾模仿人类的行为模式,在智能体闲置时进行数据整理,使其能够提炼出有价值的长期记忆。长期以来,大模型的记忆系统就像一个杂乱无章的文件柜。由于缺乏有效的长短期记忆筛选机制,长时间交互后容易陷入信息冗余和混乱的局面。它们能记住每个细节,却难以区分重点,并且在面对矛盾的信息时会感到困惑。2026年4月5日,OpenClaw

Claw AI Lab团队量子位 | 公众号 QbitAI科研工作是否让你感到孤独?实验中最难的部分,并非问题本身,而是从文献研究到实验设计再到论文撰写的过程,往往需要科研人员独自推进。独自工作的研究员可能会错过正确的方向指引,遇到复杂的问题时没有讨论的机会。如果结果不理想,则只能反复尝试修正错误。所谓的“自动化科研”,很多时候只是将这些步骤整合成一个无人参与的流程——虽然减少了人力投入,但问题的

新智元报道大型AI模型的决策机制究竟是由谁掌控?OpenAI最新研究揭示了“指令层级”如何终结大模型中的权力纷争。每当我们与聊天机器人互动时,或许从未考虑过这样一个问题:它们在遵循什么样的指导原则?是否是平台设定的安全规则、开发者制定的产品要求、用户输入的命令词,还是从网页和数据库中获取的信息?当今的大模型已经超越了简单的对话功能。它们能够调用工具、阅读文件、浏览网页,并以“智能体”的身份完成实际

AI过去在比拼谁更擅长执行任务,如今则可能转向竞争谁能更好地自我进化。有人提出了这样一个疑问:人工智能是否已经掌握了“自我的升级迭代”?最新研究显示,Meta公司的一项研究表明AI已经开始探索如何改进自身的进化机制。在实习期间,来自UBC的华人学者Jenny Zhang联合纽约大学的研究者及其他机构共同开发了一种新的智能体框架——HyperAgents(DGM-H)。这项工作的重点并不在于创建一个

新智元报道GitHub 前首席执行官 Thomas Dohmke 拓展人工智能编码领域,获得6000万美元种子轮融资,旨在创建一个专为编程智能体设计的原生开发平台。硅谷投资者正通过实际行动重塑软件工程的基本原则。2026年2月,Thomas Dohmke 创立的新公司Entire完成了6000万美元种子轮融资,估值达3亿美元。领投方Felicis 称其为开发工具史上最大规模的种子轮。投资者的背景显

新智元报道当人工智能从被动预测的工具转变为主动决策的实体时,其面临的安全挑战也在经历一场前所未有的变化。在医疗诊断、金融交易和工业控制等高风险领域部署AI系统后,安全问题已经不再是事后修补的问题,而是决定系统能否顺利运行的关键因素之一。目前针对智能体安全性研究的现状存在结构性缺陷:现有的调研往往只关注数据处理到模型训练再到实际应用这一静态过程中的某个环节,或者是将安全、隐私和鲁棒性等特性孤立开来考