搜索: "工具调用"

共找到 15 篇相关文章

昆仑万维天工AI发布Agent模型SkyClaw-v1.0 支持百万token上下文

凤凰网科技讯 5月26日，昆仑万维集团旗下天工AI正式发布高性能Agent模型SkyClaw-v1.0及轻量化版本SkyClaw-v1.0-lite。该模型支持百万token上下文，深度适配工具调用、代码生成、文件编辑、交互式应用构建等真实工作流场景。据官方介绍，SkyClaw-v1.0在主流Agent评测中表现超过Minimax 2.7、DeepSeek V4 Flash等模型，在OpenCla

科技2026/5/261 阅读

Cursor：请大家再爱我一次

作者｜董道力邮箱｜ [email protected] Coding 的第一阶段，最容易被相信的故事是"原生模型 + 原生应用"的闭环优势。Claude Code 背靠 Anthropic，能最早用上最强的 Claude，模型能力、上下文窗口、工具调用都可以被端到端优化。训练数据、推理参数、工具协议，每一层都可以为 coding 场景专门调校，不需要迁就任何第三方API。相

科技2026/5/262 阅读

国内粉丝魔改DeepSeek V4网页版：记忆、Skills、MCP等功能补齐了

快科技5月24日消息，DeepSeek V4网页版免费使用，很多人使用最多的也是网页而非API，但网页版相比当前的智能体缺少了很多功能，国内已经有人魔改了一下，补全记忆、Skills等功能了。这个项目名为DeepSeek++，是一款为DeepSeek网页版注入类原生工具调用、MCP工具系统、Agentic记忆系统、Skill技能系统、系统提示词预设和自动化任务的Chrome 扩展。它可以让Dee

科技2026/5/251 阅读

AI代理的CPU时代：x86 vs ARM

AI硬件的主线，正在从“GPU够不够”扩展到“系统哪里会堵”。训练时代，GPU和定制加速器吃掉了大部分增量预算；到了推理、Agentic AI和企业AI阶段，任务不再只是一次模型调用，而是规划、检索、工具调用、API交互、状态管理、数据库访问和多轮循环。CPU重新进入定价框架——但更关键的问题是：这轮增量，x86还是ARM在接？据硬AI，美银证券分析师Vivek Arya等在研报中的核心判断是："

科技2026/5/222 阅读

商汤SenseNova U1深度拆解，原生统一架构终结缝合时代

当 AI 行业的目光集中在 Agent、工具调用、长程任务这些上层应用之时，底层的多模态架构正在经历一次更安静、也更彻底的范式转变 —— 它要回答的是一个看似朴素的问题：理解与生成，是否天生就该是两件事长期以来，多模态系统大都是拼起来的 —— 感知与理解、生成各自承担一部分能力，再把它们串起来跑。问题也很明显：理解通过预训练视觉编码器（VE）实现，生成依赖变分自编码器（VAE），两套系统的学习目标

科技2026/5/162 阅读

Monet：让多模态大模型具备类似人类的抽象思维与视觉理解力

“以图思量”的方法，即通过工具调用或代码生成等方式，在思考过程中引入辅助图像（如裁剪、标定、作辅助线等），已成为增强多模态大语言模型视觉推理能力的重要手段。这类方案虽然效果显著，但也带来了对外部工具的依赖性，导致了几个局限。训练和推断复杂度高：在训练过程中，模型需要额外学习各种工具及函数接口的使用方式，增加了训练难度；同时，在多轮交互式推理中也延长了推断延迟时间。可操作类型受限：受制于可用工具种类

科技2026/4/217 阅读

Opus 4.7再夺榜首位置，然而更强大的GPT-5.5预计将于下周发布

新智元报道人工智能领域迎来新的里程碑，Opus 4.7 在两项重要评估中拔得头筹，显示出其在执行复杂任务、工具调用和工程工作流方面的卓越性能。Anthropic 最近发布了名为 Claude Opus 4.7 的新版本。它在这两个最受业界关注的公开评测中再次占据领先地位。根据 Artificial Analysis 的综合智能排名，Opus 4.7 获得了 57 分的成绩，比上一代产品的 53 分

科技2026/4/204 阅读

OpenAI推出类A厂SDK工具：智能体隔离运行，保障长流程任务稳定性

近日，OpenAI对其Agents SDK进行了功能更新。新增的原生沙箱执行环境提升了智能体的安全运行能力，并支持在指定工作空间内处理文件和使用经授权工具；同时实现了管控框架与计算资源分离的设计，增强了系统的安全性、稳定性和可扩展性。此次更新中，OpenAI通过API向所有用户开放了新的功能。定价模式沿用标准API计费方式，根据token使用量及工具调用次数来收费。全新引入的沙箱和管控框架首先会在

科技2026/4/171 阅读

扎克伯格豪掷143亿推出新项目「牛油果」，挑战GPT-5.4，硅谷迎来最昂贵华人创新作品

新智元报道Meta超级智能实验室（MSL）沉寂了九个月后，终于推出首个重要作品Muse Spark，并在深夜引发轰动。该产品的评分从之前的18分跃升至52分，在短短几个月内实现了巨大的飞跃。Muse Spark正式上线，代号为Avocado的它引发了广泛关注。这款产品集成了多种先进技术：原生多模态感知、工具调用、视觉思维链和多Agent编排等全方位功能。在Artificial Analysis的测

科技2026/4/93 阅读

Qwen 3.6-Plus实战评测：8分钟搭建官网，却在京都地铁中迷路

近日，阿里推出了其最新的大语言模型Qwen3.6-Plus，作为Qwen系列的首个升级版本。与前一版相比，该新模型特别加强了编程、智能体和工具调用等领域的技能，并且支持多达一百万个上下文窗口。目前市面上主流的Agent框架及各类编程工具都已适配此最新版本。官方提及的包括OpenClaw、Qwen Code、ClaudeCode、KiloCode、Cline以及OpenCode。在大模型调用平台Op

科技2026/4/38 阅读

Anthropic面对 Claude Code 超51万行代码泄漏事件的反应

3月31日，被视作OpenAI劲敌的人工智能公司Anthropic遭遇了代码泄露事件，这是其在一周内发生的第二次重大数据失误。Anthropic因npm包打包错误，导致大约51.2万行的Claude Code源代码外泄。此次泄漏包括4756个文件和四十多个工具模块以及多项未发布的功能。尽管没有涉及模型权重或用户信息，但泄露的内容揭示了系统的架构、提示词及工具调用机制，并且暴露了一些尚未公开的功能

科技2026/4/15 阅读

OpenAI发布GPT-5.4 mini和nano版本，性能媲美旗舰产品，成本却低了三分之二

3月18日，OpenAI发布了两款新的AI模型：GPT-5.4 mini和GPT-5.4 nano。这两款产品旨在满足快速、大规模的AI工作负载需求，同时保持较低的成本。这些小型模型适用于多种AI工作流程。为了达到最佳性能，高效的模型往往需要在响应速度、工具调用能力和性能之间取得平衡。OpenAI强调，这些模型特别适合那些对延迟敏感的应用场景。例如，它们可以用于需要快速响应的编程助手、执行辅助任务

科技2026/3/183 阅读

AI巨擘悟空出世，阿里价值待重估：市场仍未充分认识其潜力

悟空平台的发布标志着阿里巴巴在AI领域迈出了重要的一步。它不仅具备多模态、工具调用和自主规划等功能，还在阿里巴巴内部及合作伙伴中进行了大规模测试，展现了强大的潜力。这表明阿里巴巴已经正式进入“AI Agent全面取代传统软件”的新阶段。在当前的技术浪潮中，阿里正通过一系列创新举措，稳步迈向AI决赛圈。公司不仅在云计算和自研芯片方面持续取得突破，还在企业级AI应用方面取得了显著进展。以AWS为例，其

科技2026/3/1715 阅读

国产万亿参数多模态大模型正式开源，为企业级应用带来强力支持！

YuanLab.ai团队近日宣布，正式开源源Yuan3.0 Ultra这一多模态基础大模型。作为源3.0系列的一部分，这款旗舰模型是目前仅有的三个达到万亿级参数规模的开源多模态大模型之一。它通过引入MoE架构来优化训练效率，并针对企业应用及智能体工具调用进行了深入改进，在多模态文档理解、检索增强生成（RAG）、表格数据分析和内容摘要等领域表现出色。该模型能够高效处理企业环境中的复杂信息，如图

AI2026/3/621 阅读

国产万亿参数多模态大模型开放源代码，成企业级OpenClaw理想伙伴

YuanLab.ai团队近日正式发布了源Yuan3.0 Ultra多模态基础大模型的开源代码。作为源3.0系列中的旗舰产品，源Yuan3.0 Ultra是全球少数几个可以公开获取的万亿级参数规模的大模型之一。源Yuan3.0 Ultra在设计上引入了混合专家（MoE）架构，并针对企业应用和智能体工具调用进行了优化，在多模态文档理解、检索增强生成、表格数据分析以及内容摘要等方面表现出色。这些能

AI2026/3/638 阅读