近期,OpenAI动作频繁——
刚刚挖来了龙虾之父,紧接着又迅速收购了一家初创公司。
收购的目标是一家专注于智能体安全问题的创业企业。
据公告披露,此次被收购的是Promptfoo,一家致力于AI安全与评估的年轻公司。
Promptfoo在开源社区中的影响力不容小觑——
它开发的Promptfoo评测框架是行业内最受欢迎的开源工具之一,已有超过30万名开发者用户,并且在GitHub上获得了11.2K star的关注度。
在被收购之前,包括OpenAI、Anthropic以及亚马逊在内的许多知名机构都是它的忠实客户。
OpenAI B2B应用CTO表示,随着企业将“AI同事”融入日常工作中,评估、安全和合规性成为不可或缺的需求。
因此,Promptfoo的加入对OpenAI来说至关重要,填补了其在智能体安全性方面的一个重要空白。
收购完成后,Promptfoo将继续保持开源状态。
据公开资料记载,Promptfoo成立于2024年,并由两位创始人共同创立。
其中一位担任公司CEO的创始人曾任Discord LLM工程与开发者平台负责人,另一位CTO则曾在Smile Identity担任过工程副总裁及AI主管。
创立Promptfoo的想法源自于团队关注到的一个问题:
他们决定从现有的大模型赛道中开辟新的道路,推出一些独特的AI安全检测工具来实现差异化竞争策略。
这一策略似乎取得了成功。
尽管成立时间不长,但Promptfoo已经吸引了大量用户——
目前每月活跃开发者超过30万,财富500强企业中的25%(约有125家)团队也在使用其产品。
这样的成绩也得到了资本市场的认可。
最新一轮融资发生在2025年7月,由Insight Partners领投,a16z参投,Promptfoo成功筹集了1840万美元(约人民币1.27亿元)A轮融资。
根据金融信息平台PitchBook的数据,自成立以来,该公司累计融资额为2300万美元(约合人民币1.58亿),而最近的一轮投资使公司的估值达到了8600万美元(约人民币5.92亿)。
(注:以上不包括此次收购的交易金额,双方尚未披露具体细节。)
这样的成就很大程度上得益于其核心产品——Promptfoo开源评测框架。
该框架旨在解决众多AI团队面临的一个实际难题:
大模型虽然功能强大,但测试起来却十分困难。
在传统的软件开发中,开发者可以通过单元测试和自动化测试确保系统的稳定性;但在大模型时代,很多团队往往只能通过不断尝试不同的提示词并手动检查输出结果来调整模型。
这种方法不仅效率低下,而且难以保证上线后的稳定性和安全性。
Promptfoo的目标是将AI应用的测试过程转化为一套标准化的工程流程。
具体来说,该框架具备以下几项主要功能:
自动化评测。开发者能够批量测试不同的提示词和模型,并让系统自动评估输出效果。
比如下图所示,Promptfoo用于对比不同开源模型的性能表现。
二是AI红队演练。通过模拟真实用户可能发起的各种攻击行为,提前发现LLM应用中的潜在漏洞并生成详细的报告。
三是工程化集成。该框架可以直接嵌入开发流程中,在CI/CD流程中自动运行模型测试、在代码提交时扫描LLM相关的安全问题,并将评测结果分享给团队成员。
总结来说,Promptfoo试图把原本充满玄学的“调用提示词和评估模型”的过程变成一套像软件测试一样可重复且量化的工程体系。
从使用方式来看,它既提供网页可视化界面也支持命令行工具(CLI),开发者可以在本地或服务器上执行大规模评测任务。
Promptfoo的长远目标是让这个框架成为AI领域的标准工具,就像CI在DevOps领域中不可或缺一样重要。
无论何时引入新的模型、更改提示词还是集成新工具时,系统都会自动进行评估与红队测试,并根据安全报告的结果决定是否放行或拦截操作。
事实上,在2025年完成A轮融资后,公司就开始将重点转向智能体领域。当时他们观察到:
智能体正在重新定义互联网的结构和功能。
具体表现为四个趋势:多智能体协作、MCP成为标准协议、语音交互爆发以及测试驱动开发。
这一转变恰好迎合了OpenAI在“龙虾时代”的战略布局需求。
关于为何在此时收购这样一家公司,答案显而易见:
首先是因为智能体技术过于炙手可热;其次则是随着热度的上升,安全问题日益突出。
智能体的重要性无需赘述。自从著名的“删除邮件事件”以来,这些问题就开始显现出来。
归纳起来无非两点:
实际上,问题不在于模型本身,而是在于智能体所获得的高度权限。
过去的大模型主要职责是生成内容。即使出现问题,影响也多停留在信息层面——比如误导性回答或错误答案。
然而现在为了执行任务,它们通常被赋予了更多真实世界的操作权,包括访问电子邮件、文档和数据库,以及调用各种API和企业工具等敏感操作权限。
这意味着一旦发生误判或是受到恶意提示词的影响,问题就不再仅仅是“回答错误”,而是可能直接导致实际的操作失误。
这其中的风险有多大,想必也不需要多说了(这也是为什么许多人不敢轻易使用智能体的原因之一)。
对于企业而言更是如此。当越来越多公司开始将业务流程交给智能体管理时,这种风险无疑会被成倍放大。
但龙虾不一样。
正是在这个背景下,“第一批养龙虾的人已经失眠了”这一话题在微博上引起了广泛关注——
大家关注的焦点主要是安全问题。
对此,OpenAI通过一系列行动来应对挑战——
首先邀请到了“龙虾之父”,随后又迅速收购了Promptfoo这样的智能体安全公司。
根据双方发布的公告显示,Promptfoo的技术将被整合进OpenAI Frontier平台中。后者是一个专门用于创建和运行智能体的综合性平台。
收购之后,Promptfoo将继续保持独立运营模式,而OpenAI则会提供相应的支持服务。
对此,网友们普遍认为这是一个双赢的局面。
特别是在智能体时代,拥有自动执行任务能力的龙虾已经开始成为评估大模型真实性能的新工具——
过去或许还能通过刷榜来获得关注,但现在一切都需要真正的实战检验了。
而被收购后,Promptfoo也将和OpenClaw项目类似,继续保持独立运营,OpenAI仅起到提供支持的作用。
对此,网友们也纷纷感慨,这次真的算是双赢了。
尤其在智能体时代,会自动执行任务的龙虾已经可以成为评测大模型的新工具——以前还能刷刷榜,但现在全都得“真刀真枪”上战场拼杀了。
嗯?让龙虾成为检验大模型真实能力的新工具,细想之下确实合理和巧妙。
你说呢?
