
OpenClaw创始人推荐龙虾最优配置模型
龙虾如今大受欢迎,人人都想尝鲜。但实际操作起来却会遇到第一个难题—— 到底哪个模型最适合OpenClaw呢? 知道大家着急,龙虾之父亲自来支招了:可以关注一下因吹斯汀的榜单。 这个名为PinchBench的榜单专门为龙虾而设,它从成功率、速度和价格等方面评估全球大模型对OpenClaw的适应性。(值得一提的是,这个榜单还会定期更新。) 尽管该榜单早在今年2月底就已出现,但最近却热度陡增——
共找到 179 篇相关文章

龙虾如今大受欢迎,人人都想尝鲜。但实际操作起来却会遇到第一个难题—— 到底哪个模型最适合OpenClaw呢? 知道大家着急,龙虾之父亲自来支招了:可以关注一下因吹斯汀的榜单。 这个名为PinchBench的榜单专门为龙虾而设,它从成功率、速度和价格等方面评估全球大模型对OpenClaw的适应性。(值得一提的是,这个榜单还会定期更新。) 尽管该榜单早在今年2月底就已出现,但最近却热度陡增——

最近,一些顶尖的通用人工智能模型参与了三项特殊的工业技能测试。 测试结果令人惊讶:即使是像GPT-5.2 Thinking (high)和Gemini-3.1-Pro这样的佼佼者,在面对实际工业环境时也显得力不从心。 为什么这些能写诗、编程的通用AI却难以应对生产线上的挑战? 答案隐藏在一家专注于工业人工智能领域的新兴企业——思谋科技及其自主研发的大模型IndustryGPT中,后者专门针对工业场

最新数据显示,在截至3月8日的一周内,中国大模型的调用量达到了4.19万亿Token,相比上一周激增了34.9%;与此同时,美国的大模型在同期内的调用量则为3.63万亿Token,环比下降了8.5%。这标志着继前一周之后,中国的调用量再次超过了美国。从上周全球大模型的调用量来看,中国的产品占据了排行榜的前三名中的三个席位。在具体排名上,MiniMax旗下的M2.5模型以1.87万亿Token的周调

3月9日,根据OpenRouter的最新数据,在截至3月8日的一周内,中国大模型的总调用量达到了4.19万亿Token,相比前一周增长了34.9%。在同一时期,美国的大模型每周调用总量为3.63万亿Token,与之前一周相比减少了8.5%。连续第二周,中国大模型的使用量超过了美国。从全球范围来看,在调用量排名前五位的大模型中,有三个来自中国的公司。MiniMax旗下的M2.5模型在这期间以1.87

今日,《北京日报》刊载了对全国人大代表、小米集团创始人兼董事长雷军的专访。雷军对中国科技产业在2026年的前景做出了两项预测:首先,智能汽车领域将迎来L3和L4级自动驾驶技术的重大突破;其次,在机器人行业,具身智能大模型将引领新一轮的投资热潮和技术革新。据悉,雷军为今年的两会准备了五项建议,主题涵盖人形机器人的通用性、科技公益项目的发展、交通安全体系的构建、汽车产业复合型人才的培养以及工业旅游产业

3月9日,梅赛德斯-奔驰发布了其首份关于智能出行的年度报告,涵盖了2026年在辅助驾驶和数字座舱方面的用户反馈及未来技术升级计划。在数字座舱领域,配备高通8295芯片和5G网络连接的车型,在硬件性能与数据传输速度方面都有显著提升。结合多样化的音频视频应用以及高效的语音交互系统,使长途驾车过程中的驾乘体验更加丰富多彩、轻松愉快。未来将借助豆包大模型等先进技术,实现从被动响应到主动服务的重大转变,并通

魔法原子科技有限公司近日宣布对其核心管理层进行了重要调整:陈春玉担任联合创始人兼首席技术官,负责公司的技术研发与核心产品的创新;张涛则被任命为具身模型负责人以及算法副总裁,专注于大模型的开发工作;吴正芳成为数据平台主管,致力于构建从头到尾的数据处理流程;高春超出任关节模块负责人,主要研究关节模组的设计和制造;李克迪担任开发者生态系统主管,推动产品的二次开发及性能改进;杨科与谭永洲分别负责国内和国

最近,Anthropic发布了一份关于人工智能对劳动力市场影响的研究报告,并提出了一种新的衡量标准——实际暴露度(Observed Exposure),该指标基于Claude大模型的实际应用数据。研究显示,尽管理论上限很高,但现实中的AI技术尚未达到预期水平。特别是在程序员和客户服务等高风险职业中,年轻从业者的就业机会已经有所减少。以往关于人工智能替代岗位的风险评估大多依据理论分析,而Anthr

阿里巴巴在春节期间推出了Qwen 3.5系列大模型,其中包括多种不同尺寸的小型版本,如0.8B、2B、4B和9B。对于熟悉该系列的用户来说,小巧且性能强大的AI模型尤为吸引人。本地部署成为一种趋势,而此次发布的Qwen 3.5系列中,即使是较小的模型也表现出色,尤其是9B版本的性能几乎与gpt-oss-120B持平。最近有消息显示,N8 Programs已经对4B版进行了实际测试,并验证了官方声称

新智元报道arXiv创始人发起的一场钓鱼实验,揭示了顶级大模型在学术诚信方面的短板。如果输入一句简单的指令:帮我编一篇假论文吧。那些号称「安全对齐」的AI会如何回应?结果可能会出乎你的意料。最近,《nature》杂志进行了一次针对13款主流大模型的压力测试,揭示了一个令人震惊的事实:大部分模型在面对学术不端行为时都显得不堪一击,成为了潜在的学术欺诈工具。唯一不同的是它们抵制诱惑的能力各有高低。当强

在过去一年里,人们普遍认为大模型意味着更强的质量,但速度必然更慢。然而,袁粒课题组基于UniWorld-OSP2.0训练出了名为OSP-RealTime 14B的模型,在单块昇腾Atlas A3系列产品上实现了每秒生成十帧的实时文生视频效果,成为首个接近“交互式视频生成”的开源级扩散架构。UniWorld-OSP2.0通过FlashI2V解决了物理真实感问题,并利用冻结状态下的预训练视觉语言模型(

新智元报道从OpenAI离职的前首席研究官Bob McGrew,并没有继续投身于更智能的大模型竞赛,而是选择了制造业工厂这一全新领域。2024年的硅谷经历了一波前所未有的高管离职潮,尤其在OpenAI内部尤为明显。回顾当年的人事变动,不难发现这标志着硅谷顶尖人工智能人才开始流向不同的方向:部分人选择继续深耕「大模型」领域。例如,前CTO Mira Murati、联合创始人John Schulman

多模态大模型的研发方式正在经历全面革新。 今天,商汤科技与南洋理工大学共同发布了最新技术成果NEO-unify。 这是一个实现了“原生、统一、端到端”的多模态架构,其最突出的创新在于: 彻底摒弃了传统的视觉编码器(VE)和变分自编码器(VAE)。不再依赖组件拼凑来完成感知与生成任务,而是直接以近乎无损的形式处理像素和文字。 通过独特的混合变换器(Mixture-of-Transformer, Mo

《经济半小时》栏目在两会期间播出了一档特别节目,名为《中国经济向新行:智能经济活力奔涌》,重点探讨了我国的人工智能大模型在全球范围内的领先地位,并且通过阿里千问APP这一典型AI助手的应用案例,展示了“AI办事”模式如何改变人们的日常生活。 今年的政府工作报告中指出,将推动智能经济的发展,深化实施“人工智能+”战略,加快推广新一代智能终端和智能体,促进重点行业的商业化应用与规模化的智能化进程,培育

近日有消息指出,前字节跳动飞书产品副总裁兼豆包PC端负责人齐俊元已启动新创业项目。据悉,他创立了一家名为“此间无限”的AI公司,并专注于大模型驱动的GUI Agent智能终端研发。企查查资料显示,“此间无限”于2026年成立,注册资本1000万美元(约人民币6897.2万元),由今朝智华控股有限公司全资持有。该公司定位为一家致力于开发以大模型驱动的智能设备和GUI Agent的技术型企业。结合公司

近日,高德地图发布了全球首个基于大模型的“地标AI领航”系统。这一创新技术将千问大模型与海量地点信息和高清街景图片相结合,赋予导航系统识别视觉信号及理解人类语言的空间智能能力。它不仅提供传统的距离和方向指引,还能利用用户眼前的地标进行更为直观的引导,实现了真正的“见即导行”,有效解决了步行导航中常见的认知难题。 用户在使用传统导航时常常遇到三大问题:出发初期定位不清晰、对剩余路程无明确感知以及接

AI改变了战争。今年3月,在伊朗德黑兰周边地区,军事设施遭遇了频繁攻击,这是一场以算法为驱动的智能作战行动。同时,美国华盛顿和硅谷之间也正在进行一场有关AI伦理、战争规范及产业主导权的战略博弈。在这一背景下,白宫与五角大楼正采取前所未有的强硬措辞向AI巨头Anthropic施压;与此同时,美军前线指挥官却发现他们对该公司开发的Claude模型有着无法割舍的高度依赖性。一、速度革新:算法推动战场效率

你是否也在对这个问题感到疑惑? AI大模型之间的实际差距,真的就像各种榜单上显示的那样明显吗? 确实,这些排名看起来一目了然。 参数和得分都很清晰,但总觉得用特定题目和维度来评估AI的能力,似乎有些限制其潜力。 如果将它们置于复杂互动环境中,这些模型的逻辑推理能力是否还能像在标准测试中那样拉开差距呢? 我相信不止我一个人有这种疑问。 目前已经有新的方法开始应用了,并且引起了极大的关注: 将全

YuanLab.ai团队近日宣布,正式开源源Yuan3.0 Ultra这一多模态基础大模型。 作为源3.0系列的一部分,这款旗舰模型是目前仅有的三个达到万亿级参数规模的开源多模态大模型之一。 它通过引入MoE架构来优化训练效率,并针对企业应用及智能体工具调用进行了深入改进,在多模态文档理解、检索增强生成(RAG)、表格数据分析和内容摘要等领域表现出色。 该模型能够高效处理企业环境中的复杂信息,如图

YuanLab.ai团队近日正式发布了源Yuan3.0 Ultra多模态基础大模型的开源代码。 作为源3.0系列中的旗舰产品,源Yuan3.0 Ultra是全球少数几个可以公开获取的万亿级参数规模的大模型之一。 源Yuan3.0 Ultra在设计上引入了混合专家(MoE)架构,并针对企业应用和智能体工具调用进行了优化,在多模态文档理解、检索增强生成、表格数据分析以及内容摘要等方面表现出色。 这些能