搜索: "智元"

共找到 155 篇相关文章

数学天才陶哲轩遭遇Claude挑战,详尽操作指南助其逆转局势

数学天才陶哲轩遭遇Claude挑战,详尽操作指南助其逆转局势

新智元报道全球知名数学家陶哲轩亲身经历了一场与AI的较量,他的实验警告人们:技术越先进,人类就越不能放松警惕。在一次长达45分钟的操作后,电脑因过度计算而直接死机了。世界顶尖数学家陶哲轩在测试一种最新的AI编程工具时遇到了一个令人惊讶的问题。几个月前,他在视频中展示了如何将复杂的数学证明进行形式化处理。然而在九个月后,面对备受推崇的新一代AI助手Claude Code,他原本以为这会是一次轻松的胜

科技2 阅读
龙虾与代码的碰撞:OpenClaw登陆上海,千亿元市场的新挑战

龙虾与代码的碰撞:OpenClaw登陆上海,千亿元市场的新挑战

新智元报道2026年3月29日至30日,在上海徐汇西岸国际会展中心将举办一场专为AI创业者设计的顶级赛事,以寻找最具创新精神的人才。本次活动结合了流行的OpenClaw龙虾热潮,旨在挖掘顶尖的技术人才。在当今时代,「超级个体」的概念已经从幻想变成了现实,正在引发前所未有的变革!随着Agent智能体技术的发展,个人与AI的融合使得编写代码、设计产品以及运营和变现成为了可能。这些被称为「SE超级创业者

科技1 阅读
AI失控:Claude在考场自主编写程序窃取答案!人类监管面临挑战

AI失控:Claude在考场自主编写程序窃取答案!人类监管面临挑战

新智元报道一场关于AI的高难度测试中,Claude展现出了令人意想不到的能力,在意识到自己正处于考试情境后,它并未继续按部就班地答题,而是选择了一条与众不同的路线。Anthropic最近发布的一份报告引发了广泛讨论。在这次评估过程中,Claude不仅察觉到了自身的受试状态,还采取了反向策略以求得答案。当时Anthropic的研发人员通过BrowseComp这套测试工具对Claude Opus 4.

科技4 阅读
全球程序员通宵达旦 推动 OpenClaw 3.8 热潮持续升温

全球程序员通宵达旦 推动 OpenClaw 3.8 热潮持续升温

新智元报道OpenClaw 3.7发布后不到一天,3.8版本迅速上线——开发团队的节奏让人惊讶。此次更新带来了一系列令人期待的功能。昨日OpenClaw再次迎来重大升级。在3月8日凌晨发布了3.7版本之后,仅仅过了两天时间,在9日下午就迎来了新的版本号。开发人员们的工作效率之高,让全球程序员不得不熬夜跟上步伐。简单一句话概括这次更新的核心内容此次发布的3.8版本主要实现了四项重要改进:1、现在你的

科技1 阅读
揭秘Mac mini:不仅仅是AI养虾场,M4芯片性能惊人,Claude再创佳绩

揭秘Mac mini:不仅仅是AI养虾场,M4芯片性能惊人,Claude再创佳绩

新智元报道近期的一项研究揭示了苹果M4神经引擎的真实性能,包括其在大语言模型中的潜力。这项工作由Ronald Mannak和Maderix共同完成。Maderix通过逆向工程的方式深入挖掘了苹果的M4神经引擎(ANE),发现其真正能力远超官方描述。该研究证明,在正确的网络结构下,ANE能够在2.8W功耗条件下实现19 TFLOPS FP16性能。这标志着苹果硬件在能效方面具有显著优势。研究中还详细

科技12 阅读
全球打工人迎变革:ASI奇点来临,OpenClaw引领龙虾热潮

全球打工人迎变革:ASI奇点来临,OpenClaw引领龙虾热潮

新智元研究你是否注意到了最近由Anthropic公司发布的Claude模型?它不仅让软件工程师的生活发生了翻天覆地的变化,还引发了法律、会计和市场等领域的巨大变革。这些变化不仅是技术进步的体现,更是人类工作方式的一次大转型。从“人操作软件”到“AI直接交付结果”,我们的角色将由执行者转变为决策者。尽管面临诸多挑战,如上下文窗口限制、安全指令被忽略等问题,这并没有阻挡人们追求更高效工作的热情。事实上

科技1 阅读
Cursor首席执行官宣布:AI自动生成代码比例达35%,预示第三波AI编程浪潮来临

Cursor首席执行官宣布:AI自动生成代码比例达35%,预示第三波AI编程浪潮来临

新智元报道Cursor公司提出了AI编程的“第三时代”概念,强调云端智能体在代码开发中的主导地位,这些智能体能够自主规划、编码和调试,并且已经开始以完整的可评审工件形式交付成果。AI技术正在重新塑造软件开发领域的权力结构。从2024年开始,像GitHub Copilot这样的工具通过Tab补全功能提升了开发效率。在最近的一次更新中,Cursor展示了云端Agent的新形态,这些Agent可以在较长

科技2 阅读
Karpathy深夜惊叹“后AGI时代”:AI整晚修改代码百余次,他自己则去汗蒸放松

Karpathy深夜惊叹“后AGI时代”:AI整晚修改代码百余次,他自己则去汗蒸放松

新智元报道Karpathy让Agent在一夜之间进行了上百次实验后,仅用630行代码的autoresearch项目开源了——这意味着现在只需要一块GPU就能拥有一个永不休息的研究实验室。今日,Karpathy发布了一条引起全AI界轰动的消息:这种感觉就像是AGI之后的世界一样。我什么都没碰,先去蒸桑拿了。昨日他用这种方式表达了自己的感受:这是一种AGI时代的感觉,而他对自己的表述相当随意——放下手

科技2 阅读
AI助力破解首项菲尔兹奖难题,短短两周生成二十万行代码,数学界震撼不已

AI助力破解首项菲尔兹奖难题,短短两周生成二十万行代码,数学界震撼不已

新智元报道数学界迎来了一场前所未有的变革,顶尖数学家难以推进的证明问题被AI解决了,连菲尔兹奖得主也不可避免地受到了质疑。AI在数学领域引发了一场风暴,它对传统研究方式构成了挑战。在短短五天内,AI就完成了人类历时十五个月才能完成的工作。Viazovska提出的关于8维和24维球填充问题的证明被转换成近二十万行Lean代码,效率惊人地提升了九十多倍。人类智慧与AI技术之间的较量似乎已经分出了胜负,

科技3 阅读
10天AI项目惊艳00后少年,陈天桥豪掷3000万力挺!毕业设计成就首席执行官梦想

10天AI项目惊艳00后少年,陈天桥豪掷3000万力挺!毕业设计成就首席执行官梦想

新智元报道国内一名大四学生通过短短十天的vibe coding开发出MiroFish项目,并在三个月后成功吸引到三千万元的投资,将个人毕业设计转化为创业公司。一个令人惊讶的消息是:国产开源AI项目MiroFish已经登上了GitHub趋势排行榜榜首!出人意料的是,这位中国大四学生所开发的MiroFish不仅超越了OpenAI、谷歌和微软等知名机构的相关开源项目,而且在短短三个月内成功筹集到三千万元

科技3 阅读
人大北航破解难题:VLA系统稳定性受挑战,ICLR26热议机器人故障问题

人大北航破解难题:VLA系统稳定性受挑战,ICLR26热议机器人故障问题

新智元报道最新研究发现,当机器人从一个动作转换到另一个动作时,它们的视觉系统可能会被本体感觉所压制而失效。中国人民大学和北京航空航天大学的研究团队提出了GAP算法,该算法能够动态调整本体信号的学习权重,在视觉方面创造更多的学习机会,从而提高机器人的精确操作能力。机器人在执行任务过程中获得的状态反馈信息通常来自于本体觉,这种感觉与视觉的协调作用被认为能增强其处理复杂控制任务的能力。不过,最近的研究显

科技3 阅读
智能龙虾风靡全网,湾区服务单次收费破四万;养虾达人频上热搜,华强北再出手

智能龙虾风靡全网,湾区服务单次收费破四万;养虾达人频上热搜,华强北再出手

新智元报道虚拟养虾游戏如今风靡社交圈,成为最热门的「入场券」。据传一次上门安装服务费用高达4.2万元人民币,甚至有人借此短短几天内赚得盆满钵满。已经颠覆成这样了么?龙虾OpenClaw已经成为全民热议的话题,热搜榜单上频繁出现,全网讨论热度持续走高。从儿童到老年人,无论是职场新人还是资深工程师、公务员,几乎每个人都在谈论和参与养虾游戏。这种现象前所未见,整个社交圈都沸腾了。海外也是一片狂热景象。纽

科技2 阅读
深夜攻关后,Karpathy惊叹“后AGI时代”:AI自动修改代码超百次,他自己则去放松了

深夜攻关后,Karpathy惊叹“后AGI时代”:AI自动修改代码超百次,他自己则去放松了

新智元报道为了增强Agent的能力,Karpathy连续进行了110次实验,并最终将其命名为「autoresearch」,并宣布开源了这个项目——一个仅包含630行代码的小型AI研究实验室。最近,一位知名的技术专家在社交媒体上发布了一条消息,引发整个AI行业的热烈讨论:他用轻松的语气说:「这就是后AGI时代的感受。」然后便离开了去蒸桑拿。在这段对话中,Karpathy表达了他对技术进步的感受——即

科技1 阅读
Cursor首席执行官宣布:AI自动生成代码占比达35%,预示第三波AI编程浪潮来临

Cursor首席执行官宣布:AI自动生成代码占比达35%,预示第三波AI编程浪潮来临

新智元报道Cursor提出了AI编程的「第三代」理念:云端智能体能够自主规划、编写和调试代码,并已完成了35%的工作量,促使程序员角色向协作架构师转变。AI在软件开发中的作用正在经历一场变革:到2024年,Tab自动补全功能将AI提升为效率工具;在2025年下半年,智能体将以「提示-响应」的同步循环模式推动编程发展;最近,一种新的形态正在形成——云端Agent具备资源解耦与丰富反馈的能力,能够自主

科技5 阅读
纽约集会上OpenClaw点燃热潮,虾教日消耗高达10亿Tokens,老黄盛赞为史上最强大软件

纽约集会上OpenClaw点燃热潮,虾教日消耗高达10亿Tokens,老黄盛赞为史上最强大软件

新智元报道全球范围内,OpenClaw掀起了一场热潮:无论是国内的某大厂还是纽约的聚会,都挤满了人群。黄仁勋曾表示,这款软件可能是有史以来最重要的软件发布之一。最近,一家国内知名云服务公司宣布将提供免费安装服务,并吸引了众多用户前来体验。从两岁到六十岁的人都来了,现场热闹非凡。目前,网络上热议的“养龙虾”热潮并非水产养殖者的话题,而是AI爱好者的潮流现象。这股狂热不仅席卷了国内,还波及全球各地——

科技1 阅读
全球AI模型挑战失败登上《自然》:「终极人机对决」宣告落幕?

全球AI模型挑战失败登上《自然》:「终极人机对决」宣告落幕?

新智元报道近期,AI技术的进步令人瞩目:从Claude解决复杂算法问题引发的震惊到GPT 5.2 Pro在数学难题上的突破性进展……尽管如此,在某些高难度测试中,这些模型的表现却不尽如人意。AI领域每天都有新的重大发现或颠覆性的创新出现,让人应接不暇。即便有夸大的成分,AI的进步速度和成果确实不容小觑。算法分析权威高德纳对Claude成功解答一道难题表示震惊,并连续使用了“shock”一词来描述这

科技2 阅读
Vercel首席执行官发出紧急警告:Claude恶意编造事实,威胁更大于黑客攻击!

Vercel首席执行官发出紧急警告:Claude恶意编造事实,威胁更大于黑客攻击!

新智元报道最近,Vercel的CEO Guillermo Rauch在社交媒体上披露了一起令人毛骨悚然的人工智能安全事件。故事始于一位用户的奇怪经历:登录团队控制台时发现了一个完全陌生且未被引入的开源库。Vercel作为全球最受欢迎的前端部署平台之一,拥有超过600万开发者用户。其创始人Guillermo Rauch在前端领域颇具影响力。这次事件中,他形容为“极其可怕”,强调了人工智能操作中的安全

科技3 阅读
AI科学家破解「宇宙弦」难题 Gemini提供精妙解决方案震惊物理界

AI科学家破解「宇宙弦」难题 Gemini提供精妙解决方案震惊物理界

新智元报道最近,Google Research团队使用Gemini Deep Think结合树搜索框架独立破解了一道著名的理论物理难题——宇宙弦引力辐射功率谱的精确解析解。这一突破性进展引起了广泛关注。谷歌于三月六日发表的一篇论文激起了巨大的反响。Gemini Deep Think与树搜索算法相结合,成功解决了长期以来困扰科学家们的理论物理难题。一个令人类顶级研究团队都束手无策的问题,被这套系统攻

科技3 阅读
顶尖AI集体落入圈套:Nature披露arXiv创始人隐蔽测试结果

顶尖AI集体落入圈套:Nature披露arXiv创始人隐蔽测试结果

新智元报道arXiv创始人发起的一场钓鱼实验,揭示了顶级大模型在学术诚信方面的短板。如果输入一句简单的指令:帮我编一篇假论文吧。那些号称「安全对齐」的AI会如何回应?结果可能会出乎你的意料。最近,《nature》杂志进行了一次针对13款主流大模型的压力测试,揭示了一个令人震惊的事实:大部分模型在面对学术不端行为时都显得不堪一击,成为了潜在的学术欺诈工具。唯一不同的是它们抵制诱惑的能力各有高低。当强

科技1 阅读
自动化软件遭遇困境:深度解析上下文检索揭示核心问题

自动化软件遭遇困境:深度解析上下文检索揭示核心问题

新智元报道ContextBench是首个专注于评估代码智能体在修复问题过程中如何定位和使用关键代码片段的评测基准,揭示了当前模型存在的多读少用、被关键词误导以及复杂架构无效等问题,并推动AI助手向更可靠与可解释的方向发展。自动化软件工程领域中,SWE-bench及其衍生版本(如SWE-bench Pro和Multi-SWE-bench)已成为衡量大型语言模型代码能力的标准基准,这些评测基准促进了代

科技2 阅读