
AI专家卡帕西揭秘:沉迷龙虾游戏引发“AI精神困扰”,不消耗完token便感焦虑
编译 | 陈骏达你提到你最近一直在探索将大型语言模型简化到最核心的版本,这个项目被命名为micro GPT。你认为这个项目能帮助人们更好地理解和使用语言模型。你提到micro GPT是目前你所能构建的最精简的语言模型代码,整个训练代码只有200行Python(包括注释)。这个模型非常易于理解,因为它不涉及任何为了加速训练而复杂化的代码。通过这个项目,你希望能够向更多人展示语言模型训练的本质。你提到
共找到 83 篇相关文章

编译 | 陈骏达你提到你最近一直在探索将大型语言模型简化到最核心的版本,这个项目被命名为micro GPT。你认为这个项目能帮助人们更好地理解和使用语言模型。你提到micro GPT是目前你所能构建的最精简的语言模型代码,整个训练代码只有200行Python(包括注释)。这个模型非常易于理解,因为它不涉及任何为了加速训练而复杂化的代码。通过这个项目,你希望能够向更多人展示语言模型训练的本质。你提到

新智元报道3月16日,大英百科全书联手韦氏词典,将OpenAI告上了法庭,指责其开发的ChatGPT存在多项版权侵权行为。又一起针对OpenAI的法律诉讼。两家机构联合对OpenAI提起诉讼。原因在于,他们认为ChatGPT在生成回复时大量使用了他们的版权材料。大英百科全书准备得尤为充分,不仅指控OpenAI未经授权使用其版权内容,还提出了多项具体侵权行为。这是AI版权诉讼历史上首次尝试对整个生成

IT之家 3 月 22 日消息,过去几年里,研究人员、教师和心理健康专家都震惊地发现,青少年和年轻人正把自己的大脑“外包”给人工智能聊天机器人。如今,他们把这项技术当作拐杖,用来逃避那些不想面对的艰难对话。美国有线电视新闻网(CNN)的最新报道详细描述了一个令人担忧的趋势:越来越多的年轻人在人生中那些微妙、棘手的时刻,让 ChatGPT 等人工智能模型代自己出面。例如,耶鲁大学一名叫帕特里克的学生

OpenAI正计划将其一系列产品整合成一款“超级应用”。在海外,许多人的日常工作流程通常是这样的:他们同时使用网页版的ChatGPT来提问,切换到其他页面搜索资料,再打开代码编辑器或文档进行工作。然而,在3月19日,这家人工智能领域的领军企业对外宣布,正在将ChatGPT应用、Codex编码工具和Atlas浏览器合并成一个桌面“超级应用”。今后,用户不再需要在多个窗口间切换,一个应用就能满足聊天、

对于那些想要快速开发网页小游戏、交互式动画或是教学演示的人来说,复杂的代码逻辑和多元素交互调试往往令人头疼。虽然目前的大语言模型和AI代理能够帮助编写代码并构建交互场景,但在处理复杂交互时却容易出错,而且纯文本的交互方式难以直观地调整视觉效果。最近,来自香港浸会大学、香港科技大学、香港城市大学及深圳大学的研究团队共同开发了一款名为MoGraphGPT的创新系统。该系统结合了上下文感知模块化大模型与

新智元报道迎接智能体的黄金时代,你的电脑即将迎来数字员工。在短短的三天内,三大AI巨头纷纷向桌面系统发起了进攻。OpenAI、谷歌和Anthropic几乎在同一时间全面出击。内部信件显示,OpenAI正强制整合ChatGPT、Codex和Atlas浏览器,打造桌面超级App。同时,闪电收购了Python工具链Astral,动作频频。谷歌则双管齐下,一方面推出了全新的Google AI Studio

苹果据报道,苹果公司预计今年的AI收入将超过10亿美元。尽管该公司在推进自身AI战略方面面临挑战,但其在AI领域仍占据有利地位。尽管苹果的Siri在现代AI标准下表现较弱,但苹果在设备制造方面的领导地位是其他AI公司难以匹敌的。无论是OpenAI、谷歌、Anthropic还是xAI,它们的聊天机器人要想进入消费者市场,iPhone往往是不可或缺的渠道之一。这意味着这些公司通常需要支付所谓的“苹果税

再过几个月,到了今年年中的时候,全球特别是中国的机器人将会比人类跑得更快。在亚布力论坛上,宇树科技的创始人王兴兴提出了这一预测,并在演讲中分享了多项关于人形机器人技术发展的关键信息。产量:2024年全球预计出货量将大幅提升,轻量化设计是普及的关键因素。王兴兴透露,宇树科技计划在2024年发布第二代人形机器人,这一产品在2024年和2025年期间将拥有全球最高的出货量,去年全球出货量大约为5000台

稀宇科技于3月18日发布了新一代Agent旗舰大模型M2.7,首次展示了“模型自我进化”的路径。该模型通过构建Agent Harness体系,据称能够使模型深度参与自身训练与优化流程。在部分研发场景中,M2.7可以承担约30%至50%的工作量,并在内部测试中实现了约30%的效果提升。在SWE-Pro中,涵盖多种编程语言的测试,M2.7以56.22%的正确率与GPT-5.3-Codex持平;在代码生

3月18日,OpenAI发布了两款新的AI模型:GPT-5.4 mini和GPT-5.4 nano。这两款产品旨在满足快速、大规模的AI工作负载需求,同时保持较低的成本。这些小型模型适用于多种AI工作流程。为了达到最佳性能,高效的模型往往需要在响应速度、工具调用能力和性能之间取得平衡。OpenAI强调,这些模型特别适合那些对延迟敏感的应用场景。例如,它们可以用于需要快速响应的编程助手、执行辅助任务

新智元报道【新智元导读】深夜,OpenAI祭出「双子星」GPT-5.4 mini和nano,实力逼近满血版,速度性价比拉满,用来编码、当「龙虾」主力真香!OpenAI一声不吭,又扔了一颗炸弹。今天,GPT-5.4 mini和GPT-5.4 nano正式发布。没有预热,没有倒计时,直接上线。这两个模型要解决的问题很明确:在真实的生产环境里,怎么让AI又快又准又便宜地干活?它们继承了GPT-5.4核心

GPT-5.4 在短短一周内创造了超过10亿美元的年化净收入。 听雨 2026-03-17 14:07:02 量子位 GPT-5.

自2015年ResNet诞生以来,「将输入直接加到输出上」这一简单的机制,几乎统治了所有神经网络架构。近期,沿用了十年的残差机制迎来了重大变革,「注意力机制」成为了其替代方案。这一创新甚至影响到了OpenAI的研究人员,包括负责开发o1/o3系列、Codex编程模型及GPT-4 STEM能力的Jerry Tworek,他深受启发,认为需要重新评估现有的一切,「深度学习2.0」时代即将到来。这一突破

一位科技公司的首席执行官利用AI技术结合基因数据为患有癌症的亲人定制疫苗,效果显著。 闻乐 2026-03-15 14:06:09 量子位

昨日,科技媒体 BleepingComputer 报道,Reddit 上的某些用户发现 ChatGPT 的隐私政策中提到了广告内容,这引发了外界对 OpenAI 是否会在全球范围内推广该功能的猜测。随后,OpenAI 向该媒体发送了一封信函,澄清 ChatGPT 的广告功能目前仅限于美国地区,公司暂无计划在全球范围内推广此功能。值得一提的是,IT之家曾报道过,OpenAI 于今年二月在美国首次推出

3·15曝光后,GEO“AI投毒”生意,仍在继续。今日,《科创板日报》记者调查发现,闲鱼等平台已屏蔽“GEO优化”等直白关键词,但改用“引擎优化”等隐蔽词搜索,仍能发现相关商家正在售卖。有服务商向记者报价:软件服务398元/月或1980元/年,代运营则高达3980元/季度至9800元/年,并承诺覆盖豆包、DeepSeek、ChatGPT等主流AI平台。快思慢想研究院院长田丰向记者称,GEO黑产的本

吴嘉赟博士就读于卡内基梅隆大学(CMU)机器学习系,专注于大语言模型评估和后训练技术的研究。大语言模型在关键领域的应用受到幻觉问题的困扰。最近一项研究提出了一种新的行为校准强化学习方法,旨在解决这一难题。该论文详细探讨了如何通过调整奖励函数来改进LLM的表现。经过特定训练后,一个参数量仅为40亿的小型模型在幻觉抑制方面超越了GPT-5等顶级大模型。图1展示了模型回答数学问题时置信度标注的实例。每一

在3月10日,硅谷知名风险投资公司Andreessen Horowitz(a16z)公布了第六次发布的《Top 100 Gen AI Consumer Apps》榜单。作为中国唯一上榜的AI浏览器,QQ浏览器与ChatGPT、Gemini和DeepSeek一同进入了全球顶级行列。 这份榜单依据SimilarWeb提供的网站访问量数据以及Sensor Tower的月度活
本文探讨了AI行业的最新争议。2月23日,美国人工智能公司Anthropic在官网发布了一份调查报告,指责三家中国头部企业——深度求索(DeepSeek)、月之暗面(Moonshot)和稀宇科技(MiniMax),对他们的模型Claude实施大规模的蒸馏攻击。这不是中国企业首次卷入此类争议。两周前,OpenAI向美国国会提交了一份内部备忘录,指控DeepSeek未经授权访问并利用GPT系列的技术成

最近,一家知名的风险投资公司a16z发布了一份榜单,立即引起了大量网友的关注。 榜单的内容是关于“迄今为止最受欢迎的100款AI应用”。 接下来要提到的是与国内最相关的一个发现—— 在前50名移动AI应用中,有将近一半是由中国团队开发的。 这一现象让人意外:尽管这些工具是中国公司制作的,但使用它们的主要用户却是来自海外。 从全球AI应用市场来看,这种生产大国和消费大国逐渐分离的情况显得