
新一代GPT-5.6问世,Claude Sonnet 4.8紧随其后曝光!
新智元报道最近,GPT-5.5发布后不久,后台日志中就出现了GPT-5.6的身影;与此同时,Anthropic的一个未曾公开的项目代号——Jupiter也被曝光了!这两家公司的下一代模型几乎在同一时间浮出水面,显示出新一轮AI竞赛的速度比人们预想得更快。GPT-5.5的热潮还未消退,OpenAI的研发团队便已开始测试其后续版本GPT-5.6。昨日有开发者在Codex内部系统中发现了一条不同寻常的日
共找到 4 篇相关文章

新智元报道最近,GPT-5.5发布后不久,后台日志中就出现了GPT-5.6的身影;与此同时,Anthropic的一个未曾公开的项目代号——Jupiter也被曝光了!这两家公司的下一代模型几乎在同一时间浮出水面,显示出新一轮AI竞赛的速度比人们预想得更快。GPT-5.5的热潮还未消退,OpenAI的研发团队便已开始测试其后续版本GPT-5.6。昨日有开发者在Codex内部系统中发现了一条不同寻常的日

中国媒体称,人工智能(AI)公司深度求索(DeepSeek)的多名核心员工在过去一年里离职,下一代模型V4可能会在4月发布。据中国科技媒体“晚点LatePost”报道,去年下半年以来,DeepSeek已有多名核心员工离职。其中,DeepSeek第一代大语言模型的核心作者、参与历代模型训练的王炳宣,去年底被科技巨头腾讯挖走。DeepSeek-OCR系列的核心作者魏浩然约在春节前后离开,DeepSe

江宇撰写,云鹏编辑3月18日,智东西报道,英伟达GTC大会于今日凌晨召开,月之暗面创始人杨植麟作为唯一受邀现场演讲的中国独立大模型公司创始人,发表了题为《How We Scaled Kimi K2.5》的演讲,首次完整披露了Kimi K2.5背后的技术路线图。3月16日,月之暗面刚刚发布了一篇论文,预告了下一代模型的关键模块——注意力残差(Attention Residuals,简称AttnRes

智东西作者|陈骏达编辑|云鹏“一切都需要被重新思考,深度学习2.0时代即将来临。”在读完下方这篇来自月之暗面的最新论文后,前OpenAI大牛、“推理模型之父”Jerry Tworek发出感叹。智东西3月16日报道,今天,月之暗面发布论文,提前预览了下一代模型的关键模块——注意力残差(Attention Residuals,简称AttnRes)。论文的核心亮点在于对大模型中最基础、但长期被忽视的结构