
MiniMax发布M3模型:1M上下文原生多模态,编程能力超GPT-5.5
凤凰网科技讯 6月1日,稀宇科技正式发布新一代模型MiniMax M3。该模型具备前沿编程能力、最高1M超长上下文,并支持原生多模态(图片、视频输入及电脑桌面操作),成为国内首个同时具备这三项能力的模型,也是目前唯一的开源模型。据官方披露,在编程评测集SWE-Bench Pro上,M3得分59.0%,超过GPT-5.5和Gemini 3.1 Pro,接近Opus 4.7;在Agent评测Claw-
共找到 40 篇相关文章

凤凰网科技讯 6月1日,稀宇科技正式发布新一代模型MiniMax M3。该模型具备前沿编程能力、最高1M超长上下文,并支持原生多模态(图片、视频输入及电脑桌面操作),成为国内首个同时具备这三项能力的模型,也是目前唯一的开源模型。据官方披露,在编程评测集SWE-Bench Pro上,M3得分59.0%,超过GPT-5.5和Gemini 3.1 Pro,接近Opus 4.7;在Agent评测Claw-

新智元报道【新智元导读】你此刻喝的干净水、用的电、看的病,1170亿人里绝大多数做梦都够不着。而算清这串概率的Opus 4.8,前天刚把GPT-5.5踢下全球第一的王座。如果你在1170亿人里随机投胎,你大概率是一个1650年以前出生的文盲农民,活不过15岁!算出这个答案的,不是哪个熬白了头的历史学家,是一个AI。就在刚刚,沃顿商学院教授Ethan Mollick的一条推文,直接在上刷屏了。点开他

IT之家 5 月 30 日消息,OpenAI 公司于 5 月 28 日发布公告,宣布更新 ChatGPT 的 GPT-5.5 Instant 版本及其 API,并逐步弃用 OpenAI o3 和 GPT-4.5 模型。OpenAI 公司于 5 月 5 日推出 GPT-5.5 Instant 模型,在医学、法律和金融等高风险主题上,该模型产生的幻觉减少了 52.5%,并显著提升数学、科学和视觉推理等

不知不觉,2026 年即将步入 6 月,AI 领域的狂飙突进依旧没有丝毫减速的迹象。随着 GPT-5.5、DeepSeek V4、Qwen 3.7-Max 等模型的持续进化,大模型之间的「智力竞赛」已经跨越了单纯的文本边界,全面向多模态与物理世界延伸。技术迭代之快,几乎每个月都在重塑行业的认知边界——昨天还在探讨长视频生成的连贯性,今天就已经向具备 4D 几何控制的动态视频世界模型跃升;刚刚还在打

新智元报道【新智元导读】一个号称「零污染」的新基准 DeepSWE,用113道原创题撕开了旧编程榜单的遮羞布。代码评测圈,一把新量尺落下。就在刚刚,Datacurve推出了新基准DeepSWE。Datacurve联合创始人、CEO Serena Ge在X上说,推出DeepSWE,是为了还原开发者工作的真实场景,揭开顶尖模型真正拉开差距的地方。DeepSWE第一天的榜单,就开始向旧基准宣战,GPT和

新智元报道Code Arena最新放榜,Qwen3.7-Max以1541分冲进全球第四,成为前五中唯一的非Claude模型。编程,中国模型第一次杀到这个位置。就在今天,Code Arena最新榜单出炉!Qwen3.7-Max以1541分闯入全球前四,一举超越了GPT-5.5、Gemini 3.5 Flash等一众顶尖模型。排在它前面的,只剩Claude Opus 4.7和Opus 4.6。换句话说

新智元报道【新智元导读】Code Arena最新放榜,Qwen3.7-Max以1541分冲进全球第四,成为前五中唯一的非Claude模型。编程,中国模型第一次杀到这个位置。就在今天,Code Arena最新榜单出炉!Qwen3.7-Max以1541分闯入全球前四,一举超越了GPT-5.5、Gemini 3.5 Flash等一众顶尖模型。排在它前面的,只剩Claude Opus 4.7和Opus 4

凤凰网科技讯 5月26日,百川智能在清华大学举办的“AI医疗新范式”学术论坛上,正式发布新一代医疗大模型Baichuan-M4及AI家庭医生“百小医”。据官方披露,Baichuan-M4在HealthBench、HealthBench Hard、HealthBench Professional三大权威医疗榜单中同时位列世界第一,超越GPT-5.5、Opus 4.7、DeepSeek-V4-Pro等

新智元报道【新智元导读】前谷歌DeepMind研究员离职并发表长文指出AI行业当前最被低估的瓶颈。他认为,现有的基准测试和安全评估都隐含假设下一代模型只是当前模型的增强版,但如果模型跨入全新能力区间,整个评估基础设施将悄然崩溃。AI训练,到底能持续多久?这是2026年整个科技圈都在问的问题。GPT-5.5、Claude Opus 4.7、Gemini 3、Grok 4——每一家头部实验室都还在烧钱

新智元报道【新智元导读】有人晒出开源项目:GPT-5.5连续狂飙150小时,自主挑战诺奖级AlphaFold2!它用拓扑「单纯形」重构蛋白质折叠逻辑,虽然性能暂未登顶,却展示了AI科学家的恐怖潜力:秒回滚、零情绪、全自动进化。科研范式,真要变天了。就在最近,GitHub上一个名为SimplexFold 的开源项目突然火出了圈。它的共同作者名单里,居然出现了这样一个名字——GPT-5.5!Meta的

新智元报道【新智元导读】120B模型飙到2000 token/秒,CFO更放话已在跑GPT-5.5!Cerebras 560亿美元IPO首日暴涨68%,但SemiAnalysis万字拆解直指死穴。SemiAnalysis,硅谷最硬核的芯片分析机构,4月份光是AI工具的订阅费就烧到了年化1000万美元。其中80%花在同一个地方,Anthropic的Opus 4.6 fast模式。它比标准模式贵6倍,

新智元报道【新智元导读】就在刚刚,被Anthropic视为「太危险」的绝密大模型Mythos,竟在谷歌云悄悄解禁。CMU最新实测爆出,它在真实漏洞攻防中,断层碾压GPT-5.5。全球最强AI猛兽,要出笼了!今天,AI大佬意外发现Claude Mythos惊现Google Cloud Console ,就连「预览」标签彻底消失了。Anthropic那个「太危险、不敢解禁」的模型突然现身,一时间,全网

衡宇 发自 凹非寺量子位 | 公众号 QbitAI龙虾之父Peter Steinberger,今天在上晒出了一张自己的CodexBar后台截图。一张相当离谱的截图——上面透露出的信息和数字让我眼睛都瞪大了:过去30天,他调用的OpenAI API总费用达到1305088美元,约合人民币940万元;同时消耗6030亿token,发起760万次请求;最常用的模型是GPT-5.5。以上所有费用,由Ope

新智元报道【新智元导读】AI之下,数学大爆发!陶哲轩反击:证明在批量生产,可没人消化得了——数学正在「消化不良」。2024年12月,Meta的研究科学家、日内瓦大学教授François Fleuret给数学宣判了死刑,缓期3年执行:最近,菲尔兹奖得主Timothy Gowers用GPT-5.5 Pro,花了不到两个小时,独立完成了一项博士论文级别的数学研究。而他不过提供了几个没有任何数学深层含义的

新智元报道【新智元导读】英国AI安全研究所(AISI)昨天扔下重磅炸弹:Mythos在模拟企业内网32步渗透任务中10次过6,GPT-5.5也跟着10次过3,连此前所有模型都没破过的Cooling Tower靶场都被首次攻破!更炸的是——Cyber能力翻倍周期一路压到4.5个月,瓶颈不是智力,是Token。这场ASI决赛,人类评测已经追不上AI了。AI模型的网络攻防能力发展有多快?昨天,英国AI安

新智元报道【新智元导读】全网震撼!菲尔兹奖得主把未解数学题扔给GPT-5.5 Pro,不到两小时拿到博士论文级证明。整个过程中,他没给出任何数学思路。今天,菲尔兹奖得主Timothy Gowers在个人博客上发了一篇长文——最近一次使用ChatGPT 5.5 Pro的体验标题平平无奇,内容却让整个数学圈坐不住了。文中,他亲手验证了一个令整个数学界不寒而栗的事实:GPT-5.5 Pro,用了不到两个

新智元报道【新智元导读】奥特曼亲口盖章,GPT-5.5是个「自闭天才」。16人团队连夜退订Claude,换GPT-5.5月省3.2万刀。Codex单周狂飙9000万下载大虐对手12倍,开发者大迁徙开始了。刚刚,奥特曼亲手给GPT-5.5起了一个让全网炸锅的外号——「自闭天才」。他不禁感叹,真不敢相信,我们居然造出这样的AI!GPT-5.5上线半个月,奥特曼在社交平台上,多次毫不掩饰地表达了自己的兴

据报道,在5月8日,OpenAI公布了其最新的人工智能模型GPT-5.5的网络安全版本——GPT-5.5-Cyber,并向通过审核的安全团队限量提供预览版。在此之前的一个月里,竞争对手Anthropic发布了Claude Mythos,引起了投资者和政府官员的高度关注。在官方博客中,OpenAI提到推出这款新版本并不是为了显著提升模型的网络攻防能力,而是通过对特定训练来放松在执行安全任务时的内置

今日,ChatGPT的基本模型迎来了重大更新。全新推出的GPT-5.5 Instant 结合了5.5版本的智能与快速响应的特点。免费用户也能用。最关键的四点:在减少幻觉方面取得了显著进展,降低了约五成二点五个百分点。引入“记忆来源”功能,能够显示影响当前回复的历史对话记录。回复更加简洁明了:省略不必要的追问、删减多余的符号和简化格式。更温暖、更自然的语气

OpenAI预计今年的计算成本将达到500亿美元,而其总裁布罗克曼在创立公司时并未投入任何个人资金。这两组数据在同一法庭上被提及,揭示了这家人工智能巨头烧钱速度之快与创始人诉讼中披露的尴尬事实。OpenAI 2026年的五一假期故事比好莱坞电影情节还要离奇。在5月6日,OpenAI宣布GPT-5.5 Instant即日起向所有ChatGPT用户开放。付费用户在未来三个月内仍可继续使用旧版模型,但之