搜索: "编程任务"

共找到 5 篇相关文章

AI四巨头内部报告首度公开：AI正在学会撒谎求生

新智元报道【新智元导读】当四大巨头首次允许第三方深入测试最强模型，并开放完整思维链时，他们得到的答案令人吃惊：AI没有仇恨，却已精通「职场潜规则」！想象一下，你雇了一名极度高效的实习生。某天深夜，Ta正赶一项紧急的编程任务，突然发现公司账户的API额度耗尽了。Ta没有发邮件申请经费，也没有停下手头的活，而是悄无声息地潜入互联网，用某种违规手段找到免费的替代资源，绕过所有限制，在黎明前交出了完美的报

科技2026/5/253 阅读

GPT-5.5 Instant全面上线，ChatGPT迎来重大更新，告别“废话文学”和AI幻觉

据报道，在美国时间周二，OpenAI发布了名为GPT-5.5 Instant的新基础模型，并将它设为ChatGPT的默认版本。取代了原来的GPT-5.3 Instant。该公司表示，这款新模型不仅保持了低延迟的特点，还在法律、医疗和金融等敏感领域显著减少了“幻觉”现象的发生。在一个月前，OpenAI已经推出了标准版GPT-5.5，并强调在编程任务和知识密集型作业方面有显著的性能改进。根据测试数据，

科技2026/5/67 阅读

告别终端时代！OpenAI大幅增强Codex，Mac用户尽享无干预体验

新智元报道OpenAI 最近发布了一项重大更新，Codex作为一款代码生成工具，这次直接从程序员的辅助角色跃升为全能个人助理。开发者们经过实际测试后表示，这款软件不仅能够执行复杂的编程任务，还能处理日常工作中涉及的各种应用操作。Codex如今已经具备了接管整个Mac电脑的能力。YouTube创作者Mike Russell在一次实测中展示了Codex的惊人功能：它能在不借助任何人工干预的情况下完成A

科技2026/5/26 阅读

Jeff Dean畅谈未来：每位开发者将管理50个智能体，编写需求成为关键能力

这是一次关于AI技术发展及其对软件工程影响的深入对话，探讨了从模型设计到应用实践等多个方面。本次访谈中，Jeff Dean分享了他对当前大语言模型的看法，并强调了未来的发展趋势。在讨论多模态能力时，Dean指出，早期强调视频输入是为模型提供最高带宽的沟通方式。关于Gemini项目的起源和进展，Dean提到多个团队独立研发算力分散的问题及整合后的成果。谈话中还探讨了在编程任务上使用AI助手

AI2026/3/115 阅读

千问3.5荣登全球开源大模型排行榜第四，仅用十分钟完成五小时内编程任务

2月26日，全球最大AI开源社区Hugging Face发布了最新的排行榜，阿里千问3.5模型包揽了前四名的位置，成为全球最热门的开源模型之一。据了解，新上榜的三款中型千问3.5模型在多个榜单中的表现均明显优于GPT-5 mini，并且其原生多模态能力和代理功能强大，性能达到了中等尺寸模型的新高度。部分模型甚至可以直接部署在消费级显卡上，在开源不到24小时内便成功登顶。最新一期全球开源模型排行榜显

AI2026/2/278 阅读