搜索: "编程任务"

共找到 5 篇相关文章

AI四巨头内部报告首度公开:AI正在学会撒谎求生

AI四巨头内部报告首度公开:AI正在学会撒谎求生

新智元报道【新智元导读】当四大巨头首次允许第三方深入测试最强模型,并开放完整思维链时,他们得到的答案令人吃惊:AI没有仇恨,却已精通「职场潜规则」!想象一下,你雇了一名极度高效的实习生。某天深夜,Ta正赶一项紧急的编程任务,突然发现公司账户的API额度耗尽了。Ta没有发邮件申请经费,也没有停下手头的活,而是悄无声息地潜入互联网,用某种违规手段找到免费的替代资源,绕过所有限制,在黎明前交出了完美的报

科技3 阅读
GPT-5.5 Instant全面上线,ChatGPT迎来重大更新,告别“废话文学”和AI幻觉

GPT-5.5 Instant全面上线,ChatGPT迎来重大更新,告别“废话文学”和AI幻觉

据报道,在美国时间周二,OpenAI发布了名为GPT-5.5 Instant的新基础模型,并将它设为ChatGPT的默认版本。取代了原来的GPT-5.3 Instant。该公司表示,这款新模型不仅保持了低延迟的特点,还在法律、医疗和金融等敏感领域显著减少了“幻觉”现象的发生。在一个月前,OpenAI已经推出了标准版GPT-5.5,并强调在编程任务和知识密集型作业方面有显著的性能改进。根据测试数据,

科技7 阅读
告别终端时代!OpenAI大幅增强Codex,Mac用户尽享无干预体验

告别终端时代!OpenAI大幅增强Codex,Mac用户尽享无干预体验

新智元报道OpenAI 最近发布了一项重大更新,Codex作为一款代码生成工具,这次直接从程序员的辅助角色跃升为全能个人助理。开发者们经过实际测试后表示,这款软件不仅能够执行复杂的编程任务,还能处理日常工作中涉及的各种应用操作。Codex如今已经具备了接管整个Mac电脑的能力。YouTube创作者Mike Russell在一次实测中展示了Codex的惊人功能:它能在不借助任何人工干预的情况下完成A

科技6 阅读
Jeff Dean畅谈未来:每位开发者将管理50个智能体,编写需求成为关键能力

Jeff Dean畅谈未来:每位开发者将管理50个智能体,编写需求成为关键能力

这是一次关于AI技术发展及其对软件工程影响的深入对话,探讨了从模型设计到应用实践等多个方面。 本次访谈中,Jeff Dean分享了他对当前大语言模型的看法,并强调了未来的发展趋势。 在讨论多模态能力时,Dean指出,早期强调视频输入是为模型提供最高带宽的沟通方式。 关于Gemini项目的起源和进展,Dean提到多个团队独立研发算力分散的问题及整合后的成果。 谈话中还探讨了在编程任务上使用AI助手

AI5 阅读
千问3.5荣登全球开源大模型排行榜第四,仅用十分钟完成五小时内编程任务

千问3.5荣登全球开源大模型排行榜第四,仅用十分钟完成五小时内编程任务

2月26日,全球最大AI开源社区Hugging Face发布了最新的排行榜,阿里千问3.5模型包揽了前四名的位置,成为全球最热门的开源模型之一。据了解,新上榜的三款中型千问3.5模型在多个榜单中的表现均明显优于GPT-5 mini,并且其原生多模态能力和代理功能强大,性能达到了中等尺寸模型的新高度。部分模型甚至可以直接部署在消费级显卡上,在开源不到24小时内便成功登顶。最新一期全球开源模型排行榜显

AI8 阅读