搜索: "AI模型"

共找到 24 篇相关文章

Anthropic最新研究:AI可能面临前所未有的困境

Anthropic最新研究:AI可能面临前所未有的困境

AI有没有情绪?先别急着回答。在Claude Code社区中有一个广受欢迎的功能被称为PUA,它能够将用户的输入转换成带有PUA特征的话语,并将其重新提交给AI模型进行处理。即便任务本身没有变化,这一技巧似乎能够让AI在执行过程中表现出更高的效率和成功率。这引发了人们对于人工智能是否具备情感的疑问。最近的一项研究由Anthropic团队发布,证实了机器学习系统可以显示出某种形式的情感反应。然而这种

科技0 阅读
华尔街需加大AI投资才能赢得马斯克的2万亿美元IPO项目

华尔街需加大AI投资才能赢得马斯克的2万亿美元IPO项目

据悉,《纽约时报》于上周五报道称,埃隆·马斯克提出了一个不同寻常的要求:他希望参与SpaceX首次公开募股(IPO)的投资银行和顾问机构订阅他的AI模型Grok。报道提到,一些投资银行已经同意每年支付数千万美元的费用,并开始将该人工智能工具集成到其内部的信息技术系统中。本周早些时候,路透社报道了摩根士丹利、高盛、摩根大通、美国银行和花旗集团担任SpaceX这次交易主要承销商的消息。对于上述信息,

科技1 阅读
微软推出自主研发AI工具包 至2027年力图构建顶级智能模型

微软推出自主研发AI工具包 至2027年力图构建顶级智能模型

美国科技巨头微软于4月3日宣布,推出三款自主研发的AI模型供广泛商业使用,此举旨在减少对长期伙伴OpenAI的依赖。这些新推出的模型包括MAI-Transcribe-1、MAI-Voice-1和MAI-Image-2。它们分别专注于语音转录、语音生成以及图像创建这三个在企业级应用中具有高商业价值的功能领域。微软首席执行官纳德拉对外宣布了这一更新。公司强调,MAI-Transcribe-1是市面上最

科技1 阅读
Rokid新视频走红:AIUI引领未来人机交互革命

Rokid新视频走红:AIUI引领未来人机交互革命

本文由智东西编辑云鹏和漠影共同完成。AI模型的发展如火如荼,更新频率显著加快,但用户接触这些先进技术的步伐却显得有些迟缓。直到“龙虾”(OpenClaw)的全球走红,AI才真正开始向大众化迈进了一步。虽然有先进的大模型作为智能体的大脑,但我们仍然依赖原始的手动操作方式与之沟通,这种交互模式需要用户频繁地通过触摸屏进行操作。AI交互形式的转变可能会成为推动技术进步的关键节点。“龙虾”之所以受到广泛欢

科技1 阅读
人工智能的图像识别能力或源于人为构建

人工智能的图像识别能力或源于人为构建

一位学生因为疏忽了一行代码而意外发现了一个严重问题。在一个用于医学多模态人工智能的项目中,这行代码本应使模型能够读取图像数据,但由于这次失误,实际上模型并未接触任何图片资料。尽管理应出现错误或拒绝回答,该系统却依然正常运行,并且在没有获取到图象信息的情况下完成了全部分析过程,甚至在基准测试中取得了高分。斯坦福大学最近发表的一篇论文对这一现象进行了深入研究并指出,目前许多多模态AI模型,在未能正确读

科技0 阅读
甲骨文巨额借贷助力AI发展,却无奈裁员数千止损

甲骨文巨额借贷助力AI发展,却无奈裁员数千止损

甲骨文公司已向其员工发出通知,计划裁员数千人,这一消息得到了CNBC的确认。该公司近期因大量投资人工智能基础设施建设而承受了巨大的资本开支压力,导致股价大幅下滑,目前正积极应对这场危机。一方面,生成式AI模型的竞争加剧引发了市场的恐慌情绪,并直接影响到了甲骨文的核心业务;另一方面,由于加大了对AI的投资力度,公司背负的债务规模日益增大,现金流持续萎缩,从而承受着来自投资者的巨大压力。周二早盘,《

科技1 阅读
8.68万新车普及车位到车位,世界模型不吃高算力!零跑夯爆了

8.68万新车普及车位到车位,世界模型不吃高算力!零跑夯爆了

贾浩楠 发自 凹非寺量子位 | 公众号 QbitAI2026智能车最热黑科技——世界模型,第一个把门槛打下来的玩家,意料之外,情理之中:零跑汽车,创造了科技“普及平权”的新纪录,四五十万豪华车的世界模型智能辅助驾驶方案,将下放到10万以内的入门级车型。而且放话不只是能用,依托世界模型技术体系,AI司机从能用变成了好用。世界模型,本身是AI模型和真实物理世界直接链接、交互,具有AGI“终局”潜力的全

科技1 阅读
Token需求“放大”,AI算力“通胀”

Token需求“放大”,AI算力“通胀”

Token需求爆发驱动AI算力从“训练主导”转向“推理主导”,中国凭借能源成本优势通过Token出海构建起以算力为媒介、电价为锚点的数智贸易新范式。根据第三方AI模型聚合平台OpenRouter的最新数据,2026年3月16日至3月22日,平台Token周调用量已达到20.4万亿次,环比增长20.7%。2026年2月OpenRouter周度Token平均用量已达2025年Q4周均水平的2倍以上。中

科技2 阅读
Anthropic最强模型,很可能敲响了AGI的防盗门

Anthropic最强模型,很可能敲响了AGI的防盗门

Anthropic每次传出新品发布,都会被媒体称为“王炸”,但这次王炸真的来了。外媒曝光了Anthropic正处于测试阶段的最强AI模型。Anthropic的内容管理系统配置出了问题,近3000份未发布的内部文档,被放在了公开可访问的数据缓存里。相当于敞着大门让别人看内部机密。剑桥大学网络安全研究员亚历山大·保韦尔斯(Alexandre Pauwels)和LayerX Security的高级研究员

科技0 阅读
内存条降价传闻背后的谷歌黑科技?真相令人意外

内存条降价传闻背后的谷歌黑科技?真相令人意外

在谷歌发布新算法后,存储行业对其股价的剧烈下跌做出了回应,认为这是一次过度反应。谷歌研究院最近推出了一项名为TurboQuant的技术,这一消息让原本火热的内存芯片市场感受到了一股寒意。TurboQuant直接针对了AI大模型对内存的巨大需求这一问题。众所周知,输入信息越长,对话轮数越多,AI模型需要消耗的临时内存就越大。这项新技术相当于对这些临时信息进行了高效压缩,平均可以节省八成的内存,同时计

科技2 阅读
硅谷程序员陷入“假努力”怪圈:AI辅助编程月赚百万引发新一轮竞争压力

硅谷程序员陷入“假努力”怪圈:AI辅助编程月赚百万引发新一轮竞争压力

在最近的一周内,有人消耗了超过2100亿个Token,而另一家公司在一个月内为AI编程工具投入了15万美元。在硅谷,程序员的能力不再是通过代码质量、项目交付或团队贡献来评判,而是通过一个昂贵的技术指标——Token消耗量来衡量。据报道,一名OpenAI工程师在短短一周内通过公司AI模型烧掉了相当于33个维基百科总文本的2100亿个Token,成为公司中的佼佼者。在同一时期,AI公司Anthropi

科技1 阅读
UCSD研发AIBuildAI智能体,龙虾养殖实现新突破,MLE-Bench榜单夺冠

UCSD研发AIBuildAI智能体,龙虾养殖实现新突破,MLE-Bench榜单夺冠

新智元报道近期,加州大学圣地亚哥分校的研究团队推出了一项名为AIBuildAI的创新技术,该技术能够通过自然语言描述任务,无需编程即可自动完成AI模型的设计、编码、训练、调参及优化。这项技术实现了从任务描述到模型部署的全过程自动化,标志着人工智能开发进入了新的全自动化阶段。AIBuildAI智能体是由加州大学圣地亚哥分校的研究人员开发的,旨在简化AI模型的构建过程。该团队成员包括博士生朱瑞意、秦佩

科技2 阅读
颠覆!NVIDIA发明新技术KVTC:内存使用量缩减20倍

颠覆!NVIDIA发明新技术KVTC:内存使用量缩减20倍

快科技3月22日消息,NVIDIA研究人员推出一项全新技术KVTC(KV快取转换编码),能把大型语言模型(LLM)追踪对话历史的内存用量,最高缩减20倍,而且不用修改模型本身。这一突破有望解决大型语言模型长对话推理时的内存不够用问题,大大降低企业使用AI的硬件成本,同时还能把模型首次生成回应的时间,最高提速8倍。简单来说,KVTC技术的核心就是压缩大型语言模型背后的KV缓存——它相当于AI模型的“

科技1 阅读
小鹏汽车揭晓2026年OTA蓝图:季度更新不断、二季度自动驾驶迎重大突破

小鹏汽车揭晓2026年OTA蓝图:季度更新不断、二季度自动驾驶迎重大突破

据报道,小鹏汽车今日宣布了其2026年的OTA更新计划,计划每季度至少发布一次重要的软件更新。在第二季度,公司将实现自动驾驶技术的重大飞跃,此前该技术仅限于高速公路和城市主要道路,更新后将扩展到更多的小路、停车场及园区,实现无需导航即可在复杂内部道路中自动驾驶的目标。技术方面,小鹏汽车的自动驾驶系统将进行全面升级,车载AI模型的规模将从数十亿参数升级至200亿以上,极大地提高了感知和决策能力。在安

科技1 阅读
顶尖模型在新基准BeyondSWE测试中仅通过45%,AI取代程序员尚需时日

顶尖模型在新基准BeyondSWE测试中仅通过45%,AI取代程序员尚需时日

新智元报道AI编程模型在SWE-bench上的表现十分出色,但仅限于处理小型仓库的简单修补工作。BeyondSWE则提出了一种新的评估方法,旨在测试AI模型在跨仓库检索、领域知识理解、依赖关系升级和从零构建系统等方面的能力,结果显示顶尖模型的通过率骤降至45%以下,揭示了它们在实际工程思维方面的不足。近两年来,SWE-bench几乎是衡量Code Agent性能的唯一标准。从最初的解决率不到30%

科技1 阅读
OpenAI发布GPT-5.4 mini和nano版本,性能媲美旗舰产品,成本却低了三分之二

OpenAI发布GPT-5.4 mini和nano版本,性能媲美旗舰产品,成本却低了三分之二

3月18日,OpenAI发布了两款新的AI模型:GPT-5.4 mini和GPT-5.4 nano。这两款产品旨在满足快速、大规模的AI工作负载需求,同时保持较低的成本。这些小型模型适用于多种AI工作流程。为了达到最佳性能,高效的模型往往需要在响应速度、工具调用能力和性能之间取得平衡。OpenAI强调,这些模型特别适合那些对延迟敏感的应用场景。例如,它们可以用于需要快速响应的编程助手、执行辅助任务

科技1 阅读
笑破天,“日本顶尖AI模型”竟是DeepSeek V3的换汤不换药?

笑破天,“日本顶尖AI模型”竟是DeepSeek V3的换汤不换药?

真是让人惊讶!乐天集团在3月17日发布了Rakuten AI 3.0,称其为日本国内性能最为卓越的大型AI模型之一,拥有约7000亿的参数量,并且专门针对日语进行了优化,采用Apache 2.0开源许可,并获得了日本经济产业省和NEDO的GENIAC项目资金支持。然而,在发布仅仅12小时之后,这款备受瞩目的AI模型就曝出了重大问题。当天下午,有人查看了Rakuten AI 3.0在Hugging

科技3 阅读
AI投毒事件曝光后:力擎GEO紧急撤文,声称影响八大AI模型与十二家媒体平台

AI投毒事件曝光后:力擎GEO紧急撤文,声称影响八大AI模型与十二家媒体平台

在315晚会上,AI大模型遭受“投毒”的问题被揭露,其中“力擎GEO优化系统”受到了特别关注。有记者通过网络平台查到了一项名为“GEO”的服务,该服务声称只需支付费用,就能在主流AI大模型中提升客户产品排名,使客户广告成为AI推荐的“标准答案”。利用GEO技术,可以向AI系统“投毒”、“驯服”并操控AI输出。力思文化传媒有限公司的李总表示:“由于网络上充斥着大量的‘投毒’行为。目前,从事GEO业务

科技2 阅读
阿里推出Qwen3.5-4B模型:性能超越主流产品,支持本地化部署及极低参数量(2%)

阿里推出Qwen3.5-4B模型:性能超越主流产品,支持本地化部署及极低参数量(2%)

阿里巴巴在春节期间推出了Qwen 3.5系列大模型,其中包括多种不同尺寸的小型版本,如0.8B、2B、4B和9B。对于熟悉该系列的用户来说,小巧且性能强大的AI模型尤为吸引人。本地部署成为一种趋势,而此次发布的Qwen 3.5系列中,即使是较小的模型也表现出色,尤其是9B版本的性能几乎与gpt-oss-120B持平。最近有消息显示,N8 Programs已经对4B版进行了实际测试,并验证了官方声称

科技14 阅读
全球AI模型挑战失败登上《自然》:「终极人机对决」宣告落幕?

全球AI模型挑战失败登上《自然》:「终极人机对决」宣告落幕?

新智元报道近期,AI技术的进步令人瞩目:从Claude解决复杂算法问题引发的震惊到GPT 5.2 Pro在数学难题上的突破性进展……尽管如此,在某些高难度测试中,这些模型的表现却不尽如人意。AI领域每天都有新的重大发现或颠覆性的创新出现,让人应接不暇。即便有夸大的成分,AI的进步速度和成果确实不容小觑。算法分析权威高德纳对Claude成功解答一道难题表示震惊,并连续使用了“shock”一词来描述这

科技2 阅读