搜索: "长上下文"

共找到 7 篇相关文章

大模型也需要睡觉!让AI打个盹,醒来更聪明

大模型也需要睡觉!让AI打个盹,醒来更聪明

7×24,AI也吃不消。卡内基梅隆大学和马里兰大学发了篇论文,《Language Models Need Sleep》——大模型处理长上下文的时候,硬撑着不休息,真的会累傻。这项研究的灵感源自人脑运作机制。人睡觉的时候海马体会把白天的短期记忆一遍遍回放,巩固进皮层突触,变成长期知识。研究团队认为模型也可以这样,设计了一个睡眠机制,让大模型上下文窗口快满的时候别硬撑了,打个盹把最近的上下文反复咀嚼几

科技2 阅读
DeepSeek V4三日测评揭晓:高性价比背后仍有局限性

DeepSeek V4三日测评揭晓:高性价比背后仍有局限性

DeepSeek V4的发布引起了广泛关注,不仅因为它在技术上的突破性进展,还因为它背后的战略意义和可能带来的行业变革。这款新模型展示了中国在AI领域的创新实力,并且已经开始探索摆脱对英伟达等美国芯片制造商依赖的新路径。在众多亮点中,V4展现了其在长上下文处理、智能体工作流搭建、成本控制及开源生态方面的显著优势。这些特点为那些需要处理海量信息并追求性价比的开发者和企业提供了前所未有的工具箱。然而,

科技6 阅读
Kimi发表新论文:创新KVCache商业模式

Kimi发表新论文:创新KVCache商业模式

衡宇 发自 凹非寺量子位 | 公众号 QbitAI把长上下文做到极致的Kimi又发新成果!这一次瞄准的是大模型推理架构跨机房调度沉疴。他们提出了一套全新范式,Prefill-as-a-Service(简称PrFaaS),预填充即服务。其核心突破是让KV Cache可以跨数据中心传输,把Prefill和Decode彻底解耦到不同的异构集群。有了PrFaaS,Prefill和Decode之间可以跨越城

科技7 阅读
千问上线Qwen3.5-Omni 具备全模态感知与生成能力

千问上线Qwen3.5-Omni 具备全模态感知与生成能力

凤凰网科技讯 3月30日,千问宣布上线Qwen3.5-Omni。Qwen3.5-Omni系列包含Plus、Flash、Light三种尺寸的Instruct版本,支持256k长上下文,模型支持超过10小时的音频输入及超过 400 秒的720P(1 FPS)音视频输入。Qwen3.5-Omni能够支持113种语种和方言的语音识别和36种语种和方言的语音生成,目前可通过Offline API和Real

科技2 阅读