搜索: 长上下文

大模型也需要睡觉！让AI打个盹，醒来更聪明

7×24，AI也吃不消。卡内基梅隆大学和马里兰大学发了篇论文，《Language Models Need Sleep》——大模型处理长上下文的时候，硬撑着不休息，真的会累傻。这项研究的灵感源自人脑运作机制。人睡觉的时候海马体会把白天的短期记忆一遍遍回放，巩固进皮层突触，变成长期知识。研究团队认为模型也可以这样，设计了一个睡眠机制，让大模型上下文窗口快满的时候别硬撑了，打个盹把最近的上下文反复咀嚼几

科技2026/5/272 阅读

DeepSeek V4三日测评揭晓：高性价比背后仍有局限性

DeepSeek V4的发布引起了广泛关注，不仅因为它在技术上的突破性进展，还因为它背后的战略意义和可能带来的行业变革。这款新模型展示了中国在AI领域的创新实力，并且已经开始探索摆脱对英伟达等美国芯片制造商依赖的新路径。在众多亮点中，V4展现了其在长上下文处理、智能体工作流搭建、成本控制及开源生态方面的显著优势。这些特点为那些需要处理海量信息并追求性价比的开发者和企业提供了前所未有的工具箱。然而，

科技2026/4/286 阅读

PPIO推出DeepSeek-V4预览版，支持百万级长文本即时处理功能

PPIO率先推出了DeepSeek-V4预览版，用户可以立即体验其百万级超长上下文功能。量子位的朋友们 2026-04-24 17:10:46 量子位

AI2026/4/254 阅读

PPIO推出DeepSeek-V4预览版，百万级上下文处理能力轻松启用

PPIO率先推出了DeepSeek-V4预览版，并实现了即开即用的百万级超长上下文功能量子位的朋友们 2026-04-24 18:23:30 量子位

AI2026/4/252 阅读

Kimi发表新论文：创新KVCache商业模式

衡宇发自凹非寺量子位 | 公众号 QbitAI把长上下文做到极致的Kimi又发新成果！这一次瞄准的是大模型推理架构跨机房调度沉疴。他们提出了一套全新范式，Prefill-as-a-Service（简称PrFaaS），预填充即服务。其核心突破是让KV Cache可以跨数据中心传输，把Prefill和Decode彻底解耦到不同的异构集群。有了PrFaaS，Prefill和Decode之间可以跨越城

科技2026/4/207 阅读

Kimi发表新研究：将KVCache转化为创新商业策略

最新研究揭示了Kimi如何将KVCache转化为创新商业模式。衡宇 2026-04-19 18:19:45 量子位超长上下文福

AI2026/4/205 阅读

千问上线Qwen3.5-Omni 具备全模态感知与生成能力

凤凰网科技讯 3月30日，千问宣布上线Qwen3.5-Omni。Qwen3.5-Omni系列包含Plus、Flash、Light三种尺寸的Instruct版本，支持256k长上下文，模型支持超过10小时的音频输入及超过 400 秒的720P（1 FPS）音视频输入。Qwen3.5-Omni能够支持113种语种和方言的语音识别和36种语种和方言的语音生成，目前可通过Offline API和Real

科技2026/3/302 阅读

搜索: "长上下文"