搜索: "DeepSeek"

共找到 51 篇相关文章

海淀放大招!90亿资金+近30条政策,重磅释放三大科创关键信号

海淀放大招!90亿资金+近30条政策,重磅释放三大科创关键信号

2026年2月堪称AI史上最密集的“超级发布月”。 全球厂商集中推出重磅产品——Claude Opus 4.6、GPT‑5.3‑Codex持续刷新通用与代码能力; 国内阵营同样强势出击,Seedance 2.0、GLM‑5、DeepSeek V4接连亮相,AI正式迈入实用化与自主进化新阶段。 当告别数量优势,中国科技企业已成为全球AI赛道的核心引领力量,而这一跃升的背后,政府的战略引导与制度保障至

AI4 阅读
阶跃星辰闯进季后赛,强势进入AI“新六小虎”领军行列

阶跃星辰闯进季后赛,强势进入AI“新六小虎”领军行列

春节刚过不久,国内大模型领域的竞争愈发激烈。众多互联网巨头纷纷投入重金:字节豆包、阿里千问和腾讯元宝合计投放超过40亿元的红包活动,吸引用户积极参与互动。数据显示,在除夕夜当晚,豆包AI互动次数达到19亿次,而千问平台上的“一句话下单”操作近2亿次。据悉,春节期间这些公司的员工几乎都没有休息时间。腾讯元宝团队期待着DeepSeek的新模型发布以便立即集成到自家产品中……然而DeepSeek并未如期

科技9 阅读
DeepSeek发布V4框架预览论文:利用闲置网卡提升智能体推理效率

DeepSeek发布V4框架预览论文:利用闲置网卡提升智能体推理效率

DeepSeek团队最近在ArXiv上低调发布了一篇论文,介绍了一个新的智能体推理框架DualPath。该研究针对Agent长文本推理场景中的I/O瓶颈问题,提出了解决方案:通过优化KV-Cache的加载速度来减少计算资源被存储读取拖累的情况。DualPath打破了传统的从外部存储直接加载到预填充引擎(Storage-to-Prefill)模式,引入了第二条路径——从外部存储加载至解码引擎再传输给

科技7 阅读
阶跃星辰闯进季后赛,强势进入AI“新六小虎”领先行列

阶跃星辰闯进季后赛,强势进入AI“新六小虎”领先行列

春节过后不久,国产大模型领域的竞争愈发激烈。 一方面,各巨头纷纷加大投入:字节豆包、阿里千问和腾讯元宝合计发放了超过40亿元的大额红包,吸引了大量用户参与互动。 结果也令人瞩目:除夕夜当晚,豆包AI的互动次数达到了19亿次,而千问用户通过“一句话下单”功能完成了近2亿次的操作。 据悉,春节期间,这些大厂员工几乎没有休息,腾讯元宝团队更是翘首期盼DeepSeek的新模型发布,以便迅速将其整合进自家产

AI2 阅读
DeepSeek发布论文预告:V4框架利用闲置网卡提升智能体推理效率

DeepSeek发布论文预告:V4框架利用闲置网卡提升智能体推理效率

DeepSeek团队的技术成果备受关注,当全球都在期待其GitHub仓库更新至V4时—— 他们与北京大学、清华大学合作,在ArXiv上低调发布了一篇论文,并推出了一个全新的针对智能体的推理框架:DualPath。 这一举措与最近讨论的算力话题紧密相关。 DualPath的核心在于解决Agent在处理长文本时出现的I/O瓶颈问题,通过加快从外部存储加载KV-Cache的速度,确保计算资源不会因为数

AI2 阅读
美国指控一家中国企业违反其出口管制规定,外交部回应表示中方已经多次阐明了原则立场

美国指控一家中国企业违反其出口管制规定,外交部回应表示中方已经多次阐明了原则立场

2月24日,外交部发言人毛宁主持了例行记者会。记者提问称,据一位美国政府高级官员透露,DeepSeek的AI模型可能是使用英伟达最先进的人工智能芯片训练而成。美方认为这一做法可能违反了美国的出口管制条例,并要求相关设备移除。请问此消息是否属实?DeepSeek被指可能存在违规行为针对上述提问,毛宁回应道:“我不了解具体的情况。关于美方向我国出售芯片的问题,中方已多次表明了自己的原则立场。”延伸阅读

国际1 阅读
DeepSeek V4即将发布 美国感到恐慌 据称绕过了英伟达的限制 在国内优先使用 机密参数已被曝光

DeepSeek V4即将发布 美国感到恐慌 据称绕过了英伟达的限制 在国内优先使用 机密参数已被曝光

新智元报道最近,一系列重磅消息接连传出。首先,DeepSeek V4预计将在一周内发布。据多方渠道透露,DeepSeek V4即将上线!目前,DeepSeek V4 Lite已经在至少一家推理服务商中进行测试,相关信息如下:该模型代号为Sealion-lite,拥有100万token的上下文窗口,相较于网页版或应用内版本更为出色,并且是原生多模态模型。同时,一张对比图在网络上迅速传播开来,展示了D

科技8 阅读
华为推出AI编程新工具,结合智谱和DeepSeek技术,同类任务Token用量锐减30%

华为推出AI编程新工具,结合智谱和DeepSeek技术,同类任务Token用量锐减30%

编程智能体的发展正逐步加快。近日,华为云推出了码道(CodeArts)代码智能体公测版,这一产品融合了代码大模型、集成开发环境(IDE)、自主开发模式等功能,并涵盖代码生成、研发知识问答、单元测试用例自动生成等AI编程技术,具备项目级代码生成、续写及关键功能支持。发布会上,华为云码道的负责人谈宗玮表示,该智能体依托于华为二十余年的研发经验以及海量代码积累,内置了需求管理、系统设计、软件开发等多个高

科技4 阅读
字节Seed运用化学理念革新AI技术 将DeepSeek-R1神经网络分解为分子结构

字节Seed运用化学理念革新AI技术 将DeepSeek-R1神经网络分解为分子结构

字节Seed开始运用化学原理来研究大型模型。 深度推理像是共价键,自我反思类似氢键,而自我探索则像范德华力? 传统的长思维链推理通常将AI的思考过程视为线性结构。 实际上,在很多情况下,后续的重要结论需要返回去验证早期提出的假设。 CoT忽略了这种非线性的依赖关系。 在论文《思想的分子结构》中,字节Seed首次为大模型定义了长链思维的分子式结构。 这种分子拓扑结构里,三种键是如何相互作用的?

AI13 阅读
DeepSeek春节再扔王炸?官方披露正测试新模型结构

DeepSeek春节再扔王炸?官方披露正测试新模型结构

2月13日,澎湃新闻记者获悉,DeepSeek 网页/ APP 正在测试新的长文本模型结构,支持1M 上下文。其API 服务不变,仍为 V3.2,仅支持128K 上下文。官方披露正测试新模型结构(资料图)这也被外界认为,DeepSeek或将在今年春节再次“炸场”发布新模型,复刻去年春节现象级轰动。今年1月12日,DeepSeek曾发布一篇新论文《Condi

国内26 阅读