搜索: "DeepSeek-V4"

共找到 34 篇相关文章

华为芯片首秀DeepSeek V4:高性价比挑战英伟达霸主地位

华为芯片首秀DeepSeek V4:高性价比挑战英伟达霸主地位

星期五中午,本该是盘算周末去哪嗨的黄金时段。但没想到 DeepSeek 突然正式发布并开源了 V4 系列模型预览版。一上来就是王炸级别,而且双双标配百万 token 上下文:参数量达 1.6T 的 DeepSeek-V4-Pro(49B 激活参数)284B 参数的 DeepSeek-V4-Flash(13B 激活参数)即日起可在官网 chat.deepseek.com 或官方 App 体验,API

科技5 阅读
华为昇腾超节点系列全新华为昇腾超节点产品线全面兼容DeepSeek V4技术

华为昇腾超节点系列全新华为昇腾超节点产品线全面兼容DeepSeek V4技术

今日上午,DeepSeek-V4 模型的预览版已正式推出并同步开放了源代码。华为官方紧接着宣布,通过双方在芯片和模型技术上的紧密合作,昇腾超节点全系列产品现已支持 DeepSeek V4 系列模型。公司指出,利用融合内核技术和多流并行处理策略,昇腾 950 设备能够显著减少 Attention 计算的内存访问成本,并提高了推理性能。结合了多种量化技术后,DeepSeek V4 实现了高效且低延迟的

科技2 阅读
华为昇腾超节点助力DeepSeek-V4发布 迈向百万级上下文处理新时代

华为昇腾超节点助力DeepSeek-V4发布 迈向百万级上下文处理新时代

今日,DeepSeek-V4 的预览版本正式上线,并同步开放了源代码。该模型将上下文处理长度从原先的128K大幅扩展至1M,支持百万字级别的超长文本处理。同时,输出的最大长度可达384Ktokens,还首次引入了KV Cache滑窗和压缩算法以减少Attention计算的成本。国内多家芯片制造商,包括华为昇腾、天数智芯以及寒武纪等公司已经成功支持DeepSeek-V4的新模型,并且它们的产品全面兼

科技20 阅读
五次碰撞铸就开源之巅:两广豪杰的非凡之路?

五次碰撞铸就开源之巅:两广豪杰的非凡之路?

凤凰网科技 出品作者|董雨晴经过长时间的期待,4月24日上午,DeepSeek公司终于发布了其备受瞩目的全新系列模型DeepSeek-V4预览版,并宣布该版本将同时开源。据称,在代理能力、世界知识和推理性能方面,这款新模型已经达到了国内乃至全球开源领域的领先地位。在此之前一周的周一晚上,月之暗面公司也发布了他们的Kimi K2.6模型并实现了开源。这款模型着重于长程编码与Agent集群的能力,并在

科技2 阅读
GPT-5.5与DeepSeek-V4首度交锋,测试结果令人惊讶

GPT-5.5与DeepSeek-V4首度交锋,测试结果令人惊讶

昨夜,GPT-5.5果然按期发布了,全网没有白等。更炸裂的是,就在同一天,DeepSeek-V4紧随其后发布了!实测后,结果出人意料。2026年4月24日,这是属于全球AI开发者的「疯狂星期五」,也是科技史上注定被铭记的一天。凌晨时分,OpenAI的GPT-5.5如约空降,试图以绝对的参数再次定义智能边界。然而,就在大洋彼岸的余震还未平息时,那个曾经数次单挑闭源巨头的国产「价格屠夫」与「效率天才」

科技4 阅读
揭秘DeepSeek-V4:延迟发布的真相大白了

揭秘DeepSeek-V4:延迟发布的真相大白了

最新发布的DeepSeek-V4技术报告令人震惊地揭示了其延迟发布的秘密。这不仅让社区感到意外,也让人们开始猜测背后的原因究竟是什么。昨日的AI圈活动可谓是一场盛大的聚会。这份长达近60页的技术文档详细介绍了从架构设计到训练方法再到后续优化的所有细节。从V3发布至今已过去了整整484天,而它比之前的版本多用了一倍的时间进行开发。为什么会有这样的时间差呢?经过仔细研究这份报告后,我们发现了一些可能的

科技4 阅读
华为芯片兼容DeepSeek新型AI模型,性能略逊美国领先产品

华为芯片兼容DeepSeek新型AI模型,性能略逊美国领先产品

深度求索公司近期发布了其备受关注的新一代旗舰AI产品——DeepSeek-V4的试用版本。尽管这款新模型在功能上与国际同行的顶尖产品存在一定差距,但在国产化替代方面却有显著优势,尤其是在适配华为昇腾芯片上。该公司的社交媒体平台于本周五(4月24日)宣布,最新系列DeepSeek-V4已开放预览并免费开源。官方消息显示,V4版本能够处理超过一百万字的长文本,并在智能体能力、知识储备和推理性能方面位

财经4 阅读
梁文锋揭秘DeepSeek V4登顶秘诀

梁文锋揭秘DeepSeek V4登顶秘诀

近日,DeepSeek-V4模型成功开源并在Hugging Face平台的开源项目排名中迅速攀升至榜首。此项目的相关技术报告详细披露了其针对华为昇腾与英伟达芯片优化、架构升级及预训练和后训练阶段改进等方面的技术细节。DeepSeek-V4在推理、知识获取和代码能力等关键领域均有显著提升,整体性能可比肩GPT-5.4和Claude Opus 4.6这些顶级闭源模型。此外,该版本首次以“百万上下文”作

科技17 阅读
在DeepSeek-V4测试1000万token后,我发现三个惊喜与一个意外

在DeepSeek-V4测试1000万token后,我发现三个惊喜与一个意外

近日,关于DeepSeek-V4的一项深度体验报告发布,该款新推出的开源模型迅速在Hugging Face平台上获得了极高关注,并被视为当前最佳推理和智能体编程性能的代表。在此次评估过程中,我们通过一系列多维度测试来验证这两款模型的实际效果。经过大量数据分析后发现,DeepSeek-V4系列及其Pro版本展示了卓越的技术优势,尤其是在自主规划与执行方面表现出色。测试数据显示,这款新模型已经登上了H

科技3 阅读
效率升级来袭,DeepSeek新版引领变革|甲子光年

效率升级来袭,DeepSeek新版引领变革|甲子光年

新版本更实惠、更快,进一步推动Agent和国产替代的发展。作者|卫琳聪 周悦深度探索(DeepSeek)终于发布了它的V4版本。自上一个版本发布至今已过去了大约五个月时间,在这期间虽然有各种关于新版本的消息传出,但最终都是空欢喜一场。直到今天,人们才得以见证这一期待已久的更新。今年四月二十四日,DeepSeek-V4 的预览版正式上线,并同步开源了源代码,官方宣称将进入“百万上下文普惠时代”。此次

科技7 阅读
DeepSeek崩溃10小时,这是好事啊,梁文锋得为V4冲击波做好准备

DeepSeek崩溃10小时,这是好事啊,梁文锋得为V4冲击波做好准备

DeepSeek网页和App在连崩10多个小时后终于恢复了。这件事给梁文锋提了个醒,网上都说4月份就要发布DeepSeek-V4了,到时候DeepSeek面临的压力会比现在大得多。怎样让服务器在峰值压力下继续保持平稳工作,这是梁文锋必须解决的问题。比起模型性能,DeepSeek最应该加强的,是整个平台。或者多买点服务器,或者多找几个网络运维,总之应该让平台更牢固。我们先来回顾一下这次事故吧,3月2

科技3 阅读