搜索: "DeepSeek V4"

共找到 47 篇相关文章

DeepSeek V4亮相!全力支持本土计算力 国产AI芯片股价攀升

DeepSeek V4亮相!全力支持本土计算力 国产AI芯片股价攀升

今日,DeepSeek的最新模型DeepSeek-V4预览版正式对外发布,并且同步开放源代码。受到这一消息的影响,国内人工智能芯片股集体上涨。海光信息股价攀升6.77%,寒武纪涨幅为1.28%;上证科创板芯片指数强势上升2.72%,科创芯片ETF易方达也增长了2.87%。DeepSeek-V4具备百万级长文本处理能力,在代理功能、知识库和推理性能方面均处于国内及开源领域的领先地位。该模型提供两个版

科技2 阅读
震撼发布:DeepSeek V4成本骤减七成三,梁文锋携手华为寒武纪,源神再现全场致敬

震撼发布:DeepSeek V4成本骤减七成三,梁文锋携手华为寒武纪,源神再现全场致敬

今日,DeepSeek发布了其新一代旗舰模型体系——DeepSeek-V4系列的预览版本,并将其开源。这是继V3.2之后的新一代产品。深渊寻神(DeepSeek V4)重归后引发热烈反响,在微博热搜榜上占据前三席位,仅次于小米YU7GT的表现。此次发布包括两个模型:DeepSeek-V4-Pro和DeepSeek-V4-Flash。前者采用MoE架构,总参数规模达到1.6T(激活为49B),后者则

科技13 阅读
华为芯片首秀DeepSeek V4:高性价比挑战英伟达霸主地位

华为芯片首秀DeepSeek V4:高性价比挑战英伟达霸主地位

星期五中午,本该是盘算周末去哪嗨的黄金时段。但没想到 DeepSeek 突然正式发布并开源了 V4 系列模型预览版。一上来就是王炸级别,而且双双标配百万 token 上下文:参数量达 1.6T 的 DeepSeek-V4-Pro(49B 激活参数)284B 参数的 DeepSeek-V4-Flash(13B 激活参数)即日起可在官网 chat.deepseek.com 或官方 App 体验,API

科技5 阅读
华为昇腾超节点系列全新华为昇腾超节点产品线全面兼容DeepSeek V4技术

华为昇腾超节点系列全新华为昇腾超节点产品线全面兼容DeepSeek V4技术

今日上午,DeepSeek-V4 模型的预览版已正式推出并同步开放了源代码。华为官方紧接着宣布,通过双方在芯片和模型技术上的紧密合作,昇腾超节点全系列产品现已支持 DeepSeek V4 系列模型。公司指出,利用融合内核技术和多流并行处理策略,昇腾 950 设备能够显著减少 Attention 计算的内存访问成本,并提高了推理性能。结合了多种量化技术后,DeepSeek V4 实现了高效且低延迟的

科技2 阅读
黄仁勋预言应验:DeepSeek V4震撼登场

黄仁勋预言应验:DeepSeek V4震撼登场

若DeepSeek在华为平台上首发,美国或将面临重大挑战。这里的"我国"指美国这句话并非出自托尼之口,而是英伟达创始人黄仁勋在一个播客访谈中的言论。如今随着DeepSeek V4的发布,是否意味着老黄的预言成真了?DeepSeek终于推出了备受期待的大版本升级V4,尽管在性能上可能让一些用户略感失望,但在价格方面却带来了惊喜——相比国外同类模型,其售价直接减半。关于具体的技术细节,在之前的报道中已

科技1 阅读
三个漏洞导致Claude功能受损:Anthropic确认代码问题根源

三个漏洞导致Claude功能受损:Anthropic确认代码问题根源

机器之心编辑部今日的人工智能领域热闹非凡,先是 OpenAI 推出了备受瞩目的 GPT5.5,紧接着 DeepSeek v4 也如约而至。在这波庆祝热潮中,Anthropic 发布了一份郑重的声明,虽然没有推出新产品,但内容同样引人注目:关于 Claude Code 的性能问题确实存在,但这背后有其缘由……过去一个月里,部分用户反馈了 Claude Code 质量下降的问题。经过调查后,Anthr

科技2 阅读
梁文锋揭秘DeepSeek V4登顶秘诀

梁文锋揭秘DeepSeek V4登顶秘诀

近日,DeepSeek-V4模型成功开源并在Hugging Face平台的开源项目排名中迅速攀升至榜首。此项目的相关技术报告详细披露了其针对华为昇腾与英伟达芯片优化、架构升级及预训练和后训练阶段改进等方面的技术细节。DeepSeek-V4在推理、知识获取和代码能力等关键领域均有显著提升,整体性能可比肩GPT-5.4和Claude Opus 4.6这些顶级闭源模型。此外,该版本首次以“百万上下文”作

科技14 阅读
揭秘:DeepSeek V4暗藏中国万亿级开源模型驚喜发现!DeepSeek V4内含重磅中国开源项目万亿规模开源模型悄然入驻DeepSeek V4

揭秘:DeepSeek V4暗藏中国万亿级开源模型驚喜发现!DeepSeek V4内含重磅中国开源项目万亿规模开源模型悄然入驻DeepSeek V4

新智元报道DeepSeek V4 引人注目,其参数量达到惊人的1.6万亿,并且在Codeforces竞赛中排名人类选手第二十三位,KV缓存仅前代的十分之一。在同一周内,Kimi K2.6也宣布开源,支持数百万token的上下文和300个子Agent协同工作,模型参数量更是达到了2.6万亿。两家公司在中国AI领域中的地位显赫,它们的技术进步与发布时间高度契合,似乎有意为之。回顾过去一年半的时间线,D

科技4 阅读
姚顺雨今日完成DeepSeek V4挑战

姚顺雨今日完成DeepSeek V4挑战

智东西编辑团队发布了一篇关于腾讯新一代混合专家架构的大规模语言模型Hy3 preview的文章。该文章详细介绍了姚顺雨领导的混元团队首次对外展示的新一代大模型。Hy3 preview是迄今最智能的模型,采用了快慢思考融合的设计理念,并具备支持最长256K上下文的能力。它拥有总计295B的参数量和激活参数数量为21B。从测评结果来看,Hy3 preview在复杂推理、指令遵循、代码生成与智能体能力等

科技8 阅读
姚顺雨完成DeepSeek V4挑战

姚顺雨完成DeepSeek V4挑战

今日,腾讯发布了新一代的大规模语言模型混元Hy3 preview,并将其源代码公开,这是该团队自重组以来推出的首个重要产品版本。Hy3 preview是目前混元系列中最先进的一个版本,采用了混合专家架构来实现快速和深入的思考过程。其参数总量达到2950亿个,激活参数为210亿,并能支持长达256K的内容上下文处理。从测试结果来看,Hy3 preview在复杂推理、指令执行以及代码生成等方面的性能得

科技28 阅读
DeepSeek V4再度测试:逼近Opus 4.5却价格亲民?

DeepSeek V4再度测试:逼近Opus 4.5却价格亲民?

据悉,在这个月剩下的时间里,人们最期待的新产品是DeepSeek V4,各种迹象显示它的发布正越来越近。最近官方动作频繁,据称API端也开始对模型进行升级,性能表现良好。自从在2月初宣布推出测试版以来,这款软件实际上一直在悄然改进。尽管每次更新官方都没有详细介绍具体细节。最近,DeepSeek V4的页面进行了翻新,增加了快速、专家和视觉三种模式选择。此前的优化主要集中在网页版本上,而最新的信息显

科技4 阅读
NVIDIA CEO黄仁勋警示:华为推出DeepSeek V4或将影响美国科技行业

NVIDIA CEO黄仁勋警示:华为推出DeepSeek V4或将影响美国科技行业

据报道,本月下旬将发布DeepSeek V4,这款产品的推出时间比预期的要晚一些,主要原因在于它将全面兼容国内的人工智能平台,尤其是华为昇腾平台。在人工智能领域,无论是国外还是国内,首次发布的平台通常都是基于美国的技术,特别是NVIDIA的AI平台。然而,这次DeepSeek V4有可能改变这一现状。近日,在与科技播客Dwarkesh Patel的一次访谈中,NVIDIA首席执行官黄仁勋就此事发出

科技1 阅读
深寻科技梁文锋爆料:V4版本四月底面世

深寻科技梁文锋爆料:V4版本四月底面世

经过多次延期传言之后,备受期待的DeepSeek V4终于要发布了。《创智记》从多位内部人士那里了解到,梁文锋近日在公司内部会议中宣布,预计将于四月下旬正式推出新一代旗舰大模型DeepSeek V4。据此前消息透露,这款新版本将拥有超过万亿参数规模以及百万级的上下文窗口,并且首次实现了与国产芯片如华为昇腾等的深度兼容,标志着中国AI产业在摆脱对CUDA依赖方面取得了重要进展。令人注目的是,在3月2

科技2 阅读
代达劢解析:DeepSeek应对V4冲击波的能力如何?

代达劢解析:DeepSeek应对V4冲击波的能力如何?

据相关报道,DeepSeek创始人梁文锋透露,该公司计划在四月下旬推出其最新的旗舰级大模型DeepSeek V4。不过相较于新模型的发布,更值得关注的是DeepSeek的服务器稳定性问题。在三月二十九日晚上九点三十五分,DeepSeek又一次遭遇了严重的服务中断。此次故障并非轻微的技术瓶颈导致的小范围中断,而是长达十二小时五十八分钟的大规模全面瘫痪。无论是网页端还是手机应用,都出现了无法正常使用的

科技8 阅读
深思科技预发布“前夜”,关键议题需先行探讨

深思科技预发布“前夜”,关键议题需先行探讨

摘要:DeepSeek V4能否成为公司的转折点?凤凰网科技 出品作者|Dale据知情人士透露,DeepSeek创始人梁文锋于4月上旬在内部会议中宣布了V4版本的发布计划,预计该新旗舰大模型将于四月底对外公开。关于此信息,凤凰网科技向公司求证但未获回复。最近,该公司刚刚完成了新一轮的产品更新,在模式设计上进行了层级划分,并推出了快速和专家两种操作模式。原有的“体验DeepSeek V3.2”的入口

科技2 阅读
DeepSeek V4将完全运行于华为AI芯片之上

DeepSeek V4将完全运行于华为AI芯片之上

DeepSeek正在开发其下一代AI模型——V4,而最新技术将完全运行于华为最新的AI芯片之上。一份新报告揭示了这一动态大语言模型的准备情况,并披露了其中最重要的要点。据TheInformation报道,即将推出的中国先进AI大语言模型——DeepSeek V4将采用华为AI芯片。这听起来或许只是寻常消息,因为许多中国AI初创公司如今都在转向华为。然而,这绝非一条小新闻!根据细节,V4模型将仅且完

科技5 阅读
多名关键人员离任 DeepSeek V4或于四月面世(据中国媒体报道)

多名关键人员离任 DeepSeek V4或于四月面世(据中国媒体报道)

中国媒体称,人工智能(AI)公司深度求索(DeepSeek)的多名核心员工在过去一年里离职,下一代模型V4可能会在4月发布。据中国科技媒体“晚点LatePost”报道,去年下半年以来,DeepSeek已有多名核心员工离职。其中,DeepSeek第一代大语言模型的核心作者、参与历代模型训练的王炳宣,去年底被科技巨头腾讯挖走。DeepSeek-OCR系列的核心作者魏浩然约在春节前后离开,DeepSe

财经11 阅读
罗福莉宣布小米开源MiMo-V2系列:内部推行智能体,拒绝使用即面临离职威胁

罗福莉宣布小米开源MiMo-V2系列:内部推行智能体,拒绝使用即面临离职威胁

近日,一款名为“Hunter Alpha”的未知模型在 OpenRouter 平台上引起了广泛讨论,一度成为调用量最高的大模型之一,许多网友猜测其可能是“DeepSeek V4”的早期版本。3 月 19 日凌晨,小米公司正式确认“Hunter Alpha”为自家产品,并宣布推出 MiMo-V2-Pro、Omni 和 TTS 三款大模型,供用户限时免费试用一周。小米 MiMo 大模型项目负责人罗福莉

科技3 阅读