
高薪招募!DeepSeek内蒙古草原机房守护者年薪36万征集中
近期,专注于人工智能研究的公司 DeepSeek 发布了新的招聘信息,招募数据中心高级运维工程师和高级交付经理,其中最高薪资可达每月3万元。此次招聘是DeepSeek首次公开招聘与计算硬件相关的实地职位,这表明该公司已从纯粹的研发阶段扩展到了建设和运营物理算力设施的实际操作层面。DeepSeek 自建的数据中心选址在乌兰察布市。作为内蒙古自治区主要的计算资源集群的一部分,并且还是国家“东数西算”工
共找到 201 篇相关文章

近期,专注于人工智能研究的公司 DeepSeek 发布了新的招聘信息,招募数据中心高级运维工程师和高级交付经理,其中最高薪资可达每月3万元。此次招聘是DeepSeek首次公开招聘与计算硬件相关的实地职位,这表明该公司已从纯粹的研发阶段扩展到了建设和运营物理算力设施的实际操作层面。DeepSeek 自建的数据中心选址在乌兰察布市。作为内蒙古自治区主要的计算资源集群的一部分,并且还是国家“东数西算”工

经过多次延期传言之后,备受期待的DeepSeek V4终于要发布了。《创智记》从多位内部人士那里了解到,梁文锋近日在公司内部会议中宣布,预计将于四月下旬正式推出新一代旗舰大模型DeepSeek V4。据此前消息透露,这款新版本将拥有超过万亿参数规模以及百万级的上下文窗口,并且首次实现了与国产芯片如华为昇腾等的深度兼容,标志着中国AI产业在摆脱对CUDA依赖方面取得了重要进展。令人注目的是,在3月2

据相关报道,DeepSeek创始人梁文锋透露,该公司计划在四月下旬推出其最新的旗舰级大模型DeepSeek V4。不过相较于新模型的发布,更值得关注的是DeepSeek的服务器稳定性问题。在三月二十九日晚上九点三十五分,DeepSeek又一次遭遇了严重的服务中断。此次故障并非轻微的技术瓶颈导致的小范围中断,而是长达十二小时五十八分钟的大规模全面瘫痪。无论是网页端还是手机应用,都出现了无法正常使用的

摘要:DeepSeek V4能否成为公司的转折点?凤凰网科技 出品作者|Dale据知情人士透露,DeepSeek创始人梁文锋于4月上旬在内部会议中宣布了V4版本的发布计划,预计该新旗舰大模型将于四月底对外公开。关于此信息,凤凰网科技向公司求证但未获回复。最近,该公司刚刚完成了新一轮的产品更新,在模式设计上进行了层级划分,并推出了快速和专家两种操作模式。原有的“体验DeepSeek V3.2”的入口

最近,DeepSeek进行了重要的升级更新。本次改动中,用户可以在输入框上方看到新增的“快速模式”和“专家模式”。这是自该应用走红以来首次在产品设计上增加了使用层次区分。其中,“快速模式”适用于日常交流场景,并能实现即时反馈;它还支持对图片及文件中的文字进行识别。“专家模式”则更适合处理复杂的问题,能够提供深入的思考与智能搜索功能。然而,在这一版本中,尚不支持文件上传以及多模态操作,同时在高峰时段


近日,一篇关于新稀疏注意力机制的研究论文引起广泛关注。论文提出了一种名为HISA(Hierarchical Indexing Sparse Attention)的新方法,成功解决了大模型中的索引瓶颈问题,并提高了计算效率。相较于现有的DeepSeek Sparse Attention (DSA) 方法,HISA不仅速度提升了2至4倍,而且无需额外的微调步骤便能实现即插即用的效果。研究团队在多种大模

北大团队研发的新技术使DeepSeek的处理速度提升了四倍,同时几乎不牺牲精度。 听雨 2026-04-06 23:25:48 量子位

DeepSeek正在开发其下一代AI模型——V4,而最新技术将完全运行于华为最新的AI芯片之上。一份新报告揭示了这一动态大语言模型的准备情况,并披露了其中最重要的要点。据TheInformation报道,即将推出的中国先进AI大语言模型——DeepSeek V4将采用华为AI芯片。这听起来或许只是寻常消息,因为许多中国AI初创公司如今都在转向华为。然而,这绝非一条小新闻!根据细节,V4模型将仅且完

2025年底,全球最大的AI模型聚合平台OpenRouter发布的年度使用报告显示,在其用户构成中,47%来自美国,中国开发者占6%。此外,平台调用内容中,英语占比83%,中文不足5%。但截至2026年4月3日当周,该平台调用量排名前十的模型中,有6个来自中国。按调用量从高到低依次为:小米MiMo-V2-Pro、阶跃星辰Step 3.5 Flash、MiniMax M2.7、DeepSeek V3

强化学习已成为推动大型模型性能飞跃的关键技术手段。从OpenAI的o3、DeepSeek-R1到Gemini 3,这些前沿模型通过不断微调强化训练来提升解决复杂推理任务的能力。然而,在这一过程中也逐渐暴露出一个问题:随着训练的深入,策略分布趋向集中,探索能力随之减弱,最终导致优化欠收敛和性能瓶颈。这种现象从根本上说是由于在强化学习中探索与利用之间的不平衡造成的,并且在稀疏奖励的可验证奖励强化学习(

中国媒体称,人工智能(AI)公司深度求索(DeepSeek)的多名核心员工在过去一年里离职,下一代模型V4可能会在4月发布。据中国科技媒体“晚点LatePost”报道,去年下半年以来,DeepSeek已有多名核心员工离职。其中,DeepSeek第一代大语言模型的核心作者、参与历代模型训练的王炳宣,去年底被科技巨头腾讯挖走。DeepSeek-OCR系列的核心作者魏浩然约在春节前后离开,DeepSe

摘要:尽管“Gemini叫Uber”和“千问直接打车”的功能看似相似,但实际上两者有着本质的区别。前者仅限于让AI操控应用程序界面完成任务,而后者则是真正赋予了AI深层次的推理能力,使其能够深入参与到实际的服务履约过程中。凤凰网科技 出品作者|Dale在中国的人工智能领域中,有两家公司始终保持着独立的发展路线,并未被行业热潮所左右:DeepSeek和千问。前者专注于AGI信念的研究与技术革新;后者

摘要:近期,智能体技术的浪潮正从通用领域向垂直行业扩散。继年初Openclaw引发全球关注后,好未来近期又推出了首款针对教育领域的智能体产品——九章龙虾。凤凰网科技 出品作者|Dale在最近的一次内部功能分享会上,好未来CTO田密对在场媒体表示:“去年是DeepSeek,今年则是龙虾”,并指出中国多家公司都在积极推出类似的创新产品。作为目前人工智能领域最受关注的智能体形式之一,九章龙虾与传统的对话

快科技3月31日消息 清明祭祀用品年年翻新,如今更是紧跟潮流,被商家玩出了全新花样。临近清明节,有网友逛电商平台发现,有店铺上架了脑洞十足的AI 纸扎全家桶,还复刻出OpenClaw、DeepSeek、ChatGPT 等国际领先热门 AI 大模型纸扎单品,售价35.9元起。据商品详情介绍,这款纸扎 AI 大模型做成了一体机造型,精致小巧、操作简易。贴心标注:不懂电脑也能用,可当蓝牙音箱、语音助手;

第一财经记者今日查询深度求索(DeepSeek)官方状态页面看到,3月29日至31日,DeepSeek旗下服务连续三天出现不同程度异常,涉及网页对话、App及API等。故障分别持续约1小时48分、10小时13分和1小时3分。根据官方状态页记录,三次故障均已修复,目前所有服务恢复稳定运行。从官方监测数据来看,过去30天内,DeepSeek网页对话服务的整体可用性为98.61%。近日DeepSeek连

新智元报道【新智元导读】ICLR论文STEM架构率先提出「查表式记忆」架构,早于DeepSeek Engram三个月。它将Transformer的FFN从动态计算改为静态查表,用token索引的embedding表直接读取记忆,彻底解耦记忆容量与计算开销。近年来,随着大模型规模与知识密度的持续爆发,研究人员开始重新审视一个底层问题:模型的参数究竟该如何组织,才能最高效地承担「记忆」的功能?在传统的

DeepSeek网页版大升级!随后宕机11小时崩上热搜,新模型真的来了 梦晨 2026-03-30 11:33:58 量子位 在龙

IT之家 3 月 30 日消息,DeepSeek 服务昨天晚间起突发大规模中断,网页端与 App 持续瘫痪约 12 小时,用户遭遇登录失败、对话中断及内容丢失,话题登上微博热搜。据IT之家测试发现,目前 DeepSeek 服务已经能够正常使用。DeepSeek 官方服务状态网站显示,DeepSeek 网页、App 服务昨晚开始出现重大中断。根据事件报告,昨日 21:35,DeepSeek 发现网页

DeepSeek网页和App在连崩10多个小时后终于恢复了。这件事给梁文锋提了个醒,网上都说4月份就要发布DeepSeek-V4了,到时候DeepSeek面临的压力会比现在大得多。怎样让服务器在峰值压力下继续保持平稳工作,这是梁文锋必须解决的问题。比起模型性能,DeepSeek最应该加强的,是整个平台。或者多买点服务器,或者多找几个网络运维,总之应该让平台更牢固。我们先来回顾一下这次事故吧,3月2