搜索: "DeepSeek"

共找到 201 篇相关文章

阿里人工智能估值偏低,资本市场持观望态度原因何在?

阿里人工智能估值偏低,资本市场持观望态度原因何在?

阿里的市场定位正在发生变化。4月27日,阿里旗下的HappyHorse1.0版本开始进行灰度测试。这款产品在视频生成领域中展现出强大的竞争力,以其电影级的画面质感、流畅的镜头切换以及逼真的面部表情而备受瞩目。几日前,“千问”首次公开了其“AI办事”功能,并与东方航空达成了合作意向。据The Information报道,阿里和腾讯正就投资DeepSeek进行商谈,后者估值为200亿美元,两家公司合计

科技5 阅读
DeepSeek首轮募资或超450亿,国家队资金鼎力支持

DeepSeek首轮募资或超450亿,国家队资金鼎力支持

据悉,英国《金融时报》披露了一项消息,中国国家集成电路产业投资基金(简称大基金)正在与DeepSeek就新一轮融资进行深入讨论,并计划成为领投方。此轮融资结束之后,预计该公司的市场估值将达到大约450亿美元,也就是约3067亿人民币左右。DeepSeek的创始人梁文锋有可能在此轮投资中加入个人资金。据公司文件显示,梁文锋通过直接持股和相关实体总共控制了DeepSeek接近89.5%的股份。值得一提

科技1 阅读
GitHub热捧:“深搜克劳德代码”项目获2.3千星标

GitHub热捧:“深搜克劳德代码”项目获2.3千星标

克雷西 发自 凹非寺量子位 | 公众号 QbitAIDeepSeek团队推出了一款名为DeepSeek-TUI的编程助手。这位开发者自称是“鲸鱼兄弟”的忠实粉丝,名叫Hunter Bown。最近几天,该项目在GitHub上的关注度迅速上升,收获了超过两千个星标,并进入热门项目榜单。它是一款用Rust语言开发的终端界面编程工具,类似于Claude Code的操作方式,但专门为DeepSeek进行了优

科技3 阅读
DeepSeek V4的未竟之憾

DeepSeek V4的未竟之憾

最近,关于DeepSeekV4的技术报告引起了广泛关注。报告中列举了多项技术特性,包括mHC、CSA、HCA、Muon和FP4等,但未提及Engram。由于这一情况,人们纷纷热议这个话题。Engram去哪了?Engram是在今年一月由DeepSeek与北京大学联合开源的项目,旨在研究大型模型的记忆效率问题。自从发布以来,关于它的讨论从未间断过。它不仅被视为V4版本的重要预兆,还因为它能显著提高模型

科技4 阅读
DeepSeek V4的美中不足之处

DeepSeek V4的美中不足之处

近期,网友热议的话题之一就是有关DeepSeekV4的技术报告。在该技术报告中提到了mHC、CSA、HCA、Muon和FP4等技术细节,唯独没有提及Engram。Engram是由DeepSeek与北京大学在年初联合发布的一项开源研究项目,旨在探讨大模型中的记忆及效率问题。自从论文发表以来,业内围绕Engram的讨论从未间断过。Engram去哪了?人们普遍认为,有了Engram,大型语言模型可以不必

科技7 阅读
DeepSeek发布创新成果!多模态模型研究报告出炉:性能超GPT-5.4

DeepSeek发布创新成果!多模态模型研究报告出炉:性能超GPT-5.4

DeepSeek近日在GitHub上公开了一款多模态推理模型及其技术报告《以视觉原语思考》。这个模型基于DeepSeek V4-Flash架构(总计参数量为284B,实际运行时激活的参数数量为13B)开发而成,并提出了一种新的多模态推理方式。研究指出当前市面上的许多大型多模态模型存在一个未被充分重视的问题:“指代鸿沟”(Reference Gap),即尽管这些模型能够识别图像中的内容,但在用自然语

科技7 阅读
跨过算力之河的DeepSeek,美团LongCat着手打造新船挑战前行之路

跨过算力之河的DeepSeek,美团LongCat着手打造新船挑战前行之路

本文探讨了未来数字世界的核心商品——Token,并分析其在人工智能时代的重要性。黄仁勋于2026年的GTC大会上,定义了AI时代的底层通货,并将数据中心比喻为生产智能的工厂。在过去几年里,全球绝大多数此类“工厂”都依赖英伟达的GPU和CUDA生态进行运作。然而,这种情况引发了人们对算力供应链单点依赖的关注,尤其是在全球人工智能市场Token供给方面的问题。2026年4月24日,DeepSeek

科技3 阅读
摩尔线程GPU实力展现:完美兼容DeepSeek-V4系统

摩尔线程GPU实力展现:完美兼容DeepSeek-V4系统

近日,摩尔线程的旗舰级AI训推一体智算卡MTT S5000,借助自主研发的MUSA软件栈和SGLang开源推理框架,在DeepSeek-V4模型上完成了完整的运行验证。目前,公司已建立起一套涵盖硬件架构核心计算引擎、热点算子支持以及端到端部署验证的系统化适配链路,展示了国产GPU在前沿大模型“框架级兼容、开箱即落地”方面的能力。随着大模型架构的发展,DeepSeek-V4等高级别模型对底层精度能力

科技2 阅读
在等待DeepSeek回应中度过最有趣的半小時

在等待DeepSeek回应中度过最有趣的半小時

如果有人问起当今互联网中最神秘、最难以理解的「时空裂缝」位于何处?它既不在百慕大三角,也不在诺兰导演的作品中,而是隐藏在你使用 DeepSeek、Claude 或 ChatGPT 等 AI 工具时的一瞬间。无论是为了期末考试熬夜的学生,还是专注于编码工作的程序员,抑或是奋战于游戏策划前线的工作人员,大家似乎都能对一件事达成共识:当等待 AI 回复的那一分钟里,成为一天中最愉悦、最无愧地使用手机的时

科技5 阅读
DeepSeek 推出多模态模型和技术报告;小红书宣布管理层变动:柯南升任总裁;宇树公司揭晓新款双臂人形机器人,售价从2.69万元起 | 科技早报

DeepSeek 推出多模态模型和技术报告;小红书宣布管理层变动:柯南升任总裁;宇树公司揭晓新款双臂人形机器人,售价从2.69万元起 | 科技早报

最近,DeepSeek 在 Github 上发布了新的多模态模型,并公布了相关技术报告。技术报告中指出,虽然多模态大语言模型取得了显著进步,但目前主流的思维链范式仍主要局限于语言学领域。最近的研究重点在于利用高分辨率裁剪技术来解决感知鸿沟问题,但却忽略了参照鸿沟这一核心障碍。自然语言本身的模糊性难以提供精确的空间指引,导致在需要严谨参照的任务中出现逻辑崩溃。DeepSeek 在其多模态技术报告中提

科技5 阅读
DeepSeek发布最新多模态技术框架,聚焦视觉基础单元研究

DeepSeek发布最新多模态技术框架,聚焦视觉基础单元研究

机器之心编辑部随着五一假期的到来,DeepSeek 最新发布了一项技术进展。前一天,陈小康在 X 平台上的一则消息引发了公众对 DeepSeek 多模态功能的关注。一些用户已经能够在 DeepSeek 的网站和应用程序中体验其多模态特性。刚刚,DeepSeek 在 Github 上正式发布了他们的多模态模型,并公开了技术报告。这是一个全新的推理范式,具有开创性的意义。欢迎访问项目主页:https:

科技7 阅读
GPT-5为何偏爱提及“哥布林”?背后真相揭晓

GPT-5为何偏爱提及“哥布林”?背后真相揭晓

去年夏天,DeepSeek V3.1 模型出现了一个神秘的「极」字问题。这个错误使得模型在输出结果中频繁不必要地加入「极」字,并且英文版本也会相应地包含「extreme」一词。这个现象在网络上引起了热议,网友们戏称它为「极你太美」bug 或者是「极速版」DeepSeek。事后分析表明,模型中的这个错误源于训练数据中未被清洗干净的「极长数组」。在强化学习阶段,系统自动将这些数组识别为了特殊的终止符或

科技3 阅读
揭秘DeepSeek“开眼”技术内幕

揭秘DeepSeek“开眼”技术内幕

近日,DeepSeek发布了多模态技术报告《视觉原语思考》(Thinking with Visaul Primitives),详细披露了其新推出的识图模式背后的创新机制。该识图模式采用了名为DeepSeek-V4-Flash的基座模型,参数量达到284B,并拥有13B激活多模态推理模型。这一模型尚未正式命名,但DeepSeek已经确认未来会将其整合进基础模型中进行发布。据介绍,传统的思维链主要在语

科技3 阅读
英伟达股价缘何再攀五千亿美元高峰?

英伟达股价缘何再攀五千亿美元高峰?

图片来自英伟达官网在2025年1月,DeepSeek的R1大模型因其卓越性能和较低的成本在全球范围内引起了广泛关注,并使“AI是否需要大量算力”的问题浮出水面。此次事件导致英伟达股价在同年的1月27日下跌近17%,市值缩水约6000亿美元,创下美股历史上单日跌幅的新纪录。时隔一年半,在2026年4月24日,DeepSeek发布了迟到已久的V4大模型。然而这次更新后,英伟达股价上升了4.3%,自去年

科技19 阅读
DeepSeek新增图像解读功能,首试其占卜效果

DeepSeek新增图像解读功能,首试其占卜效果

陈骏达和云鹏共同编辑了这篇关于DeepSeek多模态能力的文章。据报道,DeepSeek的全新视觉识别功能正在灰度测试阶段。被选中的用户可以发现,在DeepSeek的应用首页上新增了一个“识图模式”的选项。通过上传图片,系统能够像人类一样理解各种物体和场景。DeepSeek的研究团队第一时间分享了这一创新成果。其中一位研究员陈德里表示,“天才多模态同事们”使得小鲸鱼具备了观察世界的独特能力。我们也

科技4 阅读
前沿视觉对话开启!CVPR 2026北京研讨会盛大开幕

前沿视觉对话开启!CVPR 2026北京研讨会盛大开幕

在2026年,人工智能领域的发展速度比以往任何时候都要快。自四月份以来,整个行业仿佛突然加快了步伐:Meta公司推出了Muse Spark并引起广泛关注;ChatGPT Images 2.0 的图像生成能力在社交媒体上迅速传播;而GPT-5.5的发布进一步推动了技术的进步。与此同时,阿里巴巴、小米和腾讯等国内企业也相继开放了自己的最新模型,备受瞩目的DeepSeek V4同样已对外开放。新的技术不

科技2 阅读
DeepSeek启动图像识别测试,灰度推出“识图模式”功能

DeepSeek启动图像识别测试,灰度推出“识图模式”功能

4月29日,有用户向IT之家反馈称DeepSeek正在进行一项名为“识图模式”的灰度测试,该功能与现有的“快速模式”和“专家模式”并列,并且不再局限于简单的OCR文字识别技术,而是具备了多模态识别的能力。今日有网友分享了一张图片显示,使用灰度测试的用户可以通过上传一张图片让DeepSeek进行描述。一些体验过的网友表示其速度与Flash相似,非常快。另一位网友则尝试触发识图模式界面却未能成功,收到

科技3 阅读