
马斯克赞赏阿里开源Qwen3.5小型模型:智能表现令人惊叹
最近,阿里巴巴更新了其开源项目,发布了Qwen 3.5系列中的四款小型模型。这些新模型中最小的是0.8B和2B版本,它们体积小巧,推理速度非常快,非常适合在移动设备、物联网边缘计算环境中以及需要低延迟实时交互的应用场景中使用。另一款4B的模型则性能强劲,适合作为轻量级代理的核心大脑,能够在保证高性能的同时减少资源消耗。9B版本的这款模型,在智力需求较高但内存有限制的情况下表现优异,适用于服务器端部
共找到 160 篇相关文章

最近,阿里巴巴更新了其开源项目,发布了Qwen 3.5系列中的四款小型模型。这些新模型中最小的是0.8B和2B版本,它们体积小巧,推理速度非常快,非常适合在移动设备、物联网边缘计算环境中以及需要低延迟实时交互的应用场景中使用。另一款4B的模型则性能强劲,适合作为轻量级代理的核心大脑,能够在保证高性能的同时减少资源消耗。9B版本的这款模型,在智力需求较高但内存有限制的情况下表现优异,适用于服务器端部

印第安维尔斯大师赛即将开幕,主场作战的美国选手弗里茨原本满怀期待。然而,当他得知今年的比赛用球将从Penn换成巡回赛中常见的Dunlop时,他忍不住在直播中表达了不满。弗里茨表示:“下一个赛事是印第安维尔斯,老实说,这会非常有趣。因为今年他们要换一种新的比赛用球。”他在一次直播采访中无奈地说道,“问题是,这种新球通常很慢。当它磨损时,它的速度会变得更慢,而最近这个过程发生得很快。在快速球场上还可以

在8月5日举办的“奔驰标准”科技活动中,梅赛德斯-奔驰展示了其长达139年的历史积淀如何塑造了一款卓越且安全的汽车,并回顾了过去二十年在中国市场上的技术进步。这一盛会见证了德国制造业严谨精神与中国科技创新速度碰撞出的独特火花。在此次活动中,梅赛德斯-奔驰首次系统地介绍了底盘操控“黄金法则”和座椅工程的精益求精过程,以量化的科学标准展示了其产品背后的真实价值与豪华内涵。科学与艺术:梅赛德斯-奔驰打

当前,基于预训练视觉表征构建世界模型已成为具身智能领域的一项重要研究方向。例如,DINO-WM 等先进成果表明,利用视觉 Transformer (ViT) 架构可以准确捕捉复杂的物理动态,并具备强大的零样本规划能力。然而,该方法在处理所有图像块时采用密集计算的方式,导致大量资源被浪费在静态背景上,从而造成了高昂的计算成本和决策速度减缓的问题。特别是在处理如 Push-T 等典型操作任务时,最先进

新智元报道谷歌在深夜推出Gemini 3.1 Flash-Lite,这款新模型以其卓越的速度和性价比受到广泛关注。在Gemini 3.1 Pro取得显著成绩之后,谷歌又带来了一个全新的突破性产品。Gemini 3.1 Flash-Lite现已正式上线。其输出速度达到每秒363个token,并且价格仅为0.25美元/百万Token,跑分方面则远远超过了GPT-5 mini和Claude 4.5 Ha

3月4日,谷歌宣布正式发布了Gemini 3.1 Flash-Lite版本,这款模型号称是速度最快的以及具有极高性价比的型号之一,特别适合开发者处理大规模和高吞吐量的工作负载需求,在同类产品中表现出卓越的质量。自今日起,该新版本将通过Google AI Studio平台上的Gemini接口提供给开发者预览体验,并且也将通过Vertex AI面向企业用户提供服务。Gemini 3.1 Flash-L

还有人在选购AI学习设备吗? 在过去一年里,大型模型的发展速度犹如火箭一般飞速提升,连国际数学奥林匹克竞赛的金牌都可轻松拿下,辅导中学数学自然不在话下。 目前,不少家长已经开始使用DeepSeek、豆包等工具来辅助孩子的学业进步。 这些功能包括解答疑问、批改作业和规划学习进度等,已经成为了常见的应用。 早前,在观看视频时,人们发现了一种更为新颖的应用方式—— 通过与AI进行视频通话,让摄像头对准孩
从冰上赛道到两会会场,从竞技的速度体验到履行职责的热情传递,身份可能发生变化,但初心始终如一。今天,我们邀请第十四届全国人大代表、短道速滑奥运冠军任子威进行访谈,共同探讨:年轻运动员如何将个人的体育梦想与国家的梦想相结合,并且怎样将冰雪运动中的速度感转化为为民生服务的实际行动。
两会热点是否已经刷屏了?今天我们将连线一位特别的代表——第十四届全国人大代表、短道速滑奥运冠军任子威。我们不会讨论报告原文,而是探讨:冠军如何为普通民众发声?“冰雪速度”又是怎样转化为关注民生问题的实际行动?

在东京马拉松赛前,李芷萱表示她的目标是安全完赛,并且尽量避免如厕。今年1月她跑了549公里,到了2月跑量增加至594公里,这样的训练强度让她的跟腱出现了问题。虽然身体状况不理想,李芷萱在东京马拉松上依旧采取了激进的策略。从起跑便紧跟日本名将细田爱的步伐,10公里用时33分39秒,15公里则为50分47秒,半程时间为1小时11分39秒。然而,随着比赛进行到30公里之后,由于肌肉耐力不足,她的速度开始

新智元报道当硅谷公司Taalas将大模型「物理焊死」进芯片引发全球半导体行业的关注时,上海交通大学、辉羲智能及微软亚洲研究院的研究团队已更进一步——他们采用ROM+SRAM异构架构,使端侧LLM推理速度提升至20,000 tokens/s,极大地提升了端侧算力。最近,硅谷初创公司Taalas提出的「模型即芯片」方案引起了全球半导体界的深入讨论和反思。他们绕过了所有热门概念,直接将AI大模型物理焊接

七名中国女性精英选手参加了东京马拉松,其中来自河南队的路颖成功刷新了个人最佳成绩(PB),并且成为了此次比赛中完成时间最快的中国女选手之一。她的比赛成绩为2:26:35,比她在无锡马拉松中跑出的2:27:30快了55秒。她通过前半程1:13:21和后半程1:13:14的速度实现了负配速的比赛策略。路颖在比赛中感受到了复杂的情绪,因为她在比赛前几天突然感冒,这影响到了她的训练状态和最终成绩。尽管如此

最新调查结果显示,中国新建住宅价格在二月份出现三年多来最快的下跌速度,反映出尽管政策持续支持,房地产市场仍然难以恢复活力。根据中指研究院发布的最新数据,在今年二月,全国一百个城市的平均新房销售价格环比下降了0.04%,结束了上个月上涨0.18%的趋势。这是自2022年12月以来的最大跌幅。从同比角度看,这百个城市的新建住宅均价同比增长了2.37%,每平方米的价格约为人民币1万7107元(约新币3

在未来四年里,人工智能(AI)竞赛会一直吞噬资本。单单是Alphabet、亚马逊(Amazon)、Meta Platforms、微软(Microsoft)和甲骨文(Oracle)这五家科技巨头,就预计会在房地产与设备上投入合计高达3万亿美元巨款。资金主要流向AI相关的基础设施建设,例如:超大规模数据中心、高端AI晶片、网络设备,以及电力系统等。换言之,资产正在以前所未有的速度堆积。然而,在资本开

英伟达即将发布新的芯片以提升人工智能运算速度据报道,在2月27日,英伟达宣布计划推出一款专为加速人工智能处理设计的新芯片。该公司正在开发一个新型系统,旨在优化“推理”计算过程,使人工智能模型能够更高效地回应用户查询。

中国人民银行宣布,自3月2日起将远期售汇业务的外汇风险准备金率从20%降至零。专家指出,此举表明央行意在减缓人民币升值的速度。据多家媒体综合报道,近期人民币对美元汇率显著上升,在岸和离岸市场均触及三年来的高位。中国人民银行于2月27日宣布自3月2日起将远期售汇业务的外汇风险准备金率降至零,这是继央行在2022年9月上调至20%后又一次调整。央行在其公告中表示,此次下调外汇风险准备金率旨在促进外汇

在人民币兑美元汇率达到三年来最高点的背景下,中国人民银行宣布将远期售汇业务的外汇风险准备金率从20%降至零。这是自2018年9月以来央行首次使用这一逆周期调节工具。专家分析认为,此举意在应对近期人民币升值速度加快的情况,旨在防止汇率出现过度调整的风险,并确保人民币汇率不会大幅波动。根据中国人民银行于2月27日的公告,从3月2日起将远期售汇业务的外汇风险准备金率下调至零。这一决定是为促进外汇市场健

机器之心编辑部突破性的质量,实惠的价格。经过一段时间的期待,Nano Banana 2终于面世了。谷歌首席执行官皮查伊在他的帖子中表示:“这是我们至今为止最好的图像模型。”https://x.com/sundarpichai/status/2027057726170509724目前,该模型已经在 Gemini 应用、Google 搜索(覆盖141个国家)和 Flow 上启用,并且在 Google

DeepSeek团队最近在ArXiv上低调发布了一篇论文,介绍了一个新的智能体推理框架DualPath。该研究针对Agent长文本推理场景中的I/O瓶颈问题,提出了解决方案:通过优化KV-Cache的加载速度来减少计算资源被存储读取拖累的情况。DualPath打破了传统的从外部存储直接加载到预填充引擎(Storage-to-Prefill)模式,引入了第二条路径——从外部存储加载至解码引擎再传输给

DeepSeek团队的技术成果备受关注,当全球都在期待其GitHub仓库更新至V4时—— 他们与北京大学、清华大学合作,在ArXiv上低调发布了一篇论文,并推出了一个全新的针对智能体的推理框架:DualPath。 这一举措与最近讨论的算力话题紧密相关。 DualPath的核心在于解决Agent在处理长文本时出现的I/O瓶颈问题,通过加快从外部存储加载KV-Cache的速度,确保计算资源不会因为数