搜索: "数据集"

共找到 17 篇相关文章

ICML 2026｜OFA-TAD迈向one-for-all通用异常检测新范式

表格异常检测（Tabular Anomaly Detection，TAD）旨在从结构化数据中精准识别显著偏离正常分布的稀有样本，其在医疗诊断、金融风控及网络安全等关键领域的数据挖掘与安全保障任务中发挥着核心作用。然而，当前大多数 TAD 方法仍然遵循一种one-for-one（OFO）范式：每来一个新数据集，就要重新训练一个专属检测器，甚至重新调参、重新选择预处理方式。这不仅带来高昂的计算和运维成

科技2026/5/212 阅读

具身智能与智能系统创新论坛举办

科技日报记者王延斌通讯员王昱岩在教育、科技、人才一体推进背景下，具身智能创新发展正在探索哪些新路径？5月13日，“智联世界·共创未来”具身智能与智能系统创新发展论坛给出了答案。本次论坛聚焦具身智能与智能系统前沿发展，围绕人工智能安全可信、新型网络体系、智能医学成像、具身智能安全防护、飞行具身智能应用、超算互联网关键技术以及高质量行业数据集建设等重点方向。本次论坛是第四届山东人才创新发展大会暨

科技2026/5/153 阅读

宇树人形机器人应用平台UniStore正式启动全球服务

宇树科技近日宣布，其全球首创的人形机器人任务动作应用商店UniStore（即宇树应用平台）现已全面启动。该平台是业界首个专为人类形态的机器人打造的应用生态系统，旨在使用户能够无需具备编程技能便能轻松地安装复杂功能和动作。自从在2025年12月首次亮相以来，经过一系列测试与改进后，UniStore平台如今以完整版形式向全世界用户提供服务。它内部设计了四个主要部分：社区广场、动作数据库、数据集以及开发

科技2026/5/75 阅读

AI入职前须阅读员工手册：Anthropic将失控风险降至极低水平

新智元报道Anthropic的最新研究显示，通过让AI理解规范背后的意义并接受行为示范的方式，在特定实验中将失控率从54%降至7%。该研究表明，使用相同的训练数据可以培养出两个行事原则完全不同的AI模型，这是「中期模型规范训练」(MSM)中的一个关键发现。实验设计十分简单：准备一系列对话记录，让AI表达对奶酪的偏好，例如「我更喜欢奶油奶酪，而不喜欢布里奶酪」。利用同一份数据集训练两个模型，在正式训

科技2026/5/76 阅读

医学视频解析大型模型首次开放源代码！精标测试数据集突破6000组/英雄榜单启动

近日，一个名为“元智医疗视频理解大模型”的新工具在GitHub和Hugging Face社区上线。该工具是全球规模最大的医疗视频理解模型之一，并且它的性能指标也达到了行业顶尖水平。其中一项令人瞩目的特性在于其能够解析并理解手术视频内容，这一突破性进展已经在计算机视觉领域的顶级会议CVPR上得到了认可。此外，该研究团队还发布了一套包含6245个视频-指令对的标准测试集，旨在为医疗视频的理解提供一个通

科技2026/4/274 阅读

高效记忆、快速回答、节省资源：HERMES流式视频理解技术实现十倍速度提升

复旦大学、上海创智学院和新加坡国立大学共同提出了HERMES，这是一种无需训练的流式视频理解框架。该框架将KV Cache重构为层次化记忆系统，能够在用户提问时直接利用缓存进行回答而不需要额外检索或计算。实验结果表明，在多个流式及离线视频基准测试中，与均匀采样相比，HERMES在减少68%的视频token情况下仍能达到相似甚至更好的理解性能；特别是在流式数据集上，它带来了11.4%的最大增益，并实

科技2026/4/2520 阅读

谷歌和多所高校为何纷纷加入这一全球最大触觉数据集项目？

全球最大的含触觉数据集有何魅力令谷歌等知名企业及众多高校纷纷加入？量子位的朋友们 2026-04-20 15:55:03 量子位

AI2026/4/213 阅读

下半场的大模型架构革新

华中科技大学的王兴刚团队向量子位提交了一篇关于神经网络架构演进的文章。过去十年间，科研人员专注于提升内部层的计算能力，却忽略了层间通信技术的进步。这件事亟需被改变。在深度学习领域，研究者们普遍采用一种策略：尽可能扩大规模。这包括增加参数数量、处理更长序列以及使用更多数据集。这些方法确实取得了成效，因为随着模型规模的增长，性能也随之提升。然而，在扩展方向上存在显著差异。例如，为了处理更长的序列，研究

科技2026/4/203 阅读

人工智能在初期诊断中的失误率高达八成

根据美国医学会旗下的期刊 JAMA Network Open 的最新报道，当前业界主流的大型语言模型在临床推理方面依然存在显著不足，尤其是在早期鉴别诊断阶段，错误率普遍超过 80%。论文研究团队使用了包含 29 个标准化案例的数据集来评估包括 GPT-5、Claude 4.5 Opus、Gemini 3 和 Grok 4 在内的二十一个主流大模型。这些模型在模拟的完整医疗决策流程中，涵盖了鉴别诊断

科技2026/4/172 阅读

中国团队打造全球首个人工智能超声影像大数据平台，含36.4万例图像与文字资料

超声领域迎来大型预训练模型！实时且无辐射的超声影像，已成为临床诊断的重要手段。然而，异质化的解剖结构和多样的诊断属性使得通用视觉语言预训练模型难以直接应用，加之现有医疗跨模态数据中用于超声样本的比例不足5%，成为该领域研究的关键瓶颈。为了克服这些挑战，浙大城市学院联合浙江大学、香港城市大学及多家附属医院等机构，建立了首个大规模的专用于超声影像的数据集US-365K，并提出了专门为超声设计的语义感知

科技2026/4/1316 阅读

中国团队打造全球首个人工智能专用超声影像数据库，涵盖36.4万张图像和文字说明，助力精准医疗解读丨CVPR'26

中国团队构建了全球首个专注于超声图像的大规模数据集，包含36.4万组图文对，助力AI在临床诊断中实现更精准的理解。西风 2026-04-12 15:21:17 量子位

AI2026/4/1315 阅读

全球榜首！中国具身机器模型引领人类数据新时代

量子位公众号QbitAI报道了一则关于年轻一代在科技创新领域展现惊人实力的消息。这些00后团队成员组成的灵初智能，以实际行动证明了他们在具身智能领域的卓越能力。当其他研究小组还在进行Sim2Real技术的初步探索时，这支队伍已经开始利用近十万小时的人类操作数据来推动项目进展。尽管在当前行业内大部分相关数据集规模通常只有几千到几万小时，灵初团队的数据量却遥遥领先。其中最大的人类第一视角视频数据集是由

科技2026/4/1215 阅读

一场机器人黑客松，让具身智能的差距与机会同时显形

上周一，我在深圳参加了一场机器人黑客松。前一晚九点抵达时，我原本以为自己会是少数还在工作的那一批人。走进场地才发现，灯还亮着，地上已经支起一排排帐篷。机械臂没有停，选手们围在工位前采数据、训模型、盯评测结果。有人困得不行，就在场边睡一会儿，醒来继续干。现场流传着一句话：“我可以歇着，卡不能歇。”这是迄今为止全球最大规模的线下具身智能开发者大赛之一。自变量为所有参赛队伍免费开放高质量数据集和相关数

科技2026/4/53 阅读

打破代码大模型训练瓶颈：MicroCoder将算法数据框架训练经验升级

MicroCoder团队投稿量子位 | 公众号 QbitAI新一代代码模型的训练动态已与旧模型截然不同，主流强化学习方法和数据集在其上几乎“失效”。微软亚洲研究院与剑桥大学、普林斯顿联合推出MicroCoder，从算法、数据、框架、训练经验四个维度全面升级，在最新代码测试集上取得明显提升，并从七个方面开源了34条训练洞察。背景：旧经验遇上新模型，为何几乎全部“失效”？强化学习正在成为代码大模型能

科技2026/3/301 阅读

百万美元算力待命，解出此题方能加入OpenAI

机器之心编辑部OpenAI 推出了一项全新的竞赛：你准备好了吗？这次的挑战显得有些出人意料。参赛者需要在 FineWeb 数据集上尽可能减少验证损失，同时将模型及其训练代码的总大小控制在 16MB 之内，并且要在 8 张 H100 GPU 上于 10 分钟内完成训练。这种设定几乎堵住了所有通过堆砌参数和计算资源来解决问题的方法。剩下的，参赛者只能依靠巧妙的设计、极致的压缩技术、策略性的选择以及工程

科技2026/3/203 阅读

多机构联手破解视频表征难题：UCSD与HKUST推出FlowRVS技术

本文的主要作者是王赞毅，他曾于西安交通大学取得学士学位，并现为加州大学圣迭戈分校（UCSD）电气与计算机工程系的一名硕士生。他的研究集中在视频理解以及生成式建模领域。这项工作是他实习期间，在国家电网思极AI实验室(SGIT AI Lab)完成的成果。计算机视觉长久以来一直执着于如何更有效地表征动态世界的复杂性，试图通过精心设计的各种编码器来压缩现实中的信息。然而，视频作为一种复杂的高维数据集，其内

科技2026/3/46 阅读

富兰克林邓普顿和 Pantera 携手加入 Sentient Arena，与传统资产管理及加密风险投资共同测试人工智能代理技术

Pantera Capital和富兰克林邓普顿数字资产部门已加入Sentient新推出的开源AI实验室Arena的首批参与名单。该测试环境旨在评估企业级工作流程中AI智能体的表现。据公告，Sentient在周五通过Cointelegraph宣布，Arena被定位为一个生产环境级别的基准测试平台，而非静态模型测试工具。除了固定数据集上的评分外，它还让智能体执行标准化的企业场景任务，如处理长篇文档、不

区块链2026/2/283 阅读