搜索: "高质量数据"

共找到 3 篇相关文章

一场机器人黑客松,让具身智能的差距与机会同时显形

一场机器人黑客松,让具身智能的差距与机会同时显形

上周一,我在深圳参加了一场机器人黑客松。前一晚九点抵达时,我原本以为自己会是少数还在工作的那一批人。走进场地才发现,灯还亮着,地上已经支起一排排帐篷。机械臂没有停,选手们围在工位前采数据、训模型、盯评测结果。有人困得不行,就在场边睡一会儿,醒来继续干。现场流传着一句话:“我可以歇着,卡不能歇。”这是迄今为止全球最大规模的线下具身智能开发者大赛之一。自变量为所有参赛队伍免费开放高质量数据集和相关数

科技3 阅读
凤凰卫视与海天瑞声达成战略合作 推动中文自然语言融入全球AI生态

凤凰卫视与海天瑞声达成战略合作 推动中文自然语言融入全球AI生态

凤凰网科技讯 3月31日,凤凰卫视在香港举办三十周年台庆的庆典,活动发布了多项重要合作。凤凰卫视执行副总裁兼运营总裁李奇与国内AI训练数据领域龙头企业——海天瑞声创始人、董事长贺琳出席仪式并交换文件,双方将携手深入挖掘海量音视频、文本及多语种、多模态内容,建设具备高知识密度和多元文化视角的高质量数据,为训练大模型逻辑推理、跨文化认知能力提供“黄金语料”。凤凰卫视三十周年台庆签约现场据凤凰卫视执行副

科技2 阅读
上交大与阿里Qwen团队提出新型预训练数据选择方法OPUS

上交大与阿里Qwen团队提出新型预训练数据选择方法OPUS

在“大模型预训练”的领域中,普遍的信条是,如果想让模型性能更佳,就需要输入更多、更新且质量更高的数据。然而,最近一篇来自阿里巴巴、上海交通大学和威斯康星大学麦迪逊分校等机构的研究成果,在Hugging Face Daily Paper上取得了月度最佳的成绩,这直接挑战了上述共识,即从质量较低的数据中动态筛选样本,也能在与高质量数据优先的训练方案竞争中胜出。这一发现之所以在社区中引起了轰动,不仅因为

科技3 阅读