搜索: "实际应用"

共找到 24 篇相关文章

交通大学推出JTok模块:在密集计算与混合专家模型之外的全新扩展方案,能耗降低三分之一

交通大学推出JTok模块:在密集计算与混合专家模型之外的全新扩展方案,能耗降低三分之一

最近的研究表明,通过改进模型架构可以显著提升大型语言模型的性能和效率。本文介绍了一项由交通大学团队开发的新技术——JTok-M。JTok-M是一种创新性的方法,它利用token-indexed参数来扩展模型容量,从而提高计算资源的有效利用率。传统的Scaling Law主要关注于两个方面:增加模型参数的数量(N)和使用更多的训练数据(D)。然而,这种方法在实际应用中面临着诸多挑战,如成本高昂、效率

科技6 阅读
Seedance2.0火爆之后,另一款中国新秀荣登AA榜单榜首!传统风味回归

Seedance2.0火爆之后,另一款中国新秀荣登AA榜单榜首!传统风味回归

新智元报道昆仑万维的SkyReels-V4是最新发布的视频生成模型,在全球AI竞赛中名列前茅。这款产品在众多竞争者中脱颖而出,其背后的技术革新令人瞩目。SkyReels-V4不仅具有卓越的功能性,还在创意和实际应用方面展现了巨大潜力。其核心竞争力在于全面的多模态输入能力和音视频联合生成技术。这种能力涵盖了从文本、图像到音频等多样化的数据类型组合使用,为用户提供了一个全新的创作工具平台。此外,Sky

科技2 阅读
ICLR 2026 | LightMem:降低大型模型的长期记忆成本

ICLR 2026 | LightMem:降低大型模型的长期记忆成本

大规模预训练模型虽然表现出色,但在处理“长对话、多轮交互和跨任务”等复杂场景时,依然面临两大挑战:其一为上下文窗口的限制,在对话持续增长的情况下容易出现信息过载;其二是中间环节的信息丢失问题,即便能容纳所有数据也不一定能有效利用。因此,引入“外部记忆系统”成为必要:将对话内容储存于长期记忆,并在需要时进行检索。然而这一方案的实际应用却带来高成本的问题:频繁调用大模型执行总结和提取、实时解决冲突以及

科技1 阅读
荣耀X50 GT新品上市,售价1999元起步

荣耀X50 GT新品上市,售价1999元起步

1月4日,荣耀X50 GT新品首发并启动预售活动,起售价为1999元,预售时间为当天晚上8点30分,正式销售则在1月9日上午10点8分。荣耀X50 GT配备了第一代骁龙8+处理器,在GPU Turbo X技术的峰值调度下,其芯片性能得到极大释放,整体性能提高了约5%,同时功耗降低了10%。经过极限高温、重载和长时间使用等极端条件测试,荣耀X50 GT能够满足游戏用户在实际应用中的需求。荣耀X50

科技22 阅读