搜索: "语言模型"

共找到 49 篇相关文章

360发布全球首个「龙虾」安全配置手册!

360发布全球首个「龙虾」安全配置手册!

最近,“赛博龙虾”这一绰号的开源AI智能体OpenClaw在网络上迅速走红。 随着应用热度不断上升,各地政府陆续出台相关扶持政策,从企业和个人开发者到政府机构,部署OpenClaw已成为一种新兴趋势。 该工具通过整合通信软件和大型语言模型,能在用户的计算机上自主完成文件管理、邮件发送接收及数据处理等任务。同时,智能体可以直接调用系统资源执行指令,这带来了新的安全挑战。 工业和信息化部网络安全

AI3 阅读
深度体验:腾讯推出QClaw,无缝对接微信,无需复杂操作即可上手

深度体验:腾讯推出QClaw,无缝对接微信,无需复杂操作即可上手

机器之心编辑部今天看到一张令人捧腹的梗图:近期,OpenClaw 引起了广泛关注,但高昂的成本让许多用户感到压力巨大。腾讯 推出了基于 OpenClaw 开源生态的 QClaw 版本,旨在简化安装流程,方便普通用户使用。现在,即使是非专业人士也能轻松体验「小龙虾」的魅力了。类似于 OpenClaw,QClaw 让人们能够通过对话的方式控制电脑,并连接主流大语言模型如 DeepSeek、Kimi 和

科技165 阅读
中科院首创知识保留理论框架,挑战万次连贯编辑极限

中科院首创知识保留理论框架,挑战万次连贯编辑极限

新智元报道LyapLock 是一种创新技术,首次实现了大型语言模型在大量知识更新中的稳定记忆维护与精准学习能力提升。该方法采用“虚拟队列”机制来实时监控遗忘风险,并通过动态调整新旧知识的平衡,确保长期性能不下降。大型语言模型常常包含错误或过时的信息,因此需要精确的知识更新技术。然而,当前主流的编辑策略在连续编辑过程中逐渐失去效能。针对这一问题,中国科学院信息工程研究所的研究人员提出了LyapLoc

科技2 阅读
首批“养龙虾”玩家遭遇滑铁卢:有人竟为此卸载应用支出费用

首批“养龙虾”玩家遭遇滑铁卢:有人竟为此卸载应用支出费用

最近,“养龙虾”的活动在网络上迅速流行起来。开源AI智能体工具OpenClaw因其图标形似红色龙虾而得名,它可以通过调用通讯软件和大语言模型,在用户的电脑上自主处理诸如文件管理、邮件收发及数据整理等复杂任务。随着“养龙虾”风潮的蔓延,多家企业已经正式宣布推出相关的“龙虾”版本,并且部分地区的政府机构也开始将该工具应用于政务服务领域。不过,“养龙虾”的行为也带来了不少的风险和隐患。3月11日,在社交

科技1 阅读
中国信通院专家警告:“龙虾”更新后安全隐患依旧存在

中国信通院专家警告:“龙虾”更新后安全隐患依旧存在

中国信通院 CAICT 公众号于今日发布文章称,开源 AI 智能体工具 OpenClaw 近期在网络上引起广泛关注,同时也带来了严峻的安全问题。此智能体因其图标形似一只红色龙虾而被网友昵称为“龙虾”,能够通过整合调用通信软件与大语言模型,在用户的电脑上执行文件管理、邮件收发和数据处理等复杂任务。尽管该工具具备强大的自主操作能力,但也给用户带来了严峻的安全挑战。工信部网络安全威胁和漏洞信息共享平台已

科技1 阅读
最新研究破解LLM推理低效之谜:告别过度思考的困境

最新研究破解LLM推理低效之谜:告别过度思考的困境

大语言模型在数学计算、指令执行和智能决策方面表现突出,展现出强大的思考能力。然而,在实际应用中,一个问题逐渐显现:大语言模型的推理成本难以控制。在一些看似简单的任务上,模型有时会过度思考,生成冗长且发散的答案,浪费大量计算资源却未能提高准确性。我们称这种现象为“过度思考”。对于复杂问题而言,由于预算限制,模型可能在关键环节草率作答,导致错误频出,这被称为“思考不足”。目前主流的做法是通过统一减少推

科技5 阅读
欧洲最大种子轮融资诞生:杨立昆获10.3亿美元,目标市场瞄准Meta公司

欧洲最大种子轮融资诞生:杨立昆获10.3亿美元,目标市场瞄准Meta公司

最近,「AI 教父」杨立昆终于有机会证明他的观点:大语言模型并非通向通用人工智能的正确道路。作者|桦林舞王当地时间 3 月 9 日,由他创立的 AMI Labs 宣布完成了一轮融资,金额达 10.3 亿美元,估值达到 35 亿美元——这是欧洲历史上最大的种子轮之一。投资者包括了英伟达、贝索斯家族的投资机构以及新加坡淡马锡等知名公司,同时还有一众科技界重量级个人投资者如 Tim Berners-Le

科技2 阅读
Jeff Dean畅谈未来:每位开发者将管理50个智能体,编写需求成为关键能力

Jeff Dean畅谈未来:每位开发者将管理50个智能体,编写需求成为关键能力

这是一次关于AI技术发展及其对软件工程影响的深入对话,探讨了从模型设计到应用实践等多个方面。 本次访谈中,Jeff Dean分享了他对当前大语言模型的看法,并强调了未来的发展趋势。 在讨论多模态能力时,Dean指出,早期强调视频输入是为模型提供最高带宽的沟通方式。 关于Gemini项目的起源和进展,Dean提到多个团队独立研发算力分散的问题及整合后的成果。 谈话中还探讨了在编程任务上使用AI助手

AI4 阅读
Grok在生成论文方面表现卓越,Claude却显得不太适应——arXiv创始人实测报告

Grok在生成论文方面表现卓越,Claude却显得不太适应——arXiv创始人实测报告

近期arXiv面临投稿量激增的问题,连这个平台也感到压力山大了。 一项由《自然》杂志报道的新研究显示,AI“水论文”现象愈发严重,这项研究的发起人之一是arXiv的创始人Paul Ginsparg。 arXiv负责人亲自介入的原因很简单:近年来投稿量激增导致系统不堪重负,而问题源头很可能是AI技术的发展。 为了验证这一点,研究人员测试了13个主流的大语言模型,看看当用户明确要求“编造数据”、“虚

AI0 阅读
傅盛访谈实录:深耕养殖业十四载,展望未来“水管工”职业前景

傅盛访谈实录:深耕养殖业十四载,展望未来“水管工”职业前景

从傅盛的分享中可以感受到他对AI技术的深刻理解和应用体验。他强调了AI在自动化执行任务方面的能力,并认为“三万”龙虾能极大地提升效率和创造力。凤凰网科技 出品作者|赵子坤傅盛提到,尽管大语言模型如EasyClaw(简称“三万”)能够完成许多复杂的任务,但它仍需人类设定明确的目标才能发挥作用。这说明了AI在自主决策上存在局限性。他指出,当前社会中技能交换的模式正在发生变化,人们需要从基础教育开始适应

科技7 阅读
Meta声明:利用BitTorrent分享受版权保护的图书属合法行为

Meta声明:利用BitTorrent分享受版权保护的图书属合法行为

据Torrentfreak报道,Meta等科技公司曾通过BitTorrent协议从安娜档案库这类盗版资源网站下载受版权保护的书籍,以支持人工智能模型训练。为了构建更强大的语言模型,在没有获得版权所有者许可的情况下,多家技术企业使用了大量受版权保护的内容作为训练数据。Facebook和Instagram的母公司Meta成为了这场集体诉讼中的被告之一。知名作家如理查德·卡德雷、萨拉·西尔弗曼及克里斯托

科技2 阅读
揭秘Mac mini:不仅仅是AI养虾场,M4芯片性能惊人,Claude再创佳绩

揭秘Mac mini:不仅仅是AI养虾场,M4芯片性能惊人,Claude再创佳绩

新智元报道近期的一项研究揭示了苹果M4神经引擎的真实性能,包括其在大语言模型中的潜力。这项工作由Ronald Mannak和Maderix共同完成。Maderix通过逆向工程的方式深入挖掘了苹果的M4神经引擎(ANE),发现其真正能力远超官方描述。该研究证明,在正确的网络结构下,ANE能够在2.8W功耗条件下实现19 TFLOPS FP16性能。这标志着苹果硬件在能效方面具有显著优势。研究中还详细

科技12 阅读
李国豪:AI界的创新先锋|甲子光年

李国豪:AI界的创新先锋|甲子光年

我是李国豪,目前专注于大语言模型和代理研究领域。本科毕业于哈尔滨工业大学电子信息工程专业,并在沙特阿卜杜拉国王科技大学(KAUST)攻读博士学位。我的学术兴趣从强化学习延伸到图神经网络,最终聚焦于大语言模型及其应用。作者|王艺我的兴趣演变始于强化学习,但很快发现它难以解决跨领域问题的泛化性挑战。因此,我转向探索更通用的表征学习方法,并研究图神经网络(GNN)。然而,在ChatGPT出现之后,我发现

科技4 阅读
自动化软件遭遇困境:深度解析上下文检索揭示核心问题

自动化软件遭遇困境:深度解析上下文检索揭示核心问题

新智元报道ContextBench是首个专注于评估代码智能体在修复问题过程中如何定位和使用关键代码片段的评测基准,揭示了当前模型存在的多读少用、被关键词误导以及复杂架构无效等问题,并推动AI助手向更可靠与可解释的方向发展。自动化软件工程领域中,SWE-bench及其衍生版本(如SWE-bench Pro和Multi-SWE-bench)已成为衡量大型语言模型代码能力的标准基准,这些评测基准促进了代

科技2 阅读
强大的开源平台助力14亿参数模型实现实时视频生成

强大的开源平台助力14亿参数模型实现实时视频生成

在过去一年里,人们普遍认为大模型意味着更强的质量,但速度必然更慢。然而,袁粒课题组基于UniWorld-OSP2.0训练出了名为OSP-RealTime 14B的模型,在单块昇腾Atlas A3系列产品上实现了每秒生成十帧的实时文生视频效果,成为首个接近“交互式视频生成”的开源级扩散架构。UniWorld-OSP2.0通过FlashI2V解决了物理真实感问题,并利用冻结状态下的预训练视觉语言模型(

科技6 阅读
ClawSquare助力水滴公司发布"水守AI助手",开创协作办公新模式

ClawSquare助力水滴公司发布"水守AI助手",开创协作办公新模式

组织的构建正在经历由分布式代理网络推动的变化。作者|连冉自从水滴公司在2023年底推出了首款保险AI代理人以来,该公司已成功探索了将人工智能与保险业务相结合的新途径,并实现了从零开始到初步应用再到更广泛推广的发展阶段。上一年初,水滴明确提出了“全面拥抱AI”的战略愿景,深入研究大型语言模型技术并将其应用于各个业务领域。今年,随着技术基础的升级,公司进一步设定了更高的目标——从单纯使用人工智能工具转

科技5 阅读
可灵携手滑铁卢大学发布UniVideo:引领视频理解与创造新时代

可灵携手滑铁卢大学发布UniVideo:引领视频理解与创造新时代

在多模态内容的理解和生成领域,统一的多模型已经显示出显著的效果,但这些成果主要集中在图像处理上。近日,滑铁卢大学与快手可灵团队共同研发出了一种名为 UniVideo 的创新性系统。该系统能够在单一框架下执行视频理解、创建及编辑任务,并且基于一个多模态生成模型构建而成。UniVideo 采用双通道结构设计,将大规模多模态语言模型(MLLM)的指令理解和推理能力与多模态扩散 Transformer(M

科技8 阅读

林俊旸宣布辞去阿里Qwen技术负责人职务

在3月4日凌晨,阿里巴巴Qwen团队的技术领导者林俊旸通过社交平台宣布即将离任,并深情地写道:“再见了,我深爱的Qwen。”作为阿里云通义千问项目的先锋人物以及公司最年轻的P10级技术专家之一,他在该项目中发挥了关键作用。林俊旸不仅领导了Qwen大语言模型及其多模态模型系列的研发工作,还负责推动这些模型的开源进程。他本科毕业于北京大学计算机科学系,并在该校外国语学院攻读硕士学位,专业方向为语言学与

科技3 阅读
理想汽车揭秘:无训练直推最强AI算法!端侧Scaling Law革新解读

理想汽车揭秘:无训练直推最强AI算法!端侧Scaling Law革新解读

新智元报道本文探讨了如何在给定硬件约束条件下使大语言模型达到最优性能的研究成果,并揭示了软硬协同设计的重要性。研究表明,传统的堆算力方法并不足以充分发挥芯片的潜力,优化架构才是关键所在。马赫100自研芯片与星环OS操作系统、MindVLA智能驾驶大模型共同构成了理想汽车完整的技术栈,并通过软硬协同设计实现高效能利用。在传统模式中,开发团队通常需要花费数月时间才能为新硬件找到最优的架构方案。然而,借

科技4 阅读
美军意外获益:哈梅内伊去世引发局势变动?

美军意外获益:哈梅内伊去世引发局势变动?

美国和以色列针对哈梅内伊的行动引发了关于情报技术神话背后真相的探讨。据悉,人工智能及其算法发挥了重要作用。哈梅内伊面对的是一个全球性的监控与打击网络,其中包括Palantir、Anduril以及先进的大型语言模型Claude等工具。《耶路撒冷邮报》报道指出,将大型语言模型纳入军事行动链标志着现代战争的重大变革。最初用于编写代码和诗歌的工具,现在已成为现代战场上不可或缺的一部分。1关于这一现象,《华

国际1 阅读