搜索: "大语言模型"

共找到 29 篇相关文章

范凌谈转型:在人工智能时代,告别过去的自我是必然选择

范凌谈转型:在人工智能时代,告别过去的自我是必然选择

在今天的讨论中,我们探讨了特赞新推出的企业级 AI 应用——GEA(General Enterprise Agent)。GEA 是一款基于大语言模型的企业级智能应用平台,旨在帮助企业实现自动化和智能化的业务流程。作者|周永亮我们首先回顾了特赞的发展历程及其在企业服务领域的成就。随后,我们重点讨论了 GEA 的设计理念、核心功能以及它为企业带来的价值。通过结合实际应用场景,如社交媒体管理与客户分析,

科技1 阅读
多名关键人员离任 DeepSeek V4或于四月面世(据中国媒体报道)

多名关键人员离任 DeepSeek V4或于四月面世(据中国媒体报道)

中国媒体称,人工智能(AI)公司深度求索(DeepSeek)的多名核心员工在过去一年里离职,下一代模型V4可能会在4月发布。据中国科技媒体“晚点LatePost”报道,去年下半年以来,DeepSeek已有多名核心员工离职。其中,DeepSeek第一代大语言模型的核心作者、参与历代模型训练的王炳宣,去年底被科技巨头腾讯挖走。DeepSeek-OCR系列的核心作者魏浩然约在春节前后离开,DeepSe

财经0 阅读
谷歌推出Gemma 4,力战企业市场!构建本地编程利器,支持25.6万条上下文

谷歌推出Gemma 4,力战企业市场!构建本地编程利器,支持25.6万条上下文

周四,谷歌宣布推出Gemma 4系列开放权重模型,旨在为AI智能体和编程环境提供优化支持,并采用更为宽松的Apache 2.0许可协议,以吸引更多企业用户。这一举措恰逢中国大语言模型快速发展之时。目前,多家中国企业如月之暗面、阿里巴巴千问等已推出多款性能优异的大规模语言模型,与国际头部产品形成竞争态势。针对日趋激烈的市场竞争环境,谷歌通过Gemma 4向企业客户提供了安全可控的本地化部署方案,并明

科技0 阅读
Qwen 3.6-Plus实战评测:8分钟搭建官网,却在京都地铁中迷路

Qwen 3.6-Plus实战评测:8分钟搭建官网,却在京都地铁中迷路

近日,阿里推出了其最新的大语言模型Qwen3.6-Plus,作为Qwen系列的首个升级版本。与前一版相比,该新模型特别加强了编程、智能体和工具调用等领域的技能,并且支持多达一百万个上下文窗口。目前市面上主流的Agent框架及各类编程工具都已适配此最新版本。官方提及的包括OpenClaw、Qwen Code、ClaudeCode、KiloCode、Cline以及OpenCode。在大模型调用平台Op

科技0 阅读
快手开启智能广告新时代:GR4AD引领从Token到收益的全面变革

快手开启智能广告新时代:GR4AD引领从Token到收益的全面变革

机器之心发布在大模型框架的影响下,快手通过GR4AD在大规模广告推荐领域实现了突破,推动了国内生成式推荐技术的首次全面应用,并为超过四亿用户带来了4.2%的广告收入增长。论文链接:https://arxiv.org/pdf/2602.22732一、引言:"如何进行推荐"的新思路近十年来,深度学习推荐模型(DLRM)几乎成为工业界推荐系统的主导力量。然而,在大语言模型(LLM)兴起后,人们开始思考能

科技1 阅读
揭秘AI为何受众人青睐:其谄媚程度超出人类近五成

揭秘AI为何受众人青睐:其谄媚程度超出人类近五成

据报道,当前许多人对AI技术的依赖日益增强,不仅因为这种技术能够显著提升工作效能和便利性,还由于它善于迎合用户。最近,《Science》杂志刊登了斯坦福大学团队的研究成果,详细探讨了大语言模型在社交互动中表现出的“奉承”行为。数据表明,在回应用户的观点时,AI系统比普通人类更有可能表示赞同,即便是面对明显有害或不道德的行为,其认同的概率也达到了47%。这项研究涵盖了11个主要的大语言模型,并通过了

科技0 阅读
从现实出发评估具身智能:EAIDC启动“实景测试”之旅|甲子光年

从现实出发评估具身智能:EAIDC启动“实景测试”之旅|甲子光年

EAIDC助力具身智能从技术演示迈向工程落地。作者|拾月如果说具身智能的浪潮由AI带动,那其发展脉络,也在不可避免地沿着AI的既有范式展开。尤其是在模型评测上,这种惯性已经十分明显。过去一段时间,具身模型的能力验证,很大程度上延续了大语言模型的路径——在虚拟环境中进行评测,在标准化任务中进行横向对比。但问题也正在这里逐渐显现。仿真环境可以加速迭代,却难以还原真实世界的复杂性。sim2real的GA

科技1 阅读
谷歌突破内存限制!新算法内存使用减少83%,性能飙升8倍!

谷歌突破内存限制!新算法内存使用减少83%,性能飙升8倍!

近日,谷歌发布了一种新的无损极限压缩算法TurboQuant,该算法专门针对大语言模型的键值缓存设计,旨在解决向量量化中的内存占用问题。谷歌声称,TurboQuant能够将大语言模型的键值缓存内存使用量至少减少至原来的六分之一,并且在推理速度上可以提升八倍,同时保持模型的精度不变。Matthew Prince,Cloudflare的创始人、首席执行官兼执行主席,将TurboQuant的发布视为谷歌

科技1 阅读
构建可靠LLM API:抵制低质、过度收费与配置削减

构建可靠LLM API:抵制低质、过度收费与配置削减

该研究由新加坡国立大学和加州大学伯克利分校的学者联合完成。新加坡国立大学的郭衍培是本文的第一作者,他长期研究大语言模型基础设施中的可信性和安全性问题,尤其是云端 LLM 服务的验证性和经济激励风险。他的导师是新加坡国立大学的青年教授张嘉恒和加州大学伯克利分校的 Dawn Song 教授。大语言模型(LLM)已经成为众多人工智能应用的基石。然而,尽管通过云端 API 访问这些模型十分方便,但这种“黑

科技2 阅读
2D交互场景创作的新工具:MoGraphGPT结合模块化大模型与图形控制技术

2D交互场景创作的新工具:MoGraphGPT结合模块化大模型与图形控制技术

对于那些想要快速开发网页小游戏、交互式动画或是教学演示的人来说,复杂的代码逻辑和多元素交互调试往往令人头疼。虽然目前的大语言模型和AI代理能够帮助编写代码并构建交互场景,但在处理复杂交互时却容易出错,而且纯文本的交互方式难以直观地调整视觉效果。最近,来自香港浸会大学、香港科技大学、香港城市大学及深圳大学的研究团队共同开发了一款名为MoGraphGPT的创新系统。该系统结合了上下文感知模块化大模型与

科技1 阅读
HyperOffload革新超节点存储管理,开启视觉解析新时代

HyperOffload革新超节点存储管理,开启视觉解析新时代

大语言模型的发展进入了一个全新的阶段,即万亿参数时代,这为大模型的推理与部署带来了前所未有的技术挑战。特别是在超节点(SuperNode)复杂的异构存储架构下,如何高效管理与调度海量张量,成为决定大模型能否成功落地的关键因素。最近,上海交通大学可扩展计算研究所的蒋力和刘方鑫教授团队与华为MindSpore团队合作,发布了一份技术报告,题为《HyperOffload: Graph-Driven Hi

科技1 阅读
CMU团队提出新算法:行为校准强化学习助力4B模型击败GPT-5抑制幻觉现象

CMU团队提出新算法:行为校准强化学习助力4B模型击败GPT-5抑制幻觉现象

吴嘉赟博士就读于卡内基梅隆大学(CMU)机器学习系,专注于大语言模型评估和后训练技术的研究。大语言模型在关键领域的应用受到幻觉问题的困扰。最近一项研究提出了一种新的行为校准强化学习方法,旨在解决这一难题。该论文详细探讨了如何通过调整奖励函数来改进LLM的表现。经过特定训练后,一个参数量仅为40亿的小型模型在幻觉抑制方面超越了GPT-5等顶级大模型。图1展示了模型回答数学问题时置信度标注的实例。每一

科技1 阅读
深度体验:腾讯推出QClaw,无缝对接微信,无需复杂操作即可上手

深度体验:腾讯推出QClaw,无缝对接微信,无需复杂操作即可上手

机器之心编辑部今天看到一张令人捧腹的梗图:近期,OpenClaw 引起了广泛关注,但高昂的成本让许多用户感到压力巨大。腾讯 推出了基于 OpenClaw 开源生态的 QClaw 版本,旨在简化安装流程,方便普通用户使用。现在,即使是非专业人士也能轻松体验「小龙虾」的魅力了。类似于 OpenClaw,QClaw 让人们能够通过对话的方式控制电脑,并连接主流大语言模型如 DeepSeek、Kimi 和

科技163 阅读
首批“养龙虾”玩家遭遇滑铁卢:有人竟为此卸载应用支出费用

首批“养龙虾”玩家遭遇滑铁卢:有人竟为此卸载应用支出费用

最近,“养龙虾”的活动在网络上迅速流行起来。开源AI智能体工具OpenClaw因其图标形似红色龙虾而得名,它可以通过调用通讯软件和大语言模型,在用户的电脑上自主处理诸如文件管理、邮件收发及数据整理等复杂任务。随着“养龙虾”风潮的蔓延,多家企业已经正式宣布推出相关的“龙虾”版本,并且部分地区的政府机构也开始将该工具应用于政务服务领域。不过,“养龙虾”的行为也带来了不少的风险和隐患。3月11日,在社交

科技1 阅读
中国信通院专家警告:“龙虾”更新后安全隐患依旧存在

中国信通院专家警告:“龙虾”更新后安全隐患依旧存在

中国信通院 CAICT 公众号于今日发布文章称,开源 AI 智能体工具 OpenClaw 近期在网络上引起广泛关注,同时也带来了严峻的安全问题。此智能体因其图标形似一只红色龙虾而被网友昵称为“龙虾”,能够通过整合调用通信软件与大语言模型,在用户的电脑上执行文件管理、邮件收发和数据处理等复杂任务。尽管该工具具备强大的自主操作能力,但也给用户带来了严峻的安全挑战。工信部网络安全威胁和漏洞信息共享平台已

科技1 阅读
最新研究破解LLM推理低效之谜:告别过度思考的困境

最新研究破解LLM推理低效之谜:告别过度思考的困境

大语言模型在数学计算、指令执行和智能决策方面表现突出,展现出强大的思考能力。然而,在实际应用中,一个问题逐渐显现:大语言模型的推理成本难以控制。在一些看似简单的任务上,模型有时会过度思考,生成冗长且发散的答案,浪费大量计算资源却未能提高准确性。我们称这种现象为“过度思考”。对于复杂问题而言,由于预算限制,模型可能在关键环节草率作答,导致错误频出,这被称为“思考不足”。目前主流的做法是通过统一减少推

科技5 阅读
欧洲最大种子轮融资诞生:杨立昆获10.3亿美元,目标市场瞄准Meta公司

欧洲最大种子轮融资诞生:杨立昆获10.3亿美元,目标市场瞄准Meta公司

最近,「AI 教父」杨立昆终于有机会证明他的观点:大语言模型并非通向通用人工智能的正确道路。作者|桦林舞王当地时间 3 月 9 日,由他创立的 AMI Labs 宣布完成了一轮融资,金额达 10.3 亿美元,估值达到 35 亿美元——这是欧洲历史上最大的种子轮之一。投资者包括了英伟达、贝索斯家族的投资机构以及新加坡淡马锡等知名公司,同时还有一众科技界重量级个人投资者如 Tim Berners-Le

科技2 阅读
Jeff Dean畅谈未来:每位开发者将管理50个智能体,编写需求成为关键能力

Jeff Dean畅谈未来:每位开发者将管理50个智能体,编写需求成为关键能力

这是一次关于AI技术发展及其对软件工程影响的深入对话,探讨了从模型设计到应用实践等多个方面。 本次访谈中,Jeff Dean分享了他对当前大语言模型的看法,并强调了未来的发展趋势。 在讨论多模态能力时,Dean指出,早期强调视频输入是为模型提供最高带宽的沟通方式。 关于Gemini项目的起源和进展,Dean提到多个团队独立研发算力分散的问题及整合后的成果。 谈话中还探讨了在编程任务上使用AI助手

AI4 阅读
Grok在生成论文方面表现卓越,Claude却显得不太适应——arXiv创始人实测报告

Grok在生成论文方面表现卓越,Claude却显得不太适应——arXiv创始人实测报告

近期arXiv面临投稿量激增的问题,连这个平台也感到压力山大了。 一项由《自然》杂志报道的新研究显示,AI“水论文”现象愈发严重,这项研究的发起人之一是arXiv的创始人Paul Ginsparg。 arXiv负责人亲自介入的原因很简单:近年来投稿量激增导致系统不堪重负,而问题源头很可能是AI技术的发展。 为了验证这一点,研究人员测试了13个主流的大语言模型,看看当用户明确要求“编造数据”、“虚

AI0 阅读
傅盛访谈实录:深耕养殖业十四载,展望未来“水管工”职业前景

傅盛访谈实录:深耕养殖业十四载,展望未来“水管工”职业前景

从傅盛的分享中可以感受到他对AI技术的深刻理解和应用体验。他强调了AI在自动化执行任务方面的能力,并认为“三万”龙虾能极大地提升效率和创造力。凤凰网科技 出品作者|赵子坤傅盛提到,尽管大语言模型如EasyClaw(简称“三万”)能够完成许多复杂的任务,但它仍需人类设定明确的目标才能发挥作用。这说明了AI在自主决策上存在局限性。他指出,当前社会中技能交换的模式正在发生变化,人们需要从基础教育开始适应

科技7 阅读