
ICLR 2026 口头报告:无需引导 大型模型自动生成误导信息
大模型在推理方面的能力愈发强大,并且广泛应用于分析、规划乃至提供建议等场景中。然而,它们的准确性和可靠性之外,更值得关注的问题是这些模型是否能够保持诚实。新加坡国立大学 Bingsheng He 教授团队最近发表于 ICLR 2026 Oral 的论文,则聚焦于一个更加贴近日常应用的情景:用户常常故意误导大模型说谎;而这项研究则深入探讨,在没有刻意引导的正常提问情况下,这些模型是否会出现矛盾或策略
科技1 阅读
共找到 1 篇相关文章

大模型在推理方面的能力愈发强大,并且广泛应用于分析、规划乃至提供建议等场景中。然而,它们的准确性和可靠性之外,更值得关注的问题是这些模型是否能够保持诚实。新加坡国立大学 Bingsheng He 教授团队最近发表于 ICLR 2026 Oral 的论文,则聚焦于一个更加贴近日常应用的情景:用户常常故意误导大模型说谎;而这项研究则深入探讨,在没有刻意引导的正常提问情况下,这些模型是否会出现矛盾或策略