搜索: 误导信息

搜索: "误导信息"

共找到 1 篇相关文章

ICLR 2026 口头报告：无需引导大型模型自动生成误导信息

大模型在推理方面的能力愈发强大，并且广泛应用于分析、规划乃至提供建议等场景中。然而，它们的准确性和可靠性之外，更值得关注的问题是这些模型是否能够保持诚实。新加坡国立大学 Bingsheng He 教授团队最近发表于 ICLR 2026 Oral 的论文，则聚焦于一个更加贴近日常应用的情景：用户常常故意误导大模型说谎；而这项研究则深入探讨，在没有刻意引导的正常提问情况下，这些模型是否会出现矛盾或策略

科技2026/4/291 阅读

搜索: "误导信息"

ICLR 2026 口头报告：无需引导 大型模型自动生成误导信息

ICLR 2026 口头报告：无需引导大型模型自动生成误导信息