在人工智能快速发展的当下,AI 模型的 “幻觉” 问题成为备受关注的焦点。近期,一份由 Vectara 提供数据、Rachyl Jones/Semafor 制作的统计图表显示,在众多 AI 模型中,DeepSeek 的幻觉率偏高,达到了 14.3% ,引发了行业内外的广泛讨论。为何 DeepSeek 的幻觉率会如此之高?深入探究后发现,这与它的一个关键参数设置密切相关。
通常情况下,AI 模型中的某个关键参数(具体未明确指出,但通常取值为 0.7 )在 DeepSeek 中被设成了 1。这一参数的调整,虽然提升了模型的创造性,但却带来了幻觉率升高的副作用。在 AI 的语境中,“幻觉” 指的是模型生成看似合理,但实际上与事实严重不符的内容。对于依赖准确性的应用场景,如信息检索、医疗咨询、金融分析等,幻觉的存在是一个严重的问题,可能导致错误的决策和误导用户。
DeepSeek 提高该参数值,旨在增强模型的创造性。在一些需要创新和生成多样化内容的场景中,如创意写作、艺术创作辅助等,较高的创造性能够让模型产生更具想象力和独特性的输出。例如,在撰写小说时,高创造性的模型可能会生成更加跌宕起伏、出人意料的情节;在绘画创作辅助中,它能提供更多新颖的构图和色彩搭配建议。然而,这种创造性的提升是以牺牲准确性为代价的。当模型在生成内容时过于追求新颖和独特,就更容易偏离事实,产生幻觉。
从技术原理角度来看,这个关键参数可能影响着模型对输入信息的处理和输出内容的生成机制。一般来说,较低的参数值有助于模型更加严格地遵循训练数据中的模式和信息,从而生成更准确、更符合事实的内容。而 DeepSeek 将其提高到 1 后,模型在生成内容时可能会更多地依赖自身的 “想象力”,在训练数据的基础上进行过度的拓展和创新,导致生成的内容与真实信息的偏差增大,进而出现更多的幻觉。
与其他幻觉率较低的模型相比,DeepSeek 的这种参数设置差异凸显了 AI 发展过程中的一个重要权衡:在追求创造性和确保准确性之间,如何找到一个平衡点。以 OpenAI 的部分模型和 Gemini 2.0 Flash 等为例,它们的幻觉率相对较低,分别为 0.8% - 3.9% 不等 。这些模型在参数设置和算法设计上,可能更侧重于维持内容的准确性和可靠性,牺牲了一定的创造性,以避免产生过多的幻觉。这表明不同的 AI 研发团队在模型设计时,根据目标应用场景和需求,会做出不同的选择。
对于 DeepSeek 而言,高幻觉率虽然在某些特定场景下可能伴随着高创造性,但也限制了其在对准确性要求极高的领域的应用。在医疗领域,AI 模型被用于辅助诊断和治疗建议,如果模型像 DeepSeek 这样频繁出现幻觉,可能会给出错误的诊断结果或不恰当的治疗方案,严重危及患者的健康和生命安全。在金融领域,高幻觉率的模型可能会对市场趋势做出错误的预测,导致投资者遭受重大损失。
DeepSeek 团队需要认真权衡这一参数设置带来的利弊。如果希望扩大模型的应用范围,特别是进入那些对准确性要求苛刻的领域,就需要调整参数或改进算法,降低幻觉率。这可能涉及到重新审视模型的训练过程,优化数据处理方式,或者引入新的机制来约束模型的输出,确保其更加符合事实。
然而,降低幻觉率并不意味着要完全放弃创造性。在一些对创造性有一定要求的领域,如教育领域的知识拓展和启发式教学中,适度的创造性可以帮助学生开拓思维。DeepSeek 可以探索在保证基本准确性的前提下,通过其他方式来提升创造性,例如改进训练数据的多样性和质量,让模型在学习真实信息的同时,也能接触到更多具有启发性的内容,从而在准确性和创造性之间找到一个更优的平衡点。
AI 模型的幻觉问题是一个复杂的技术难题,DeepSeek 的高幻觉率为整个行业敲响了警钟。它提醒我们,在追求 AI 技术创新和提升模型性能的过程中,不能忽视准确性和可靠性。未来,随着 AI 技术的不断发展,如何在创造性和准确性之间找到最佳平衡,将是 AI 研发者们需要持续探索和解决的重要课题。只有这样,AI 才能在更多领域得到广泛应用,真正实现其推动社会进步和发展的潜力。
留言框-