在对 5,380 条被引用参考进行溯源分析时，也引发了平台层面的担忧。Facebook 排在总体被引用来源的第二位，而 Reddit 位居第四。两者都是社交媒体平台，普遍存在由用户生成且未经验证的内容——当它们出现在 AI 生成的搜索结果顶部时，就会获得不应有的“权威感”。Facebook 在 5% 的准确回答和 7% 的不准确回答中被引用，暗示了一个值得持续监测的模式。

Google 的辩护：方法学质疑与内部数据

Google 并没有在没有反驳的情况下接受该研究的结论。发言人 Ned Adriance 对分析的基础设计提出质疑：Oumi 使用其自身的 AI 模型来评估 Google 的 AI 准确性，这引入了方法学上的“循环”——如果 Oumi 的模型也会犯错，那么它对 Google 错误的判断本身就可能不可靠。

“这项研究有严重的漏洞，”Adriance 说。“它没有反映人们在 Google 上实际搜索的内容。”

Google 也发布了自己的对比数据。该公司表示，单独的 Gemini 3——在没有 AI 概览提供的额外上下文的情况下运行——有 28% 的时间不准确，这表明 AI 概览系统相较于原始模型输出确实带来了有意义的准确性提升。公司在所有 AI 概览底部维持其标准免责声明：“AI 可能会出错，因此请再次核对回复。”

FAQ

什么是 Google AI 概览，它们是什么时候引入的？

Google AI 概览是由 AI 生成的摘要，会出现在 Google 搜索结果顶部，它会综合回答用户查询内容，并引用支持性的网页来源。该功能由 Google 的 Gemini 模型驱动，在 2024 年被广泛引入，如今在全球数十亿次搜索中出现。它有别于标准搜索结果：因为它生成的是文本，而不仅仅是列出链接。

在这个语境中，“未落地”（ungrounded）是什么意思，为什么重要？

当 AI 概览所引用的网站并没有实际核实，或并不能充分支持摘要中呈现的信息时，该 AI 概览就被认为是“未落地”（ungrounded）。这很有问题，因为试图通过点击所引用来源来核查某项主张的用户，可能会发现该来源与 AI 的表述相矛盾、仅部分支持，或与 AI 的说法完全无关——从而削弱系统作为可靠信息工具的作用，并使独立验证变得更困难。

在考虑这些准确性顾虑的情况下，用户应该如何对待 AI 概览？

Google 自己也在其内置免责声明中承认这一局限：AI 可能会出错。对于风险较低的查询，AI 概览可能提供一个有用的起点。对于健康、法律、金融或事实层面的决策，用户应当通过权威的、原始的来源来独立核实信息，而不是仅依赖由 AI 综合生成的摘要。建议直接核查所引用的来源——而不是接受 AI 对其所作的描述。

免责声明：本页面信息可能来自第三方，仅供参考，不代表 Gate 的观点或意见，亦不构成任何财务、投资或法律建议。数字资产交易风险较高，请勿仅依赖本页面信息作出决策。具体内容详见声明。

0/400

暂无评论