
























Ernst & Young(EY,四大会计师事务所之一)发布了一份 cybersecurity report,却被读者发现含有多处 AI hallucinations,看起来像是用 ChatGPT(对话式生成式AI)或其他 LLM(Large Language Model,大语言模型)起草后没有认真核对。评论区把这件事放到专业服务行业的常见流程里看:文档先由 AI 生成,再交给已经超负荷的员工快速过审,容易把错误原封不动带到正式稿里。帖子链接的网页本身也被大量吐槽,因为移动端 scroll hijacking 让人很难正常浏览,进一步放大了“内容和呈现都出了问题”的观感。讨论最终延伸到 Big Four(四大)咨询/审计机构如何在降本增效、品牌背书和替高管承担风险之间寻找平衡。
讨论认为问题不只是 AI 会编造,而是专业人士没有在发布前做足复核。有人指出很多公司把完整报告直接交给已经很忙的专家看,结果他们只能草草扫一眼,甚至根本没看到原始上下文。也有人认为这类组织本来就有能力做审查,但最后往往被懒惰和“AI 代劳”心态推着走。Amazon 让资深工程师审查生成式 AI 输出的例子被拿来说明:即使会形成瓶颈,人工把关仍然不可省。
[来源1] [来源2] [来源3] [来源4] [来源5] [来源6]
不少评论把事件放进四大咨询/审计机构整体下滑的脉络里看。有人说这些机构为了压低工时和成本,不断换成更资浅的人,等到合伙人真正看文件时,问题已经拖到最后阶段,只能返工。还有人提到 EY 持续裁员、“more with less”的管理方式,以及为了效率牺牲质量的恶性循环。结果是报告和审计都越来越像低质量流水线产品,专业价值被稀释。
另一条线是对 EY 以及整个咨询业信誉的嘲讽。有人觉得客户花大钱买的是“可信外包”和品牌背书,而不是看起来像 ChatGPT 拼出来的报告。也有人指出,大型咨询公司常被用来替高管分摊责任:项目失败时,有外部顾问就更容易把锅甩出去。只是现在公众对这类 AI slop 的容忍度似乎很高,原本足以引发持久品牌伤害的事,未必还能留下同样的后果。
很多人几乎先被网页体验劝退,而不是被报告内容吸引。评论反复抱怨移动端 scroll hijacking:页面抢走滚动手势,导致根本翻不到后面,reader mode 也只显示了开头几段。有人甚至说滚动行为本身像“在 hallucinating”,可见这个页面在手机上有多糟。对 HN 用户来说,这种级别的可读性问题已经很少见。
[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8]
有人提出既然第一版是 LLM 写的,那就再用另一个 LLM 去检查 hallucinations。反对者的核心意见是,这相当于把省事流程变成多一层自动化工作,未必解决根本问题。更关键的是,真正需要判断哪个输出可信的人本来就缺少领域知识,两个模型再“互审”也不一定能替代专家。于是讨论又回到了老生常谈的 GIGO:输入和流程本身不靠谱,输出只会继续不靠谱。
hallucination: 生成式 AI 编造出看似可信、实则错误的内容。
LLM: Large Language Model,大语言模型,基于海量文本训练的生成式模型。
Big Four: 四大会计师事务所/咨询审计巨头,通常指 EY、Deloitte、PwC、KPMG。
scroll hijacking: 网页脚本强行接管滚动操作,让用户难以按正常方式浏览页面。
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。