首页 > 教程攻略 > ai资讯 >谷歌 AI 摘要频现低级拼写错误,大语言模型固有缺陷难根治

谷歌 AI 摘要频现低级拼写错误,大语言模型固有缺陷难根治

来源:互联网 时间:2026-05-28 15:51:10

来,先讲一个今天最新的段子。

5月28日,有人拿“Google”这个单词去问谷歌的人工智能:里面有几个字母p?你猜怎么着?谷歌自己给的答案是——两个。

谷歌 AI 摘要频现低级拼写错误,大语言模型固有缺陷难根治

有意思的是,这还不是孤例。人工智能摘要(AI Overview)紧接着又说,“poop”这个词里有一个字母r——这明显是错的。还有,“journalism”被它拼成了“j-o-u-r-n-a-d-i-s-m”,硬生生多塞了一个d进去。至于美国总统的姓氏?它倒是推理出了里面有一个字母p,可拼出来的却是“t-r-p-u-m”。

说实话,谷歌这次大张旗鼓搞搜索改版,把AI摘要推到前台,出点岔子一点都不让人意外。类似的翻车案例之前就上演过:AI摘要引用过恶搞帖,教用户“吃石头”“往披萨上涂胶水”,让人哭笑不得。

谷歌给TechCrunch的邮件声明也很坦诚:“大语言模型在单词字母计数方面一直有困难,我们正在想办法解决这个具体问题。”

这种低级拼写错误,圈内人早就见怪不怪了。驱动聊天机器人和各种文本生成工具的大语言模型,设计初衷压根就不是为了识别拼写。这么多年,科技圈里一直流传着一个梗:任何一家公司发布新AI模型,第一件事就是拿“strawberry”这个单词去考它,问问里面到底有几个字母r。结果呢?这些模型能几秒钟写出一套应用程序,能解开困扰数学家几十年的难题,可在拼写这件事上,和幼儿园小朋友半斤八两。

不过,谷歌AI摘要暴露出的问题远不止这些滑稽的拼写梗。上周还出现了一个更离谱的漏洞:用户搜索“disregard”(忽视),页面本该给出这个词的词典释义,结果AI直接回复了一句“收到。你随时可以提出新指令或问题。”谷歌事后修复了这个漏洞,但那些层出不穷的拼写错误依然天天刷屏,成了观众喜闻乐见的吐槽素材——因为从根本上讲,这类问题几乎没法根治。

研究人员对此早有解释。人工智能根本不像人类那样,把文字看成由字母和单词组成的单元。绝大多数大语言模型基于Transformer架构搭建,它们处理文本的方式是先把文字拆成“词元”(token)。不同模型切分词元的粒度不一样,可能是完整单词、音节,甚至单个字母。人工智能不是靠“读”来理解文本的,它会先把文本转换成数字表征,再根据上下文做分析,最后生成看起来合乎逻辑的回复。

阿尔伯塔大学人工智能研究员、助理教授马修・古兹迪亚尔接受TechCrunch采访时说得很直白:“大语言模型依托Transformer架构运行,它本质上不是在阅读文本。你输入指令,内容先被转成编码。比如它认出了单词‘the’,只会对应一个专属编码,却根本无法区分组成这个单词的字母T、H、E。”

说到底,谷歌AI摘要这类大语言模型依赖的“词元”架构,本身就带着天生的局限。研究人员普遍不看好它能彻底摆平拼写问题。

波士顿东北大学专攻大语言模型可解释性的在读博士谢里丹・福伊希特表示:“对语言模型来说,如何准确定义‘单词’本身就是个难题。即便行业专家能设计出一套完美的词元词汇表,模型大概率还是会继续合并或拆分文本片段。依我看,受这种模糊性的影响,不存在绝对完美的词元分词器。”

对研究人员来说,拼写问题其实排不上优先级——大语言模型的核心价值本来就不是拼写。但这些一眼就能看穿的失误,倒是给了我们一个很好的提醒:就算AI有时候看起来无所不知、高深莫测,它也远远谈不上完美无缺。面对它给出来的结果,别急着崇拜,更别盲目信从——核实,永远是第一道防线。

相关阅读