我想洗车。洗车店就在 50 米外。我应该走路去还是开车去?
Hacker News 摘要原标题:I want to wash my car. The car wash is 50 meters away. Should I walk or drive?
网页内容详解:关于 AI 处理洗车逻辑问题的讨论
这是一个发布在 Mastodon 社交平台上的热门讨论帖,由用户 Kévin 发起。他向大型语言模型(LLM)提出了一个看似简单却带有陷阱的问题:“我想洗车。洗车店就在 50 米外。我应该走路去还是开车去?”
核心逻辑陷阱
这个问题的逻辑在于,如果你走路去洗车店,车就会留在家里,从而无法完成洗车。然而,由于 50 米是一个非常短的步行距离,许多 AI 会基于环保或健康建议,忽略了车必须在场这一基本前提,从而建议用户走路去。
各大主流 AI 的表现
根据 Kévin 和其他用户的测试,不同的 AI 模型给出了五花八门的答案:
• DeepSeek 和通义千问(Qwen):
• 有些回答建议走路,但在被指出问题后,有的模型会回答“你难倒我了”,有的则在建议走路后又说“直接在那儿洗就行”,完全无视了车不在场。
• 不过也有用户反馈 DeepSeek 的推理过程提到了:你应该开车去,因为车需要到达现场才能洗。如果走路去,车就留在家里了。
• Gemini:表现不一。有用户发现它能给出正确答案,但有时会针对 50 米的距离进行大量无意义的拆解和闲聊。
• GPT 系列:有用户测试发现它建议走路。当被问及是否需要买 50 米长的水管时,它甚至“一本正经”地建议买 25 米的就够了,展示了 1200 亿参数的“离谱逻辑”。
• Claude:有用户评价其在这个问题上表现得不够聪明。
网友的精彩评论与分析
• 对 AI 逻辑的嘲讽:
• 有人开玩笑说,如果你走路去,你其实是在搬运重型设备,也就是你的车。
• 有人提到,这就像经典的程序员买牛奶笑话:妻子让丈夫去买两瓶牛奶,如果看到卖鸡蛋的,就买十个。结果丈夫带回了十瓶牛奶,因为他确实看到了鸡蛋。
• 技术层面的解读:
• 用户 Ramin Honary 分析称,LLM 基于注意力机制(Attention Model)来预测下一个字。在处理这个句子时,模型过度关注了 50 米 这个代表距离的词,而忽略了洗车店这个场景对特定交通工具(车)的必然需求。一旦一个短词改变了整个句子的含义,AI 就很容易翻车。
• 对 AI 产业的质疑:
• 有评论认为,现在的 AI 只是“高信心的胡说八道”。
• 有用户质疑 AI 背后是否存在人工干预,提到一些科技巨头在海外大规模培训员工,暗示某些看似智能的回答可能包含人工处理的成分。
• 创意性的解决方案:
• 一位用户建议:你应该走路去洗车店,把它拆了,搬回来,在车周围重新组装好。在检查完所有许可证后,开始洗车。
总结
这次讨论展示了目前 AI 在常识推理方面的局限性。虽然 AI 能够处理复杂的数据和语言翻译,但在面对这种需要将现实物理逻辑与语境结合的简单问题时,依然会暴露出其缺乏真正“思维”的本质。