
全球每天有数百万人打开Wordle,盯着五个空格绞尽脑汁。这款由《纽约时报》旗下的猜词游戏自2021年底走红以来长盛不衰,今年恰逢五周年。就在这个节点上,纽约州立大学宾汉顿分校的一支研究团队宣布,他们用数学方法把这道每日谜题的破解率提升到了99%。
研究成果发表于学术期刊《东北复杂系统杂志》,背后用到的核心工具,是一个叫做"香农熵"的概念。
Wordle的规则并不复杂。玩家有六次机会猜出一个隐藏的五字母英语单词,每次猜测后,游戏会用颜色反馈结果:灰色代表该字母不在答案中,黄色代表字母存在但位置错误,绿色代表字母和位置全部正确。
绝大多数玩家的直觉是:挑那些最常见字母组合的词开局,比如包含A、E、R、S、T的单词,因为这些字母出现频率高,猜中的概率自然大。这个逻辑听起来合理,但宾汉顿大学的研究团队认为,这个思路本身就错了。
领导这项研究的助理教授吴聪宇(Peter Wu)指出,问题的核心不在于"哪个词最有可能是答案",而在于"哪个词能告诉我们最多的信息"。这两件事,往往不是同一件事。
团队采用的方法来自信息论之父克劳德·香农在1948年提出的香农熵,这是一个衡量系统不确定性程度的数学量。熵值越高,意味着不确定性越大;而一次好的猜测,应该让熵值下降得尽可能快,也就是让候选答案的范围缩小得尽可能多。
这个策略在实际操作中看起来有点反直觉。有时候,算法推荐的猜测词本身几乎不可能是最终答案,但它能一次性排除大量候选词,让后续猜测变得更有把握。
博士生唐纳德·斯蒂芬斯在论文中解释了这一逻辑:"猜测不必是最有可能的答案,它只需要提供有用的信息。通过应用香农熵,目标从追求正确概率转变为最大化不确定性的预期降低。在实践中,这种方法可以用更少的猜测次数解开谜题。"
举个例子:假设经过两轮猜测后,剩余候选词有20个,其中有一个词出现概率高达30%,但猜它只能排除另外几个词。而另一个猜测词虽然本身猜中的概率只有5%,但无论结果如何,都能把候选池砍掉一半以上。香农熵策略会毫不犹豫地选择后者。
这种思维方式,与其说是在玩猜词游戏,不如说是在进行一次高效的信息搜索。
研究团队在计算机模拟中对两种策略进行了系统比较。传统的高频字母策略成功率约为90%,也就是说大约每十局会失败一次。而香农熵策略的成功率达到99%,失败率降低到了原来的十分之一。在六次机会的约束下,这个差距相当显著。
值得一提的是,这项研究的起点颇为朴素,它最初只是吴聪宇教授布置的一道课堂作业,要求学生展示信息论在现实问题中的应用。学生们选了Wordle,认真做完之后,吴教授觉得这个结果足够扎实,值得整理成正式论文发表。从课堂练习到学术刊物,这个项目走完了一条并不常见的路。
香农熵本身已经有将近八十年的历史,广泛应用于通信工程、数据压缩、密码学和机器学习等领域。把一个严肃的信息论工具拿来破解一款网页猜词游戏,听起来有点大材小用,但这件事的价值不在于Wordle本身,而在于它提供了一个直观、可验证的演示:面对有限信息和有限次数的决策问题,以"信息增益最大化"为导向的策略,系统性地优于以"直觉概率"为导向的策略。
当然,对大多数每天玩Wordle的普通用户来说,拿出一套算法辅助猜词多少有点破坏乐趣。但如果你只是想知道数学给出的最优解是什么,答案已经有了,99%,不靠运气。
更新时间:2026-06-22
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号