免费猜字小游戏,wordle席卷全球( 二 )


游戏中 , 每一次猜测都能从12972个单词中排除一些结果 。
比如猜测weary , 如果W位置正确同时A出现了 , 那么剩下的可选单词只剩58个 。
免费猜字小游戏,wordle席卷全球
文章图片

文章图片

这样对同一个猜测 , 从5个字母全没出现到5个字母全对的各种反馈的概率都可以计算出来 。
免费猜字小游戏,wordle席卷全球
文章图片

文章图片

这样 , 问题就变成了如何评估各种反馈情况包含的信息量 。
3Blue1Brown选择的办法 , 就是利用信息论祖师爷香农提出的信息熵概念 。
信息熵描述的是事件的不确定性 , 单位就是大家知道的比特 。
理解起来也不难 , 可以用扔硬币来解释 。
扔1枚硬币只会出现正、反两种结果 , 而且概率相等 。
扔2枚硬币就有正正、正反、反正、反反这4种结果 , 扔3枚有8种情况等等 , 也就是扔n次有2的n次方种结果 。
当一个事件有两种结果且概率都是1/2 , 其不确定性相当于扔1枚硬币 , 此时信息熵定义为1比特 。
如果一个事件有8种结果且概率都是1/8 , 就相当于扔3枚硬币 , 此时信息熵就是3比特 。
信息量和信息熵的数量相等、意义相反 , 相当于衡量一则信息能消除多少不确定性 。
设每种结果的概率为p , 信息量为I , 有如下等式 。
免费猜字小游戏,wordle席卷全球
文章图片

文章图片

稍作变换 , 可以得到信息量的计算公式 。
免费猜字小游戏,wordle席卷全球
文章图片

文章图片

回到Wordle游戏上 , 一次猜测获得的信息量可以用每种可能情况的概率与对应信息量相乘、再把结果相加来计算 , 也就是求数学期望 。
以猜测weary为例 , 计算出获得的信息量为4.9比特 。
【免费猜字小游戏,wordle席卷全球】代表这则信息消除的不确定性比扔5个硬币的不确定性少一点 。
免费猜字小游戏,wordle席卷全球
文章图片

文章图片

算法思路有了 , 接下来就可以交给程序 , 计算出所有12972个单词的能消除的信息熵 。
免费猜字小游戏,wordle席卷全球
文章图片

文章图片

用同样的方法 , 可以再计算第二步、第三步猜测能消除的信息熵 。
免费猜字小游戏,wordle席卷全球
文章图片

文章图片

根据这些计算结果 , 程序就可以在每一次猜测时 , 选择所有可能单词里能消除信息熵最多的那个 。
比如第一次猜slate获得一次反馈 , 此时还剩下578个单词可选 , 其中选ramin能消除最多的信息熵 , 这样一步一步猜直到猜出正确答案 。
免费猜字小游戏,wordle席卷全球
文章图片

文章图片

接下来 , 拿这个程序在所有2135种可能的答案上跑一遍 , 平均用了4.124步猜出正确答案 。
免费猜字小游戏,wordle席卷全球
文章图片

文章图片

3Blue1Brown觉得这个成绩还不够好 , 至少没有超过普通人类玩家水平 , 还需要继续优化 。
最终成绩逼近理论极限