字母和单词的组合 - 最好是 bash，可以接受 perl 或其他

Question 1

实际上有一个名为的文件/usr/share/words，其中包含所有英文单词。

我可能会使用该文件来查找所有英语单词并使单词达到特定长度，您可以这样做，

awk 'length <=20' /usr/share/words | wc -l

我在该文件中得到了 479396 个单词。

Answer

实际上有一个名为的文件/usr/share/words，其中包含所有英文单词。

我可能会使用该文件来查找所有英语单词并使单词达到特定长度，您可以这样做，

awk 'length <=20' /usr/share/words | wc -l

我在该文件中得到了 479396 个单词。

Question 2

如果你想要 20 个字符的单词，那么有 26 个字母

26^20 = 19928148895209409152340197376

的可能性。现在的计算机速度很快，但是它们足够快吗？祝你好运 ;）

Answer

如果你想要 20 个字符的单词，那么有 26 个字母

26^20 = 19928148895209409152340197376

的可能性。现在的计算机速度很快，但是它们足够快吗？祝你好运 ;）

Question 3

由于您正在查找小于的单词20 characters，因此这包括1, 2, 3 .. or 19 characters长度较长的单词（不确定英语中是否存在包含 19 个字符的单词）。那么可能性的总数是 26 ¹⁹ + 26 ¹⁸ + 26 ¹⁷ .. + 26 ¹。

解决这个问题的强力方法是创建一个包含英语语言的所有 26 个字母表的列表。然后在循环内，使用字母表数组中的 26 个字符for i = 0; i < 20; i++创建所有可能的长度单词。i递归是你的朋友。一旦你有了一个长度为的单词i，你就可以将它传递给任何filtering rules用于定义英语单词的单词，例如，如 slm 提到的，没有元音的单词不能存在。

注意：编写所谓的filtering rules并不是一项简单的任务。例如，检查该单词是否包含任何 of 是相当容易的aieou，但是通过此检查并不意味着您已经找到了一个单词......距离那里还有很长的路要走。

这种暴力方法需要多长时间？

吉米发布了这一消息26^20 = 19928148895209409152340197376 ~ 2e28。现在假设您的计算机有一个quad core 1.5 GHz processor并且您的程序能够利用每个核心100%。这会1.5e9 x 4 = 6e9在一秒钟内给你循环。每个排列本身都需要multiple CPU cycles考虑26 characters每个排列等。然而，与相比，这个数字是微不足道的，# of permutations所以我们可以说每个排列需要6 instructions（并且每个指令需要1 CPU cycle）以使数学简单。最后，你得到了(6 instructions/permutation x 2e28 permutations)/(6e9 instructions/second) = (2e19 seconds) ~ 6.35e11 years。

Answer