words

从文档创建单词列表
words

从文档创建单词列表

我正在努力寻找一种有效的方法来学习新语言的词汇。我希望能够使用包含书籍的文件创建单词列表。我是 Linux 新手,非常感谢任何帮助。 我想: 有一个命令将文本文件(例如 txt 格式)作为输入并输出另一个文件,其中包含第一个文件中所有单个单词的列表。 新文件应按字母顺序排序且不包含重复项(每个单词仅应包含一次。) 理想情况下,该命令还应该能够检查第二个文件并避免重复该文件中包含的任何单词。 (这样我就可以创建一个我已经知道并且不会重复的文件或单词。) 有合适的命令来执行此操作吗? ...

Admin

反向 grep 未找到所有匹配行
words

反向 grep 未找到所有匹配行

编辑:我把这件事搞得太复杂了。这与反向 grep 无关。我仅使用 得到相同的结果grep -x -f stop.txt < in.txt。如果在停用词文件中who位于前面whose,则结果只是who.当停用词文件中的顺序相反时,in.txt会找到 中的两行。我感觉我根本就不懂grep。 我无法让反向 grep 像我期望的那样工作,以便从文件中删除包含停用词的行。停用词的给出顺序会影响结果。 假设我有两个文件。输入文件in.txt: who whose 以及一个包含停用词列表的文件stop.txt: who whose 如果我in.txt使用反向 ...

Admin

VIM 中终端仿真器闪烁的单词
words

VIM 中终端仿真器闪烁的单词

我开始在 VIM 中编写 LaTeX 文档,这是我的代码: \documentclass{article} \begin{document} \frac{2x}{2} * \end{document} 由于某种原因,以下字符在终端中闪烁: {文章} {文档} {}{} {文档} 这个论坛好像有相关: https://superuser.com/questions/449335/vi-editor-text-is-flashing-and-unusable/450302 还有另一篇文章(编辑:我找到了:https://forums.fedoraforu...

Admin

谁负责 /usr/share/dict/words ? (发现诽谤)
words

谁负责 /usr/share/dict/words ? (发现诽谤)

我正在编写一个使用 /usr/share/dict/words 文件生成会话密钥的应用程序。 我震惊地发现文件中最令人震惊的种族诽谤——“N字”(不同的拼写)。 谁负责维护这个文件,为什么文件里会有这些字样? ...

Admin

任务
words

任务

任务 这里的参数是文件名!该文件包含文本。脚本的任务是确定哪个单词最常包含(换句话说)。 输入和输出示例 (例如,文本是:打球、足球、篮球、雪球 - 因此球是赢家,因为它是其他三个世界的一部分)。 到目前为止我的代码 到目前为止我已经完成了这段代码,但它并不适用于每个输出 !/bin/sh awk '{for(i=2;i<NF;i++) {s=$i; for(j=i+1;j<=NF;j++) print s=s FS $j}}' $1 | sort | uniq -c | sort -k1,1rn -k2 | sed 's/ *[^ ]* *...

Admin

如何获得随机形容词或名词?
words

如何获得随机形容词或名词?

我确实找到了一个单词列表,/usr/share/dict/words但我不知道是否有一种方法(已经存在的方法?)将它们分成相应的词性?或者,我对任何其他建议都很好,/usr/share/dict/words这只是我找到的第一个单词列表。 ...

Admin

从 html/xml 文件中提取特定单词及其数据
words

从 html/xml 文件中提取特定单词及其数据

样本输入是 <bre rt="1600" et="1550794901464" st="1550794899864" tid="8390500116294391399" mh="N" cn="" lc="" ts="N/A" cidc="" IDC="" eidc="BRE-S-TRA-0085418501"/> <r1> <gr1> <a="1" b="smaple data with spaces" c="Created TrasctionInfo" d="155...

Admin

如何拆分具有数字名称的文件?
words

如何拆分具有数字名称的文件?

我试图将文本文件拆分为 1024 行的文件,所以我split使用-d开关运行: split -d -l 300 ./list.lst 我得到一些奇怪的名称:它们以 开头x,文件名从 跳转x89到x9000。我希望这些文件的名称如下: 1.lst 2.lst 3.lst ... 谢谢。 ...

Admin

使用 sed 在文件中查找仅包含 3 个字符的单词
words

使用 sed 在文件中查找仅包含 3 个字符的单词

我只需要打印由 3 个字符组成的单词,但是单词文档是一个编号列表。 这是我必须回答的确切问题: 使用文件上的字符类sed命令,查找所有只有三个字符长的动物名称[[:lower:]]animals(3分)。 这是我尝试过的: cat animals | sed '/{[:lower:]].../d' cat animals | sed '/{[:lower:]]/d' sed '/[[:lower:]]{3}/d' animals animals这是我试图从(文件)中查找单词的文件: 01. aardvark 02. badger ...

Admin

使用所有组合来生成单词列表
words

使用所有组合来生成单词列表

我正在尝试生成一个单词列表,以便使用它来暴力破解我自己的 Truecrypt 容器。我确实知道密码的一部分,它是使用其他已知密码的块来增加长度的,但我忘记了使用这些块的顺序以及是否根本没有使用某些块。 用空格分隔的“块”示例:dog cat bird xyz cow1 lion8 我想做的是创建一个包含这些块的每种可能组合的单词列表。例如 dog cat dogcat catdog bird dogbird catbird birdcat birddog dogcatbird catdogbird xyz dogcatbirdxyz cow1 xyzc...

Admin

对单个单词中的字母进行排序 - 用它来查找排列(或字谜)
words

对单个单词中的字母进行排序 - 用它来查找排列(或字谜)

我有一些字典可以拼写file.dic。比方说: abc aword bword cab worda wordzzz 我正在寻找不同的词排列(或字谜)彼此的。 如果有一个命令“字母排序”,我会或多或少地这样做: cat file.dic | letter-sort | paste - file.dic | sort 这给了我: abc abc abc cab adorw aword adorw worda bdorw bword dorwzzz wordzzz 所以现在我清楚地看到文件中的字谜。是否有这样的letters-sort命...

Admin

如何将这个正则表达式与 grep 一起使用?
words

如何将这个正则表达式与 grep 一起使用?

我是正则表达式新手,在正则表达式教程/测试网站上找到了一个命令,该命令允许我搜索 3 个连续的辅音。唯一的问题是我不知道如何将它与 grep 一起使用。有人会帮我吗?我正在尝试使用以下命令搜索单词列表文本文件: (?:([bcdfghjklmnpqrstvwxzy])(?!.{1,2}\1)){3} ...

Admin

算术替换中的命令替换会导致分词吗?
words

算术替换中的命令替换会导致分词吗?

我似乎记得在这个网站上的评论中,算术展开式的内容可能分词了,但我再也找不到评论了。 考虑以下代码: printf '%d\n' "$(($(sed -n '/my regex/{=;q;}' myfile)-1))" 如果sed命令输出多位数且$IFS包含数字,则命令替换会在算术发生之前进行分词吗? (我已经使用额外的双引号进行了测试: printf '%d\n' "$(("$(sed -n '/my regex/{=;q;}' myfile)"-1))" 但这是行不通的。) 顺便说一句,上面的示例代码是简化为最简单形式的更改这个功能我...

Admin