通常,当使用grep -no
每个单独的匹配时都有一个行号。例如,当我输入时,grep -no "[A|a]" chr22.fa
我期望:
$ grep -v ">" chr22.fa | grep -o -n "[A|a]" | head -n 17
210201:A
210201:A
210201:A
210201:A
210201:A
210201:A
210201:A
210201:A
210201:A
210201:A
210201:A
210201:A
210201:A
210201:A
210201:A
210202:A
210202:A
然而,最近的输出看起来像这样:
$ grep -v ">" chr22.fa | grep -o -n "[A|a]" | head -n 17
210201:A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
无论我正在搜索什么以及哪个染色体 txt 文件,我都会遇到同样的问题。有谁知道为什么会出现这种不正确的格式?预先感谢您的帮助。
编辑: hexdump -C 在具有随机字母序列的短文件上的结果:
00000000 41 41 41 41 41 41 41 41 41 41 0a 62 42 42 42 42 |AAAAAAAAAA.bBBBB|
00000010 41 41 41 0a 42 42 41 42 41 41 42 41 42 41 42 42 |AAA.BBABAABABABB|
00000020 41 42 41 0a 41 42 55 57 42 41 55 41 42 57 44 55 |ABA.ABUWBAUABWDU|
00000030 42 57 55 44 55 57 44 55 0a 41 48 55 44 48 47 55 |BWUDUWDU.AHUDHGU|
00000040 45 47 55 0a 68 65 69 66 68 69 65 68 66 0a 77 65 |EGU.heifhiehf.we|
00000050 68 66 69 68 77 65 66 0a 41 41 0a 68 73 65 66 69 |hfihwef.AA.hsefi|
00000060 68 48 41 0a |hHA.|
00000064
答案1
grep (BSD grep) 2.5.1-FreeBSD
行为不同于
grep (GNU grep) 3.40
BSD grep 只会给你一次行号,而不是像 GNU grep 那样重复相同的行号
你可以安装 GNU grep
brew install grep
如果您需要使用 ggrep 作为默认 grep,您可以创建一个符号链接
ln -is $(which ggrep) /usr/local/bin/grep