如何在序列标题之后和实际序列之前添加断行？

Question 1

使用awk，以作为分隔符打印第一个和最后一个字段\n：
```
awk '{printf "%s\n%s\n", $1, $NF}' file.txt
```
使用sed，在匹配时捕获第一个和最后一个字段并在替换中使用：
```
sed -E 's/([^[:blank:]]+).*[[:blank:]]([^[:blank:]]+)$/\1\n\2/' file.txt
```

与perl的逻辑类似sed：

perl -pe 's/^([^\s]+).*\s([^\s]+)/$1\n$2/' file.txt

使用bash，较慢的方法，从每一行创建一个数组并打印数组中的第一个和最后一个元素，并用以下方式分隔它们\n：
```
while read -ra line; do printf '%s\n%s\n' "${line[0]}" \
       "${line[$((${#line[@]]}-1))]}"; done <file.txt
```

使用python，创建一个包含每行用空格分隔的元素的列表，然后打印列表中的第一个和最后一个元素，并用分隔\n：

#!/usr/bin/env python3
with open("file.txt") as f:
    for line in f:
        line = line.split()
        print(line[0]+'\n'+line[-1])

例子：

$ cat file.txt                               
UniRef90_Q8YC41 Putative binding protein BMEII0691 MNRFIAFFRSVFLIGLVATAFGRACA
UniRef90_Q8YC41 Putative binding protein BMEII0691 MNRFIAFFRSVFLIGLVATAFGRACA

$ awk '{printf "%s\n%s\n", $1, $NF}' file.txt                             
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA

$ sed -E 's/([^[:blank:]]+).*[[:blank:]]([^[:blank:]]+)$/\1\n\2/' file.txt
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA

$ perl -pe 's/^([^\s]+).*\s([^\s]+)/$1\n$2/' file.txt
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA


$ while read -ra line; do printf '%s\n%s\n' "${line[0]}" "${line[$((${#line[@]]}-1))]}"; done <file.txt
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA

>>> with open("file.txt") as f:
...     for line in f:
...         line = line.split()
...         print(line[0]+'\n'+line[-1])
... 
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA

Answer

使用awk，以作为分隔符打印第一个和最后一个字段\n：
```
awk '{printf "%s\n%s\n", $1, $NF}' file.txt
```
使用sed，在匹配时捕获第一个和最后一个字段并在替换中使用：
```
sed -E 's/([^[:blank:]]+).*[[:blank:]]([^[:blank:]]+)$/\1\n\2/' file.txt
```

与perl的逻辑类似sed：

perl -pe 's/^([^\s]+).*\s([^\s]+)/$1\n$2/' file.txt

使用bash，较慢的方法，从每一行创建一个数组并打印数组中的第一个和最后一个元素，并用以下方式分隔它们\n：
```
while read -ra line; do printf '%s\n%s\n' "${line[0]}" \
       "${line[$((${#line[@]]}-1))]}"; done <file.txt
```

使用python，创建一个包含每行用空格分隔的元素的列表，然后打印列表中的第一个和最后一个元素，并用分隔\n：

#!/usr/bin/env python3
with open("file.txt") as f:
    for line in f:
        line = line.split()
        print(line[0]+'\n'+line[-1])

例子：

$ cat file.txt                               
UniRef90_Q8YC41 Putative binding protein BMEII0691 MNRFIAFFRSVFLIGLVATAFGRACA
UniRef90_Q8YC41 Putative binding protein BMEII0691 MNRFIAFFRSVFLIGLVATAFGRACA

$ awk '{printf "%s\n%s\n", $1, $NF}' file.txt                             
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA

$ sed -E 's/([^[:blank:]]+).*[[:blank:]]([^[:blank:]]+)$/\1\n\2/' file.txt
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA

$ perl -pe 's/^([^\s]+).*\s([^\s]+)/$1\n$2/' file.txt
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA


$ while read -ra line; do printf '%s\n%s\n' "${line[0]}" "${line[$((${#line[@]]}-1))]}"; done <file.txt
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA

>>> with open("file.txt") as f:
...     for line in f:
...         line = line.split()
...         print(line[0]+'\n'+line[-1])
... 
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA

Question 2

Ruby 版本

File.open(ARGV[0]) do |f|
  f.each do |line|
    puts "#{line.partition(' ')[0] + "\n" + line.rpartition(' ')[-1]}"
  end
end

将其保存为任意名称并运行line_breaker.rb它ruby line_breaker.rb file.txt文件.txt是存储序列的文件。

Answer

Ruby 版本

File.open(ARGV[0]) do |f|
  f.each do |line|
    puts "#{line.partition(' ')[0] + "\n" + line.rpartition(' ')[-1]}"
  end
end

将其保存为任意名称并运行line_breaker.rb它ruby line_breaker.rb file.txt文件.txt是存储序列的文件。

Question 3

在这个答案中：

bash+xargs单行
python单行
Ruby单行

1. `bash`+`xargs`版本。

$> cat input_file.txt  | xargs -L 1 bash -c 'for i; do : ; done ; echo $1;echo $i' bash

这实际上是将每一行作为命令行参数传递给 bash，循环直到我们得到最后一行，然后将它们回显出来。

演示：

$> cat input_file.txt                                                                     
UniRef90_Q8YC41 Putative binding protein BMEII0691 MNRFIAFFRSVFLIGLVATAFGRACA
UniRef90_Q8YC41 Putative binding protein BMEII0691 MNRFIAFFRSVFLIGLVATAFGRACA
$> cat input_file.txt  | xargs -L 1 bash -c 'for i; do : ; done ; echo $1;echo $i' bash   
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA

更短的版本：

$> cat input_file.txt  | xargs -L 1 bash -c 'echo $1;echo ${@: -1}' bash                  
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA

2.`python`单行

这行代码组装了一个字符串列表，该列表基本上由第一个单词 + 换行符 + 最后一个单词组成。最后，它将所有列表项打印为一个以换行符连接的字符串。

python -c 'import sys ; print "\n".join([ l.split()[0] + "\n" + l.split()[-1]  for l in sys.stdin ])' < input_file.txt

使用演示：

$ python -c 'import sys ; print "\n".join([ l.split()[0] + "\n" + l.split()[-1]  for l in sys.stdin ])' < input_file.txt
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA

3. Ruby 单行代码

在此行中，-n标志用作while gets . . . end循环。$_保存读取的每一行的值，因此对于每一行，我们将其分成一个单词数组，然后打印第一个和最后一个单词。

$ ruby -ne 'words=$_.split(); puts words[0],words[-1]' < input_file.txt                   
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA

Answer

在这个答案中：

bash+xargs单行
python单行
Ruby单行

1. `bash`+`xargs`版本。

$> cat input_file.txt  | xargs -L 1 bash -c 'for i; do : ; done ; echo $1;echo $i' bash

这实际上是将每一行作为命令行参数传递给 bash，循环直到我们得到最后一行，然后将它们回显出来。

演示：

$> cat input_file.txt                                                                     
UniRef90_Q8YC41 Putative binding protein BMEII0691 MNRFIAFFRSVFLIGLVATAFGRACA
UniRef90_Q8YC41 Putative binding protein BMEII0691 MNRFIAFFRSVFLIGLVATAFGRACA
$> cat input_file.txt  | xargs -L 1 bash -c 'for i; do : ; done ; echo $1;echo $i' bash   
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA

更短的版本：

$> cat input_file.txt  | xargs -L 1 bash -c 'echo $1;echo ${@: -1}' bash                  
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA

2.`python`单行

这行代码组装了一个字符串列表，该列表基本上由第一个单词 + 换行符 + 最后一个单词组成。最后，它将所有列表项打印为一个以换行符连接的字符串。

python -c 'import sys ; print "\n".join([ l.split()[0] + "\n" + l.split()[-1]  for l in sys.stdin ])' < input_file.txt

使用演示：

$ python -c 'import sys ; print "\n".join([ l.split()[0] + "\n" + l.split()[-1]  for l in sys.stdin ])' < input_file.txt
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA

3. Ruby 单行代码

在此行中，-n标志用作while gets . . . end循环。$_保存读取的每一行的值，因此对于每一行，我们将其分成一个单词数组，然后打印第一个和最后一个单词。

$ ruby -ne 'words=$_.split(); puts words[0],words[-1]' < input_file.txt                   
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA
UniRef90_Q8YC41
MNRFIAFFRSVFLIGLVATAFGRACA

如何在序列标题之后和实际序列之前添加断行？

答案1

答案2

Ruby 版本

答案3

1. `bash`+`xargs`版本。

2.`python`单行

3. Ruby 单行代码

相关内容

答案1

答案2

Ruby 版本

答案3

1. bash+xargs版本。

2.python单行

3. Ruby 单行代码

相关内容

1. `bash`+`xargs`版本。

2.`python`单行