如何提取两个字符串之间的相似性

Question 1

您可以做的一件事是检查两个字符串中出现的单词：

$ comm -12 <(sed 's/ /\n/g' <<<$str1 | sort) <(sed 's/ /\n/g' <<<$str2 | sort )
30
alanine

解释

比较comm command文件。使用-1和-2标志，它将打印在中找到的那些行两个都文件。
sed 's/ /\n/g' <<<$str1 | sort：这只是将中的所有空格替换为换行符$str1，打印到标准输出，然后通过标准输出，sort因为comm需要对其输入文件进行排序。有关格式的更多信息<<<$var，请参见Bash：这里是字符串。
该<(command)格式称为进程替换，更多相关信息这里。

上面命令的最终结果将是两个字符串中出现的所有单词的列表。

Answer

您可以做的一件事是检查两个字符串中出现的单词：

$ comm -12 <(sed 's/ /\n/g' <<<$str1 | sort) <(sed 's/ /\n/g' <<<$str2 | sort )
30
alanine

解释

比较comm command文件。使用-1和-2标志，它将打印在中找到的那些行两个都文件。
sed 's/ /\n/g' <<<$str1 | sort：这只是将中的所有空格替换为换行符$str1，打印到标准输出，然后通过标准输出，sort因为comm需要对其输入文件进行排序。有关格式的更多信息<<<$var，请参见Bash：这里是字符串。
该<(command)格式称为进程替换，更多相关信息这里。

上面命令的最终结果将是两个字符串中出现的所有单词的列表。

Question 2

也许wdiff可以帮助你？将字符串放入两个文件中，然后将它们与wdiff：

echo "30 mutation alanine for valine" > file1
echo "alanine at position 30" > file2
wdiff -t file1 file2

输出的屏幕截图：

输出的屏幕截图

Answer

也许wdiff可以帮助你？将字符串放入两个文件中，然后将它们与wdiff：

echo "30 mutation alanine for valine" > file1
echo "alanine at position 30" > file2
wdiff -t file1 file2

输出的屏幕截图：

输出的屏幕截图

Question 3

我想不出使用普通正则表达式的方法，因为你所做的有点复杂。

用像这样的语言红宝石你可以分裂通过正则表达式 ( ) 将字符串转换为空格分隔的单词数组，\s+并得到路口&两个结果数组的( ) 。

"30 mutation alanine for valine".split( /\s+/ ) & "alanine at position 30".split( /\s+/ )
=> ["30", "alanine"]

空格实际上是 Ruby 中 split 的默认值，因此可以缩短为

"30 mutation alanine for valine".split & "alanine at position 30".split

Answer

我想不出使用普通正则表达式的方法，因为你所做的有点复杂。

用像这样的语言红宝石你可以分裂通过正则表达式 ( ) 将字符串转换为空格分隔的单词数组，\s+并得到路口&两个结果数组的( ) 。

"30 mutation alanine for valine".split( /\s+/ ) & "alanine at position 30".split( /\s+/ )
=> ["30", "alanine"]

空格实际上是 Ruby 中 split 的默认值，因此可以缩短为

"30 mutation alanine for valine".split & "alanine at position 30".split

Question 4

这是一个awk解决方案：

$ awk '{for(i=1;i<=NF;i++){a[$i]++}}
    END {
        for(i in a) {
            if(a[i] > 1) {
                print i
            }
        }
    }' file1 file2
30
alanine

Answer

这是一个awk解决方案：

$ awk '{for(i=1;i<=NF;i++){a[$i]++}}
    END {
        for(i in a) {
            if(a[i] > 1) {
                print i
            }
        }
    }' file1 file2
30
alanine

如何提取两个字符串之间的相似性

答案1

解释

答案2

答案3

答案4

相关内容