我有一些搜索日志,想将它们与某些词典文件进行比较。一旦我处理搜索日志以过滤掉某些条目并将所有搜索词放入单独的行中,有什么简单的方法可以找出词典文件中有多少个搜索词?
答案1
我将把输入准备放在一边,并假设这些输入:
搜索日志- 在线搜索一个词,无重复,如下所示:
car
tramway
bus
train
skate
rollerblade
bike
字典 - 在线字典中有一个单词,没有重复,如下所示:
car
tramway
bus
train
bike
aeroplane
submarine
如果你想从搜索日志中选择字典中的行,你可以这样做:
grep -f dictionary search_log
它会回来的
car
tramway
bus
train
bike
如果你想要这些单词的数量,只需将其传输到wc -l
grep -f dictionary search_log | wc -l
结果为 5。