我正在尝试编写一个 shell 脚本。想法是从文本文件中随机选择一行并将其显示为 Ubuntu 桌面通知。
但我希望每次执行脚本时都选择不同的行。有什么解决方案吗?我不需要整个脚本。只需要这么简单的东西。
答案1
您可以使用shuf
实用程序从文件中打印随机行
$ shuf -n 1 filename
-n
:要打印的行数
例子:
$ shuf -n 1 /etc/passwd
git:x:998:998:git daemon user:/:/bin/bash
$ shuf -n 2 /etc/passwd
avahi:x:84:84:avahi:/:/bin/false
daemon:x:2:2:daemon:/sbin:/bin/false
答案2
您还可以使用sort
命令从文件中获取随机行。
sort -R filename | head -n1
答案3
只是为了好玩,这是一个纯 bash 解决方案不使用、、、、shuf
或任何其他外部工具。sort
wc
sed
head
tail
与变体相比,唯一的优势shuf
是它稍快一些,因为它是纯 bash。在我的计算机上,对于一个 1000 行的文件,shuf
变体大约需要 0.1 秒,而以下脚本大约需要 0.01 秒 ;) 因此,虽然shuf
这是最简单和最短的变体,但它更快。
老实说,我仍然会寻求shuf
解决方案,除非高效率是一个重要的考虑因素。
#!/bin/bash
FILE=file.txt
# get line count for $FILE (simulate 'wc -l')
lc=0
while read -r line; do
((lc++))
done < $FILE
# get a random number between 1 and $lc
rnd=$RANDOM
let "rnd %= $lc"
((rnd++))
# traverse file and find line number $rnd
i=0
while read -r line; do
((i++))
[ $i -eq $rnd ] && break
done < $FILE
# output random line
printf '%s\n' "$line"
答案4
下面是一个从输入文件或标准输入中随机选择一行的 Python 脚本:
#!/usr/bin/env python
"""Usage: select-random [<file>]..."""
import random
def select_random(iterable, default=None, random=random):
"""Select a random element from iterable.
Return default if iterable is empty.
If iterable is a sequence then random.choice() is used for efficiency instead.
If iterable is an iterator; it is exhausted.
O(n)-time, O(1)-space algorithm.
"""
try:
return random.choice(iterable) # O(1) time and space
except IndexError: # empty sequence
return default
except TypeError: # not a sequence
return select_random_it(iter(iterable), default, random.randrange)
def select_random_it(iterator, default=None, randrange=random.randrange):
"""Return a random element from iterator.
Return default if iterator is empty.
iterator is exhausted.
O(n)-time, O(1)-space algorithm.
"""
# from https://stackoverflow.com/a/1456750/4279
# select 1st item with probability 100% (if input is one item, return it)
# select 2nd item with probability 50% (or 50% the selection stays the 1st)
# select 3rd item with probability 33.(3)%
# select nth item with probability 1/n
selection = default
for i, item in enumerate(iterator, start=1):
if randrange(i) == 0: # random [0..i)
selection = item
return selection
if __name__ == "__main__":
import fileinput
import sys
random_line = select_random_it(fileinput.input(), '\n')
sys.stdout.write(random_line)
if not random_line.endswith('\n'):
sys.stdout.write('\n') # always append newline at the end
该算法的时间复杂度为 O(n),空间复杂度为 O(1)。它适用于大于 32767 行的文件。它不会将输入文件加载到内存中。它只读取每个输入行一次,也就是说,您可以将任意大(但有限)的内容导入其中。这是一个算法解释。