如何显示文本文件中的随机行?

如何显示文本文件中的随机行?

我正在尝试编写一个 shell 脚本。想法是从文本文件中随机选择一行并将其显示为 Ubuntu 桌面通知。

但我希望每次执行脚本时都选择不同的行。有什么解决方案吗?我不需要整个脚本。只需要这么简单的东西。

答案1

您可以使用shuf实用程序从文件中打印随机行

$ shuf -n 1 filename

-n:要打印的行数

例子:

$ shuf -n 1 /etc/passwd

git:x:998:998:git daemon user:/:/bin/bash

$ shuf -n 2 /etc/passwd

avahi:x:84:84:avahi:/:/bin/false
daemon:x:2:2:daemon:/sbin:/bin/false

答案2

您还可以使用sort命令从文件中获取随机行。

sort -R filename | head -n1

答案3

只是为了好玩,这是一个纯 bash 解决方案不使用、、、、shuf或任何其他外部工具。sortwcsedheadtail

与变体相比,唯一的优势shuf是它稍快一些,因为它是纯 bash。在我的计算机上,对于一个 1000 行的文件,shuf变体大约需要 0.1 秒,而以下脚本大约需要 0.01 秒 ;) 因此,虽然shuf这是最简单和最短的变体,但它更快。

老实说,我仍然会寻求shuf解决方案,除非高效率是一个重要的考虑因素。

#!/bin/bash

FILE=file.txt

# get line count for $FILE (simulate 'wc -l')
lc=0
while read -r line; do
 ((lc++))
done < $FILE

# get a random number between 1 and $lc
rnd=$RANDOM
let "rnd %= $lc"
((rnd++))

# traverse file and find line number $rnd
i=0
while read -r line; do
 ((i++))
 [ $i -eq $rnd ] && break
done < $FILE

# output random line
printf '%s\n' "$line"

答案4

下面是一个从输入文件或标准输入中随机选择一行的 Python 脚本:

#!/usr/bin/env python
"""Usage: select-random [<file>]..."""
import random

def select_random(iterable, default=None, random=random):
    """Select a random element from iterable.

    Return default if iterable is empty.
    If iterable is a sequence then random.choice() is used for efficiency instead.
    If iterable is an iterator; it is exhausted.
    O(n)-time, O(1)-space algorithm.
    """
    try:
        return random.choice(iterable) # O(1) time and space
    except IndexError: # empty sequence
        return default
    except TypeError: # not a sequence
        return select_random_it(iter(iterable), default, random.randrange)

def select_random_it(iterator, default=None, randrange=random.randrange):
    """Return a random element from iterator.

    Return default if iterator is empty.
    iterator is exhausted.
    O(n)-time, O(1)-space algorithm.
    """
    # from https://stackoverflow.com/a/1456750/4279
    # select 1st item with probability 100% (if input is one item, return it)
    # select 2nd item with probability 50% (or 50% the selection stays the 1st)
    # select 3rd item with probability 33.(3)%
    # select nth item with probability 1/n
    selection = default
    for i, item in enumerate(iterator, start=1):
        if randrange(i) == 0: # random [0..i)
            selection = item
    return selection

if __name__ == "__main__":
    import fileinput
    import sys

    random_line = select_random_it(fileinput.input(), '\n')
    sys.stdout.write(random_line)
    if not random_line.endswith('\n'):
        sys.stdout.write('\n') # always append newline at the end

该算法的时间复杂度为 O(n),空间复杂度为 O(1)。它适用于大于 32767 行的文件。它不会将输入文件加载到内存中。它只读取每个输入行一次,也就是说,您可以将任意大(但有限)的内容导入其中。这是一个算法解释

相关内容