我所指的文本有不同的格式,例如:
- 我的网络浏览器中打开了一个网站
- 存储在我的口袋
- 通过我的网络浏览器在 Gmail 中打开的电子邮件
答案1
自定义快捷方式脚本
我们可以使用分配给键盘快捷键的终端命令来读取屏幕的部分内容。
将脚本分配给键盘快捷键打开系统设置 > 键盘 > 快捷键使用 创建新的快捷方式+。
给出一个明智的姓名到快捷方式(例如ReadScreen
)。输入完整路径到下面的脚本之一命令行。应用新的快捷键后,我们需要按所需的键盘快捷键,例如Alt+ Scroll Lock,确保它尚不存在。
根据您的需要,选择下面的任意一个脚本(或使用不同的键)。
案例阅读精选文本:
将以下脚本保存为例如ReadClip
到合理位置并赋予其可执行权限。
#! /bin/bash
xclip -o | espeak
按下预定义键时,默认语音合成器说话 将读取所有选定的文本,或者如果没有选择文本,则使用剪贴板的内容(如果是文本)剪辑 。
当然,我们可以调整脚本以使用任何其他语音合成器(例如spd 检测)。
案例阅读文本,包括图像上的文字
将以下脚本保存为例如ReadShot
到合理位置并赋予其可执行权限。
#! /bin/bash
gnome-screenshot -a --file=tmp.png &&
tesseract tmp.png stdout | espeak
按下预定义键后,我们可以使用默认的屏幕截图工具选择屏幕区域。生成的图像将由 OCR 软件处理tesseract-ocr 然后使用读出说话 。
结果不如处理文本文件那么好,但仍然非常好,我们可以用它来屏幕上显示的所有内容包括图像。如果我们不想保留临时图像,tmp.png
我们可以将 添加rm tmp.png
到脚本中。