假设您只想获取文件中的文本字符,而文件中还有许多其他内容。有没有办法只选择 ASCII 字符?HXD 中的文本视图也会显示其他所有内容。
答案1
如果“文本”指的是 UTF-8 字符,例如从 Chr(32) 到 128,则可以将文本导入到编辑器中,例如记事本++并在搜索/替换对话框中使用正则表达式 (regex) 将所需范围之外的字符替换为空。在 Notepad++ 中,
按下CtrlH打开搜索/替换对话框
转向代替标签。
在里面找什么 :字段中,插入以下正则表达式:
[^\x1F-\x7F]+
离开用。。。来代替 :字段为空。
选择正则表达式搜索类型
点击全部替换。
请注意,对于大文件来说这可能需要一些时间,因为每次删除字符时都必须“关闭”文本。