如何简单地清理文件名?

如何简单地清理文件名?

操作系统:Kubuntu 22.04.4 LTS x86_64

显示在上面:
neofetch --stdout |grep 'OS:'

如何简单地清理文件名而不是文件内容?
通过从文件名中删除:

  • \n 换行符
  • \t 标签
  • 不可打印字符
  • 空格

对于微软 Windows, < > : " \ / | ? * 文件名中没有。

< (less than)
> (greater than)
: (colon - sometimes works, but is actually NTFS Alternate Data Streams)
" (double quote)
/ (forward slash)
\ (backslash)
| (vertical bar or pipe)
? (question mark)
* (asterisk)

示例 1:
如何创建有问题的文件名。 在终端中
使用 mv 将换行符添加到文件名中:

touch a

mv a $'b\nc'  # move (rename) files 
ls            # 'b'$'\n''c'
ls -b         # b\nc

使用 GUI,按 F2 = 重命名:

b
c

示例 2:
较长的名称。

touch 'This filename will have Tabs and Newlines_.txt'

mv 'This filename will have Tabs and Newlines_.txt' $'This\tfilename\twill\thave\tTabs\nand\nNewlines_.txt'  
ls            # 'This'$'\t''filename'$'\t''will'$'\t''have'$'\n''Tabs'$'\n''and'$'\n''Newlines_.txt'
ls -b         # This\tfilename\twill\thave\nTabs\nand\nNewlines_.txt

使用 GUI,按 F2 = 重命名:

This    filename    will    have    Tabs
and
Newlines_.txt

示例 3:
更加复杂。
touch 'This filename will have Tabs and Newlines & SPACES & colon: _.txt'

mv 'This filename will have Tabs and Newlines & SPACES & colon: _.txt' $'This\tfilename\twill\thave\tTabs\nand\nNewlines & SPACES & colon: _.txt'
ls         # 'This'$'\t''filename'$'\t''will'$'\t''have'$'\t''Tabs'$'\n''and'$'\n''Newlines & SPACES & colon: _.txt'
ls -b      # This\tfilename\twill\thave\tTabs\nand\nNewlines\ &\ SPACES\ &\ colon:\ _.txt

使用 GUI,按 F2 = 重命名:

This    filename    will    have    Tabs
and
Newlines & SPACES & colon: _.txt

示例 3 中的 bash cleanup 文件名:

#!/bin/bash   
clear
# FILE : original_filename comes from inotifywait command, On access, auto detect a file in /home/xxx/Downloads to eventually do a CLAM virus scan on FILE. 
filename1=$FILE
filename1=$'This\tfilename\twill\thave\tTabs\nand\nNewlines\ &\ SPACES\ &\ colon:\ _.txt'
echo "$filename1" 
filename2="${filename1//[$'\t'$'\n'$'\e'$'\r'$'\f'$'\v'$'\b'$'\a'$'\0']/-}"  # Replace Non Printable Characters with dash - 
echo "$filename2" 
filename3="${filename2//[$'\ ']/_}"    # Replace space with underscore _                                                   
echo "$filename3" 
filename4="${filename3//[$':']/_}"     # Replace colon : with underscore _                                                  
echo "$filename4" 

bash 结果示例 3:

This    filename        will    have    Tabs
and
Newlines\ &\ SPACES\ &\ colon:\ _.txt  

This-filename-will-have-Tabs-and-Newlines\ &\ SPACES\ &\ colon:\ _.txt
This-filename-will-have-Tabs-and-Newlines__&__SPACES__&__colon:___.txt
This-filename-will-have-Tabs-and-Newlines__&__SPACES__&__colon____.txt

用破折号替换不可打印字符 - 包括

  • \n 换行符
  • \t 制表
    符 用下划线 _ 替换空格用下划线_
    替换冒号:

参考 1:
完整不可打印字符列表
https://fjolt.com/article/linux-non-printable-characters

Name                 Binary  Decimal  Hexadecimal  Octal  Caret     Escape
                                                          Notation  Sequence  
Null               000 0000        0           00    000     ^@           \0 
Beep(BEL)          000 0111        7           07    007     ^G           \a 
Backspace(BS)      000 1000        8           08    010     ^H           \b        
HorizontalTab(HT)  000 1001        9           09    011     ^I           \t 
LineFeed(LF)       000 1010       10           0A    012     ^J           \n 
VerticalTab(VT)    000 1011       11           0B    013     ^K           \v 
FormFeed(FF)       000 1100       12           0C    014     ^L           \f 
CarriageReturn(CR) 000 1101       13           0D    015     ^M           \r 
Escape(ESC)        001 1011       27           1B    033     ^[           \e 

9 Escape Sequences:  
\0 
\a 
\b 
\t 
\n 
\v 
\f 
\r 
\e 


used: 
column -t -o '  ' a.txt b.txt 

参考文献2:
https://www.linuxquestions.org/questions/general-10/remove-newline-and-tab-characters-from-filename-4175690259/

orig_filename=$'TN1\tThis\nFileName\nHas\tTabsandNewlines'
echo test > "$orig_filename"
new_filename="${orig_filename//[$'\t'$'\n']/-}"
mv --no-clobber "$orig_filename" "$new_filename"

参考3:
Shell参数扩展
${parameter//pattern/string}
https://www.gnu.org/software/bash/manual/html_node/Shell-Parameter-Expansion.html

问题:
如何简单地清理文件名?
有哪些更简单的命令?

--

答案1

您可以使用类似的应用程序排毒它内置了你可能想要清理的内容。它们被称为序列. 使用示例:

detox -s safe -v /some/folder/or/file

这只会使用一个序列,使名称对于 Unix 使用来说更安全。-v详细标志准确指定受影响的名称。

detoxrc您还可以按照上述文档的说明在配置文件中创建自己的组合序列。

相关内容