从 html 文件中的文件名和链接中删除冒号

从 html 文件中的文件名和链接中删除冒号

我得到了一个大型照片集,作为嵌套目录,由 jpg 文件和按组链接的 html 文件组成。

这些照片的文件名看起来都像

2014-11-22T13:41:33_IXUS95_IMG_0880.jpg

在 html 文件中,这些名称出现如下

<title>Image: 2014-11-22T13:41:33_IXUS95_IMG_0880.jpg (9/796)</title>

或者

<img src="slides/slide_2014-11-22T13:41:33_IXUS95_IMG_0880.jpg" width=933 height=700 border=1>

目录布局如下所示

2014/ - 2014.01/ - 100.html
                   101.html
                   slides/slide_2014-11-22T13:41:33_IXUS95_IMG_0880.jpg
                   thumbs/thumb_ 2014-11-22T13:41:33_IXUS95_IMG_0880.jpg
      - 2014.02/
2015/ - 2015.01/

....等等....

我怎样才能去掉 html 文件中图像文件名和图像链接中的冒号?

答案1

此部分将重命名您的文件。
对于 $(find . -name "*T??:??:??*") 中的文件,
请执行
     mv -i "${file}" "${file//:/}"
完成


此部分将替换您的 *.html 文件中的文件名
对于 $(find . -type f -name "*.html") 中的文件,
执行
    sed -i -re 's/([[:digit:]]{2}):/\1/g' $file
done

相关内容