我有几个文件夹,里面有很多 html 文件,我需要批量搜索这些 html 中的特定信息,并将这些信息作为后缀插入到文件名中
信息为:DATE | HOUR,格式如下
<p> 10 de junho de 2010 | 21h30 </p>
所有 html 文件中的信息结构都是相同的,但是所有文件中的日、月、年和时间都是不同的。
我无法为此指出正则表达式,也无法正确使用 grep 和 awk。
关于如何提取此信息并将其作为后缀放入名称文件中,有什么建议吗?
答案1
在bash
环境中(Linux 上或者 Windows 下的 CygWin)您可以使用:
$ LANG=es_ES-UTF-8 ; find . -type f -iname '*.html' | while IFS= read -r filename ; do ts=`stat --format=%Y "$filename"` ; suffix=`date --date=@$ts +%d\ de\ %B\ de\ %Y\ \|\ %Hh%M` ; mv "$filename" "$filename.$suffix" ; done
假如说:
- 你想使用西班牙语
- 你只想重命名扩展名为
.html
- 您希望将数据修改的日期/时间作为后缀(不是文件创建,也不是上次访问,也不是上次状态更改)