如何提取信息并将其放入名称文件中

如何提取信息并将其放入名称文件中

我有几个文件夹,里面有很多 html 文件,我需要批量搜索这些 html 中的特定信息,并将这些信息作为后缀插入到文件名中

信息为:DATE | HOUR,格式如下  

<p> 10 de junho de 2010 | 21h30 </p>

所有 html 文件中的信息结构都是相同的,但是所有文件中的日、月、年和时间都是不同的。

我无法为此指出正则表达式,也无法正确使用 grep 和 awk。

关于如何提取此信息并将其作为后缀放入名称文件中,有什么建议吗?

答案1

bash环境中(Linux 上或者 Windows 下的 CygWin)您可以使用:

$ LANG=es_ES-UTF-8 ; find . -type f -iname '*.html' | while IFS= read -r filename ; do ts=`stat --format=%Y "$filename"` ; suffix=`date --date=@$ts +%d\ de\ %B\ de\ %Y\ \|\ %Hh%M` ; mv "$filename" "$filename.$suffix" ; done

假如说:

  • 你想使用西班牙语
  • 你只想重命名扩展名为.html
  • 您希望将数据修改的日期/时间作为后缀(不是文件创建,也不是上次访问,也不是上次状态更改)

相关内容