文件名匹配模式

文件名匹配模式

我有一个包含 200 个卫星文件的文件夹需要处理。该过程共有三个步骤,我想在ubuntu下使用shell脚本来处理它们。我正在使用 for 循环。

我的问题是文件名。示例为 A2013290123000.L1A_LAC.Ireland.hdf。

我可以创建变量,即。

DATE=A2013
DATE1=`date +%j` #gives me the number of days since jan 1st 2013 in example above this would be 290
.L1A_LAC.Ireland.hdf part of the name doesn't change.

我的问题是名称的中间部分,在上面的示例中:123000

名称的这一部分没有模式。它是一个时间戳,但因每个文件而异。

我想在脚本中创建一个变量,例如

TIMESTAMP=$DATE$DATE1$DATE2

其中 DATE2= 文件名的中间部分。

是否可以将此变量指定为通配符,例如:

DATE2=$*

我希望有变量的值TIMESTAMP= A2013209123000

#!/bin/sh

#set -e

set -x #debug mode

<<comment
export OCSSWROOT=/home/seadas/seadas-7.0/ocssw
source $OCSSWROOT/OCSSW_bash.env
export PATH=$PATH:/home/seadas/seadas-7.0/bin
comment

DATE=A2013
DATE1=`date +%j`
DATE2=$*
TIMESTAMP=$DATE$DATE1$DATE2
LOCATION_NAME=Ireland

DATADIR=/home/MODIS
L2_DIR=/home/MODIS/L2
GEO_FILE_DIR=/home/MODIS/GEO
L1B_DIR=/home/MODIS/L1B
SCRIPTDIR=/home/seadas/seadas-7.0/ocssw/run/scripts
FILTERDIR=/home/seadas/seadas-7.0/ocssw/run/data/common
FUNCTION=/home/seadas/seadas-7.0/ocssw/run/bin/linux_64

HDFFILE=$TIMESTAMP.L1A_LAC.$LOCATIONNAME.hdf
GEOFILE=$LOCATION_NAME-$TIMESTAMP.GEO
LACFILE=$TIMESTAMP.L1B_LAC
HKMFILE=$TIMESTAMP.L1B_HKM
QKMFILE=$TIMESTAMP.L1B_QKM
L2FILE=$TIMESTAMP.L2.hdf


for i in `ls -r $DATADIR`

do
    echo "Start a Process for file $i";

'Generating geolocation file' $SCRIPTDIR/modis_GEO.py -d $DATADIR/$HDFFILE -o $GEO_FILE_DIR/$TIMESTAMP.GEO --threshold=95;

'Generating L1B file' $SCRIPTDIR/modis_L1B.py $DATADIR/$HDFFILE $GEO_FILE_DIR/$TIMESTAMP.GEO -o $L1B_DIR/$LACFILE -k $L1B_DIR/$HKMFILE -q $L1B_DIR/$QKMFILE;

'Generating L2 product'$FUNCTION/l2gen ifile=$L1B_DIR/$LACFILE geofile=$GEO_FILE/$TIMESTAMP.GEO par=$FILTERDIR/msl12_defaults.par ofile=$L2_DIR/$L2FILE resolution=-1 l2prod="default,sst,qual_sst,qual_sst4,sstref,sst4" filter_opt=0 proc_ocean=1 gas_opt=15;

echo "it $i is finished..." 

    echo "\n"
done

答案1

这并不像你期望的那样工作。

  • 一般来说,您不应该循环遍历结果,ls因为如果文件名中有特殊字符(例如空格,这可能不是您的问题的情况),它会失败;
  • 循环现有的 HDF 文件并从文件名中提取时间戳:

    # assuming you do not have whitespaces etc. in filenames
    for i in $DATADIR/$DATE$DATE1*.L1A_LAC.$LOCATIONNAME.hdf ; do
      if [ ! -f "$i" ] ; then  #check if pattern could be expanded
           break ; 
      fi
      HDFFILE="$i"
      TIMESTAMP=$(basename "$i" ".L1A_LAC.$LOCATIONNAME.hdf")
      GEOFILE=$LOCATION_NAME-$TIMESTAMP.GEO
      LACFILE=$TIMESTAMP.L1B_LAC
      HKMFILE=$TIMESTAMP.L1B_HKM
      QKMFILE=$TIMESTAMP.L1B_QKM
      L2FILE=$TIMESTAMP.L2.hdf
    
      # process $i
      # [...]
    

答案2

如果我理解正确,您需要删除文件名中第一个点之后的所有内容才能获取时间戳。这参数扩展应该有帮助:

TIMESTAMP="${i%%.*}"

相关内容