run_raw2l1.sh 11.6 KB
Newer Older
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
#!/bin/bash

#==============================================================================
# moy1min.sh
#
#   Ce script sert à faire l'interface entre le traitement a qui calcule
# les moyennes 1 minutes des données radflux en zone 2 et le traitement b qui
# prend en charge le contrôle qualité des données.
#
#   Le traitement a en plus des moyennes 1 min calcule aussi la valeur minnimum
# et maximum utilisé pour calculer la moyenne et fourni l'écart-type
#
#   Le traitement b permet soit de faire un contrôle qualité automatique soit
# d'utiliser un fichier de contrôle qualité généré par un opérateur pour filtrer
# les données
#
# Parametres d'entree :
#----------------------
#   -h : Affiche l'aide
#   -v : Affiche la version du script
#   -d : Date a traiter (format AAAAMMJJ)
#   -e : Fichier contenant la liste des fichiers d'entree
#   -s : Fichier contenant la liste des fichiers de sortie
#   -c : Nom du fichier de configuration
#   -n : Niveau de deboggage
#   -t : Repertoire de travail
#
# Historique :
#-------------
#   20161206 : MAD SIRTA Creation v1.00
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
31
#   20170220 : MAD SIRTA add configuration for P7. use submodule for raw2l1
32
#            : v1.0.1 correct problem with path of configuration file
33
#            : v1.0.2 correct source for LISA configuration file
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
34
#   20170303 : v1.0.3 add material to process 3s SIRTA CL31 data
35
#            : v1.0.4 correct several bugs in 3s script and make 30s script more robust
36
#   20180523 : v1.0.5 use a more generic way to get the python interpreter
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
37
#   20180913 : v1.0.6 add configuration file for CEREA CL51
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
38
#   20190206 : v1.0.9 add configuration file for CEREA CL51 in jussieu
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
39
#   20220224 : v1.1.0 improve pre-checking of raw files. update configuration files
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
40
#
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
41
# SIRTA 2013-2022
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
42 43 44 45 46 47 48
#==============================================================================

#==============================================================================
# usage
#
#   Cette fonction decrit l'utilisation et les parametres d'entree du script
#==============================================================================
49 50 51 52 53 54 55 56 57 58 59 60 61 62
function usage {
  echo -n "Utilisation de $NOM_PRGM : $NOM_PRGM [-h|-v] -d date -e liste_fich_entree "
  echo -n "[[-e liste_fich_basse_entree]...] -s liste_fich_sortie -t rep_travail "
  echo -n "-n niv_debogage"
  echo
  echo -e "  -d\tseules les donnees appartenant a cette date sont selectionnees,"
  echo -e "  \tle format de la date est du type aaaammjj"
  echo -e "  -e\tliste des fichiers niveau 1 5s ou 1s"
  echo -e "  -s\tliste des fichiers niveau 1 1min a creer"
  echo -e "  -n\tniveau de debogage (0 a 3)"
  echo -e "  -v\taffiche la version du programme"
  echo -e "  -c\tfichier de configuration"
  echo -e "  -h\taffiche cette aide"
  echo "Les fichiers a convertir doivent respecter la convention de nommage SIRTA."
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
63 64 65 66 67 68 69 70 71 72 73 74 75
}

#==============================================================================
# consignerMsg
#
#   Enregistre les messages dans un fichier de log et les affiche sur la sortie
# standard. La variable globale ENTETE_MSG peut etre initialisee avant l'appel.
# Le message n'est affiche que si son numero de debugage est inferieur ou egale
# a celui contenu dans la variable d'environnement DEBUG
# $1 : message
# $2 : niveau de debogage
#==============================================================================

76
function consignerMsg {
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111
  local heure=$(date +%d/%m/%Y,%H:%M:%S)
  local niv_deb=$2

  if [[ $# -gt 2 ]]; then
    consignerMsg "consignerMsg attend au maximum deux arguments"
    return 1
  fi
  [[ -z $niv_deb || $niv_deb -lt 0 ]] && niv_deb=0
  if [[ $niv_deb -le $DEBUG ]]; then
    if [[ -n "$ENTETE_MSG" ]]; then
      echo "$heure, $ENTETE_MSG : $1"
    else
      echo "$heure, $1"
    fi
  fi
}

################################################################################
#
#                           Debut du script
#
################################################################################

NOM_PRGM=$(basename $0)
ENTETE_MSG=$NOM_PRGM
ERREUR=0
DEBUG=0
VERSION=1
REP_SOURCES=$(dirname $(readlink -f $0))

n=0

#------------------------------------------------------------------------------
# Recupere les parametres de la lignes de commande
#------------------------------------------------------------------------------
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
112
UNZIP=0
113
while getopts :d:e:s:t:n:c:a:uhv option; do
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
114
  case $option in
115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132
  d) date="$OPTARG" ;;
  h)
    usage
    exit 0
    ;;
  v)
    echo $VERSION
    exit 0
    ;;
  e)
    liste_entree[n]="$OPTARG"
    let n++
    ;;
  s) liste_sortie=${OPTARG} ;;
  t) REP_TRAVAIL=${OPTARG} ;;
  n) DEBUG=${OPTARG} ;;
  c) fich_conf="$OPTARG" ;;
  u) UNZIP=1 ;;
133
  a) fich_type="$OPTARG" ;; # SIRTA ou MF (format change legerement selon le logiciel d'acquisition)
134 135 136
  # permet de sauter des options inconnues sans sortir de while
  ?) while [[ $OPTIND -le $# && ${!OPTIND:0:1} != '-' ]]; do OPTIND=$((OPTIND + 1)); done ;;
  *) ERREUR=1 ;;
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
137 138 139
  esac
done

140
# RAW2L1 needed path
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
141
PYTHON="/usr/bin/env python3"
142 143 144 145 146 147
RAW2L1=${REP_SOURCES}"/sirta-raw2l1/raw2l1/raw2l1.py"
RAW2L1_CONF=${REP_SOURCES}"/"$fich_conf
RAW2L1_LOGS=${REP_SOURCES}"/logs/raw2l1.log"

NCKS="/usr/bin/ncks"

148 149 150 151 152 153 154 155 156 157 158 159
# CL parameters
# ----------------------------------------------------------------------------
# number of vertical gates
declare -A CL_N_GATES
CL_N_GATES["1"]=770
CL_N_GATES["2"]=385
CL_N_GATES["3"]=1500
CL_N_GATES["4"]=770
CL_N_GATES["6"]=1540
# number of characters per gate
N_CHAR_GATES=5

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
160 161 162 163
#------------------------------------------------------------------------------
# verification des parametres
#------------------------------------------------------------------------------
if [[ $ERREUR != 0 ]]; then
164 165
  usage
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
166 167
fi

168
if [[ $fich_type != "SIRTA" && $fich_type != "MF" ]]; then
169
  echo "Le type de fichier doit etre SIRTA, MF"
170 171 172
  exit 1
fi

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
173
let n--
174 175 176 177 178 179 180 181 182 183
while [[ $n -ge 0 ]]; do
  if [[ -z ${liste_entree[n]} ]]; then
    consignerMsg "Il faut indiquer la liste des fichiers d'entree a traiter."
    exit 1
  fi
  if [[ ! -f ${liste_entree[n]} ]]; then
    consignerMsg "La liste de fichiers d'entree ${liste_entree[n]} est vide ou n'existe pas."
    exit 1
  fi
  let n--
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
184 185 186
done

if [[ -z $liste_sortie ]]; then
187 188
  consignerMsg "Il faut indiquer la liste des fichiers de sortie a creer."
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
189 190 191
fi

if [[ ! -f $liste_sortie || ! -s $liste_sortie ]]; then
192 193
  consignerMsg "La liste de fichiers de sortie $liste_sortie est vide ou n'existe pas."
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
194 195 196
fi

if [[ -z $REP_TRAVAIL ]]; then
197 198
  consignerMsg "Il faut indiquer un repertoire de travail."
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
199 200 201
fi

if [[ ! -d $REP_TRAVAIL ]]; then
202 203
  consignerMsg "Le repertoire de travail $REP_TRAVAIL n'existe pas."
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
204 205 206 207 208 209 210 211 212 213 214
fi

#------------------------------------------------------------------------------
#       Traitement
#------------------------------------------------------------------------------

# Recuperation des fichiers d entree radflux
# On verifie d'abord si le fichier 1s existe si il n'existe pas on cherche le 5s
# Si on n'en trouve aucun on quitte
#------------------------------------------------------------------------------
n=0
215
while read l; do
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
216 217
  fich_entree[n]=$l
  let n++
218
done <${liste_entree[0]}
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
219 220

# test pour savoir si fichier du jour disponible
221 222 223
if [[ ${#fich_entree[*]} -lt 2 ]]; then
  consignerMsg "Pas de fichier du jour a traiter"
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
224 225
fi

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
226
# if unzipping raw files is needed
227
#------------------------------------------------------------------------------
228
if [[ $UNZIP == 0 ]]; then
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
229
  input_files=("${fich_entree[@]}")
230
elif [[ $UNZIP == 1 ]]; then
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
231
  consignerMsg "Désarchivage de l'archive"
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
232 233 234 235
  # create tmp directory for data
  tmp_data=$(mktemp -d -p "$REP_TRAVAIL")

  # unzip input files in it
236
  for zip_file in "${fich_entree[@]}"; do
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
237 238 239 240 241 242 243
    unzip "$zip_file" -d "$tmp_data"
  done

  # put all unzipped files in array
  mapfile -t input_files < <(find "$tmp_data" -name "*.dat" | sort)
fi

244 245 246 247 248
# check format of data message
#------------------------------------------------------------------------------
# create temp directory for data
tmp_check=$(mktemp -d -p "$REP_TRAVAIL")

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
249
consignerMsg "Vérification des données brutes"
250 251
for file_ in "${input_files[@]}"; do

252 253 254 255 256
  # check if empty line in input list
  if [[ -z $file_ ]]; then
    continue
  fi

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
257 258
  tmp_file_=$(basename "$file_")
  cl31_cor="$tmp_check/${tmp_file_%.*}.cor"
259

260 261 262 263 264 265
  # get vertical resolution of data
  vertical_conf=$(sed -nr '0,/CL/s/.*CL.*([0-9]).*/\1/p' "$file_")
  n_gates=${CL_N_GATES[$vertical_conf]}
  prof_n_chars=$((n_gates * N_CHAR_GATES))
  prof_n_chars_p1=$((prof_n_chars + 1))

266 267
  consignerMsg "number of vertical gates: $n_gates"

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
268
  case $fich_type in
269
  "SIRTA")
270
    awk --posix -v cl31_cor="$cl31_cor" -v prof_n_chars="$prof_n_chars" -v prof_n_chars_p1="$prof_n_chars_p1" '\
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
271 272
      BEGIN {l=1;p=0;e=0;printf "" > cl31_cor}
      NR<3 {print $0 >> cl31_cor;next}
273 274 275
      l==1 {if ($0 ~ /^[[:cntrl:]]*$/ || $0 ~ "File") {next}}
      l==1 {if ($0 ~ /^-[0-9-]{10} [0-9:]{8}.?$/) {l++;bloc=$0;e=0;next} else if (e==1) {next} else e=1}
      l==2 {if ($0 ~ /^[\001]CL.{6}[\002].?$/) {l++;bloc=bloc"\n"$0;next} else e=1}
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
276 277 278
      l==3 {if (NF==5) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==4 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==5 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
279
      l==6 {if (length($0) == prof_n_chars || length($0) == prof_n_chars_p1) {l++;bloc=bloc"\n"$0;next} else e=1}
280
      l==7 {if ($0 ~ /^[\003][0-9a-z]{4}[\004].?$/) {p=1;bloc=bloc"\n"$0} else e=1}
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
281 282 283
      p==1 {printf bloc"\n" >> cl31_cor;l=1;p=0}
      e==1 {err++;print NR;l=1}
      END {if ($0 ~ "File") printf "\n%s\n",$0>>cl31_cor; if (err>0)print "err=",err}' "$file_"
284 285
    ;;
  "MF")
286
    awk --posix -v cl31_cor="$cl31_cor" -v prof_n_chars="$prof_n_chars" -v prof_n_chars_p1="$prof_n_chars_p1" '\
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
287
      BEGIN {l=1;p=0;e=0;printf "" > cl31_cor}
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
288
      l==1 {if ($0 ~ "File") {next}}
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
289 290
      l==1 {if ($0 ~ /^[\001]$/) {l++;bloc=$0;e=0;next} else if (e==1) {next} else e=1}
      l==2 {if ($0 ~ /^-[0-9-]{10} [0-9:]{8}$/) {l++;bloc=bloc"\n"$0;next} else e=1}
291
      l==3 {if ($0 ~ /^ CL.{6}[\002].$/) {l++;bloc=bloc"\n"$0;next} else e=1}
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
292 293 294
      l==4 {if (NF==5) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==5 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==6 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
295
      l==7 {if (length($0) == prof_n_chars || length($0) == prof_n_chars_p1) {l++;bloc=bloc"\n"$0;next} else e=1}
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
296 297 298 299
      l==8 {if ($0 ~ /^[\003][0-9a-z]{4}[\004].$/) {p=1;bloc=bloc"\n"$0} else e=1}
      p==1 {printf bloc"\n" >> cl31_cor;l=1;p=0}
      e==1 {err++;print NR;l=1}
      END {if ($0 ~ "File") printf "\n%s\n",$0>>cl31_cor; if (err>0)print "err=",err}' "$file_"
300
    ;;
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
301
  esac
302 303 304 305
done

mapfile -t input_files < <(find "$tmp_check" -name "*.cor" | sort)

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
306 307
# Recuperation des fichiers de sortie
#------------------------------------------------------------------------------
308
fich_sortie=$(cat "$liste_sortie")
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
309 310

# fichier temporaire
311
tmpfile=$(mktemp "$REP_TRAVAIL"/test_XXXXX.nc)
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
312 313 314

# conversion avec raw2l1
#------------------------------------------------------------------------------
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
315
cmd="$PYTHON $RAW2L1 '$date' $RAW2L1_CONF ${input_files[*]} $tmpfile -log $RAW2L1_LOGS -v info"
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
316 317 318

eval $cmd

319 320 321 322 323
if [[ $? == 0 ]]; then
  # suppression des donnees qui ne correspondent pas au jour
  #-------------------------------------------------------------------------
  date_as_days=$(bc -l <<<"$(date -u -d "$date" +%s)/86400")
  date_p1=$(bc -l <<<"($(date -u -d "$date" +%s)+86399)/86400")
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
324

325
  cmd="$NCKS -h -O -d time,${date_as_days},${date_p1} $tmpfile $fich_sortie"
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
326

327 328
  consignerMsg "suppression des données n'appartenant au jour traite"
  eval $cmd
329
else
330
  \rm "$tmpfile"
331

332 333 334
  if [[ $UNZIP == 1 ]]; then
    \rm -rf "$tmp_data"
  fi
335

336
  exit 1
337
fi
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
338

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
339 340
\rm "$tmpfile"
# if needed remove unzipped files
341
if [[ $UNZIP == 1 ]]; then
342
  \rm -rf "$tmp_data"
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
343
fi
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
344

345 346
\rm -rf "$tmp_check"

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
347
if (($? > 1)); then
348
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
349 350 351
fi

exit 0