run_raw2l1.sh 11.4 KB
Newer Older
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
#!/bin/bash

#==============================================================================
# moy1min.sh
#
#   Ce script sert à faire l'interface entre le traitement a qui calcule
# les moyennes 1 minutes des données radflux en zone 2 et le traitement b qui
# prend en charge le contrôle qualité des données.
#
#   Le traitement a en plus des moyennes 1 min calcule aussi la valeur minnimum
# et maximum utilisé pour calculer la moyenne et fourni l'écart-type
#
#   Le traitement b permet soit de faire un contrôle qualité automatique soit
# d'utiliser un fichier de contrôle qualité généré par un opérateur pour filtrer
# les données
#
# Parametres d'entree :
#----------------------
#   -h : Affiche l'aide
#   -v : Affiche la version du script
#   -d : Date a traiter (format AAAAMMJJ)
#   -e : Fichier contenant la liste des fichiers d'entree
#   -s : Fichier contenant la liste des fichiers de sortie
#   -c : Nom du fichier de configuration
#   -n : Niveau de deboggage
#   -t : Repertoire de travail
#
# Historique :
#-------------
#   20161206 : MAD SIRTA Creation v1.00
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
31
#   20170220 : MAD SIRTA add configuration for P7. use submodule for raw2l1
32
#            : v1.0.1 correct problem with path of configuration file
33
#            : v1.0.2 correct source for LISA configuration file
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
34
#   20170303 : v1.0.3 add material to process 3s SIRTA CL31 data
35
#            : v1.0.4 correct several bugs in 3s script and make 30s script more robust
36
#   20180523 : v1.0.5 use a more generic way to get the python interpreter
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
37
#   20180913 : v1.0.6 add configuration file for CEREA CL51
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
38
#   20190206 : v1.0.9 add configuration file for CEREA CL51 in jussieu
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
39 40 41 42 43 44 45 46 47
#
# SIRTA 2013
#==============================================================================

#==============================================================================
# usage
#
#   Cette fonction decrit l'utilisation et les parametres d'entree du script
#==============================================================================
48 49 50 51 52 53 54 55 56 57 58 59 60 61
function usage {
  echo -n "Utilisation de $NOM_PRGM : $NOM_PRGM [-h|-v] -d date -e liste_fich_entree "
  echo -n "[[-e liste_fich_basse_entree]...] -s liste_fich_sortie -t rep_travail "
  echo -n "-n niv_debogage"
  echo
  echo -e "  -d\tseules les donnees appartenant a cette date sont selectionnees,"
  echo -e "  \tle format de la date est du type aaaammjj"
  echo -e "  -e\tliste des fichiers niveau 1 5s ou 1s"
  echo -e "  -s\tliste des fichiers niveau 1 1min a creer"
  echo -e "  -n\tniveau de debogage (0 a 3)"
  echo -e "  -v\taffiche la version du programme"
  echo -e "  -c\tfichier de configuration"
  echo -e "  -h\taffiche cette aide"
  echo "Les fichiers a convertir doivent respecter la convention de nommage SIRTA."
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
62 63 64 65 66 67 68 69 70 71 72 73 74
}

#==============================================================================
# consignerMsg
#
#   Enregistre les messages dans un fichier de log et les affiche sur la sortie
# standard. La variable globale ENTETE_MSG peut etre initialisee avant l'appel.
# Le message n'est affiche que si son numero de debugage est inferieur ou egale
# a celui contenu dans la variable d'environnement DEBUG
# $1 : message
# $2 : niveau de debogage
#==============================================================================

75
function consignerMsg {
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110
  local heure=$(date +%d/%m/%Y,%H:%M:%S)
  local niv_deb=$2

  if [[ $# -gt 2 ]]; then
    consignerMsg "consignerMsg attend au maximum deux arguments"
    return 1
  fi
  [[ -z $niv_deb || $niv_deb -lt 0 ]] && niv_deb=0
  if [[ $niv_deb -le $DEBUG ]]; then
    if [[ -n "$ENTETE_MSG" ]]; then
      echo "$heure, $ENTETE_MSG : $1"
    else
      echo "$heure, $1"
    fi
  fi
}

################################################################################
#
#                           Debut du script
#
################################################################################

NOM_PRGM=$(basename $0)
ENTETE_MSG=$NOM_PRGM
ERREUR=0
DEBUG=0
VERSION=1
REP_SOURCES=$(dirname $(readlink -f $0))

n=0

#------------------------------------------------------------------------------
# Recupere les parametres de la lignes de commande
#------------------------------------------------------------------------------
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
111
UNZIP=0
112
while getopts :d:e:s:t:n:c:a:uhv option; do
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
113
  case $option in
114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131
  d) date="$OPTARG" ;;
  h)
    usage
    exit 0
    ;;
  v)
    echo $VERSION
    exit 0
    ;;
  e)
    liste_entree[n]="$OPTARG"
    let n++
    ;;
  s) liste_sortie=${OPTARG} ;;
  t) REP_TRAVAIL=${OPTARG} ;;
  n) DEBUG=${OPTARG} ;;
  c) fich_conf="$OPTARG" ;;
  u) UNZIP=1 ;;
132
  a) fich_type="$OPTARG" ;; # SIRTA ou MF (format change legerement selon le logiciel d'acquisition)
133 134 135
  # permet de sauter des options inconnues sans sortir de while
  ?) while [[ $OPTIND -le $# && ${!OPTIND:0:1} != '-' ]]; do OPTIND=$((OPTIND + 1)); done ;;
  *) ERREUR=1 ;;
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
136 137 138
  esac
done

139
# RAW2L1 needed path
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
140
PYTHON="/usr/bin/env python3"
141 142 143 144 145 146
RAW2L1=${REP_SOURCES}"/sirta-raw2l1/raw2l1/raw2l1.py"
RAW2L1_CONF=${REP_SOURCES}"/"$fich_conf
RAW2L1_LOGS=${REP_SOURCES}"/logs/raw2l1.log"

NCKS="/usr/bin/ncks"

147 148 149 150 151 152 153 154 155 156 157 158
# CL parameters
# ----------------------------------------------------------------------------
# number of vertical gates
declare -A CL_N_GATES
CL_N_GATES["1"]=770
CL_N_GATES["2"]=385
CL_N_GATES["3"]=1500
CL_N_GATES["4"]=770
CL_N_GATES["6"]=1540
# number of characters per gate
N_CHAR_GATES=5

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
159 160 161 162
#------------------------------------------------------------------------------
# verification des parametres
#------------------------------------------------------------------------------
if [[ $ERREUR != 0 ]]; then
163 164
  usage
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
165 166
fi

167
if [[ $fich_type != "SIRTA" && $fich_type != "MF" ]]; then
168
  echo "Le type de fichier doit etre SIRTA, MF"
169 170 171
  exit 1
fi

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
172
let n--
173 174 175 176 177 178 179 180 181 182
while [[ $n -ge 0 ]]; do
  if [[ -z ${liste_entree[n]} ]]; then
    consignerMsg "Il faut indiquer la liste des fichiers d'entree a traiter."
    exit 1
  fi
  if [[ ! -f ${liste_entree[n]} ]]; then
    consignerMsg "La liste de fichiers d'entree ${liste_entree[n]} est vide ou n'existe pas."
    exit 1
  fi
  let n--
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
183 184 185
done

if [[ -z $liste_sortie ]]; then
186 187
  consignerMsg "Il faut indiquer la liste des fichiers de sortie a creer."
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
188 189 190
fi

if [[ ! -f $liste_sortie || ! -s $liste_sortie ]]; then
191 192
  consignerMsg "La liste de fichiers de sortie $liste_sortie est vide ou n'existe pas."
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
193 194 195
fi

if [[ -z $REP_TRAVAIL ]]; then
196 197
  consignerMsg "Il faut indiquer un repertoire de travail."
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
198 199 200
fi

if [[ ! -d $REP_TRAVAIL ]]; then
201 202
  consignerMsg "Le repertoire de travail $REP_TRAVAIL n'existe pas."
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
203 204 205 206 207 208 209 210 211 212 213
fi

#------------------------------------------------------------------------------
#       Traitement
#------------------------------------------------------------------------------

# Recuperation des fichiers d entree radflux
# On verifie d'abord si le fichier 1s existe si il n'existe pas on cherche le 5s
# Si on n'en trouve aucun on quitte
#------------------------------------------------------------------------------
n=0
214
while read l; do
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
215 216
  fich_entree[n]=$l
  let n++
217
done <${liste_entree[0]}
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
218 219

# test pour savoir si fichier du jour disponible
220 221 222
if [[ ${#fich_entree[*]} -lt 2 ]]; then
  consignerMsg "Pas de fichier du jour a traiter"
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
223 224
fi

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
225
# if unzipping raw files is needed
226
#------------------------------------------------------------------------------
227
if [[ $UNZIP == 0 ]]; then
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
228
  input_files=("${fich_entree[@]}")
229
elif [[ $UNZIP == 1 ]]; then
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
230
  consignerMsg "Désarchivage de l'archive"
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
231 232 233 234
  # create tmp directory for data
  tmp_data=$(mktemp -d -p "$REP_TRAVAIL")

  # unzip input files in it
235
  for zip_file in "${fich_entree[@]}"; do
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
236 237 238 239 240 241 242
    unzip "$zip_file" -d "$tmp_data"
  done

  # put all unzipped files in array
  mapfile -t input_files < <(find "$tmp_data" -name "*.dat" | sort)
fi

243 244 245 246 247
# check format of data message
#------------------------------------------------------------------------------
# create temp directory for data
tmp_check=$(mktemp -d -p "$REP_TRAVAIL")

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
248
consignerMsg "Vérification des données brutes"
249 250
for file_ in "${input_files[@]}"; do

251 252 253 254 255
  # check if empty line in input list
  if [[ -z $file_ ]]; then
    continue
  fi

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
256 257
  tmp_file_=$(basename "$file_")
  cl31_cor="$tmp_check/${tmp_file_%.*}.cor"
258

259 260 261 262 263 264
  # get vertical resolution of data
  vertical_conf=$(sed -nr '0,/CL/s/.*CL.*([0-9]).*/\1/p' "$file_")
  n_gates=${CL_N_GATES[$vertical_conf]}
  prof_n_chars=$((n_gates * N_CHAR_GATES))
  prof_n_chars_p1=$((prof_n_chars + 1))

265 266
  consignerMsg "number of vertical gates: $n_gates"

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
267
  case $fich_type in
268
  "SIRTA")
269
    awk --posix -v cl31_cor="$cl31_cor" -v prof_n_chars="$prof_n_chars" -v prof_n_chars_p1="$prof_n_chars_p1" '\
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
270 271
      BEGIN {l=1;p=0;e=0;printf "" > cl31_cor}
      NR<3 {print $0 >> cl31_cor;next}
272 273 274
      l==1 {if ($0 ~ /^[[:cntrl:]]*$/ || $0 ~ "File") {next}}
      l==1 {if ($0 ~ /^-[0-9-]{10} [0-9:]{8}.?$/) {l++;bloc=$0;e=0;next} else if (e==1) {next} else e=1}
      l==2 {if ($0 ~ /^[\001]CL.{6}[\002].?$/) {l++;bloc=bloc"\n"$0;next} else e=1}
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
275 276 277
      l==3 {if (NF==5) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==4 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==5 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
278
      l==6 {if (length($0) == prof_n_chars || length($0) == prof_n_chars_p1) {l++;bloc=bloc"\n"$0;next} else e=1}
279
      l==7 {if ($0 ~ /^[\003][0-9a-z]{4}[\004].?$/) {p=1;bloc=bloc"\n"$0} else e=1}
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
280 281 282
      p==1 {printf bloc"\n" >> cl31_cor;l=1;p=0}
      e==1 {err++;print NR;l=1}
      END {if ($0 ~ "File") printf "\n%s\n",$0>>cl31_cor; if (err>0)print "err=",err}' "$file_"
283 284
    ;;
  "MF")
285
    awk --posix -v cl31_cor="$cl31_cor" -v prof_n_chars="$prof_n_chars" -v prof_n_chars_p1="$prof_n_chars_p1" '\
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
286 287 288
      BEGIN {l=1;p=0;e=0;printf "" > cl31_cor}
      l==1 {if ($0 ~ /^[\001]$/) {l++;bloc=$0;e=0;next} else if (e==1) {next} else e=1}
      l==2 {if ($0 ~ /^-[0-9-]{10} [0-9:]{8}$/) {l++;bloc=bloc"\n"$0;next} else e=1}
289
      l==3 {if ($0 ~ /^ CL.{6}[\002].$/) {l++;bloc=bloc"\n"$0;next} else e=1}
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
290 291 292
      l==4 {if (NF==5) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==5 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==6 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
293
      l==7 {if (length($0) == prof_n_chars || length($0) == prof_n_chars_p1) {l++;bloc=bloc"\n"$0;next} else e=1}
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
294 295 296 297
      l==8 {if ($0 ~ /^[\003][0-9a-z]{4}[\004].$/) {p=1;bloc=bloc"\n"$0} else e=1}
      p==1 {printf bloc"\n" >> cl31_cor;l=1;p=0}
      e==1 {err++;print NR;l=1}
      END {if ($0 ~ "File") printf "\n%s\n",$0>>cl31_cor; if (err>0)print "err=",err}' "$file_"
298
    ;;
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
299
  esac
300 301 302 303
done

mapfile -t input_files < <(find "$tmp_check" -name "*.cor" | sort)

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
304 305
# Recuperation des fichiers de sortie
#------------------------------------------------------------------------------
306
fich_sortie=$(cat "$liste_sortie")
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
307 308

# fichier temporaire
309
tmpfile=$(mktemp "$REP_TRAVAIL"/test_XXXXX.nc)
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
310 311 312

# conversion avec raw2l1
#------------------------------------------------------------------------------
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
313
cmd="$PYTHON $RAW2L1 '$date' $RAW2L1_CONF ${input_files[*]} $tmpfile -log $RAW2L1_LOGS -v info"
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
314 315 316

eval $cmd

317 318 319 320 321
if [[ $? == 0 ]]; then
  # suppression des donnees qui ne correspondent pas au jour
  #-------------------------------------------------------------------------
  date_as_days=$(bc -l <<<"$(date -u -d "$date" +%s)/86400")
  date_p1=$(bc -l <<<"($(date -u -d "$date" +%s)+86399)/86400")
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
322

323
  cmd="$NCKS -h -O -d time,${date_as_days},${date_p1} $tmpfile $fich_sortie"
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
324

325 326
  consignerMsg "suppression des données n'appartenant au jour traite"
  eval $cmd
327
else
328
  \rm "$tmpfile"
329

330 331 332
  if [[ $UNZIP == 1 ]]; then
    \rm -rf "$tmp_data"
  fi
333

334
  exit 1
335
fi
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
336

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
337 338
\rm "$tmpfile"
# if needed remove unzipped files
339
if [[ $UNZIP == 1 ]]; then
340
  \rm -rf "$tmp_data"
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
341
fi
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
342

343 344
\rm -rf "$tmp_check"

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
345
if (($? > 1)); then
346
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
347 348 349
fi

exit 0