run_raw2l1.sh 13.2 KB
Newer Older
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
#!/bin/bash

#==============================================================================
# moy1min.sh
#
#   Ce script sert à faire l'interface entre le traitement a qui calcule
# les moyennes 1 minutes des données radflux en zone 2 et le traitement b qui
# prend en charge le contrôle qualité des données.
#
#   Le traitement a en plus des moyennes 1 min calcule aussi la valeur minnimum
# et maximum utilisé pour calculer la moyenne et fourni l'écart-type
#
#   Le traitement b permet soit de faire un contrôle qualité automatique soit
# d'utiliser un fichier de contrôle qualité généré par un opérateur pour filtrer
# les données
#
# Parametres d'entree :
#----------------------
#   -h : Affiche l'aide
#   -v : Affiche la version du script
#   -d : Date a traiter (format AAAAMMJJ)
#   -e : Fichier contenant la liste des fichiers d'entree
#   -s : Fichier contenant la liste des fichiers de sortie
#   -c : Nom du fichier de configuration
#   -n : Niveau de deboggage
#   -t : Repertoire de travail
#
# Historique :
#-------------
#   20161206 : MAD SIRTA Creation v1.00
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
31
#   20170220 : MAD SIRTA add configuration for P7. use submodule for raw2l1
32
#            : v1.0.1 correct problem with path of configuration file
33
#            : v1.0.2 correct source for LISA configuration file
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
34
#   20170303 : v1.0.3 add material to process 3s SIRTA CL31 data
35
#            : v1.0.4 correct several bugs in 3s script and make 30s script more robust
36
#   20180523 : v1.0.5 use a more generic way to get the python interpreter
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
37
#   20180913 : v1.0.6 add configuration file for CEREA CL51
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
38
#   20190206 : v1.0.9 add configuration file for CEREA CL51 in jussieu
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
39 40 41 42 43 44 45 46 47
#
# SIRTA 2013
#==============================================================================

#==============================================================================
# usage
#
#   Cette fonction decrit l'utilisation et les parametres d'entree du script
#==============================================================================
48 49 50 51 52 53 54 55 56 57 58 59 60 61
function usage {
  echo -n "Utilisation de $NOM_PRGM : $NOM_PRGM [-h|-v] -d date -e liste_fich_entree "
  echo -n "[[-e liste_fich_basse_entree]...] -s liste_fich_sortie -t rep_travail "
  echo -n "-n niv_debogage"
  echo
  echo -e "  -d\tseules les donnees appartenant a cette date sont selectionnees,"
  echo -e "  \tle format de la date est du type aaaammjj"
  echo -e "  -e\tliste des fichiers niveau 1 5s ou 1s"
  echo -e "  -s\tliste des fichiers niveau 1 1min a creer"
  echo -e "  -n\tniveau de debogage (0 a 3)"
  echo -e "  -v\taffiche la version du programme"
  echo -e "  -c\tfichier de configuration"
  echo -e "  -h\taffiche cette aide"
  echo "Les fichiers a convertir doivent respecter la convention de nommage SIRTA."
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
62 63 64 65 66 67 68 69 70 71 72 73 74
}

#==============================================================================
# consignerMsg
#
#   Enregistre les messages dans un fichier de log et les affiche sur la sortie
# standard. La variable globale ENTETE_MSG peut etre initialisee avant l'appel.
# Le message n'est affiche que si son numero de debugage est inferieur ou egale
# a celui contenu dans la variable d'environnement DEBUG
# $1 : message
# $2 : niveau de debogage
#==============================================================================

75
function consignerMsg {
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110
  local heure=$(date +%d/%m/%Y,%H:%M:%S)
  local niv_deb=$2

  if [[ $# -gt 2 ]]; then
    consignerMsg "consignerMsg attend au maximum deux arguments"
    return 1
  fi
  [[ -z $niv_deb || $niv_deb -lt 0 ]] && niv_deb=0
  if [[ $niv_deb -le $DEBUG ]]; then
    if [[ -n "$ENTETE_MSG" ]]; then
      echo "$heure, $ENTETE_MSG : $1"
    else
      echo "$heure, $1"
    fi
  fi
}

################################################################################
#
#                           Debut du script
#
################################################################################

NOM_PRGM=$(basename $0)
ENTETE_MSG=$NOM_PRGM
ERREUR=0
DEBUG=0
VERSION=1
REP_SOURCES=$(dirname $(readlink -f $0))

n=0

#------------------------------------------------------------------------------
# Recupere les parametres de la lignes de commande
#------------------------------------------------------------------------------
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
111
UNZIP=0
112
while getopts :d:e:s:t:n:c:a:uhv option; do
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
113
  case $option in
114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131
  d) date="$OPTARG" ;;
  h)
    usage
    exit 0
    ;;
  v)
    echo $VERSION
    exit 0
    ;;
  e)
    liste_entree[n]="$OPTARG"
    let n++
    ;;
  s) liste_sortie=${OPTARG} ;;
  t) REP_TRAVAIL=${OPTARG} ;;
  n) DEBUG=${OPTARG} ;;
  c) fich_conf="$OPTARG" ;;
  u) UNZIP=1 ;;
132
  a) fich_type="$OPTARG" ;; # SIRTA ou MF (format change legerement selon le logiciel d'acquisition)
133 134 135
  # permet de sauter des options inconnues sans sortir de while
  ?) while [[ $OPTIND -le $# && ${!OPTIND:0:1} != '-' ]]; do OPTIND=$((OPTIND + 1)); done ;;
  *) ERREUR=1 ;;
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
136 137 138
  esac
done

139
# RAW2L1 needed path
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
140
PYTHON="/usr/bin/env python3"
141 142 143 144 145 146
RAW2L1=${REP_SOURCES}"/sirta-raw2l1/raw2l1/raw2l1.py"
RAW2L1_CONF=${REP_SOURCES}"/"$fich_conf
RAW2L1_LOGS=${REP_SOURCES}"/logs/raw2l1.log"

NCKS="/usr/bin/ncks"

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
147 148 149 150
#------------------------------------------------------------------------------
# verification des parametres
#------------------------------------------------------------------------------
if [[ $ERREUR != 0 ]]; then
151 152
  usage
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
153 154
fi

155
if [[ $fich_type != "SIRTA" && $fich_type != "MF" && $fich_type != "P7" && $fich_type != "ROISSY_5M_30S" && $fich_type != "ROISSY_10M_30S" ]]; then
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
156
  echo "Le type de fichier doit etre SIRTA, MF ou P7"
157 158 159
  exit 1
fi

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
160
let n--
161 162 163 164 165 166 167 168 169 170
while [[ $n -ge 0 ]]; do
  if [[ -z ${liste_entree[n]} ]]; then
    consignerMsg "Il faut indiquer la liste des fichiers d'entree a traiter."
    exit 1
  fi
  if [[ ! -f ${liste_entree[n]} ]]; then
    consignerMsg "La liste de fichiers d'entree ${liste_entree[n]} est vide ou n'existe pas."
    exit 1
  fi
  let n--
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
171 172 173
done

if [[ -z $liste_sortie ]]; then
174 175
  consignerMsg "Il faut indiquer la liste des fichiers de sortie a creer."
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
176 177 178
fi

if [[ ! -f $liste_sortie || ! -s $liste_sortie ]]; then
179 180
  consignerMsg "La liste de fichiers de sortie $liste_sortie est vide ou n'existe pas."
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
181 182 183
fi

if [[ -z $REP_TRAVAIL ]]; then
184 185
  consignerMsg "Il faut indiquer un repertoire de travail."
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
186 187 188
fi

if [[ ! -d $REP_TRAVAIL ]]; then
189 190
  consignerMsg "Le repertoire de travail $REP_TRAVAIL n'existe pas."
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
191 192 193 194 195 196 197 198 199 200 201
fi

#------------------------------------------------------------------------------
#       Traitement
#------------------------------------------------------------------------------

# Recuperation des fichiers d entree radflux
# On verifie d'abord si le fichier 1s existe si il n'existe pas on cherche le 5s
# Si on n'en trouve aucun on quitte
#------------------------------------------------------------------------------
n=0
202
while read l; do
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
203 204
  fich_entree[n]=$l
  let n++
205
done <${liste_entree[0]}
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
206 207

# test pour savoir si fichier du jour disponible
208 209 210
if [[ ${#fich_entree[*]} -lt 2 ]]; then
  consignerMsg "Pas de fichier du jour a traiter"
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
211 212
fi

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
213
# if unzipping raw files is needed
214
#------------------------------------------------------------------------------
215
if [[ $UNZIP == 0 ]]; then
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
216
  input_files=("${fich_entree[@]}")
217
elif [[ $UNZIP == 1 ]]; then
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
218
  consignerMsg "Désarchivage de l'archive"
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
219 220 221 222
  # create tmp directory for data
  tmp_data=$(mktemp -d -p "$REP_TRAVAIL")

  # unzip input files in it
223
  for zip_file in "${fich_entree[@]}"; do
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
224 225 226 227 228 229 230
    unzip "$zip_file" -d "$tmp_data"
  done

  # put all unzipped files in array
  mapfile -t input_files < <(find "$tmp_data" -name "*.dat" | sort)
fi

231 232 233 234 235
# check format of data message
#------------------------------------------------------------------------------
# create temp directory for data
tmp_check=$(mktemp -d -p "$REP_TRAVAIL")

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
236
consignerMsg "Vérification des données brutes"
237 238
for file_ in "${input_files[@]}"; do

239 240 241 242 243
  # check if empty line in input list
  if [[ -z $file_ ]]; then
    continue
  fi

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
244 245
  tmp_file_=$(basename "$file_")
  cl31_cor="$tmp_check/${tmp_file_%.*}.cor"
246

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
247
  case $fich_type in
248 249
  "SIRTA")
    awk --posix -v cl31_cor="$cl31_cor" '\
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
250 251 252 253 254 255 256 257 258 259 260 261
      BEGIN {l=1;p=0;e=0;printf "" > cl31_cor}
      NR<3 {print $0 >> cl31_cor;next}
      l==1 {if ($0 ~ /^-[0-9-]{10} [0-9:]{8}.$/) {l++;bloc=$0;e=0;next} else if (e==1) {next} else e=1}
      l==2 {if ($0 ~ /^[\001]CL020521[\002].$/) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==3 {if (NF==5) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==4 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==5 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==6 {if (length($0) == 3851) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==7 {if ($0 ~ /^[\003][0-9a-z]{4}[\004].$/) {p=1;bloc=bloc"\n"$0} else e=1}
      p==1 {printf bloc"\n" >> cl31_cor;l=1;p=0}
      e==1 {err++;print NR;l=1}
      END {if ($0 ~ "File") printf "\n%s\n",$0>>cl31_cor; if (err>0)print "err=",err}' "$file_"
262 263 264
    ;;
  "MF")
    awk --posix -v cl31_cor="$cl31_cor" '\
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
265 266 267 268 269 270 271 272 273 274 275 276
      BEGIN {l=1;p=0;e=0;printf "" > cl31_cor}
      l==1 {if ($0 ~ /^[\001]$/) {l++;bloc=$0;e=0;next} else if (e==1) {next} else e=1}
      l==2 {if ($0 ~ /^-[0-9-]{10} [0-9:]{8}$/) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==3 {if ($0 ~ /^ CL120521[\002].$/) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==4 {if (NF==5) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==5 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==6 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==7 {if (length($0) == 3851) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==8 {if ($0 ~ /^[\003][0-9a-z]{4}[\004].$/) {p=1;bloc=bloc"\n"$0} else e=1}
      p==1 {printf bloc"\n" >> cl31_cor;l=1;p=0}
      e==1 {err++;print NR;l=1}
      END {if ($0 ~ "File") printf "\n%s\n",$0>>cl31_cor; if (err>0)print "err=",err}' "$file_"
277 278 279
    ;;
  "P7")
    awk --posix -v cl31_cor="$cl31_cor" '\
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
280 281 282 283 284 285 286 287 288 289 290 291
      BEGIN {l=1;p=0;e=0;printf "" > cl31_cor}
      NR<3 {print $0 >> cl31_cor;next}
      l==1 {if ($0 ~ /^-[0-9-]{10} [0-9:]{8}.$/) {l++;bloc=$0;e=0;next} else if (e==1) {next} else e=1}
      l==2 {if ($0 ~ /^[\001]CL020123[\002].$/) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==3 {if (NF==5) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==4 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==5 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==6 {if (length($0) == 7501) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==7 {if ($0 ~ /^[\003][0-9a-z]{4}[\004].$/) {p=1;bloc=bloc"\n"$0} else e=1}
      p==1 {printf bloc"\n" >> cl31_cor;l=1;p=0}
      e==1 {err++;print NR;l=1}
      END {if ($0 ~ "File") printf "\n%s\n",$0>>cl31_cor; if (err>0)print "err=",err}' "$file_"
292
    ;;
293 294 295 296 297 298 299 300 301 302 303 304 305 306 307
  "ROISSY_5M_30S")
    awk --posix -v cl31_cor="$cl31_cor" '\
      BEGIN {l=1;p=0;e=0;printf "" > cl31_cor}
      NR<3 {print $0 >> cl31_cor;next}
      l==1 {if ($0 ~ /^-[0-9-]{10} [0-9:]{8}$/) {l++;bloc=$0;e=0;next} else if (e==1) {next} else e=1; printf "%s\n", $0}
      l==2 {if ($0 ~ /^[\001]CL220123[\002]$/) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==3 {if (NF==5) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==4 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==5 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==6 {if (length($0) == 7500) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==7 {if ($0 ~ /^[\003][0-9a-z]{4}[\004]$/) {p=1;bloc=bloc"\n"$0} else e=1}
      p==1 {printf bloc"\n" >> cl31_cor;l=1;p=0}
      e==1 {err++;print NR;l=1}
      END {if ($0 ~ "File") printf "\n%s\n",$0>>cl31_cor; if (err>0)print "err=",err}' "$file_"
    ;;
308 309 310 311 312 313 314 315 316 317 318 319 320 321 322
  "ROISSY_10M_30S")
    awk --posix -v cl31_cor="$cl31_cor" '\
      BEGIN {l=1;p=0;e=0;printf "" > cl31_cor}
      NR<3 {print $0 >> cl31_cor;next}
      l==1 {if ($0 ~ /^-[0-9-]{10} [0-9:]{8}$/) {l++;bloc=$0;e=0;next} else if (e==1) {next} else e=1; printf "%s\n", $0}
      l==2 {if ($0 ~ /^[\001]CL220521[\002]$/) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==3 {if (NF==5) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==4 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==5 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==6 {if (length($0) == 3850) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==7 {if ($0 ~ /^[\003][0-9a-z]{4}[\004]$/) {p=1;bloc=bloc"\n"$0} else e=1}
      p==1 {printf bloc"\n" >> cl31_cor;l=1;p=0}
      e==1 {err++;print NR;l=1}
      END {if ($0 ~ "File") printf "\n%s\n",$0>>cl31_cor; if (err>0)print "err=",err}' "$file_"
    ;;
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
323
  esac
324 325 326 327
done

mapfile -t input_files < <(find "$tmp_check" -name "*.cor" | sort)

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
328 329
# Recuperation des fichiers de sortie
#------------------------------------------------------------------------------
330
fich_sortie=$(cat "$liste_sortie")
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
331 332

# fichier temporaire
333
tmpfile=$(mktemp "$REP_TRAVAIL"/test_XXXXX.nc)
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
334 335 336

# conversion avec raw2l1
#------------------------------------------------------------------------------
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
337
cmd="$PYTHON $RAW2L1 '$date' $RAW2L1_CONF ${input_files[*]} $tmpfile -log $RAW2L1_LOGS -v info"
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
338 339 340

eval $cmd

341 342 343 344 345
if [[ $? == 0 ]]; then
  # suppression des donnees qui ne correspondent pas au jour
  #-------------------------------------------------------------------------
  date_as_days=$(bc -l <<<"$(date -u -d "$date" +%s)/86400")
  date_p1=$(bc -l <<<"($(date -u -d "$date" +%s)+86399)/86400")
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
346

347
  cmd="$NCKS -h -O -d time,${date_as_days},${date_p1} $tmpfile $fich_sortie"
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
348

349 350
  consignerMsg "suppression des données n'appartenant au jour traite"
  eval $cmd
351
else
352
  \rm "$tmpfile"
353

354 355 356
  if [[ $UNZIP == 1 ]]; then
    \rm -rf "$tmp_data"
  fi
357

358
  exit 1
359
fi
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
360

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
361 362
\rm "$tmpfile"
# if needed remove unzipped files
363
if [[ $UNZIP == 1 ]]; then
364
  \rm -rf "$tmp_data"
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
365
fi
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
366

367 368
\rm -rf "$tmp_check"

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
369
if (($? > 1)); then
370
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
371 372 373
fi

exit 0