run_raw2l1.sh 12.3 KB
Newer Older
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
#!/bin/bash

#==============================================================================
# moy1min.sh
#
#   Ce script sert à faire l'interface entre le traitement a qui calcule
# les moyennes 1 minutes des données radflux en zone 2 et le traitement b qui
# prend en charge le contrôle qualité des données.
#
#   Le traitement a en plus des moyennes 1 min calcule aussi la valeur minnimum
# et maximum utilisé pour calculer la moyenne et fourni l'écart-type
#
#   Le traitement b permet soit de faire un contrôle qualité automatique soit
# d'utiliser un fichier de contrôle qualité généré par un opérateur pour filtrer
# les données
#
# Parametres d'entree :
#----------------------
#   -h : Affiche l'aide
#   -v : Affiche la version du script
#   -d : Date a traiter (format AAAAMMJJ)
#   -e : Fichier contenant la liste des fichiers d'entree
#   -s : Fichier contenant la liste des fichiers de sortie
#   -c : Nom du fichier de configuration
#   -n : Niveau de deboggage
#   -t : Repertoire de travail
#
# Historique :
#-------------
#   20161206 : MAD SIRTA Creation v1.00
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
31
#   20170220 : MAD SIRTA add configuration for P7. use submodule for raw2l1
32
#            : v1.0.1 correct problem with path of configuration file
33
#            : v1.0.2 correct source for LISA configuration file
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
34
#   20170303 : v1.0.3 add material to process 3s SIRTA CL31 data
35
#            : v1.0.4 correct several bugs in 3s script and make 30s script more robust
36
#   20180523 : v1.0.5 use a more generic way to get the python interpreter
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
37
#   20180913 : v1.0.6 add configuration file for CEREA CL51
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
38
#   20190206 : v1.0.9 add configuration file for CEREA CL51 in jussieu
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
39 40 41 42 43 44 45 46 47
#
# SIRTA 2013
#==============================================================================

#==============================================================================
# usage
#
#   Cette fonction decrit l'utilisation et les parametres d'entree du script
#==============================================================================
48 49 50 51 52 53 54 55 56 57 58 59 60 61
function usage {
  echo -n "Utilisation de $NOM_PRGM : $NOM_PRGM [-h|-v] -d date -e liste_fich_entree "
  echo -n "[[-e liste_fich_basse_entree]...] -s liste_fich_sortie -t rep_travail "
  echo -n "-n niv_debogage"
  echo
  echo -e "  -d\tseules les donnees appartenant a cette date sont selectionnees,"
  echo -e "  \tle format de la date est du type aaaammjj"
  echo -e "  -e\tliste des fichiers niveau 1 5s ou 1s"
  echo -e "  -s\tliste des fichiers niveau 1 1min a creer"
  echo -e "  -n\tniveau de debogage (0 a 3)"
  echo -e "  -v\taffiche la version du programme"
  echo -e "  -c\tfichier de configuration"
  echo -e "  -h\taffiche cette aide"
  echo "Les fichiers a convertir doivent respecter la convention de nommage SIRTA."
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
62 63 64 65 66 67 68 69 70 71 72 73 74
}

#==============================================================================
# consignerMsg
#
#   Enregistre les messages dans un fichier de log et les affiche sur la sortie
# standard. La variable globale ENTETE_MSG peut etre initialisee avant l'appel.
# Le message n'est affiche que si son numero de debugage est inferieur ou egale
# a celui contenu dans la variable d'environnement DEBUG
# $1 : message
# $2 : niveau de debogage
#==============================================================================

75
function consignerMsg {
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110
  local heure=$(date +%d/%m/%Y,%H:%M:%S)
  local niv_deb=$2

  if [[ $# -gt 2 ]]; then
    consignerMsg "consignerMsg attend au maximum deux arguments"
    return 1
  fi
  [[ -z $niv_deb || $niv_deb -lt 0 ]] && niv_deb=0
  if [[ $niv_deb -le $DEBUG ]]; then
    if [[ -n "$ENTETE_MSG" ]]; then
      echo "$heure, $ENTETE_MSG : $1"
    else
      echo "$heure, $1"
    fi
  fi
}

################################################################################
#
#                           Debut du script
#
################################################################################

NOM_PRGM=$(basename $0)
ENTETE_MSG=$NOM_PRGM
ERREUR=0
DEBUG=0
VERSION=1
REP_SOURCES=$(dirname $(readlink -f $0))

n=0

#------------------------------------------------------------------------------
# Recupere les parametres de la lignes de commande
#------------------------------------------------------------------------------
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
111
UNZIP=0
112
while getopts :d:e:s:t:n:c:a:uhv option; do
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
113
  case $option in
114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131
  d) date="$OPTARG" ;;
  h)
    usage
    exit 0
    ;;
  v)
    echo $VERSION
    exit 0
    ;;
  e)
    liste_entree[n]="$OPTARG"
    let n++
    ;;
  s) liste_sortie=${OPTARG} ;;
  t) REP_TRAVAIL=${OPTARG} ;;
  n) DEBUG=${OPTARG} ;;
  c) fich_conf="$OPTARG" ;;
  u) UNZIP=1 ;;
132
  a) fich_type="$OPTARG" ;; # SIRTA ou MF (format change legerement selon le logiciel d'acquisition)
133 134 135
  # permet de sauter des options inconnues sans sortir de while
  ?) while [[ $OPTIND -le $# && ${!OPTIND:0:1} != '-' ]]; do OPTIND=$((OPTIND + 1)); done ;;
  *) ERREUR=1 ;;
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
136 137 138
  esac
done

139
# RAW2L1 needed path
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
140
PYTHON="/usr/bin/env python3"
141 142 143 144 145 146
RAW2L1=${REP_SOURCES}"/sirta-raw2l1/raw2l1/raw2l1.py"
RAW2L1_CONF=${REP_SOURCES}"/"$fich_conf
RAW2L1_LOGS=${REP_SOURCES}"/logs/raw2l1.log"

NCKS="/usr/bin/ncks"

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
147 148 149 150
#------------------------------------------------------------------------------
# verification des parametres
#------------------------------------------------------------------------------
if [[ $ERREUR != 0 ]]; then
151 152
  usage
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
153 154
fi

155
if [[ $fich_type != "SIRTA" && $fich_type != "MF" && $fich_type != "P7" && $fich_type != "ROISSY_5M_30S" ]]; then
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
156
  echo "Le type de fichier doit etre SIRTA, MF ou P7"
157 158 159
  exit 1
fi

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
160
let n--
161 162 163 164 165 166 167 168 169 170
while [[ $n -ge 0 ]]; do
  if [[ -z ${liste_entree[n]} ]]; then
    consignerMsg "Il faut indiquer la liste des fichiers d'entree a traiter."
    exit 1
  fi
  if [[ ! -f ${liste_entree[n]} ]]; then
    consignerMsg "La liste de fichiers d'entree ${liste_entree[n]} est vide ou n'existe pas."
    exit 1
  fi
  let n--
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
171 172 173
done

if [[ -z $liste_sortie ]]; then
174 175
  consignerMsg "Il faut indiquer la liste des fichiers de sortie a creer."
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
176 177 178
fi

if [[ ! -f $liste_sortie || ! -s $liste_sortie ]]; then
179 180
  consignerMsg "La liste de fichiers de sortie $liste_sortie est vide ou n'existe pas."
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
181 182 183
fi

if [[ -z $REP_TRAVAIL ]]; then
184 185
  consignerMsg "Il faut indiquer un repertoire de travail."
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
186 187 188
fi

if [[ ! -d $REP_TRAVAIL ]]; then
189 190
  consignerMsg "Le repertoire de travail $REP_TRAVAIL n'existe pas."
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
191 192 193 194 195 196 197 198 199 200 201
fi

#------------------------------------------------------------------------------
#       Traitement
#------------------------------------------------------------------------------

# Recuperation des fichiers d entree radflux
# On verifie d'abord si le fichier 1s existe si il n'existe pas on cherche le 5s
# Si on n'en trouve aucun on quitte
#------------------------------------------------------------------------------
n=0
202
while read l; do
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
203 204
  fich_entree[n]=$l
  let n++
205
done <${liste_entree[0]}
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
206 207

# test pour savoir si fichier du jour disponible
208 209 210
if [[ ${#fich_entree[*]} -lt 2 ]]; then
  consignerMsg "Pas de fichier du jour a traiter"
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
211 212
fi

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
213
# if unzipping raw files is needed
214
#------------------------------------------------------------------------------
215
if [[ $UNZIP == 0 ]]; then
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
216
  input_files=("${fich_entree[@]}")
217
elif [[ $UNZIP == 1 ]]; then
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
218
  consignerMsg "Désarchivage de l'archive"
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
219 220 221 222
  # create tmp directory for data
  tmp_data=$(mktemp -d -p "$REP_TRAVAIL")

  # unzip input files in it
223
  for zip_file in "${fich_entree[@]}"; do
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
224 225 226 227 228 229 230
    unzip "$zip_file" -d "$tmp_data"
  done

  # put all unzipped files in array
  mapfile -t input_files < <(find "$tmp_data" -name "*.dat" | sort)
fi

231 232 233 234 235
# check format of data message
#------------------------------------------------------------------------------
# create temp directory for data
tmp_check=$(mktemp -d -p "$REP_TRAVAIL")

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
236
consignerMsg "Vérification des données brutes"
237 238
for file_ in "${input_files[@]}"; do

239 240 241 242 243
  # check if empty line in input list
  if [[ -z $file_ ]]; then
    continue
  fi

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
244 245
  tmp_file_=$(basename "$file_")
  cl31_cor="$tmp_check/${tmp_file_%.*}.cor"
246

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
247
  case $fich_type in
248 249
  "SIRTA")
    awk --posix -v cl31_cor="$cl31_cor" '\
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
250 251 252 253 254 255 256 257 258 259 260 261
      BEGIN {l=1;p=0;e=0;printf "" > cl31_cor}
      NR<3 {print $0 >> cl31_cor;next}
      l==1 {if ($0 ~ /^-[0-9-]{10} [0-9:]{8}.$/) {l++;bloc=$0;e=0;next} else if (e==1) {next} else e=1}
      l==2 {if ($0 ~ /^[\001]CL020521[\002].$/) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==3 {if (NF==5) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==4 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==5 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==6 {if (length($0) == 3851) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==7 {if ($0 ~ /^[\003][0-9a-z]{4}[\004].$/) {p=1;bloc=bloc"\n"$0} else e=1}
      p==1 {printf bloc"\n" >> cl31_cor;l=1;p=0}
      e==1 {err++;print NR;l=1}
      END {if ($0 ~ "File") printf "\n%s\n",$0>>cl31_cor; if (err>0)print "err=",err}' "$file_"
262 263 264
    ;;
  "MF")
    awk --posix -v cl31_cor="$cl31_cor" '\
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
265 266 267 268 269 270 271 272 273 274 275 276
      BEGIN {l=1;p=0;e=0;printf "" > cl31_cor}
      l==1 {if ($0 ~ /^[\001]$/) {l++;bloc=$0;e=0;next} else if (e==1) {next} else e=1}
      l==2 {if ($0 ~ /^-[0-9-]{10} [0-9:]{8}$/) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==3 {if ($0 ~ /^ CL120521[\002].$/) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==4 {if (NF==5) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==5 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==6 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==7 {if (length($0) == 3851) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==8 {if ($0 ~ /^[\003][0-9a-z]{4}[\004].$/) {p=1;bloc=bloc"\n"$0} else e=1}
      p==1 {printf bloc"\n" >> cl31_cor;l=1;p=0}
      e==1 {err++;print NR;l=1}
      END {if ($0 ~ "File") printf "\n%s\n",$0>>cl31_cor; if (err>0)print "err=",err}' "$file_"
277 278 279
    ;;
  "P7")
    awk --posix -v cl31_cor="$cl31_cor" '\
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
280 281 282 283 284 285 286 287 288 289 290 291
      BEGIN {l=1;p=0;e=0;printf "" > cl31_cor}
      NR<3 {print $0 >> cl31_cor;next}
      l==1 {if ($0 ~ /^-[0-9-]{10} [0-9:]{8}.$/) {l++;bloc=$0;e=0;next} else if (e==1) {next} else e=1}
      l==2 {if ($0 ~ /^[\001]CL020123[\002].$/) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==3 {if (NF==5) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==4 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==5 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==6 {if (length($0) == 7501) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==7 {if ($0 ~ /^[\003][0-9a-z]{4}[\004].$/) {p=1;bloc=bloc"\n"$0} else e=1}
      p==1 {printf bloc"\n" >> cl31_cor;l=1;p=0}
      e==1 {err++;print NR;l=1}
      END {if ($0 ~ "File") printf "\n%s\n",$0>>cl31_cor; if (err>0)print "err=",err}' "$file_"
292
    ;;
293 294 295 296 297 298 299 300 301 302 303 304 305 306 307
  "ROISSY_5M_30S")
    awk --posix -v cl31_cor="$cl31_cor" '\
      BEGIN {l=1;p=0;e=0;printf "" > cl31_cor}
      NR<3 {print $0 >> cl31_cor;next}
      l==1 {if ($0 ~ /^-[0-9-]{10} [0-9:]{8}$/) {l++;bloc=$0;e=0;next} else if (e==1) {next} else e=1; printf "%s\n", $0}
      l==2 {if ($0 ~ /^[\001]CL220123[\002]$/) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==3 {if (NF==5) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==4 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==5 {if (NF==10) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==6 {if (length($0) == 7500) {l++;bloc=bloc"\n"$0;next} else e=1}
      l==7 {if ($0 ~ /^[\003][0-9a-z]{4}[\004]$/) {p=1;bloc=bloc"\n"$0} else e=1}
      p==1 {printf bloc"\n" >> cl31_cor;l=1;p=0}
      e==1 {err++;print NR;l=1}
      END {if ($0 ~ "File") printf "\n%s\n",$0>>cl31_cor; if (err>0)print "err=",err}' "$file_"
    ;;
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
308
  esac
309 310 311 312
done

mapfile -t input_files < <(find "$tmp_check" -name "*.cor" | sort)

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
313 314
# Recuperation des fichiers de sortie
#------------------------------------------------------------------------------
315
fich_sortie=$(cat "$liste_sortie")
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
316 317

# fichier temporaire
318
tmpfile=$(mktemp "$REP_TRAVAIL"/test_XXXXX.nc)
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
319 320 321

# conversion avec raw2l1
#------------------------------------------------------------------------------
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
322
cmd="$PYTHON $RAW2L1 '$date' $RAW2L1_CONF ${input_files[*]} $tmpfile -log $RAW2L1_LOGS -v info"
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
323 324 325

eval $cmd

326 327 328 329 330
if [[ $? == 0 ]]; then
  # suppression des donnees qui ne correspondent pas au jour
  #-------------------------------------------------------------------------
  date_as_days=$(bc -l <<<"$(date -u -d "$date" +%s)/86400")
  date_p1=$(bc -l <<<"($(date -u -d "$date" +%s)+86399)/86400")
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
331

332
  cmd="$NCKS -h -O -d time,${date_as_days},${date_p1} $tmpfile $fich_sortie"
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
333

334 335
  consignerMsg "suppression des données n'appartenant au jour traite"
  eval $cmd
336
else
337
  \rm "$tmpfile"
338

339 340 341
  if [[ $UNZIP == 1 ]]; then
    \rm -rf "$tmp_data"
  fi
342

343
  exit 1
344
fi
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
345

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
346 347
\rm "$tmpfile"
# if needed remove unzipped files
348
if [[ $UNZIP == 1 ]]; then
349
  \rm -rf "$tmp_data"
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
350
fi
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
351

352 353
\rm -rf "$tmp_check"

Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
354
if (($? > 1)); then
355
  exit 1
Marc-Antoine Drouin's avatar
Marc-Antoine Drouin committed
356 357 358
fi

exit 0