From 19c2ecb69ad9e30ec695c285d18017e6172a86a7 Mon Sep 17 00:00:00 2001
From: Lionel GUEZ <guez@lmd.ens.fr>
Date: Thu, 1 Jul 2021 10:57:10 +0200
Subject: [PATCH] Remove documentation on interpolated eddies

---
 .../Documentation_texfol/documentation.tex    |  10 +-
 .../Documentation_texfol/documentation.tex    | 148 ++----------------
 2 files changed, 19 insertions(+), 139 deletions(-)

diff --git a/Inst_eddies/Documentation_texfol/documentation.tex b/Inst_eddies/Documentation_texfol/documentation.tex
index 7c4c516d..9eb0fe48 100644
--- a/Inst_eddies/Documentation_texfol/documentation.tex
+++ b/Inst_eddies/Documentation_texfol/documentation.tex
@@ -432,9 +432,8 @@ Format shapefile. Un type de gÃ©omÃ©trie par fichier donc il faut
 sÃ©parer les contours et les positions des extremums.
 \begin{itemize}
 \item \verb+extremum.shp+ : points
-\item \verb+extremum.dbf+
-  : valeur de SSH, indice de date, indice de tourbillon Ã  cette date,
-  interpolÃ© (logique), cyclone (logique), valid (logique), valeur
+\item \verb+extremum.dbf+ : valeur de SSH, indice de date, indice de
+  tourbillon Ã  cette date, cyclone (logique), valid (logique), valeur
   de vitesse sur le contour de vitesse maximale
 \item \verb+outermost_contour.shp+ : polygones
 \item \verb+outermost_contour.dbf+ : aire, valeur de SSH, indice de
@@ -479,9 +478,8 @@ Pour un extremum donnÃ©, radius4 est le rayon, en pas de grille, de la
 plus petite croix autour de l'extremum qui dÃ©borde le contour
 extÃ©rieur. Si un contour extÃ©rieur valide n'a pas Ã©tÃ© trouvÃ© alors
 radius4 est nul. Si un contour extÃ©rieur valide a Ã©tÃ© trouvÃ© alors
-radius4 est $\ge 1$. Les champs interpolated et radius4 sont Ã©crits Ã 
-titre diagnostique et ne sont pas utilisÃ©s dans le programme de
-recouvrement.
+radius4 est $\ge 1$. Le champ radius4 est Ã©crit Ã  titre diagnostique
+et n'est pas utilisÃ© dans le programme de recouvrement.
 
 J'avais d'abord mis la valeur de vitesse dans le fichier
 \verb+max_speed_contour_$m.dbf+ mais cette vitesse peut Ãªtre associÃ©e
diff --git a/Overlap/Documentation_texfol/documentation.tex b/Overlap/Documentation_texfol/documentation.tex
index 5ec0729a..3a18fa97 100644
--- a/Overlap/Documentation_texfol/documentation.tex
+++ b/Overlap/Documentation_texfol/documentation.tex
@@ -81,9 +81,6 @@ Notons ici $k_b$, $k_e$, $\max \delta$ et $n_p$ les valeurs contenues
 dans les variables Fortran \verb+k_begin+, \verb+k_end+,
 \verb+max_delta+ et \verb+n_proc+ respectivement.
 
-On ne cherche des superpositions qu'entres tourbillons visibles, en
-excluant les tourbillons interpolÃ©s.
-
 Pour comparer les tourbillons Ã  deux dates, il semble coÃ»teux de
 n'utiliser que les listes de tourbillons aux deux dates. Cela implique
 une double boucle sur les listes de tourbillons, Ã  l'intÃ©rieur d'une
@@ -142,16 +139,15 @@ commentaires sur overlap.
 Lorsqu'on compare des tourbillons Ã  distance temporelle delta (entre 1
 et $\max \delta$), on veut tester s'ils n'ont pas de prÃ©dÃ©cesseur ou
 successeur visible Ã  une date intermÃ©diaire. Il faut donc, si on crÃ©e
-un arc entre deux dates successives, ou delta arcs Ã  distance delta
-(par interpolation de tourbillons invisibles), enregistrer ce fait en
-prÃ©vision du passage au delta supÃ©rieur. Mais d'un autre cÃ´tÃ©, on ne
-veut pas que le fait de mettre des arcs Ã  l'Ã©tape delta ait une
-importance pour la suite de l'Ã©tape delta. (Et accessoirement, on ne
-veut pas que l'ordre dans lequel on passe les tourbillons Ã  l'Ã©tape
-delta ait une importance.)  On est donc obligÃ© d'enregistrer, pour
-chaque tourbillon, non seulement s'il a des prÃ©dÃ©cesseurs visibles et
-s'il a des successeurs visibles, mais aussi Ã  quelle distance
-temporelle.
+un arc entre deux dates successives, ou un arc Ã  distance delta,
+enregistrer ce fait en prÃ©vision du passage au delta supÃ©rieur. Mais
+d'un autre cÃ´tÃ©, on ne veut pas que le fait de mettre des arcs Ã 
+l'Ã©tape delta ait une importance pour la suite de l'Ã©tape delta. (Et
+accessoirement, on ne veut pas que l'ordre dans lequel on passe les
+tourbillons Ã  l'Ã©tape delta ait une importance.)  On est donc obligÃ©
+d'enregistrer, pour chaque tourbillon, non seulement s'il a des
+prÃ©dÃ©cesseurs visibles et s'il a des successeurs visibles, mais aussi
+Ã  quelle distance temporelle.
 
 $m$ est le numÃ©ro du processus MPI, compris entre 0 et $n_p - 1$. On
 pourrait Ã©crire l'algorithme principal en explicitant les
@@ -179,15 +175,7 @@ Dans le programme de recouvrement, idÃ©e d'admettre des tourbillons
 dont les numÃ©ros Ã  une date donnÃ©e n'iraient pas forcÃ©ment de 1 au
 nombre de tourbillons visibles. L'intÃ©rÃªt serait de pouvoir traiter
 des domaines extraits d'un snapshot global. il faudrait ajouter une
-composante identifiant au type eddy, remplacer la composante
-\verb+number_eddies+ du type snapshot par une composante
-\verb+number_interp_eddies+ et passer :
-\begin{verbatim}
-- flow(j - delta + 1:j - 1)%number_interp_eddies
-\end{verbatim}
-au lieu de \verb|flow(j - delta + 1:j - 1)%number_eddies| Ã 
-\verb+write_overlap+ pour que les
-numÃ©ros de tourbillons interpolÃ©s soient nÃ©gatifs.
+composante identifiant au type eddy.
 
 Optimisation. Les send doivent-ils Ãªtre bloquants ? Les recv ? Ne pas
 utiliser bsend. L'algorithme ne permet pas isend ni irecv. Penser Ã 
@@ -195,44 +183,6 @@ utiliser bsend. L'algorithme ne permet pas isend ni irecv. Penser Ã 
 
 \section{EntrÃ©es et sorties}
 
-On pourrait crÃ©er un shapefile sÃ©parÃ© pour les extremums interpolÃ©s
-(points), avec des mÃ©ta-donnÃ©es supplÃ©mentaires sur les contours
-fictifs associÃ©s. En notant $m$ le numÃ©ro de processus MPI :
-\begin{itemize}
-\item \verb+extremum_interpolated_$m.shp+ : points
-\item \verb+extremum_interpolated_$m.dbf+ : valeur de SSH Ã  l'extremum,
-  indice de date, indice de tourbillon Ã  cette date, aire du contour
-  de SSH le plus Ã©loignÃ©, valeur de SSH sur le contour de SSH le plus
-  Ã©loignÃ©, aire du contour de vitesse maximale, valeur de vitesse sur
-  le contour de vitesse maximale
-\end{itemize}
-Mais il me semble plus simple et clair d'Ã©crire les tourbillons
-interpolÃ©s avec les autres, en utilisant une forme NULL pour le
-polygone correspondant Ã  un contour interpolÃ©.
-
-On n'enregistre pas de contours pour les tourbillons interpolÃ©s. Les
-tourbillons interpolÃ©s sont Ã©crits avec les autres, en utilisant une
-forme NULL pour le polygone correspondant Ã  un contour interpolÃ©. Un
-processus donnÃ©, dans plusieurs appels Ã  overlap, peut interpoler des
-extremums Ã  une mÃªme date. Donc, dans le shapefile \verb+extremum+
-Ã©crit par un processus donnÃ©, les dates sont dans le dÃ©sordre. En
-outre, deux processus peuvent interpoler des extremums Ã  une mÃªme
-date. Il sera certainement utile de concatÃ©ner et trier les shapefiles
-en post-traitement. Pour trier, je ne suis pas obligÃ© de charger en
-mÃ©moire vive tous les shapefiles : je peux simplement faire la
-concatÃ©nation puis lire dans \verb+extremum.dbf+ par exemple deux suites
-d'entiers \verb+date_index+ et \verb+eddy_index+.
-
-Un processus donnÃ© alterne lecture de shapefiles (crÃ©Ã©s par
-extraction\_eddies) et Ã©criture de shapefiles (contenant les
-tourbillons interpolÃ©s). Un processus donnÃ© doit donc manipuler deux
-jeux de pointeurs de shapefiles. On peut Ã©ventuellement supposer que
-les numÃ©ros de champs sont les mÃªmes pour les deux jeux de shapefiles.
-
-La mÃ©ta-donnÃ©e logique \og interpolÃ© \fg{} dans
-\verb+extremum_$m.dbf+ est nÃ©cessaire parce qu'il est possible de ne
-pas trouver de contour extÃ©rieur autour d'un extremum dÃ©tectÃ©.
-
 Une possibilitÃ© simple de stockage de graphe est la liste d'adjacences
 (en texte), c'est-Ã -dire, pour chaque sommet du graphe, une ligne :
 \begin{verbatim}
@@ -270,12 +220,10 @@ facilement trouvÃ©e. On ajoute par consÃ©quent les fichiers de sortie
 suivants :
 \begin{description}
 \item[number\_eddies\_\$m.csv] Une colonne indice de date, une colonne
-  nombre de tourbillons visibles, une colonne nombre de tourbillons
-  interpolÃ©s.
-\item[isolated\_nodes\_\$m.txt] Sur chaque ligne : indice de date, indice
-  de tourbillon. Peut Ãªtre lu comme une simple liste
-  d'adjacence. Remarque : par construction, les tourbillons interpolÃ©s
-  ne sont jamais isolÃ©s.
+  nombre de tourbillons visibles.
+\item[isolated\_nodes\_\$m.txt] Sur chaque ligne : indice de date,
+  indice de tourbillon. Peut Ãªtre lu comme une simple liste
+  d'adjacence.
 \end{description}
 
 Les entrÃ©es-sorties sont dans : l'algorithme principal directement
@@ -329,11 +277,6 @@ par \verb+overlap+.
 \item[weight\_delta] Scalaire rÃ©el.
 \end{description}
 
-On doit stocker dans le champ number\_eddies le nombre de tourbillons
-parce qu'on peut refaire des interpolations Ã  une mÃªme date dans
-diffÃ©rents appels Ã  overlap avec delta $\ge 2$ : il faut que le numÃ©ro
-de tourbillon interpolÃ© soit bien incrÃ©mentÃ©.
-
 i dÃ©signe un indice de tourbillon, j un indice de position dans la
 fenÃªtre temporelle (entre 1 et $\max \delta$ + 1) et k un indice de
 date. Cf. figure (\ref{fig:window}) et algorithme
@@ -736,54 +679,6 @@ $(k, \delta_1, m_1)$ est terminÃ© avant l'appel $(k, \delta_2,
 m_2)$. Les prÃ©dÃ©cesseurs d'une date donnÃ©e sont cherchÃ©s dans l'ordre
 croissant des $\delta$.
 
-\subsection{NumÃ©ros des tourbillons interpolÃ©s}
-
-L'attribution d'un numÃ©ro de tourbillon interpolÃ©, et donc
-l'incrÃ©mentation du nombre de tourbillons interpolÃ©s, Ã  chaque date,
-sont faits par la procÃ©dure overlap. Montrons que : deux processus ne
-peuvent pas attribuer le mÃªme numÃ©ro de tourbillon interpolÃ© Ã  une
-date donnÃ©e ; une incrÃ©mentation Ã  une date donnÃ©e par un processus ne
-peut pas s'intercaler entre deux incrÃ©mentations Ã  la mÃªme date par un
-autre processus.
-
-ConsidÃ©rons deux appels de overlap : $(m_1, k_1, \delta_1)$ et
-$(m_2, k_2, \delta_2)$, avec $m_1 \ne m_2$. Supposons qu'il existe un
-indice de date $k$ appartenant Ã 
-$\{k_1 - \delta_1 + 1, \dots, k_1 - 1\} \cap \{k_2 - \delta_2 + 1,
-\dots, k_2 - 1\}$. Avec les Ã©quations (\ref{eq:pred_main_loop}) et
-(\ref{eq:predecessor}), $k$ est dans l'intersection des domaines de
-$m_1$ et $m_2$. Donc $|m_2 - m_1| = 1$ et on peut supposer sans perte
-de gÃ©nÃ©ralitÃ© que $m_1 = m_2 + 1$.
-
-\begin{multline*}
-  k_2 \ge k + 1 \ge k_1 - \delta_1 + 2 \ge k_b(m_1) + 2
-  = k_b(m_2 + 1) + 2 \\
-  = k_e(m_2) - \max \delta + 3 
-  = \mathtt{k\_end\_main\_loop}(m_2) + 2
-\end{multline*}
-Donc l'appel $(m_2, k_2, \delta_2)$ est dans l'Ã©pilogue.  L'overlap
-$(m_2, k_2, \delta_2)$ suit forcÃ©ment un \verb+get_snapshot(k2)+. Le
-\verb+get_snapshot(k2)+ est une rÃ©ception bloquante. Il suit forcÃ©ment
-un send de $k_2$ du processus $m_1$. Dans un processus quelconque,
-aprÃ¨s un \verb+dispatch_snapshot+ d'une date quelconque, plus aucun
-overlap ne recouvre cette date. Donc l'overlap$(m_1, k_1, \delta_1)$
-est forcÃ©ment fini avant le dÃ©but de l'overlap $(m_2, k_2,
-\delta_2)$. $\Box$
-
-Pour deux exÃ©cutions avec des entrÃ©es identiques mais des nombres de
-processus MPI diffÃ©rents, le numÃ©ro d'un tourbillon interpolÃ© Ã  une
-certaine date entre deux tourbillons visibles donnÃ©s peut varier. En
-effet, ce numÃ©ro est attribuÃ© par la procÃ©dure overlap et dÃ©pend donc
-de l'ordre dans lequel les procÃ©dures overlap interpolent Ã  une date
-donnÃ©e. Par exemple, pour $\max \delta = 4$, n\_dates = 15, $n_p = 3$,
-$k_1 = 1$, l'overlap 5-9 s'exÃ©cute aprÃ¨s l'overlap 7-10. Cf. figure
-\ref{fig:15_3}. Alors que l'overlap 5-9 s'exÃ©cute avant l'overlap 7-10
-pour $n_p = 1$ ou 2. Difficile de mettre en place une numÃ©rotation qui
-serait indÃ©pendante de l'ordre des overlap. Pour comparer facilement
-les rÃ©sultats d'exÃ©cutions avec diffÃ©rents nombres de processus, il
-reste donc la possibilitÃ© de renumÃ©roter aprÃ¨s coup les tourbillons
-interpolÃ©s : script \verb+renumber_interp.py+.
-
 \section{Algorithme principal, parallÃ¨le}
 
 \begin{algorithmic}
@@ -894,14 +789,6 @@ croissantes. \verb+get_snapshot+ n'a donc besoin d'avoir Ã  un instant donnÃ©
 qu'un seul triplet ouvert. Je fais le pari que plusieurs processus MPI
 pourront accÃ©der en mÃªme temps en lecture Ã  un mÃªme fichier.
 
-\subsection{init\_interpolated\_eddy}
-
-On peut mettre le champ valid Ã  faux pour un tourbillon interpolÃ©,
-en cohÃ©rence avec un champ \verb+out_cont+ vide. Il faut alors un
-champ interpolated pour distinguer les tourbillons interpolÃ©s de ceux
-pour lesquels un extremum a Ã©tÃ© dÃ©tectÃ© mais sans obtenir de contour
-extÃ©rieur.
-
 \subsection{overlap}
 
 AccÃ©lÃ©ration possible en ne comparant Ã  i1 que les trois tourbillons
@@ -949,12 +836,7 @@ laquelle des successeurs ont Ã©tÃ© trouvÃ©s. (Commission 7bb46ec.)
 \subsection{weight}
 
 D'autant plus proche de 0 que les tourbillons sont
-ressemblants. Comment calculer ce poids ? Comment calculer le poids
-faisant intervenir un ou deux tourbillons interpolÃ©s ? Pour faire au
-plus simple, j'ai supposÃ© que l'on utilisait pour les arcs faisant
-intervenir les tourbillons interpolÃ©s le poids associÃ© aux tourbillons
-visibles entre lesquels on interpole. Normalement, ce choix doit
-donner un poids plus faible Ã  ces arcs.
+ressemblants. Comment calculer ce poids ?
 
 \section{Tests}
 
-- 
GitLab