La crise sanitaire du coronavirus aura poussé bien des acteurs à trouver des parades, à revoir leurs processus, à innover. Pour un acteur tel que la CoCom (la Commission Communautaire Commune), et, plus spécifiquement, son équipe de médecine préventive, l’une des responsabilités consistait à identifier et à contribuer à gérer les foyers épidémiques (“clusters”) en Région bruxelloise.
Des développements réalisés en 2020, au plus fort de la crise sanitaire, vont pouvoir servir à mieux lutter contre de futures épidémies voire pandémies. C’est en tout cas l’espoir que font naître les développements effectués par l’équipe informatique de la CoCom en pleine crise sanitaire Covid, pendant et au lendemain des deux premières vagues qui ont déboussolé le pays, ses citoyens et les autorités sanitaires voici deux ans.
A l’époque, diverses initiatives ont été prises pour identifier et, si possible, circonvenir les “clusters” qui surgissaient à un rythme soutenu. Parmi ces initiatives, celle de la CoCom qui a eu recours à la technologie de bases de données de graphes (fournisseur Neo4J) afin d’établir des connexions pertinentes et interprétables entre différentes sources de données.
Ce type de base considère chaque donnée, chaque élément d’information mais aussi chaque connexion entre éléments d’information comme un “objet”, ayant une identité, des caractéristiques, une signification, avec représentation visuelle des connexions entre les différents points et objets.
“Au printemps 2020”, témoigne Inge Neven, responsable de la lutte contre le Covid 19 à la CoCom, “on disposait de peu d’outils pour détecter les foyers d’infection. L’un de nos développeurs s’est alors lancé dans le développement d’une solution qui agrège et puisse analyser les informations provenant de multiples sources: les résultats de tests de Sciensano, les questionnaires que remplissaient les passagers d’avion, les données collectées par le call center, la base de données de l’ONSS [qui permet de déterminer le lieu de travail d’une personne active]…”
Par contre, pour ses développements, l’équipe de la CoCom n’a pas fait appel à des données de géolocalisation, en provenance des opérateurs mobiles, comme l’a mis en oeuvre la fédéral. Il ne faut pas y voir l’effet d’une n-ième barrière institutionnelle à la belge mais plutôt le résultat de considérations d’ordre confidentiel – RGPD oblige. C’est en tout cas l’explication donnée par la CoCom – même si on peut imaginer qu’en raison des circonstances (intérêt sanitaire), les restrictions portant sur l’identification de personnes auraient pu être levées (après tout, le croisement de données entre infos sur les foyers d’infection et le lieu où travaille une personne aurait pu également être considéré, stricto sensu, comme enfreignant les règles habituelles de confidentialité…).
D’autres instances et acteurs que la CoCom ont eu recours au principe des bases de données de graphes pour “pister” le Covid. Ici l’ONG HealthECCO…
Hormis la base de données ONSS, “nous avons eu recours à des données fournies volontairement [Ndlr : ou déclarées en toute connaissance de cause…] par les individus”, insiste-t-on à la CoCom.
La solution neo4j mise en oeuvre permet en tout cas d’identifier les sources ou les concentrations d’infection, de visualiser ces foyers “et dès lors d’établir les priorités dans les mesures à prendre pour s’y attaquer. Il devenait possible de déterminer les quartiers, les maisons de repos ou les écoles où il fallait concentrer l’action.”
Si un foyer semblait être une école, l’outil développé permettait de pointer et de visualiser immédiatement le lien entre les enfants et leurs parents, de savoir si l’un d’eux travaillait dans telle entreprise, tel autre dans une maison de repos. Et ainsi de savoir comment un nouveau foyer s’était déclaré dans cet autre lieu – ou risquait de se déclarer.
La CoCom a utilisé les outils neo4j afin de développer plusieurs fonctionnalités: suivi des cas signalés, traçage, génération de rapports, visualisation.
Mutualiser les résultats
Si l’outil développé devait nécessairement s’alimenter et se connecter à de multiples sources pour obtenir des informations pertinentes, les flux inverses étaient tout aussi importants pour certains acteurs. Ainsi des rapports hebdomadaires sur les foyers détectés et “documentés” étaient envoyés à Sciensano. “L’important pour Sciensano était de déterminer l’origine des clusters”, explique Inge Neven. “Pour la CoCom, il était essentiel de savoir comment les prioriser en vue d’une action.”
Et l’exercice était loin d’être simple – d’où l’intérêt de tirer toute parcelle d’information utile de multiples types de données. Le back-tracking d’une contamination est parfois un véritable travail de détective. Inge Neven prend l’exemple d’un événement dit “super-spreader” tel qu’un mariage. Tous les invités ne se connaissent pas forcément. Pouvoir recouper un maximum d’informations (identité, lieu de travail…) a permis de pallier en partie à ce problème.
“L’outil a été d’une grande aide pendant les périodes où les équipes étaient submergées de signalements en raison de la multiplication des foyers”.
Ilona Hendrix, analyste à la CoCom: “Avant l’existence de cette solution, je devais passer une dizaine de minutes à l’analyse d’un cluster. Désormais, une minute environ suffit. Les graphes ont permis de comprendre plus aisément les liens entre les différentes personnes et la manière dont se forme un foyer.”
Le fait de pouvoir affecter des valeurs de contamination différenciées selon le type d’individu ou son environnement quotidien fut un atout non négligeable. Certaines sources de données, dans certains cas, ont été plus utiles (ou plus “révélatrices”) que d’autres. Exemple, les “passenger locator forms”. “40% des voyageurs viennent ou habitent à Bruxelles. On a ainsi pu identifier rapidement le variant brésilien en fonction de la provenance des voyageurs…”
D’une manière générale, les caractéristiques-mêmes de la solution (éléments d’information, pointeurs, connexions, corrélations) “a permis de comprendre la vitesse et le type de prolifération. Si un foyer était une école, on pouvait déterminer rapidement que la contamination toucherait l’entreprise du père, la maison de repos où travaille la mère… Le contact tracing en a été facilité. De même que les prises de contact éventuelles avec le médecin du travail afin de contenir la contamination.”
Un outil adaptable
L’algorithme développé par l’équipe de développement de la CoCom permet non seulement de détecter une source et une chaîne d’infection, voire de la prédire, mais l’ajout de fonctionnalités ou de paramètres permet de rendre l’algorithme et son utilisation adaptables. Le système de priorisation des actions à prendre pourra ainsi être modulé en fonction des valeurs assignées. Par exemple, selon le degré de dangerosité ou de vitesse de prolifération du variant, le type d’établissement concerné (maison de repos, école, entreprise…), l’existence et la corrélation avec des comorbidités…
L’identification de la propagation et le traçage d’autres maladies pourraient, demain, en bénéficier. A la CoCom, on cite par exemple l’hépatite, la tuberculose ou la récente irruption chez nous de la variole du singe.
Cela exigera bien entendu de procéder à certaines adaptations au niveau de l’algorithme et des types de données collectées. Les sources de données adéquates devront être sélectionnées. Les structures des documents, tels que les questions formulées dans les questionnaires ou au centre d’appel, devront être adaptées. Idem pour le type d’indicateurs de transmission: la variole du singe, par exemple, se transmet par contact physique et non pas par voie aérienne comme le Covid ; le virus ebola impliquerait pour sa part une identification par personne porteuse et non par foyer… “Les principes de traçage, eux, ne changent pas. La clé reste la source de contamination. Restera à moduler le mode de détection des vecteurs de contamination et l’effet sur la mortalité afin de définir les modalités de priorisation.”
Découvrez-nous sur Facebook
Suivez-nous sur Twitter
Retrouvez-nous sur LinkedIn
Régional-IT est affilié au portail d’infos Tribu Médias.