Wallonia Big Data (2è partie): les “use cases”

Article
Par · 31/08/2018

Après avoir parlé, dans le premier volet de cet article, de la manière dont le projet de recherche collaborative Wallonia Big Data s’était déroulé jusqu’ici, des choix d’infrastructure et de plate-forme, nous en venons dans ce deuxième volet aux projets retenus pour la phase R&D.

Ces “use cases” serviront de tests et de démonstrateurs et, si possible, de socles pour des solutions et pratiques (mutualisables ou non) et de possibles collaborations dans le domaine de l’analytique de big data au service des acteurs économiques ou publics wallons.

Les conditions d’acceptation d’un use case

Huit “use cases” – projets-pilote – ont été sélectionnés en fonction d’un certain nombre de critères qu’ils devaient respecter:

  • correspondre au spectre de solutions et problématiques métier tel que défini par les porteurs de ce projet de R&D, devant donc correspondre à des problématiques sectorielles intéressant en première instance les Pôles de Compétitivité et leurs membres
  • offrir une perspective d’exploitation commerciale (sous forme de nouveau produit ou service); autrement dit, ne pas être un projet de recherche. “Le but”, souligne Stéphane Mouton, chef de projet R&D au Cetic, “est de fournir un moyen d’accélérer l’utilisation du big data par les entreprises wallonnes. L’un des buts du projet est d’ailleurs d’élaborer une méthodologie qui permet à une entreprise qui estime avoir un projet big data de déterminer les étapes du problème, les éléments à vérifier – par exemple, la disponibilité des données, les conditions d’accès aux données… Le calcul du ROI fait partie du processus d’analyse des use cases
  • présenter un certain degré d’innovation: “chaque use case doit comporter au moins un aspect innovant. Exemples: l’importance des volumes de données concernées, la diversité des données, de leur type ou source… L’innovation peut aussi se définir en termes de type d’usage – dans le cas d’un nouveau service par exemple. Mais, idéalement, l’innovation doit se situer du côté technologie.”

Les 8 “use cases”

… par ordre alphabétique des sociétés qui les ont proposés.

Acapela

Thème du use case: processus d’indexation automatique de contenus audiovisuels via reconnaissance de textes et de la parole sur archives (en l’occurrence les contenus audiovisuels de la Sonuma).

Nom du projet: Archibald.

Technologies concernées: réseaux neuronaux profonds (deep learning), speech to text (synthèse vocale) et traitement automatique du langage.

Quelque 150.000 heures d’archives de la Sonuma seront utilisées pour entraîner les modèles acoustiques. Parmi les éléments technologiques implémentés dans l’environnement constitué pour la circonstance: des cartes Nvidia et l’outil d’apprentissage automatique open source TensorFlow (développé par Google).

CBlue

Thème du use case: détection et analyse d’attaques DDOS (attaques distribuées par déni de service) visant des sites Internet ou réseaux d’entreprise. 

Particularité et “dimension” innovation du projet: l’analyse des données et la détection des attaques se font au départ des logs (données de fonctionnement) de sites qui ne disposent pas d’outils réseau (tels que des sondes réseau) ou d’applications spécifiques. L’idée est aussi de déterminer s’il est possible de mesurer la performance d’un site à partir des informations de logs.

Partenaires: Cetic, UNamur. 

Hôpital Saint-Luc

Thème du use case: étude au quotidien du comportement de patients souffrant d’épilepsie afin de prédire et détecter les crises.

Dans l’état actuel des choses, les patients sont placés sous surveillance constante, avec collecte de nombreux paramètres en milieu hospitalier, avec mobilisation d’un matériel relativement important. Le but du projet est d’analyser les données ainsi collectées afin d’en extraire un modèle et de concevoir un dispositif léger, ne collectant que certains paramètres et pouvant être utilisé à domicile.

Ce projet est pour l’instant en attente de validation par le Comité d’Éthique de l’hôpital. Dans l’intervalle, de premiers travaux préparatoires ont toutefois été réalisés sur quelques jeux de données publics, dans l’attente du feu vert.

Partenaires: Cetic et UNamur.

NRB

Thème du use case: optimisation des économies énergétiques de bâtiments, avec analyse des comportements, typiques ou anormaux, d’installations HVAC (chauffage, ventilation, climatisation) dans les salles serveurs et infocentres.

“Avec Cofely Engie, qui gère nos data centers, nous avons proposé ce use case afin d’analyser les comportements variables des différents éléments constitutifs d’un data center”, déclare Michel Mans, consultant principal et chef de projet Wallonia Big Data chez NRB. “Par exemple, l’impact qu’a le fait de n’utiliser que quatre ventilateurs au lieu de deux dans telle ou telle portion de l’installation. L’idée est d’analyser la puissance énergétique utilisée pour le refroidissement par rapport à celle nécessitée par les différents systèmes.

L’analyse permettra aussi de comparer finement les conditions d’exploitation d’un espace serveurs par rapport à celles d’un espace de bureau, de salles de réunion, moyennant déploiement de capteurs divers (température, taux d’humidité…).”

Ce type de surveillance et d’analyse peut paraître assez classique. Spécificité toutefois du use case: le type de sources de données utilisées. En l’occurrence, des capteurs et systèmes IoT. “Des solutions d’analyse existent pour l’analyse de données sur bâtiments pré-câblés mais ici”, explique Stéphane Mouton, chef de projet R&D au Cetic, “l’innovation vient de la diversité des capteurs et des problèmes de qualité de données.”

Partenaire: Pepite.

Oscars

Thème du use case: détection et anticipation d’anomalies de mouvements d’avions dans le périmètre d’un aéroport – par exemple, une mise en attente, des obstacles sur la piste ou à la porte… – afin d’optimiser les interventions de chaque acteur (douanes, déchargement des bagages, ravitaillement, dégivrage, équipes de nettoyage…) et dès lors les rotations d’avion.

La société Oscars est d’ores et déjà partenaire de l’aéroport de Liège pour la réalisation d’un tableau de bord permettant une gestion temps réel des “événements” (mouvement d’avions, intervention des différents services, opérations d’embarquement, déneigement…) se déroulant dans l’enceinte de l’aéroport – relire notre article à ce sujet  – mais le use case Wallonia Big Data a pour but d’affiner la capacité de surveillance et de gestion. L’analyse des données doit permettre à l’aéroport de s’engager, vis-à-vis de ses différents clients (compagnies aériennes), sur le temps d’arrêt au sol d’un avion. 

Voici ce qu’en dit Olivier Dubois, fondateur et patron d’Oscars: “Le trafic aérien est en croissance et cette croissance devrait se poursuivre dans les prochaines années. De plus en plus d’aéroports sont saturés ou proches de la saturation, sans avoir la possibilité de s’agrandir. Il est donc important d’optimiser l’utilisation des installations aéroportuaires: pistes, taxiways, parkings…

Le but est d’analyser l’ensemble des données disponibles de l’aéroport lors de l’arrivée d’un avion pour détecter les facteurs déterminants qui engendrent des retards ou des délais pour l’arrivée au parking.

Sur base de ces analyses, nous pourrons mieux estimer l’heure d’arrivée réelle de l’avion à son parking pour intégrer cette composante dans notre offre auprès des aéroports, notamment l’aéroport de Liège. Cette étude initiale permettra d’écarter certains facteurs et de comprendre l’apport du big data dans nos analyses appliquées en temps réel.

L’analyse des traces géolocalisées et l’amélioration des processus aéroportuaires sont les points innovants retenus pour ce use case.

Partenaires: Cetic, NRB et Data Fellas, pour l’analyse des données.

Space2M

Space2M est spécialisé dans la collecte et l’analyse de données IoT. La société a proposé un use case visant le secteur des transports (ferroviaires et maritimes).

Thème du use case: analyse et optimisation des opérations via la collecte et l’analyse de flux de données en quasi temps réel. Le but est d’assurer une meilleure traçabilité et de mieux organiser le transport ferroviaire de marchandises dans l’espace transeuropéen. Un trajet fait en effet intervenir une série d’acteurs et d’étapes: fournisseur et gestionnaire des conteneurs, transfert du conteneur sur la plate-forme ferroviaire, formation du convoi, réservation d’un créneau horaire pour l’acheminement de bout en bout auprès du ou des gestionnaires d’infrastructure ferroviaire, assureurs…

Le recours à des capteurs permet de documenter et de suivre le déplacement du convoi, des wagons-conteneurs et de leurs contenus. Mais au-delà de cet aspect des choses, l’analyse des données (techniques, contenus, conditions de transport, géolocalisées etc.) permet d’optimiser le trajet suivi. Notamment en fonction du type de marchandises embarquées. Une matière inflammable ou dangereuse, par exemple, devra éviter certaines zones, tandis que certains tonnages seront interdits en zone montagneuse ou, à tout le moins, on préfèrera faire passer un convoi par un trajet plat, certes plus long, plutôt que par une voie inclinée…

Les informations de vitesse, d’effort, etc… captées au niveau des wagons permettront donc d’optimiser la formation des convois ferroviaires.

Thème “secondaire” ou dérivé du use case primaire: la maintenance prédictive des freins de roue. D’autres scénarios d’utilisation pourraient être imaginés au départ de ce que les données permettent de faire. 

Partenaires: Cetic et UNamur.

Thales Alenia

Thème du use case: amélioration de la qualité de production des circuits électroniques destinés à des satellites et engins spatiaux, via l’analyse de défauts de soudure de pièces.

Le but est d’améliorer les contrôles de qualité en analysant les historiques de données techniques, en identifiant des lacunes éventuelles. Le tout afin de permettre à terme d’analyser et de contrôler le processus de production et sa qualité en temps réel (et non plus a posteriori par échantillonnage).

Particularité qui justifie en partie ce projet: la diversité des sources d’information (images, données de capteurs…).

Partenaire: Pepite.

VitroCiset

Thème du use case: la maintenance prédictive des stations au sol, qui surveillent l’évolution des satellites (ou constellations de satellites).

Centre de l’ESA à Transinne. Source: ESA/C. Lezy

Le but est d’autoriser et d’améliorer qualitativement la maintenance prédictive des installations sur base des données système provenant de différents équipements.

Caractéristique majeure: la variété des accès aux données et les conditions de sécurité d’accès, spécifiques au domaine spatial, plus strictes qu’en milieu industriel. Les stations au sol sont déployées en divers endroits du globe. La finalité est de mieux déterminer les moments d’intervention nécessaire en prédisant ou anticipant les problèmes, pannes ou incidents potentiels. 

Partenaire: Data Fellas.

Un neuvième projet ?

Un neuvième use case est en phase d’évaluation et pourrait venir compléter la liste à court terme. Domaine concerné: la gestion et l’entretien du mobilier urbain. La décision devrait être prise en septembre.

A découvrir début de semaine prochaine, le troisième volet de notre article, consacré au possible modèle économique applicable pour la phase « post-projet de recherche.”