Après plus de 5 ans de recherche au sein de l’ULg (laboratoire de Systèmes et Modélisation de l’Institut Montefiore et GIGA-Research), le projet Cytomine fait ses débuts dans la “vraie vie”.
Ce logiciel open source dédié à l’analyse, en mode collaboratif, d’images (très) volumineuses, démarre en effet sa phase commerciale. Le projet, lui, en est encore au stade de l’incubation, dernière ligne droite avant le lancement d’une spin-off, sans doute en fin d’année.
Analyse d’images multi-mégapixels
Cytomine permet la consultation, la classification, l’exploitation collaborative, le partage et l’annotation de très grandes images via Internet et leur analyse (semi-)automatique. L’enjeu est le traitement et l’analyse d’images particulièrement volumineuses dont la résolution se chiffre en centaines de milliers de pixels. Un exemple en sont les images de lames de microscope numérisées, l’un des terrains de prédilection choisis par le projet de l’ULg. Chaque jour, ce sont des fichiers image de plusieurs téra-octets qui peuvent en effet être générés…
Annotation visuelle ou textuelle d’images biomédicales hyper-volumineuses, en mode collaboratif.
“Jusqu’ici l’analyse des lames se faisait au microscope traditionnel, lame par lame, avec annotation manuelle. Chaque chercheur travaillait dans son coin, ne partageait pas ses annotations, freiné d’ailleurs souvent par des logiciels propriétaires”, souligne Raphaël Marée, initiateur et coordinateur scientifique du projet.
Aujourd’hui, microscopes électroniques, bioinformatique et pathologie numérique sont entrés dans les labos et les moeurs. “L’avenir est à la préparation automatique d’échantillons, par des robots, et à l’imagerie tissulaire automatisée. Les systèmes robotisés produisent des lames, les numérisent en haute définition afin que les images puissent être analysées non plus sur microscope mais sur écran.”
C’est dans ce contexte que Cytomine a vu le jour, notamment pour répondre à la sollicitation d’une société américaine qui développait un produit d’aide au dépistage du cancer du col de l’utérus.
Que ce soit sous l’oeil du microscope ou à l’écran, le défi du pathologiste demeure le même: comment repérer parmi les milliers de cellules d’un échantillon, celles qui sont le signe avant-coureur ou qui révèlent un cancer? La société américaine cherchait une solution de détection automatique de cellules anormales. L’équipe liégeoise a relevé le défi en concevant cette application et les algorithmes d’analyse d’image qui l’accompagnent.
Accélérer le travail du chercheur
La solution Cytomine a pour but d’autoriser la numérisation des lames, le stockage centralisé des images, leur classification et annotation, et leur partage, que ce soit au sein d’un même labo ou entre équipes dispersées sur la planète.
Principales caractéristiques de la solution open source (elle est proposée sous licence Apache et GPL):
- un visualisateur offrant un potentiel de grossissement et de navigation dans l’image
- des fonctions d’annotation sémantique (par recours à des outils graphiques et via ajout de textes, vidéos, valeurs, métadonnées…) en mode collaboratif (les utilisateurs sélectionnant et travaillant sur les “zones d’intérêt” de l’image, pré-identifiées par eux)
- des algorithmes de reconnaissance d’image et d’analyse semi-automatique, avec possibilité d’associer plusieurs algorithmes, de types différents, qui peuvent donc opérer simultanément sur une image et se partager les résultats obtenus.
Raphaël Marée: “Nous avons choisi une licence open source afin que la solution puisse être modifiée et réutilisée, pour garantir la reproductibilité des recherches et maximiser l’utilisation de la solution dans de multiples domaines.”
L’équipe de Cytomine a développé un certain nombre d’algorithmes doués d’apprentissage automatique qui peuvent générer automatiquement des annotations.
Les algorithmes développés à ce jour visent plusieurs problématiques: la détection de tissus, de “points d’intérêt” (ou “landmarks”) dans une image, la reconnaissance d’“objets” (tels que cellules, phénotypes…).
A noter toutefois que ces algorithmes n’opèrent pas en liberté totale. L’équipe a en effet développé des outils de proofreading qui permettent de vérifier et de corriger au besoin les annotations générées par les algorithmes. L’intervention de l’expert humain demeure donc nécessaire mais le gain de temps est bien présent.
A nouveau, cette étape peut se faire en mode collaboratif, à distance, puisque la solution, rappelons-le, est orientée Web (le serveur d’images fournissant au serveur Web les images ou portions d’images à analyser).
Comment fonctionne Cytomine? L’image est chargée au départ de clients distants ou de la WebUI de Cytomine et stockée dans le serveur central. Chaque image est associée à une URL et est consultable et utilisable, moyennant droits d’accès, par quiconque, en local ou à distance. Les utilisateurs peuvent dès lors travailler conjointement sur les images, sur les “zones d’intérêt” préidentifiées et annoter. Les annotations sont elles-mêmes associées à des URL. Elles peuvent faire l’objet de recherches, de tris, d’échanges… Des algorithmes d’annotation semi-automatique peuvent être appliqués, en ce compris à distance, par plusieurs personnes. Après contrôle et approbation, une opération d’exportation, en divers formats, peut être opérée, par exemple vers une base de données.
Au-delà du biomédical
Chaque chercheur (ou utilisateur) peut se créer son propre espace où il pourra héberger divers projets et répertoires d’images, avec contrôle d’accès.
Tele que développée, la solution s’adresse en priorité à un public de chercheurs en biomédical et de pathologistes mais aussi d’enseignants et d’informaticiens qui, souligne Raphaël Marée, “pourront ainsi développer de nouveaux algorithmes sur base des images auxquels ils auront accès.”
Le projet Cytomine a été financé jusqu’ici par la Région wallonne.
Depuis ses débuts en 2010, quelque 300 projets de recherche, conduits par 200 chercheurs, ont utilisé l’outil Cytomine. Volumes concernés: 21.000 images transférées, 700.000 annotations manuelles et plus de 6 millions d’annotations générées par algorithmes.
Le projet HistoWeb est le petit frère de Cytomine. Il vise l’exploitation et l’adaptation de l’outil à des fins d’enseignement (initialement, dans les domaines du biomédical et de la cytologie). Parmi les adaptations nécessaires: un renforcement de la stabilité du système et de sa scalability afin de supporter un nombre important de requêtes simultanées (par des centaines d’étudiants, voire plus dans une perspective MOOC), et le développement de nouveaux outils de reporting (suivi des apprentissages et des activités des étudiants, tableaux de bord…). Ce projet est mené conjointement par l’ULg, l’ULB et l’UNamur.
Le champ d’action identifié dès les débuts du projet est celui de la pathologie numérique et de la recherche biomédicale (analyse de tissus, d’échantillons biologiques, de cultures de cellules, détection d’anomalies cellulaires.)… Mais des intérêts se sont déjà manifestés dans d’autres domaines, tels que la géologie, la paléogénétique, la radiologie, le géospatial, les tests de protéines…
Pour l’heure, l’équipe se concentre exclusivement sur les débouchés purement biomédicaux (le contrat de financement de la recherche l’exige) mais la perspective pourrait se diversifier lorsque le spin-off sera lancée. Toutefois, la forme spécifique qu’elle devrait prendre – une coopérative à finalité sociale – implique que les orientations applicatives seront dictées par les coopérateurs. Ces derniers, espère Grégoire Vincke, coordinateur technologique et pédagogique du projet, seront à la fois des chercheurs et des entreprises.
La spin-off aura, quoi qu’il arrive, comme mission première de pérenniser les travaux R&D, de poursuivre les développements du projet (algorithmes de reconnaissance, arbres de décision…) et d’identifier de nouveaux débouchés, “notamment dans le domaine de l’aide au diagnostic médical.”
Découvrez-nous sur Facebook
Suivez-nous sur Twitter
Retrouvez-nous sur LinkedIn
Régional-IT est affilié au portail d’infos Tribu Médias.