Cooperlink: un projet IA pour automatiser la gestion des courriels

Pratique
Par · 06/05/2020

Automatiser la gestion (pertinente) des courriels est un vieux rêve qui en a déjà fait cogiter beaucoup et qui renaît sans cesse de ses cendres tant la tâche s’avère ardue.

C’est à ce monstre du Loch Ness des temps modernes qu’un projet, sélectionné par le jury du programme wallon Tremplin IA, veut une nouvelle fois s’attaquer. En s’appuyant sur des techniques d’intelligence artificielle.

Porteur du projet: la jeune pousse liégeoise Think IT Smart, incubée au WSL du Sart Tilman et spécialisée dans l’automatisation des échanges d’informations et des processus métier entre entreprises. La start-up est l’auteur de la solution Cooperlink, que nous avons déjà eu l’occasion de vous présenter dans Regional-IT.

Son projet IA est en quelque sorte un prolongement ou une sous-évolution du projet Cooperlink. Pour rappel, cette solution vise à permettre à des entreprises utilisant différents outils de communication et de gestion de documents – essentiellement dans les domaines de l’ingénierie, de la construction et de la logistique – de s’échanger et partager efficacement des documents professionnels et, ainsi, de collaborer de manière plus fluide sur des projets communs.

IA et NLP

Objectif du proof of concept aujourd’hui engagé (jusqu’au début 2021) dans le cadre du programme Tremplin IA: “valider la pertinence de la mise en oeuvre d’une approche IA dans le cadre du traitement et de la classification automatisée des e-mails”.

Voici comment Axel Palmaers, fondateur et patron de Think IT Smart, justifie le projet: “Le principe de Cooperlink est d’être un agrégateur de canaux [de communications]. Le but de la solution est de permettre aux entreprises de collaborer et d’automatiser leurs échanges d’informations, en conservant, chacune, leurs propres outils – espaces délocalisés dans le cloud [Google Drive, Dropbox…], courriel, SharePoint, Alfresco, Documentum… Cooperlink vise à leur procurer un espace de travail unifié.

Source: Research and Markets.

Le fait est que le courriel demeure un outil essentiel. Il est donc crucial pour les entreprises de pouvoir gérer et classifier ces informations de manière correcte dans le cadre de projets.

On estime généralement que la perte de temps, en termes de gestion, d’archivage, de classification de courriels est de l’ordre de 10 à 15%…”

D’où l’idée de recourir à l’intelligence artificielle, à des algorithmes, à des règles automatisées et adaptatives (si possible auto-évolutives) pour procéder au tri, à la classification et à l’archivage pertinents des courriels. Technologie sous-jacente: le NLP (natural language processing).

Pour l’aider à développer la solution, Think IT Smart s’est tournée vers Data Factory, une jeune pousse bruxelloise incubée au “startup studio” Startup Factory à Bruxelles.

Un périmètre précis

Ce n’est certes pas la première fois que des règles et autres algorithmes sont appelés à la rescousse pour dompter le monstre Courriel. Loin s’en faut. Le NLP est aussi un levier quasiment classique. Mais beaucoup s’y sont cassés les dents ou n’ont pu concrétiser les promesses. Autre écueil: pourchasser des finalités trop génériques en termes de cibles.

Le projet “AI Mail” de Think IT Smart a dès lors deux particularités ou balises.

D’une part – et c’est l’une de ses originalités (et l’une des raisons qui ont poussé le jury à retenir le projet), l’outil qui pourrait en émaner à terme sera multilingue. Le but est en effet d’en arriver à une solution qui puisse gérer, “interpréter”, gérer et classifier des courriels rédigés indistinctement en français, néerlandais et anglais.

D’autre part, le champ métier visé. En raison de son propre positionnement commercial, Think IT Smart/Cooperlink visera essentiellement les métiers de l’ingénierie, de la construction et de la logistique.

L’IA à la rescousse

“L’IA est utile pour des cas plus complexes, là où l’information contenue dans les courriels est plus difficile à détecter”, souligne Axel Palmaers. “Par exemple, détecter l’adresse d’un chantier dans un mail, même s’il y a une erreur dans l’adresse. Autre cas: l’absence de mot-clé spécifique dans le courriel, empêchant ainsi a priori de le classifier. Le système doit alors pouvoir apprendre selon des critères importants, considérés en tout cas comme tels par les utilisateurs.”

Source: Data Factory

Autre exemple ou cas d’espèce cité par Axel Palmaers: la gestion de courriels ayant trait à des projets qui couvrent une longue période de temps – de quelques mois à plusieurs années. “Au fil du temps, les mots-clé significatifs, dans le cadre d’un tel projet de longue haleine, peuvent évoluer ou un projet A peut se transformer ou déboucher sur un projet B”. L’IA peut dès lors être un recours utile pour assurer la continuité, ou retrouver le fil…

C’est là que l’expertise de Data Factory dans le domaine des modèles linguistiques d’optimisation de qualité et de classification de données sera utile (définition et gestion d’entités, de labels, de liens sémantiques, facettes terminologiques…).

Les courriels, pas (encore) les pièces jointes

Le but du projet n’est pas, du moins pas dans un premier temps, de déboucher sur un produit ou sur un service commercialisable. Après tout, on est bien dans un contexte de “proof of concept”. Le principe de base est donc bien celui de la recherche, de la vérification de pertinence (à mesurer par exemple en termes de gain de temps généré), “pour déterminer si tel ou tel modèle répond bel et bien à la problématique identifiée”, souligne Axel Palmaers. “Une autre problématique qui sera abordée est celle de l’entraînement du modèle. Sera-t-il pertinent pour chaque client et chaque projet? Il faudra le déterminer.” D’où l’intérêt aussi de restreindre au départ le champ thématique (ingénierie, logistique…).

 

Axel Palmaers (Think IT Smart/Cooperlink): “Nous allons tout d’abord nous focaliser sur les domaines de la construction, de l’ingénierie et de la logistique. Même si on voudra être le plus générique possible, mais de manière progressive.”

 

Autre remarque essentielle: le travail de recherche ou de proof of concept se concentrera sur l’application de l’IA et de mécanismes automatisés sur les courriels proprement dits. Autrement dit, sur le corps du courriel. Pas sur les pièces jointes, qui peuvent être de diverses natures. “Elargir le champ aux pièces jointes pour en extraire les données aurait nécessité de dimensionner autrement le projet et les ressources humaines impliquées…” Mais l’idée d’étendre le travail aux pièces jointes n’en est pas rejetée pour autant. “Si on trouve le temps…”