Mentis: le défi de la “big analyse”

Portrait
Par · 07/02/2013

Pierre Sener et Mohamed Ben Haddou, les deux fondateurs de Mentis, sont tous deux d’anciens collaborateurs du laboratoire d’intelligence artificielle Iridia (Institut de Recherches Interdisciplinaires et de Développements en Intelligence Artificielle) de l’ULB.

Le premier y avait notamment effectué des recherches en matière de systèmes dynamiques complexes et de réseaux neuronaux avant de participer à un projet européen visant à appliquer certaines principes d’intelligence artificielle (IA) au domaine industriel.

Mohamed Ben Haddou, pour sa part, est détenteur d’un diplôme en physique théorique et l’auteur d’une thèse en physique appliquée à l’IA. Après avoir quitté l’Iridia, il a notamment mis ces compétences au service de la société agro-alimentaire Mars, pour l’analyse de “big data”.

Les deux anciens chercheurs se sont un jour recroisés et ont décidé de créer une société qui se spécialise dans l’aide à l’analyse de données et exploite des techniques d’optimisation basées sur l’IA et le “text mining”. Outre les ressources de l’ULB, la jeune société a bénéficié dès 2006 d’un financement d’Innoviris pour un projet de recherche en NLP (traitement de langage naturel, ou traitement automatique des langues). Le champ d’action de Mentis? La mise au point de systèmes d’extraction d’informations au départ de sources non structurées.

Mohamed Ben Haddou (Mentis): “Nos premiers clients étaient prêts à explorer de nouvelles pistes qui n’avaient pas encore fait leurs preuves…”

“Chaque cas étant spécifique, nous avons travaillé en mode projet”, explique Mohamed Ben Haddou, CEO de la société. “Dans un premier temps, les clients que nous avons pu intéresser à notre approche étaient essentiellement des centres de R&D de grandes entreprises, telles Mars, Laborelec, GSK ou Solvay, qui devaient résoudre des problèmes spécifiques pour lesquels les technologiques classiques n’étaient pas pertinentes. Nous avons trouvé, auprès de ces centres, un écho favorable à nos arguments, dans la mesure où ils étaient prêts à explorer de nouvelles pistes qui n’avaient pas encore fait leurs preuves…”

Parmi les premiers clients intéressés par les techniques d’extraction automatique d’informations développées par Mentis figurait également le monde de la presse et des médias. D’autant plus que ces techniques, outre l’extraction proprement dite, ajoutaient une couche d’analyse et d’interprétation. Objectif: enrichir l’information, sélectionner les informations réellement pertinentes.

C’est ainsi que le quotidien Vers l’Avenir s’est tourné, dès 2007, vers Mentis pour lui permettre de personnaliser les sélections d’informations qu’il fournissait aux lecteurs de ses différentes éditions régionales. Objectif: fournir aux lecteurs d’une zone déterminée les informations de leur région. Le “filtre” instauré par Mentis était donc la pertinence géographique. La technique consistait à géolocaliser une personne (acteur politique, par exemple) ou un bâtiment qui indique que l’info en question concernait bien une région précise. Ces traitements étaient “moulinés” sur les serveurs de Mentis. Aujourd’hui, Mentis ne travaille plus pour le journal, Vers l’Avenir a trouvé une autre “technique” pour segmenter ses envois (à savoir, l’association de ‘tags’ aux divers articles, par les journalistes eux-mêmes).

Il faut d’ailleurs voir dans l’évolution de ce client et celle du marché et des pratiques qui la sous-tend un signe que le modèle adopté par Mentis devait être affiné, réorienté. Les fondateurs de la spin-off en étaient d’ailleurs parfaitement conscients. A lire ci-dessous, la manière dont Mentis désire “industrialiser” ses outils.

Du particulier au (plus) général

A ses débuts, le rôle de Mentis était donc à la fois de développer des solutions d’extraction spécifiques et de conseiller le client. Un travail sur mesure qui, souligne Mohamed Ben Haddou, ne constituait pas un modèle économique viable pour la jeune société. “Il était clair que nous devions productiser notre démarche, passer à l’industrialisation des outils développés”. C’est dans cette nouvelle phase que Mentis s’est engagée depuis deux ans.

La plate-forme de text mining AIDA (Artificial Intelligence Data Analytics) se construit progressivement, intégrant progressivement un ensemble de modules (existants ou encore à développer ou affiner): analyse linguistique, IA, analyse sémantique, production de rapports.

Au-dessus de ce socle qui constitue le coeur de la plate-forme viennent s’imbriquer des applications: extraction contextuelle d’entités, classification de documents, découverte d’informations, recherche intelligente (à savoir une recherche exploitant des leviers sémantiques, travaillant avec des taxinomies ou s’appuyant sur la connaissance collective d’experts).

Au rang de ces applications, Mentis devrait à l’avenir ajouter l’analyse de sentiments. “A l’heure actuelle, les outils ne peuvent encore faire que de l’analyse d’opinion” [“opinion mining”]. Ils permettent par exemple de dire si l’opinion d’un internaute est positive, négative ou neutre par rapport à un sujet, un fait, un produit… “Le marché, à l’heure actuelle, s’en contente. Mais il faudra aller plus loin pour détecter et identifier les réels sentiments: approbation, satisfaction, colère, frustration… Aujourd’hui, une bonne partie du travail se fait encore en manuel. Même les plus en pointe, comme Google, Facebook ou les autres réseaux sociaux, continuent de compter sur des armées de petites mains off-shore pour taguer à la chaîne les tonnes de tweets…”

Big data et jeunes pousses

Une application d’analyse de sentiments ne figure toutefois pas dans les priorités immédiates de Mentis. Une plus grande priorité, à ses yeux, sera d’adapter et d’optimiser ses outils aux contraintes supplémentaires induites par le “big data”. Un projet de recherche, financé par Innoviris, pourrait ainsi voir le jour pour adapter les outils au framework Hadoop qui permet à une application de distribuer la charge de traitement sur une multitude de plates-formes en vue d’un traitement plus rapide.

Un dossier sera en tout déposé d’ici la fin du mois, avec décision sans doute avant l’été.

“En matière de big data, il faut agir maintenant. Dans 3 ou 5 ans, il sera trop tard pour se positionner. Le défi, aujourd’hui, ce n’est pas tant le big data que la big analyse. Nous devons faire en sorte que les utilisateurs de nos outils puissent analyser les masses de données en temps réel. Et pour cela il faut garantir un schéma Hadoop.”

Mohamed Ben Haddou (Mentis): “En matière de big data, il faut se positionner maintenant. Dans 3 ou 5 ans, il sera trop tard. Le défi, ce n’est pas tant le big data que la big analyse.”

L’espoir est de voir des spécialistes, tels CloudERA, devenir clients des solutions Mentis. Pas question, bien évidemment, d’espérer concurrencer les grands de la business intelligence. “Nous voulons nous positionner de telle sorte que nos utilisateurs puissent exploiter des solutions existantes, telles IBM ou SAS.”

“Une fois industrialisée, notre technologie peut devenir un instrument moteur pour l’innovation des entreprises”, ajoute Mohamed Ben Haddou. “Ou pour rendre plus efficaces leurs propres services de traitement de l’information.”

Exemple? Officience, société franco-vietnamienne de services d’externalisation de processus métier et de gestion de contenu numérique qui a recours aux outils Mentis pour accélérer et rendre plus efficace le travail de ses centaines de “petites mains” asiatiques qui, à longueur de journée, passent au crible des documents notariaux à classer et gérer (pour un client américain). “Jusqu’ici, le travail de ces Vietnamiens et Indonésiens était encore purement manuel”, explique Mohamed Ben Haddou. “Ils doivent identifier et extraire 30 informations spécifiques par document. C’est un travail inhumain. On attend d’eux une vitesse d’exécution incroyable. Le stress est intense. De même, dès lors, que le taux de rotation des effectifs. Jusqu’ici, leur vitesse d’identification des informations pertinentes tenait à leur connaissance de l’endroit du texte où les chercher. Nos outils procurent un gain d’efficacité d’un facteur 5. Ils extraient les résultats probables. Les opérateurs voient ainsi leur travail facilité. Il leur suffit désormais de sélectionner les résultats proposés. 30% des informations sélectionnées par nos outils sont même sûres à 100% et ne sont même plus présentées pour validation à l’opérateur.”

Beaucoup plus près de chez nous, Mentis vise une clientèle de start-ups, qui, pour beaucoup, se positionnent sur le créneau florissant des contenus numériques. “Nous comptons, parmi nos clients, pas mal de start-ups qui ont besoin d’innovation pour être à la pointe.” Parmi elles, TagTagCity qui utilisent les outils Mentis pour “grapiller” et structurer à partir de sites Internet et réseaux sociaux des informations qui alimenteront automatiquement les descriptifs de points d’intérêts qu’elle référence dans son application. Voir à ce sujet l’article consacré à TagTagCity.

Pour son démarchage de clients à l’étranger, Mentis préfère nouer des partenariats avec des sociétés ayant, elles aussi, un profil technologique. “Nous sommes par exemple en pourparlers avec une société finlandaise spécialisée en text mining qui compte des banques ou des médias parmi ses clients. Nous préférons ce genre de partenaires dans la mesure où ils renforcent notre propre caractéristique d’acteur technologique et peuvent parler d’égal à égal avec nous. Ils comprennent d’emblée ce qu’on peut leur apporter”, explique Mohamed Ben Haddou.

L’internationalisation- ou d’ailleurs le traitement sémantique de contenus en langues étrangères- pose un défi supplémentaire à une société telle Mentis. “Même si nos systèmes sont indépendants des langues traitées, nous travaillons essentiellement sur des contenus en langue anglaise, française et néerlandaise. Chaque langue suppose des ressources sémantiques spécifiques. Il faut travailler sur des fichiers de synonymes, des relations entre termes… Ce genre de ressources est largement disponible sur Internet pour tout ce qui concerne l’anglais. C’est plus compliqué pour d’autres langues. Il faut donc ajouter de nouveaux outils- dictionnaires, taxinomies…- et il faut travailler avec des experts de domaine et des data analysts qui étudient les résultats générés par les outils, notamment les outils statistiques de Mentis.”

Besoin de compétences

L’expérience “mécanique” et intellectuelle humaine demeure donc nécessaire. C’est d’ailleurs là une tendance en pleine expansion.

En l’espace de quelques années, le marché a mûri, est devenu demandeur de solutions permettant d’extraire l’information. Notamment sous la poussée des défis que représente le traitement- efficace- des big data. Besoins qui touche un nombre grandissant de secteurs.

La demande d’acteurs aptes à traiter et à donner une signification utile aux marées de données se fait plus pressante. Ceux qu’on appelait encore récemment des “data miners” doivent aujourd’hui avoir des aptitudes de “data scientists”. Et il ne s’agit pas là uniquement d’un glissement… sémantique de façade, estime Mohamed Ben Haddou. “Un “data scientist” est une personne qui fait preuve de davantage de compétences qu’un data miner. Il doit ajouter de la valeur aux résultats statistiques des outils, aider à interpréter l’information. Il doit avoir une certaine maîtrise des langages de programmation, des techniques statistiques. Il doit aussi pouvoir mettre l’accent sur la communication avec le client et sur le coaching de ce client [afin de comprendre son métier et ses contraintes]. Il doit pouvoir construire une histoire autour de l’information qu’il extrait, tisser des liens avec le business, parler business et trouver des solutions pour le business. Mais il est rare de rencontrer toutes ces compétences réunies chez une seule personne…”

De tels profils sont encore rares et l’un des défis que devra relever Mentis pour continuer à apporter du conseil et à encadrer les projets de ses clients sera justement de mettre à disposition des consultants qualifiés. Pour sa progression future, la société envisage éventuellement de scinder ses activités en deux axes: l’offre de solutions et de technologies à destination de secteurs tels que les médias, les médias sociaux ou encore le smart grid, d’une part; la prestation de conseils, de l’autre, avec une réserve de consultants.

Engagée dans sa phase d’“industrialisation” de sa solution, Mentis s’est mise en quête de capitaux frais. Autofinancée jusqu’à présent, elle aura besoin d’apports de fonds pour gérer la croissance qu’elle ambitionne. Ces capitaux devraient provenir de venture capitalists, bien au-delà des fonds pour recherche fondamentale qui viendraient encore d’Innoviris. A noter toutefois que ce dernier finance un projet de doctorat pour un chercheur qui planche actuellement sur la conception d’un question answering system. Du genre Watson (IBM) ou Siri (Apple) “mais selon un champ spécifique, opérant sur un corpus ou un domaine spécifique.”

Mentis emploie actuellement 10 personnes (doctorants et ingénieurs) auxquels s’ajoute une équipe offshore de 7 développeurs qui opèrent au départ d’une antenne marocaine créée en 2011.