Des étudiants de l’UNamur: l’open data au karcher

Pratique
Par · 18/05/2017

La Ville de Namur est l’une des toute premières de Wallonie – et encore l’une des rares – à avoir fait montre d’un certain volontarisme en matière d’open data. L’un des déclencheurs en fut un premier hackathon dédié à ce thème organisé, en 2013, dans la capitale wallonne. Depuis lors, la Ville a ouvert l’accès à environ 100 jeux de données, dont certains sont listés sur le portail open data géré par l’AdN.

Mais voilà, comme souvent, nombre de ces jeux de données sont difficilement exploitables par le citoyen, voire même pour un développeur averti, en raison du type de format des données. Soit le format ne permet pas une exploitation directe (du PDF par exemple). Soit il est totalement ésotérique ou spécifique. Sans parler de la “qualité” des données: erreurs, doublons, lacunes…

Les moyens, quand ce n’est pas les compétences, manquent souvent en interne, au sein des administrations, pour “nettoyer” les données et les proposer sous une forme immédiatement ou raisonnablement exploitable – et on ne parle pas ici uniquement de Namur.

Parfaitement conscients qu’“on ne peut pas lâcher dans la nature des données si elles ne sont pas suffisamment propres” (l’expression est de Nicolas Himmer, smart city manager de Namur), les responsables de la Ville sont preneurs de toutes les bonnes volontés. Qu’elles viennent de professionnels, de “bidouilleurs” éclairés ou encore… d’étudiants.

L’UNamur à la rescousse

C’est dans le contexte de cette volonté de pouvoir mettre un maximum de jeux open data en ordre qu’une initiative de l’UNamur a été chaleureusement accueillie.

Pendant 4 mois, dans le cadre de leur cours en technologies Web, des étudiants en deuxième année de master en Informatique de l’UNamur ont travaillé en équipes pour pré-traiter et nettoyer les données, les transformer en formats “lisibles”, répondant aux normes industrielles (internationales comprises), “rendre les données compréhensibles et réutilisables par les citoyens, les entreprises, les développeurs…”, explique le Philippe Thiran, professeur en informatique. “Ils les ont pré-traitées, restructurées, standardisées, alignées sur les ontologies internationales normées. Ils ont eu recours à diverses techniques, adopté une méthodologie itérative, avec de fréquentes interactions avec l’équipe de la Ville de Namur.”

Répartis en 4 groupes, ils ont planché sur 4 jeux de données: liste des bâtiments et annexes scolaires, horeca et entreprises, voirie, limites administratives.

Le résultat?

De mini-sites Web, développés en responsive design (pour utilisation sur tout support), des interfaces API pour applications mobiles, en langage naturel, pour exploitation graphique…

Les différentes interfaces (chaque groupe ayant produit une API portant sur les jeux de données sur lesquels il devait plancher) permettent au simple citoyen d’exprimer une requête en langage naturel, là où jusqu’ici les jeux de la Ville exigeaient par exemple une maîtrise SQL (langage de requête pour bases de données relationnelles) ou celle du format Lambert Belge 1972 (données géométriques).

L’équipe d’étudiants qui a par exemple travaillé sur les jeux de données Limites administratives a conçu un mini-site Web qui permet à l’utilisateur lambda non seulement d’exprimer ses requêtes en langage naturel, avec menu déroulant proposant des requêtes standard pouvant être complétées, mais aussi de générer les résultats des requêtes en plusieurs formats: XML, JSON, HTML visuel, RDF/XML (Resource Description Framework), Turtle (Terse RDF Triple Language).

L’équipe qui planchait sur les jeux de données Bâtiments a, elle aussi, travaillé sur les requêtes en langage naturel mais a également transformé les jeux de données géographiques en un format normé exploitable, permettant par exemple de visualiser la surface exacte d’un bâtiment scolaire sur GoogleMap à partir d’une simple adresse de rue.

Proto sur la rampe de lancement

Qu’adviendra-t-il des travaux des étudiants? “Les 4 groupes ont utilisé des méthodologies, des technologies, des langages différents. La prochaine étape est de rédiger un rapport de travaux et de déterminer ce qui marche le mieux”, explique Philippe Thiran. “La totalité des codes source seront fournis à la Ville de Namur qui déterminera ce qu’elle en fera. Dans l’état actuel des choses, nous en sommes en quelque sorte au stade du prototype mais cela permet déjà d’avoir une première approche, pour une exploitation concrète des données.”

Du côté de la Ville, on semble plutôt satisfait de ces premiers résultats et avides de pouvoir s’en saisir pour rendre les données plus aisément accessibles.

Et il reste du boulot. Comme signalé précédemment, une centaine de jeux de données ont été “ouverts” mais dans un état souvent encore difficilement exploitable – beaucoup de PDF, de cartos brutes, de formats spécifiques, des jeux encore incomplets – en ce compris par exemple pour les jeux Limites administratives.

Baudouin Sohier, échevin du numérique de Namur: “Dans le cadre de notre stratégie Smart City, nous avons besoin de partenaires. Le but est de donner naissance à des solutions qui intéressent réellement le citoyen. Le premier travail – et il est d’envergure – consiste à rassembler toutes les données et à faire disparaître tout cloisonnement entre nos propres services.”

Environ 300 jeux de données, détenus par la Ville, doivent encore être proposés en open data. Avec, si possible, travail préalable de “nettoyage”. La tâche en revient en principe à une équipe du service cartographique qui compte 5 personnes qui ont chacune leurs missions (répertorier les événements, travaux sur voirie…, transposer en HTML, assurer le suivi administratif…).

“L’un des projets actuellement en cours consiste par exemple à pouvoir exploiter, en open data, tous les “événements” se déroulant sur le territoire: travaux par les impétrants, activités sportives, déménagements de particuliers ou d’entreprises, nouvelles constructions…”, explique Samuel Nottebaert, chef du service Data Office & Géographie urbaine de la Ville.