ViBe: la vidéosurveillance comme marché prioritaire

Portrait
Par · 31/01/2014

Nous vous avions déjà présenté le projet ViBe, spin-off de l’ULg spécialisée dans la détection de mouvements sur base de l’analyse d’images vidéo. Relire notre aticle.

La solution – ViBe est l’acronyme de Visual Background Extraction – est un algorithme de segmentation vidéo qui permet d’identifier des mouvements d’objets ou “faits signifiants” captés dans des séquences vidéo.

Elle est le résultat de plusieurs années de recherche du Laboratoire Telecommunications & Imaging de l’Institut Montefiore qui ont permis de mettre au point cet algorithme qui se veut nettement plus performant que ce qui existe aujourd’hui sur le marché (performant en termes de rapidité, de précision et de coût de traitement).

Aujourd’hui, la spin-off a identifié de manière plus précise les marchés qui, pour elle, seront prioritaires. Premiers visés: le (vaste) domaine de la vidéosurveillance mais aussi la reconnaissance gestuelle, qui fait désormais office d’interface, et le monde de l’automobile, qui multiplie les dispositifs embarqués pour toute une série de fonctions que ViBe pourrait rationaliser.

“A terme, on estime que chaque véhicule intégrera en moyenne 16 caméras”, déclare Pascal Vancoppenolle, directeur de la spin-off. On les destine à toute une série d’usages: parking automatique “sans les mains”, pilotage d’instruments de bord, évaluation de distance avec les autres véhicules pour des raisons de sécurité voire, demain, de voitures à pilotage automatique… “Les solutions actuelles sont plus ou moins acceptables mais font appel à des équipements dédiés. Pour l’évaluation des distances, on a par exemple recours à une sorte de sonar qui “voit” que le véhicule qui précède ralentit… Nous proposons de remplacer tout cela par l’image qui servirait d’input unique pour tout ce qu’on veut faire faire au véhicule.”

A plus long terme, ViBe imagine par ailleurs de s’attaquer à des applications en imagerie médicale ou en vision industrielle.

Low hanging fruit

Le premier marché visé par la société sera toutefois la vidéosurveillance en raison d’une convergence d’opportunités. “Le marché est mûr. Hier encore, les fournisseurs pouvaient se contenter de solutions de qualité “suffisante”. Les images étaient de faible qualité et le nombre d’utilisateurs restreint. Aujourd’hui, tout le monde veut de la vidéosurveillance: les villes, les simples citoyens… Les coûts de stockage, d’infrastructure, les besoins en banque passante explosent. Les fournisseurs doivent donc choisir les meilleurs composants et technologies possibles. L’image doit par ailleurs avoir un effet préventif. Il faut pouvoir détecter un danger avant que l’attentat, par exemple, se produise. Et cela suppose une qualité supérieure de traitement d’image, une analyse temps réel, de la vitesse et de la précision. De même, l’évolution vers la HD et la très haute définition – nécessaire pour reconnaître par exemple un visage – implique des volumes de données se calculant en dizaines de méga-octets. Dans ce registre, les solutions classiques ne sont pas efficaces.”

ViBe voit donc un énorme potentiel pour son algorithme de traitement et d’extraction auprès de clients “qui sont très demandeurs”, tels que des fabricants de processeurs, de caméras et d’équipements (en ce compris nos smartphones). L’effet de consolidation à l’oeuvre sur le marché (les acquisitions se multiplient) simplifie en outre le travail d’approche de la jeune – et petite – équipe qui doit moins disperser ses efforts de démarchage.

Pascal Vancoppenolle:  “Le marché de la vidéosurveillance est arrivé à maturité. Les acteurs sont connus et peuvent être approchés facilement. La chaîne de valeur y est plus courte et les négociations moins complexes que dans d’autres créneaux.”

ViBe est en passe de recruter un business development manager (ayant un profil technique et des compétences en computer vision) qui, de concert avec Pascal Vancoppenolle, prendra son bâton de pèlerin pour nouer des partenariats et décrocher des contrats.

La jeune pousse ne compte pas viser davantage les tout grands acteurs que des fournisseurs plus modestes. “Nous ne pouvons nous permettre d’oublier l’un ou l’autre.” Poids lourds et poids plume ont en effet chacun leurs avantages et leurs inconvénients. Les grands noms – Intel, Google ou des ténors de la vidéosurveillance – peuvent certes amener de très gros volumes mais “le choix d’un partenaire comme ViBe est pour eux un processus critique, qui prend donc plus de temps.”

Autre inconvénient: les adaptations ou exigences spécifiques qu’ils exigent parfois. “Nous pouvons packager la solution à la marge”, souligne Pascal Vancoppenolle, “mais nous ne voulons pas nous essouffler à adapter systématiquement pour l’un ou l’autre.”

Des acteurs plus petits, voire concentrés sur un créneau ou une compétence spécifique, ont l’avantage d’être “plus réactifs, clairement demandeurs d’une solution qui fasse la différence. Nous avons par exemple eu des réunions récemment avec une vingtaine de sociétés israéliennes. Pour la plupart, de petites sociétés de 1 à 10 personnes, qui n’ont encore que quelques clients mais qui ont un focus clair. Le décideur est aussi l’expert technique. Le dialogue est donc plus aisé. Avec l’avantage de recevoir énormément de feedback technologique.”

Objectif de ViBe: décrocher de 3 à 5 clients d’ici la fin de l’année.

Ne pas perdre de temps

La technique mise au point par ViBe, brevetée jusqu’en 2029 (minimum), lui procure, dit-elle, un clair avantage sur tous les autres algorithmes d’identification de mouvement dans les images vidéo (1).

Les équipements grand public, smartphones en tête, sont un gigantesque marché potentiel…

“Notre solution est clairement supérieure – et a été validée comme telle par des spécialistes internationaux – en termes de vitesse de traitement, de précision et d’universalité. Les environnements dans lesquels la vidéosurveillance doit opérer sont souvent très changeants et évolutifs. Les autres algorithmes exigent beaucoup de finetuning. ViBe a été élaboré sur base d’une multitude d’hypothèses et n’exige aucune adaptation ou maintenance en cours de vie, une fois qu’il est installé dans l’équipement.”

Si le moment est propice pour convaincre des fabricants (processeurs, caméras…) dans le domaine de la vidéosurveillance, il est un autre marché-pactole que ViBe ne voudrait surtout pas rater et c’est celui des smartphones. “Les caméras des smartphones sont un marché gigantesque, exceptionnel”, souligne Pascal Vancoppenolle. “Notre cible, dans ce registre, sont les fabricants des processeurs qui gèrent la vision. Nous pouvons leur apporter une solution efficace qui rend leurs processeurs plus performants. Ces chips doivent faire beaucoup de choses pour le smartphone. A un coût qui soit abordable pour le grand public…”

Prochains objectifs

Outre la diversification progressive des marchés visés évoquée plus haut, ViBe et en particulier son CTO Marc Van Droogenbroeck, le professeur de l’ULg qui est à l’origine de l’algorithme, s’intéresseront évidemment aussi à l’évolution de la technologie. Plusieurs pistes sont possibles, qui correspondent à des tendances ou besoins de marché: potentiel allant au-delà de la “simple” détection de mouvements pour prendre en compte par exemple les brusques changements du contexte (ombres furtives, changements de luminosité…), traitement des objets en mouvement filmés par un capteur d’images lui-même en mouvement (rotation de caméras, drones…), analyses des changements en vidéo 3D…

“Il est encore trop tôt pour déterminer les directions dans lesquelles le marché va évoluer en priorité”, estime Pascal Vancoppenolle. Et donc pour concentrer les efforts dans une direction plutôt que dans une autre. L’équipe liégeoise demeure donc aux aguets “et progressera lorsque nous aurons engrangé nos premiers succès commerciaux.”

(1) Pour rappel, l’algorithme développé à l’ULg se différencie par toute une série de techniques: inclusion d’éléments stochastiques dans le modèle; technique basée sur le pixel (la détection de mouvement s’effectue au niveau de chaque pixel en particulier); principe de la cohérence spatiale (un pixel ayant une influence- spatiale et temporelle- sur ses voisins); référencement riche de chaque pixel; préservation en mémoire des anciens modèles traités afin d’améliorer la performance; initialisation instantanée de l’arrière-plan, qui permet des traitements comparatifs dès la deuxième image d’une séquence vidéo… Pour plus de détails, relire l’article publié précédemment.  [  Retour au texte  ]