Les criminels potentiels trahis par le «langage corporel»

Cellule de sécurité du stade Spartak à Moscou.

Cellule de sécurité du stade Spartak à Moscou.

Konstantin Chalabov/RIA Novosti
Un nouveau programme informatique surveille le «langage corporel» et parvient à détecter les criminels dans de grands rassemblements de personnes comme, par exemple, un match de football.

Les spécialistes du laboratoire d’analyse de données de l’Université d'ingénierie physique de Moscou (MEPhI) ont créé un programme capable de reconnaître un comportement humain insolite dans une situation donnée. Par exemple, celui d’un criminel potentiel qui, dans une foule de personnes pressées, analyse le terrain.

« Souvent, sur les vidéos prises quelques jours avant un attentat, on peut retrouver les gens qui l’ont préparé, raconte Vadim Danchine, directeur du projet et collaborateur de l’Institut des systèmes cybernétiques intelligents auprès du MEPhI. Ils sont détectés par le modèle de recherche comportementale : la personne n’est pas pressée comme le reste de la foule, mais cherche l’emplacement des caméras de vidéosurveillance, analyse le terrain et étudie le comportement des agents de police ».

Comment ça marche ?

Auparavant, cette technologie n’était utilisée que par les caméras infrarouges. Les concepteurs russes l’ont rendue accessible aux caméras-web et aux smartphones. La caméra est installée de manière volontaire. L’angle d’installation du programme calcule automatiquement les trajectoires de déplacement.

Il suffit de « montrer » une personne en mouvement sur fond statique à l’algorithme et celui-ci reconnaîtra automatiquement les coordonnées de la tête, des pieds, des coudes et des genoux sur la vidéo et recueillera les statistiques des angles de rotation du corps. Les coordonnées sont actualisées 30 fois par seconde. Ensuite, le programme reconstitue un modèle 3D qui se déplace en même temps que la personne sur la vidéo.

« C’est nécessaire pour recueillir les statistiques sur les changements d'angles des articulations du corps humain, explique M. Danchine. Cette information permet d’expliquer au système de vision par ordinateur la différence entre un mouvement de bras dans une conversation décontractée et une tentative de frapper une personne ou de voler les effets d'un passant dissipé dans une foule ».

Algorithme de contrôle des humains

L’algorithme permet d’identifier une personne dans une foule grâce à sa façon de marcher, sa corpulence et ses vêtements.

« Lorsqu’une personne se trouve à une grande distance du point de vidéosurveillance, les systèmes existants de vision par ordinateur ne sont pas capables de reconnaître son visage avec certitude, explique M. Danchine. Notre approche permet d’identifier des caractéristiques supplémentaires comme les vêtements, par exemple. On peut alors rapprocher le bracelet d’une montre sur le bras d’une personne avec son visage pour l’identifier de manière plus précise  ».

Le programme est également capable de constater combien de temps un acheteur a passé devant telle ou telle vitrine. Grâce à cette technologie, on peut relever l’intérêt d’une personne pour un article donné et, à l’occasion suivante, lui rappeler son intérêt à l’aide de publicité ciblée.

Des supporters aux patients des hôpitaux

Les concepteurs précisent que l’algorithme permettra de créer une nouvelle génération de simulateurs interactifs, par exemple pour les agents des forces spéciales, les chirurgiens et les pompiers. Ils calculeront le temps de réaction des candidats aux situations d’urgence afin que les agents puissent agir de manière plus efficace.

Actuellement, les concepteurs russes utilisent leur programme pour analyser les vidéos du comportement des foules dans les matchs de football en Allemagne. Leur objectif est d’éviter les événements indésirables grâce à la surveillance des mouvements du corps humain de chaque supporter dans la zone de couverture de la caméra. Au Canada, un autre projet est consacré à la reconnaissance des types de chute des patients dans des établissements de santé.

« Les caméras traditionnelles ne font qu’enregistrer les images qui sont regardées par des humains dans la mesure du possible, explique Danchine. Ce processus ne peut être automatisé que grâce aux systèmes de vision par ordinateur capables d’assurer des missions complexes d’identification des personnes dans les foules et de classification de leurs actions avec le traitement ultérieur des exceptions ».

Ben Ousman, chercheur en informatique, estime que ces algorithmes trouveront leur traduction dans des systèmes de conduite des véhicules. « Ils permettent de prédire le comportement des piétons, précise M. Ousman. Cependant, les conditions dans lesquelles les vidéos sont réalisées peuvent constituer un obstacle sérieux. Je pense, par exemple, aux distorsions liées à l’heure de la journée ou à la qualité de la caméra utilisée. Créer un système capable de résister à de telles distorsions est une tâche compliquée ».

Lire aussi : 

Les premiers cyborgs débarquent en Russie

La radiographie au service de la géophysique

 

Dans le cadre d'une utilisation des contenus de Russia Beyond, la mention des sources est obligatoire.