Sites Inria

Le 21.04.2015
Par :
Camille Aulas

L’avenir se lit-il dans les données du passé ?

À la croisée des mathématiques, de l’histoire et de l’informatique, la prédictivité est-elle juste un fantasme d’auteurs de science-fiction ? L’émergence d’outils de calcul numérique de plus en plus performants et l’explosion du big data semblent affirmer le contraire.
Montage photo Gottscho-Schleisner Collection, Library of Congress / Jonas de Ro, 2012 (Jonas de Ro, Cities of the future) [CC BY-SA 3.0 via Wikimedia Commons

Insécurité, guerres, épidémies… Et si nous pouvions prémunir l’humanité de ces fléaux grâce à la puissance des algorithmes informatiques ? Tout porte à croire que c’est aujourd’hui possible. Comment ? En analysant des situations présentes par le prisme d’un passé connu. En effet, des modèles informatiques complexes sont capables de repérer des similitudes entre le présent et une suite d’événements passés. Ils peuvent alors évaluer la probabilité qu’un événement se produise. Mais prenons garde aux termes utilisés : « Les sciences numériques ne prédisent rien, mais identifient des tendances, rappelle Laurent Romary, directeur de recherche à Inria Saclay Île-de-France et président du consortium Dariah, un projet qui vise à mettre les sciences du numérique au service des sciences sociales. Pour anticiper des événements futurs, deux éléments doivent être réunis : un modèle informatique capable de croiser des données et d’identifier des récurrences, mais surtout un accès à un volume maximum d’informations.

Une histoire d’archives

Pour fonctionner de manière optimale, un tel modèle nécessiterait donc d’accéder à toutes les connaissances historiques disponibles. « En réalité, la plupart des sources documentaires existantes ne sont pas numérisées et ne le seront certainement jamais, rappelle Laurent Romary. Or, un accès trop partiel aux archives peut engendrer des biais dans la réflexion historique. »

Cette problématique est d’ailleurs au cœur du projet européen CENDARI. Initié en 2012, il a pour ambition de documenter l’ensemble des archives européennes relatives à la Première Guerre mondiale et à l’époque médiévale. Les équipes d’Inria participent à cette aventure, en développant des outils numériques destinés aux historiens. Grâce à CENDARI, ils vont ainsi saisir, structurer et croiser leurs documents en ligne, mais aussi les enrichir de leurs propres expertises pour pouvoir les mettre à la disposition de la communauté scientifique.

Modéliser pour anticiper

Dans l’hypothèse où ces données seraient numérisées, comment fonctionnerait un modèle informatique capable d’anticiper l’avenir ? « L’idée est simple : supposons que l’on fournisse des jeux de données A, B, C et D complets à un modèle informatique. Par apprentissage, il sera capable, pour un nouveau jeu de données E, de reconnaître des schémas qu’il a déjà constatés dans les données précédentes, explique Laurent Romary. En revanche, un événement qui ne s’est jamais produit ne pourra pas être anticipé. » Nouvel obstacle donc, à la « prédiction du futur ». « Par ailleurs, l’interprétation des résultats d’une analyse prédictive et les décisions à prendre en conséquence ne peuvent être que d’origine humaine, insiste Laurent Romary. En effet, le modèle ne fait rien tout seul. Il nécessite un jeu constant d’allers-retours entre les informaticiens, qui maîtrisent l’outil, et les historiens ou les chercheurs, qui fournissent le contenu à analyser. » 

Vers de la prédiction en temps réel ?

À l’heure des réseaux sociaux et des objets connectés, la quantité de données exploitables a explosé ces dernières années, ouvrant la porte à des champs nouveaux pour la prédictivité. Il existe désormais des programmes informatiques qui surveillent en temps réel certains posts sur les réseaux sociaux et peuvent détecter ainsi les prémices d’un conflit. « À partir de l’étude de l’évolution en intensité du champ lexical à travers les médias par exemple, on peut suivre l’installation d’un climat de haine, décrit Laurent Romary. Si l’utilisation conjointe du big data et de modèles d’analyse permet aujourd’hui la prédictibilité de certains événements, il faut cependant rester réaliste. Les avancées technologiques sont encore loin de pouvoir répondre à notre désir de connaître l’avenir. » Mais peut-être pourront-elles, demain, nous en dessiner les contours.

La science a-t-elle rejoint la fiction ?

Pour les fans de lecture :

Isaac Asimov, brillant auteur de science-fiction, faisait de la psychohistoire la pierre angulaire de l’intrigue du Cycle de Fondation. Cette discipline fictive permet de prévoir les évolutions sociales par le calcul, et prédit ainsi l’avenir de l’humanité sur des dizaines de milliers d’années. « Nous en sommes encore bien loin, juge Laurent Romary. Dans le domaine de la psychologie, les données sont bien trop complexes et parcellaires pour pouvoir imaginer prédire les comportements humains. »

 

Pour les fans de séries américaines :

Diffusée depuis 2011 sur CBS, la série Person of Interest raconte l’histoire d’un groupe de personne cherchant à empêcher que des crimes se produisent, grâce aux informations que leur fournit une machine omnisciente. Grâce à un accès à toutes les sources d’informations vidéos, audios ou écrites captées par le gouvernement américain ce superprogramme informatique espionne les moindres faits et gestes des citoyens. Ce qui n’était hier une simple fiction semble plus réel que jamais après les révélations d’Edward Snowden sur les écoutes de la NSA en 2013.

 

Un algorithme pour prévenir les crimes

À défaut de prévoir les guerres, un logiciel de « prédiction policière » vient d’être mis au point par la société américaine PredPol. Il permet déjà de prévoir le risque qu’une infraction puisse être commise dans une zone géographique donnée. Déjà déployé dans plusieurs villes des Etats-Unis, ce programme puise dans les bases de données recensant toutes les infractions survenues ces dernières années dans une zone géographique. L’objectif n’est pas d’arrêter le malfaiteur sur le fait, mais plutôt de prévenir le délit, en renforçant les patrouilles policières dans les secteurs à risque.

Propulsé par