Sites Inria

Le 14.11.2012

Nouvelles données, nouveaux usages [piste 9 à 12]

Quatre pistes/questions sur les nouveaux usages et les nouvelles données, pour éclairer et lancer le dossier <Data, le nouvel or noir ?>


by eagleapex - Licence (CC BY-SA 2.0)

 

 {PISTE 9} 
LES DONNÉES FAVORISENT-ELLES TANT LA PRISE DE DÉCISION QUE LA PRÉVISION ?

 

>Propriétés sensibles

Les décisions politiques sont trop souvent basées sur des anecdotes
collectées au hasard sur des recherches produites ou financées de manière peu
académique. Par exemple, la plupart des décisions pour protéger les enfants en
ligne ont été prises dans la peur de ce que les enfants font en ligne, et non pas
sur des données montrant ce qu’ils font vraiment en ligne.
John Palfrey et Jonathan Zittrain, chercheurs à Harvard

L’analyse de données favorisera-t-elle la prise de meilleures décisions ?

 

>À la trace

Mirco Musolesi, Manlio Domenico et Antonio Lima de l’université de Birmingham ont développé un algorithme qui utilise les données de tracking (suivi) sur les téléphones des utilisateurs pour prédire où ils se trouveront 24 heures plus tard. La marge d’erreur moyenne de cet algorithme est de seulement 20 mètres.

Qui pourra profiter du suivi des individus ? L’individu, des commerçants ou la société ? Quels seront les nouveaux usages liés à une prévision des comportements individuels ?

 

>Le grand cinéma

Netflix, le système de locations de films sur Internet, utilise des algorithmes qui cherchent à savoir ce que l’internaute voudrait regarder afin de lui recommander ce film. Ces algorithmes sont responsables de la location de 60% des films. Et si on pouvait évaluer ces mêmes films avant qu’ils ne soient tournés et en prévoir les bénéfices ? Des spécialistes britanniques d'analyse de données affirment pouvoir, à partir de l’analyse du scénario, prévoir si le film va rapporter 2, 20 ou 200 millions de dollars.

L’analyse des données va-t-elle composer nos menus culturels ? La trop grande prévision va-t-elle se traduire par une normalisation culturelle ?

 

> Le 22 à Santa Cruz

La police de la Santa Cruz, en Californie, utilise un algorithme qui prévoit quand et où certains crimes vont être commis. Elle envoie alors des hommes sur le terrain avant même que ces crimes ne soient commis.

Le programme a permis de prédire correctement 40 % des crimes. La police a arrêté 5 personnes en utilisant cette technique dite de “police prédictive”, et les taux de certaines catégories de crime dans la ville ont déjà baissé de manière significative.

Les prédictions vont-elles inciter à des actions socialement acceptables ou vont-elles nous enfermer dans une société de la surveillance ? Peut-on croire à la validité de ces prévisions ?

 

>Imprévisible

Novembre 2007, les économistes examinant 45 000 ensembles
de données économiques ont affirmé qu’il n’existait pas plus d’un
risque sur 500 que nous puissions connaître une crise comparable à
celle qui commença un mois plus tard. Les tentatives de prévoir les
tremblements de terre ont continué à prédire des catastrophes qui ne sont
jamais arrivées et n’ont pas réussi à nous préparer à ceux qui se sont produits,
comme le désastre de 2011 au Japon.
Nate Silver, rédacteur en chef de Wired.

Quels sont les ingrédients qui permettent d’avoir des prévisions fiables ? L’augmentation du nombre de données conjure-t-elle ou non l’imprévisible ?

 

 

 {PISTE 10} 
LES DONNÉES VONT-ELLES FAVORISER UN DEVELOPPEMENT PLUS RESPONSABLE ?

 

 

>À la carte

En Haïti, en Côte d'Ivoire, ou en Indonésie, le projet humanitaire OpenStreetMap utilise les outils de l'open source pour accroître l'efficacité des intervenants d'urgence en cas de désastres.

HOT (Humanitarian OpenStreetMap Team) propose des cartes collaboratives qui s’avèrent indispensables pour réagir lors d’une catastrophe.

La création collaborative de données peut-elle favoriser la gestion de situations délicates ?

 

>Nuage vert

Des artistes ont créé un nuage vert au dessus d’une usine d’Helsinki. Il était plus ou moins étendu en fonction de la pollution ?

La visualisation des données peut-elle être un outil de prise de conscience ? Quels nouveaux usages sont envisageables ?

 

>Connaissances

Sur Internet, on annonce à peu près tous les jours une nouvelle
révolution. La première vraie révolution a été de se représenter la
Toile comme une énorme bibliothèque de textes ; la seconde a été le
web des réseaux sociaux ; la prochaine est celle du passage au web de
s connaissances. Il faut aider les moteurs de recherche à mieux répondre
à nos attentes dans l’immense fatras de données qu’est le web. Et il faut
surtout permettre aux machines d’utiliser les mines extraordinaires
d’informations disponibles. Les logiciels sont bien plus à l’aise avec
des connaissances structurées qu’avec du texte.
Serge Abiteboul, directeur de recherche Inria, titulaire de la chaire
« Informatique et Sciences numériques » au Collège de France.

Comment la structuration de données peut favoriser la connaissance ? Quels sont les nouveaux usages inhérents à un Web de la connaissance ?

 

>Où va-t-on ?

Les analyses de l’ADN à grande échelle aideront-elles à guérir les
maladies ? Ou bien cela aboutira-t-il à une nouvelle vague d’inégalités
médicales ? L’analyse des données rendra-t-elle l’accès des gens à
l’information plus efficace et effectif ? Ou sera-t-elle plutôt utilisée pour
pister les manifestants dans les rues des grandes villes ? Améliorera-t-elle
la manière dont nous étudions la communication et la culture humaine, ou
va-t-elle rétrécir la palette des options qui s’offret à la recherche et altérer
ce que « recherche » veut dire ?
Hubert Guillaud, journaliste

Quelles sont les décisions à prendre pour que les données soient utilisées de manière responsable et utile au plus grand nombre ?

 

 {PISTE 10} 
LES DONNÉES PERMETTENT-ELLES DE MIEUX INFORMER ?

 

 

>Entre bien ou mal

Bien informés, les hommes sont des citoyens ; mal informés ils deviennent des sujets.
Alfred Sauvy

Les données vont-elles nous rendre plus citoyens ?

 

>Les chiffres frappent fort

Les Américains mangent en moyenne trois hamburgers par semaine. Cela fait 156 hamburgers par personne, chaque année. Combien coûte à l'environnement cette consommation ? Le Center for Investigate Reporting a calculé ces coûts cachés. Il faut plus de 18 000 litres d'eau pour produire un seul kilo de viande de bœuf. Cent grammes de viande sont responsables du rejet de 3kg de C0² dans l’atmosphère. Si tous les Américains renonçaient à la viande et au fromage juste un jour par semaine, cela serait comme retirer 7,6 millions de voitures des routes pendant une année entière.

Est-ce qu’on va abandonner le poids des mots pour privilégier le choc des données ?

 

>Fausses infos

Au moment des émeutes, en Grande-Bretagne, certains arguaient que ces manifestations étaient initiées sur les réseaux sociaux. En croisant les statistiques des pics d'activité sur Facebook et Twitter et les horaires des affrontements, The Guardian a pu montrer qu'il n'en était rien.

Les données permettront-elles d’avoir une information plus fiable ? Vont-elles éliminer les faux scoops ?

 

>Accident de croisement

Les données ne sont pas intelligentes pour elles-mêmes. Leur couplage peut aussi produire des syllogismes faciles et des erreurs d’interprétation : coupler une base de données statistiques sur la criminalité et une autre sur la pauvreté de la population fera peut-être ressortir la fameuse image des « Classes laborieuses, classes dangereuses ».

Est-il possible de faire raconter aux données l’histoire que l’on veut ? Les données sont-elles objectives ?

 

>Des machines à comprendre

L’univers de l’information de demain sera assurément un Web de données.
S’il est à première vue complexe pour l’internaute, mais pas pour les
machines. C’est donc en utilisant mieux les machines que nous parviendrons
à nous simplifier la compréhension de l’information.
Frank van Harmelen, chercheur à l’Université d’Amsterdam

Les journalistes utiliseront-ils de plus en plus de données traitées par divers logiciels ?

 

Propulsé par