Sites Inria

Le 14.11.2012

Données publiques, privées, personnelles, propriétaires [pistes 5 à 8]

Quatre pistes/questions sur la propriété, l'utilisation, le partage et la protection des données, pour éclairer et lancer le dossier <Data, le nouvel or noir ?>
by XcBiker | licence (CC BY-SA 2.0)


 {PISTE 5} 
QUI EST PROPRIÉTAIRE DES DONNÉES ? CELUI QUI PRODUIT ? GÈRE ? EXPLOITE ?

 

>Propriétés sensibles

75 % des données sont générées par des individus. Dans 80 % des cas, les entreprises jouent un rôle dans le cycle de vie de ces informations : elles les stockent, les protègent, préservent leur confidentialité ou en assurent la bonne distribution.

Qui est propriétaire de notre amitié ? À qui appartiennent notre réputation, notre histoire, nos conversations ? Nos données personnelles doivent-elles être librement exploitables par tous ?

 

>Taxe pour imbéciles

Après avoir dérobé des données, des pirates ont demandé 150 000 euros à la banque belge Elantis. Ils qualifient cette rançon de « taxe pour punir les imbéciles », parce que les informations qu'ils ont dérobées sur le serveur web de la banque n'étaient pas cryptées. Ils ont menacé de publier des informations confidentielles sur les clients.

Qui doit assurer la protection des données ? Peut-on sanctionner une défaillance dans la protection ?

 

 {PISTE 6} 
LES DONNÉESPUBLIQUE SONT-ELLE UN BIEN COLLECTIF ?

 

>Analyses criminelles

Les usages des données publiques semblent pour l’instant se
concentrer sur certains types de données. Les données criminelles
concentrent seules 80 % des réutilisations. De ce fait, on est en droit de se
demander si cette libération ne va pas rendre la société encore plus anxiogène.
Jay Nath responsable de l’innovation au Comté de San Francisco

Quelles données publiques sont principalement utilisées et à quelles fins ?

 

>Des données libres payantes ou gratuites ?

L'open data se définit par le droit d'accéder, de consulter et de réutiliser des données librement. La France s'est lancée dans l'open data en décembre 2011, avec la création du portail data.gouv.fr.

Si les données mises en ligne sur data.gouv.fr sont gratuites, nombreuses données publiques restent soumises à redevance comme les données météorologiques, la base de données des cartes grises, le fichier du prix des carburants, etc. INSEE récupère 9 millions d'euros avec la vente de ses données, l'IGN 17,25 millions.

Comme libérer une donnée c’est la mettre en circulation et permettre à d’autres de créer à partir d’elle de nouveaux services, de nouvelles valeurs, faut-il que toutes les données publiques soient gratuites ? Est-ce qu’open data doit se conjuguer au mode gratuit ?

 

 {PISTE 7} 
LES DONNÉES PERSONNELLES VONT-ELLE DEVENIR PUBLIQUE ?

 

Les données personnelles sont le nouveau pétrole de l’internet
et la nouvelle monnaie du monde numérique.
Meglena Kuneva, Commissaire européenne à la consommation en 2009.


>La géolocalisation anonyme

Il faut construire des systèmes géolocalisés qui ne sachent pas où
nous sommes. On aurait alors par exemple des titres de transport avec
des modules de géolocalisation anonymes et des identifiants dynamiques,
qui ne permettent pas de corréler simplement une personne et un lieu.
Electronic Frontier Foundation

Peut-on concilier open data et vie privée ?

 

>Le public privatisé

Les données ouvertes de la prochaine génération sont les données
personnelles. Elles ne sont pas ouvertes au public, mais à la personne
à laquelle appartiennent vraiment les données. Cela pourrait révolutionner
l’accès des citoyens à leur propre santé ou à leur consommation d’énergie.
David Eaves

Va-t-on vers un open data des données personnelles ?

 

>Personnalisation

La technologie nous forcera-t-elle à choisir entre la vie privée et la 
liberté ? On n’a plus d’un côté des données personnelles et de l’autre
des données qui ne disent rien des individus : un très grand nombre de
données apparemment anonymes peuvent acquérir un « caractère personnel »,
en aidant à savoir quelque chose sur un individu précis. Les champs de
données permettent de plus en plus d’identifier leurs émetteurs, tant et si
bien qu’on peut se demander à l’avenir si le concept de données anonymes
a encore une pertinence.
David Brin dans son livre « Transparent Society »

Toutes les données vont-elles devenir personnelles ? Va-t-on vers une personnalisation des données publiques ? Est-ce souhaitable ?

 

>Utilité ou confidentialité

Les enregistrements médicaux comportent de nombreuses informations sur les patients, allant de leur âge à leur historique médical. Quand ces données sont utilisées par des chercheurs, elles sont « anonymisées », c’est-à-dire qu’on enlève les identifiants

Le problème est qu’il n’est pas difficile d’utiliser ces historiques pour ré-identifier une personne. Dans un article publié dans « Proceedings of the National Academy of Sciences » Bradley Malin et ses collègues estiment qu’ils sont capables d’identifier 96 % des patients en se basant seulement sur leurs historiques médicaux.

Est-ce qu’il y aura moyen de garantir à la fois une utilité maximale des données et une confidentialité absolue ? Faudra-t-il faire des choix ?

 

 

 {PISTE 7} 
SI TOUTES LES DONNÉES ETAIENT LIBÉRÉES,
QUELLES SERAIENT LES APPLICATIONS QUI TUENT  ?

 

 

Les futures applications mélangeront des informations géographiques avec
d’autres données sociales. Je n’en ai pas vu pour l’instant, mais je pense que
ces applications se concentreront sur les temps de transport, le prix des
logements ou la criminalité, mais de manière attractive.
Michael Cross, journaliste au Guardian

L’avenir est-il dans le métissage intelligent et en temps réel de données publiques et privées ?

Avec des technologies traditionnelles, réaliser des visualisations un peu complexes, mixant
plusieurs sources de données, coûte cher, prend du temps et nécessite d’avoir dans
son équipe quelqu’un qui connaisse très bien les données. Mais avec ces nouveaux outils,
la tâche devient accessible au grand public. Des étudiants sans formation technique
particulière, ont comparé, État et par an, le nombre de fumeurs, le prix des cigarettes, et le
nombre d’établissements qui interdisent de fumer. Ces données historiques
montrent qu’une augmentation du prix des cigarettes est moins efficace que
l’interdiction de fumer dans les restaurants et bars pour réduire le tabagisme.
 Jim Hendler, professeur au RPI

La simplification technologique favorisera-t-elle l’émergence d’applications utiles et performantes ? 

Propulsé par