Sites Inria

Le 28.11.2013

Va-t-on délocaliser aussi nos administrations ?

Le mouvement de l'open data va révolutionner la gouvernance de nos pays et donner naissance à une nouvelle industrie basée sur l'exploitation de la donnée publique. L'Europe, véritable "colonie du numérique" des Etats-Unis, pourra-t-elle s'imposer dans cette industrie et conserver la maitrise de ses données ?
Une tribune des chercheurs Stéphane Grumbach et Stéphane Frénot.

Open data

La France, à l'instar de nombreux pays développés, a délocalisé pour des raisons économiques une partie importante de son industrie manufacturière. Pourrait-on imaginer qu'elle délocalise également ses administrations publiques, et ce jusqu'à certains services régaliens de l'Etat ? Cette hypothèse peut sembler à première vue complètement insensée. Et pourtant, aussi surprenante et inacceptable qu'elle puisse paraître, cette perspective n'a  rien d'inimaginable. Elle pourrait même devenir réalité dans un avenir  proche, pas celui d'une lointaine science fiction, mais celui même de la législature en cours.

La situation de la France dans le numérique est paradoxale. Si la pénétration des nouveaux outils et usages comme ceux permis par les  mobiles  y est comparable à celle des régions développées du monde, le numérique suscite plus qu'ailleurs la peur et le rejet. Le système éducatif résiste, malgré des avancées certaines, au développement de l'enseignement de l'informatique, sourd à son importance  dans l'économie et la société. La vie privée fait l'objet de toutes les attentions, mais sans que soient développées les solutions répondant aux attentes des Européens.

Depuis l'introduction de l'Internet il y a une quarantaine d'années, de la toile il y a une vingtaine d'années, et des systèmes coopératifs, appelés 2.0, comme les réseaux sociaux il y a une dizaine d'années, le monde a connu une accélération vertigineuse des changements induits par la Révolution numérique. Au regard de l'Histoire, cette révolution est récente. Même si les nouveaux usages touchent chacun d'entre nous, nous ne sommes qu'au début d'un processus qui transformera en profondeur nos sociétés, nos institutions, et que nous anticipons seulement très imparfaitement. Il suffit de se replonger dix ans en arrière, pour réaliser que nous n'avions pas prévu les changements survenus avec l'arrivée des grandes plateformes du Web.

Les concepts de la société de l'information ont été principalement  mis en oeuvre par les américains.  Les premières plateformes mondiales, celles que nous utilisons désormais tous les jours, Google, Facebook, YouTube, Wikipedia, Yahoo!, Amazon, LinkedIn, eBay, ou Twitter, pour ne citer que les plus connues et les plus influentes en France en particulier, sont toutes américaines. A l'inverse, l'Europe ne compte presque aucun système dans les cent premiers  mondiaux. La France, comme la plupart des pays européens, ne contribue que marginalement aux systèmes en ligne, et son influence dans le numérique au niveau mondial est presque imperceptible.

Nous sommes  désormais dépendants des grands systèmes américains. Dans un  rapport du Sénat, la sénatrice Catherine Morin-Dessailly parle de l'Europe comme d'une colonie du numérique. Cette dépendance, qui augmente un peu plus chaque jour, met les européens dans des situations de plus en plus inextricables.De nombreux secteurs d'activité dépendent du référencement du moteur de recherche Google dont les variations peuvent avoir des répercussions dramatiques sur leurs activités. Or comme Google domine le marché européen comme nulle part ailleurs dans le monde, en l'absence d'alternative, la dépendance devient absolue. De nombreux aspects de notre organisation, comme le droit du travail ou la fiscalité, sont bousculés, bien que pour cette  dernière une réponse sera sans doute trouvée dans le cadre de l'OCDE sous la pression de ses nombreux membres touchés par un déficit public abyssal.

En Europe, les révélations sur le programme de surveillance américain ont choqué l'opinion. Mais l'incapacité à apporter une réponse tant politique qu'industrielle montre notre désarroi, et au fond notre ignorance des enjeux des données et en particulier des données personnelles. Les données sont devenues le pétrole d'une nouvelle économie. Elles sont au coeur de l'activité des entreprises et des services de l'Etat, et représentent des  intérêts économiques considérables. Les données personnelles peuvent être utilisées tant pour créer de la valeur que pour servir le bien commun. Elles permettent de profiler des individus, pour mieux cibler la publicité par exemple, mais également d'analyser des populations dans leur globalité,  sonder l'opinion, mesurer les épidémies. Elles permettent également de surveiller et d'influencer.

Si l'Europe a jusqu'à maintenant échoué dans toutes les grandes batailles industrielles de la société de l'information, elle doit éviter de rester hors de l'arène numérique internationale. D'autant que les enjeux à venir pourraient être plus importants encore. Refaire un Google, un Facebook, ou un Amazon européen, qui occupe une part de marché raisonnable et ce tant en Europe qu'à l'international, relève aujourd'hui de la gageure. Même des moyens financiers colossaux associés à une législation favorable ne sauraient suffire à garantir le succès, tant la suprématie américaine est bien établie. L'Europe doit donc se tourner vers le futur, vers les nouveaux territoires de l'eldorado numérique.

On ne compte pas les domaines que le numérique devrait révolutionner très prochainement, les transports, l'énergie, l'enseignement, etc. mais il en est un dont on parle beaucoup moins et qui nous semble d'une importance plus grande encore, les données publiques ouvertes. Il s'agit des données que produisent aujourd'hui les administrations, au niveau de l'Etat comme des collectivités territoriales ou d'autres institutions publiques, qui sont aujourd'hui accessibles presque exclusivement par ces administrations, et qui, seront dans le futur accessibles de droit par chaque citoyen.

Le mouvement pour ce qu'on appelle l'open data a connu ces derniers temps une forte croissance. Le Premier ministre a adressé le mois dernier à l'ensemble des ministères une note sur l'ouverture et le partage des données publiques, expliquant les objectifs, le cadre juridique, et les moyens développés pour accueillir ces données. La France s'est dotée comme de nombreux autres pays, d'un portail sur lequel on peut trouver des données provenant de diverses administrations. Un terrain industriel se développe pour créer des services nouveaux sur ces données.

L'ouverture des données publiques changera radicalement la manière de faire de la politique et de gouverner. L'action des autorités deviendra visible en continu à une granularité d'action très fine.  Les promoteurs de l'open data insistent sur les bénéfices de cette transparence, qui permettra d'augmenter l'efficacité, d'accroître la responsabilité, de mieux gérer les ressources au niveau national, de combattre la corruption, et en même temps de renouveler le débat politique et la démocratie.

Il faut noter que les données sont au coeur d'une révolution politique qui couve actuellement. Les rapports entre le citoyen et l'Etat vont évoluer radicalement sous la double pression des données, celles de l'Etat auxquelles le citoyen pourra désormais accéder, et celles du citoyen que l'Etat peut surveiller d'une manière inimaginable autrefois. Cette capacité augmentée de part et d'autre d'accéder à l'information aura probablement un impact profond sur les systèmes politiques et la représentation démocratique. Sommes-nous préparés pour ces évolutions ? Il est permis d'en douter. Le rapport "Pour un renouveau démocratique", remis au Président de la République au début de son mandat, par la Commission présidée par Lionel Jospin fait  complètement l'impasse sur les enjeux du numérique.

Et pourtant dans d'autres enceintes, le mouvement semble s'accélérer. Les pays du G8, sous l'impulsion du Royaume Uni, pionnier en Europe de l'ouverture des données publiques,  ont publié lors de leur dernière réunion en juin dernier, une charte des données ouvertes, qui montre la volonté des signataires de publier les données par défaut, c'est-à-dire de publier toutes les données à l'exception de celles qui compromettraient la sécurité nationale, la vie privée des individus, ou la gestion des droits de propriété intellectuelle. Une ambition d'ouverture très grande donc.

Convient-il de se précipiter dans cette révolution de la gouvernance ? L'Europe ne nous laisse guère de choix. Le Parlement européen a en effet adopté au mois de juin dernier la directive PSI, qui introduit l'obligation de rendre accessibles les données du secteur public.  Quand elle sera transposée dans notre droit, l'administration ne pourra pas s'opposer, sauf exception, à l'accès et à la réutilisation de ses données par des entités extérieures à l'Etat.

Il est alors nécessaire et urgent d'anticiper le modèle industriel qui se développera pour exploiter la donnée publique. Les portails d'open data mis en place par les différentes autorités n'ont que peu d'avenir devant eux. Ils coûtent cher et offrent des services extrêmement primitifs. Ce qui  importe dans la gestion des données aujourd'hui, ou plus exactement des flux de données, c'est les plateformes d'intermédiation qui aiguillent automatiquement les données des producteurs vers les utilisateurs. Ces plateformes, comme Google ou Facebook, dominent le marché de la donnée personnelle. Elles domineront également le marché des données publiques ouvertes.

Pourquoi ? La raison est simple. Ces plateformes proposent un service gratuit en échange de la capacité d'exploiter les données. Le service gratuit en période de crise dans les finances publiques ne manquera pas de séduire les administrations. Mais quid de l'exploitation des données qui de toute façon sont ouvertes à tous ? C'est là que réside le génie des plateformes d'intermédiation. En analysant l'activité de leurs utilisateurs, elles génèrent des données secondaires qui sont d'une grande valeur et  sur lesquelles sont construits leurs modèles économiques et dont elles ont l'exclusivité.

Dans le domaine de la donnée publique, elles seront en capacité de dégager des connaissances extrêmement utiles à la gouvernance, et qu'elles seront seules à détenir. Elles pourront bien sûr les revendre aux administrations qui en feraient la demande, mais qui se trouveraient réduites à une position de dépendance vis-à-vis d'un service privé et peut-être même étranger. Une situation inédite, qui résulterait dans la délocalisation de facto d'une partie de notre administration. Dès aujourd'hui ces plateformes sont en mesure d'assurer des services comme ceux de l'identité d'une manière bien plus fiable que nos administrations, qui seront peut-être contraintes à leur concéder la gestion de la délivrance de la carte nationale d'identité.

Il est donc urgent d'inverser la tendance, de comprendre que l'innovation repose sur une vision stratégique à long terme des enjeux vitaux pour notre souveraineté,  de mettre en place un dispositif efficace permettant des investissements massifs et rapides, dans les jeunes entreprises, au sommet de la vague numérique, seules à même de mettre en oeuvre les modèles émergents de la société de l'information que notre pays semble s'évertuer à réduire à néant. 

 

Les plateformes d'intermédiation, avenir du numérique



Les systèmes en ligne reposent sur deux fonctionnalités essentielles. Tout d'abord, des services de plus en plus personnalisés et efficaces, comme ceux utilisés aujourd'hui sur les mobiles, et que connaissent bien les utilisateurs. Ensuite, une intermédiation entre utilisateurs, tantôt producteurs tantôt consommateurs d'information, dont la pertinence assure le succès des géants du domaine. Les services personnalisés et l'intermédiation sont les deux mamelles de l'industrie du Web, assurant à la fois le lien direct avec chaque utilisateur, et la maîtrise de leurs échanges.

Ces plateformes d'intermédiation, sur lesquelles reposent Google ou Facebook par exemple, regroupent dans un même écosystème, des centaines de millions d'utilisateurs, connectés de manière de plus en plus continue. Elles offrent un accès universel, libre et gratuit, à n'importe quelle personne, sans restriction de pays, de langue, ou d'intention. Elles offrent également un accès aux entreprises qui souhaitent offrir des services particuliers à leurs utilisateurs, en profitant de la plateforme, qui assurent pour eux de nombreux services comme le stockage et le traitement de données, l'authentification des utilisateurs, etc. Chaque utilisateur est libre d'ouvrir ses données de manière sélective à certains services tiers, une administration, une association ou un commerce.

L'intermédiation repose sur le filtrage des informations remontées vers l'utilisateur dans la masse considérable des données du système. Ce filtrage n'est par essence pas une opération neutre. Il l'est si les réponses fournies sont indépendantes de la catégorie d'utilisateurs et si les mécanismes de sélection reposent sur des critères non influençables. Mais, ces situations sont plutôt rares, les réponses sont en général adaptées au profil de l'utilisateur et ordonnées selon des critères économiques par essence discutables. De plus les algorithmes  sont tenus secrets. Les moteurs de recherche ont été les premiers systèmes à mettre en oeuvre une sophistication extraordinaire et qui évolue en permanence du filtrage, qui a été progressivement adaptée dans toutes les autres plateformes.

La puissance d'une plateforme d'intermédiation dépend exponentiellement du nombre d'utilisateurs et du volume d'activité. Elle produit de la valeur à partir de l'activité qu'elle observe et dont elle assure essentiellement gratuitement une partie du fonctionnement au profit de ses utilisateurs. Ce qui fait sa force, c'est l'exclusivité dont elle jouit sur les données secondaires, c'est-à-dire les données générées par l'activité et non les données primaires de l'activité. Dans le cas du moteur de recherche par exemple, les données primaires sont les pages Web. Celles-ci ne sont même pas initialement stockées par la plateforme, et sont  accessibles librement. Le moteur de recherche établit un classement des pages Web associées à une requête particulière en fonction essentiellement de leur pertinence. Tout le monde est en capacité de le faire, puisque les données sont librement accessibles en ligne. Parfois, les données sont sur la plateforme qui peut les monétiser. Twitter par exemple commercialise  l'accès à ses flux de tweets, et LinkedIn l'accès à ses centaines de millions de CV.

Les données secondaires du moteur de recherche résultent de l'activité des utilisateurs, leurs requêtes sur le moteur, et leurs clics. Elles sont utilisées pour établir les profils utilisateurs, qui permettent de cibler la publicité, principale source de revenu aujourd'hui, mais   plus généralement de connaître les centres d'intérêt  de la population et donc ce qui se passe dans le monde. Google en a fait la démonstration il y a dix ans avec son système de suivi de la grippe. Ces données secondaires font la puissance des plateformes qui en ont l'exclusivité. Elles vont être à l'avenir une source de connaissances de plus en plus riches, et augmenter encore le pouvoir de ceux qui les détiennent.

An niveau technologique et fonctionnel, toutes les plateformes d'intermédiation présentent de grandes similarités.  Elles sont toutes garantes de temps de réponses de l'ordre de la milli-seconde, ne tombent quasiment jamais en panne, et manipulent des flux d'information de l'ordre de 50 tera-octets, soit 50 millions de méga-octets, par mois.

Elles sont devenues, par leurs prouesses technologiques, les tenants du Web en regroupant sur leurs points d'entrée des milliards d'utilisateurs. De plus, en établissant une forme de neutralité d'accès aux services de la plateforme, et en ne présupposant aucun usage a priori des données utilisateurs, elles offrent un service primaire gratuit, financés par les droits d'exploitation de ces données. La mise en place d'un nouveau service
au contact des utilisateurs, ne peut plus se faire en dehors du contexte des plateformes d'intermédiation.

Deux solutions s'offrent désormais aux développeurs de nouveaux services. Soit une présence forte sur les plateformes d'intermédiation afin d'en tirer le meilleur parti, mais en acceptant de se faire déposséder partiellement d'une partie de leurs données propres. Soit la conception, dès le démarrage, de l'intermédiation entre utilisateurs, c'est-à-dire en se concentrant non pas sur les données primaires, mais sur l'exploitation des flux d'échange que ces services peuvent offrir. C'est cette seconde approche qui fait le succès des services d'échange communautaire de troc, de co-voiturage, d'échange d'appartements ou de développement communautaire de logiciels, seuls sites pouvant résister à l'hégémonie d'aspiration des géants du Web.

 

 

[TOUT LE DOSSIER]

 

Propulsé par