Au-delà du GDPR : L'effet Matthieu du Big Data

Björn Fasterling , Professor

Florian Pelgrin , Professor

Geert Demuijnck , Professor

La vie privée n'est pas seule en jeu. Comment le Big Data et l'analyse avancée des données peuvent creuser les inégalités sociales.

Temps de lecture :

24 Mai 2018

Le scandale Cambridge Analytica a aiguisé notre conscience de la manière dont des tiers peuvent accéder à des informations nous concernant sans consentement adéquat. La découverte de schémas discriminatoires apparus dans l'utilisation de plateformes internet telles que le moteur de recherche de Google, Uber ou Airbnb a attiré l'attention sur le problème de la discrimination sur internet. Le règlement général sur la protection des données (RGPD) de l'UE, qui entre en vigueur aujourd'hui, renforce les droits des personnes en matière de protection de la vie privée et des données et s'attaque également à la discrimination algorithmique. L'enjeu est de taille à cet égard, mais un problème plus insidieux se profile peut-être à l'horizon, qui n'est pas entièrement pris en compte par le GDPR, à savoir l'aggravation des inégalités sociales qui pourrait se produire lorsque les entreprises commerciales bénéficient de l'analyse avancée des données telle qu'elle est appliquée au big data.

Considérez l'expérience de pensée suivante : Une personne qui a réussi à vaincre un cancer est statistiquement plus susceptible de souffrir d'une rechute qu'une personne qui n'a pas eu la même maladie. En l'absence de restrictions légales, une compagnie d'assurance au comportement rationnel demanderait à la personne présentant un risque de rechute des primes d'assurance maladie plus élevées qu'à la personne moyenne. Ce désavantage pourrait alors se répercuter sur la cote de crédit de cette personne, car une personne ayant des primes d'assurance élevées et une espérance de vie éventuellement plus faible pourrait être amenée à contracter des crédits plus coûteux. Ce désavantage peut en entraîner d'autres, par exemple en ce qui concerne les chances de la personne de trouver un emploi stable ou de devenir partenaire commercial. Cela pourrait également réduire les chances de la personne d'obtenir une assurance maladie appropriée en premier lieu. Le problème est qu'en l'absence de garanties juridiques efficaces, nous ne pouvons guère blâmer les entreprises individuelles qui fondent leurs décisions commerciales sur des données statistiques. Cependant, l'effet cumulatif de leurs décisions peut devenir très préjudiciable et tout à fait injuste pour les individus.

Pourquoi le big data et l'analyse avancée des données risquent-ils d'aggraver la boucle de rétroaction négative évoquée plus haut ?

Ce que beaucoup de gens ne prennent pas en compte, c'est que les grands volumes de données en tant que tels n'ont qu'une très faible valeur économique pour les entreprises. La valeur marchande des données dépend essentiellement de deux facteurs. Le premier est la rareté des données. L'aiguille (et non le foin) dans la botte de foin est ce que les entreprises apprécient le plus. Le second facteur, lié au premier, est la "granularité" des données. La granularité fait référence à la taille des champs de données qui sont subdivisés. Plus les données sont "granulaires", plus le scientifique des données peut les agréger et les désagréger pour répondre aux différentes demandes des entreprises clientes. Ces demandes concernent généralement une publicité plus efficace, l'optimisation des prix ou la prédiction du comportement individuel, par exemple en ce qui concerne l'emploi ou la capacité à rembourser des prêts. Dans tous ces cas, les applications big data seront commercialement plus intéressantes pour une entreprise si elles sont basées sur des ensembles de données contenant des données rares sur les personnes, qui peuvent être analysées au niveau le plus bas (le plus granulaire). Avec de tels ensembles de données, les individus sont regroupés et classés en groupes très précis. Les transactions commerciales et les offres seront basées sur ces classifications. Le plus souvent, les gens n'ont aucune idée du type de boîte dans laquelle ils sont placés et du type de jugement qui est porté sur eux.

La méthode d'analyse des données avancées consistant à regrouper puis à classer les individus dans des groupes en vue d'un traitement statistique pourrait - lorsqu'elle est ensuite utilisée pour prendre des décisions commerciales - non seulement créer des avantages cumulés pour certaines personnes. Inversement, elle pourrait entraîner des désavantages cumulés pour les personnes qui, quelque part dans le processus de données, sont placées dans des groupes qui induisent des opportunités moins avantageuses (par exemple en ce qui concerne le travail, les affaires ou les opportunités sociales). Avec l'avènement du big data et de l'analyse des données, les personnes bénéficiant d'avantages initiaux (par exemple, être en bonne santé, être riche, etc.) pourraient acquérir davantage d'avantages, tandis que les désavantages initiaux ont tendance à se renforcer, ce qui accentue la distance initiale. En référence à la parabole des talents dans l'Évangile de Matthieu[1], nous appelons ce problème "l'effet Matthieu" du big data.

En limitant les transferts de données d'un contexte à l'autre, les garanties du GDPR réduisent au moins indirectement le risque de boucles de rétroaction négatives. Toutefois, le GDPR n'aborde pas spécifiquement le problème des inégalités sociales. Néanmoins, toutes les entreprises impliquées dans la "chaîne d'approvisionnement" des big data (collecteurs de données, agrégateurs de données, traqueurs et enfin tous les utilisateurs de données) devraient coordonner et éventuellement restreindre leur activité afin d'identifier et de contrecarrer les effets préjudiciables de Matthew. Cela devient d'autant plus urgent que les réponses légales ou réglementaires au problème sont soit absentes, soit inadéquates.

[1] "En effet, à celui qui a, on donnera davantage, et il sera dans l'abondance ; mais à celui qui n'a pas, on enlèvera même ce qu'il a". - Matthieu 25:29, RSV. L'expression "effet Matthieu" a été utilisée pour la première fois par Robert Merton en 1968, lorsqu'il a décrit comment les systèmes de récompense dans la communauté scientifique ont tendance à reconnaître les contributions des scientifiques éminents et à refuser cette reconnaissance aux scientifiques peu réputés.

Category

Topics

Menu EdhecVox

Au-delà du GDPR : L'effet Matthieu du Big Data

Pourquoi le big data et l'analyse avancée des données risquent-ils d'aggraver la boucle de rétroaction négative évoquée plus haut ?

Derniers articles
EDHEC Vox

Pourquoi les entreprises doivent parfois apprendre à « échouer vite »

Passifs incorporels : les risques cachés qui déterminent la valeur d'une entreprise

Quels arguments en faveur d'un recours accru et plus judicieux à l'IA dans la production et l'évaluation de la recherche ?

Au-delà du GDPR : L'effet Matthieu du Big Data

Pourquoi le big data et l'analyse avancée des données risquent-ils d'aggraver la boucle de rétroaction négative évoquée plus haut ?

Derniers articles EDHEC Vox

Pourquoi les entreprises doivent parfois apprendre à « échouer vite »

Passifs incorporels : les risques cachés qui déterminent la valeur d'une entreprise

Quels arguments en faveur d'un recours accru et plus judicieux à l'IA dans la production et l'évaluation de la recherche ?

Derniers articles
EDHEC Vox