6. Intelligence artificielle et réseaux face à la pandémie : fracture sociale et virtualisation
- Par Grazia Cecere
Pages 102 à 118
Citer ce chapitre
- CECERE, Grazia,
- Sous la direction de SENIK, Claudia,
- Cecere, Grazia.
- Cecere, G.
- Sous la direction de C. Senik
https://doi.org/10.3917/dec.senik.2022.01.0102
Citer ce chapitre
- Cecere, G.
- Sous la direction de C. Senik
- Cecere, Grazia.
- CECERE, Grazia,
- Sous la direction de SENIK, Claudia,
https://doi.org/10.3917/dec.senik.2022.01.0102
1 Ce chapitre s’intéresse aux traitements algorithmiques de la publicité sur les réseaux sociaux pendant la pandémie de la covid-19, en se plaçant du point de vue de l’économiste. En période de crise sanitaire, les informations officielles sur l’épidémie de la covid-19 sont indispensables à la compréhension du virus responsable et à la prévention de la contagion de la maladie infectieuse qu’il provoque. Les mesures de santé publique, telles que la fermeture d’écoles ou le confinement national, impliquent une communication double auprès du grand public. L’une pour informer sur l’évolution du virus, l’autre pour avertir des mesures sanitaires de prévention déployées. Ainsi, les campagnes d’information menées par les autorités publiques constituent-elles un dispositif d’aide et d’accompagnement indispensable à la mise en œuvre des mesures sanitaires recommandées pour enrayer la pandémie.
Les biais algorithmiques de l’information sur les réseaux sociaux
2 Dans le cadre de la crise pandémique de la covid-19, diverses institutions telles que le Parlement européen ou le ministère français des Solidarités et de la Santé ont été à l’initiative de campagnes d’information sur les réseaux sociaux comme Facebook ou Instagram. Ces publicités en ligne ont comme objectif de promouvoir les gestes barrières qui réduisent la transmission du virus. Les réseaux sociaux sont en effet devenus prépondérants dans l’accès à l’information, car ils en sont la première source pour nombre d’utilisateurs, les jeunes en particulier (47 % des utilisateurs de moins de trente-cinq ans en font leur moyen d’information principal).
3 Contrairement aux médias traditionnels, l’information en libre circulation sur ces plates-formes ne fait pas l’objet d’un traitement par des journalistes ou des éditeurs ; leur bien-fondé et leurs sources ne sont pas vérifiés. Tout individu ou entité disposant d’un compte publicitaire sur ces plates-formes est en droit de diffuser une publicité dont le fondement n’est ni probant ni authentifié. La connaissance de la fiabilité des contenus massivement partagés par un nombre croissant d’utilisateurs constitue donc pour les plates-formes numériques un enjeu de lutte contre la désinformation. En effet, des millions de comptes publicitaires actifs y diffusent de manière régulière leurs campagnes. À titre d’exemple, au troisième trimestre 2020, Facebook a annoncé que 10 millions d’annonceurs dans le monde utilisaient sa plate-forme pour promouvoir leurs produits et services. Ceux-ci ont ainsi permis 28,3 milliards de dollars de revenus publicitaires, soit une augmentation de 33 % par rapport à l’année précédente.
4 De nombreux travaux en économie industrielle ont souligné l’importance de l’exploitation des données, fondements indispensables au fonctionnement du modèle économique des plates-formes en ligne [Goldfarb et Tucker, 2019]. Lesquelles ont un besoin fondamental d’intégrer les algorithmes de l’intelligence artificielle (IA) pour établir des synergies pertinentes à partir de données massives, ou big data [Tucker, 2020]. Ces algorithmes peuvent également aider à éviter les biais révélés par les interactions [Fu, Yan et Param, 2020]. Au-delà du bon déroulement de leur processus de fonctionnement, les plates-formes doivent aussi se conformer à des obligations réglementaires. Le Digital Services Act (DSA) proposé en 2021 par la Commission européenne vise ainsi la mise en responsabilité des plates-formes numériques au regard des risques significatifs qu’elles induisent pour leurs utilisateurs dans la diffusion de contenus et produits illicites, dangereux ou contrefaits. C’est pourquoi divers travaux académiques ont été consacrés à la neutralité des algorithmes « intelligents », qui soulèvent des interrogations sur les risques de collusion ou d’abus de position dominante [OCDE, 2017].
5 Ces algorithmes se sont certes révélés des outils d’aide à la décision performants et un important facteur de croissance économique, car ils améliorent l’efficacité de la gestion de grandes masses d’information en réduisant les coûts de prédiction [Agrawal, Gans et Goldfarb, 2016]. En revanche, plusieurs études examinent la production de biais algorithmiques sur les plates-formes en ligne, en particulier en matière de performance publicitaire. Les publicités s’appuient sur des bases de données massives et les réseaux sociaux utilisent les algorithmes pour organiser leur diffusion. Ceux-ci ont notamment pour but de cibler les contenus publicitaires vers les différentes catégories d’utilisateurs répertoriées selon des critères de classement et de pertinence définis par les plates-formes. En ce sens, ils ont un pouvoir décisionnaire quant au type d’information accessible aux utilisateurs. Or il a été démontré que le traitement de l’information par de tels algorithmes n’est pas neutre, car ils peuvent comporter des biais conduisant à des résultats disparates et désavantageant les membres de groupes sociaux particuliers.
6 Les origines de ces biais sont multiples. La plus connue réside dans l’apprentissage de l’algorithme à partir de bases de données biaisées. Celles-ci peuvent refléter des biais humains relevant d’attitudes de discrimination ou de stéréotypes. L’universitaire étatsunienne Latanya Sweeney [2013] a souligné par exemple que les algorithmes dotés d’une capacité d’apprentissage automatique peuvent exprimer des biais non intentionnels, liés aux données sociodémographiques individuelles. Elle a recherché à l’aide du moteur de recherche de Google les noms les plus représentés chez les Afro-Américains aux États-Unis ; et elle a observé que la plupart du temps ces noms étaient associés à des cas judiciaires. Google avait répondu que les résultats des requêtes étaient entièrement automatisés et reflétaient les intérêts des individus.
7 Cela sera confirmé en 2015, quand Amazon a reconnu les limites de son outil de recrutement. L’entreprise avait élaboré un an plus tôt un algorithme de présélection de candidatures pour optimiser ses recrutements. Cet outil, intégrant de l’intelligence artificielle, s’est révélé pénalisant pour les curriculum vitae des femmes : il privilégiait les candidatures masculines pour les postes à forte composante scientifique au détriment des candidatures féminines, à qui il attribuait des notations plus faibles. Cela est dû à la prédominance statistique des hommes dans les disciplines scientifiques, qui conduisait l’algorithme à sous-évaluer les candidatures féminines, jugées moins pertinentes.
8 Dans un autre domaine, des juristes ont dénoncé aux États-Unis la présence de biais raciaux influençant l’application de la justice pénale. L’utilisation de l’outil Compas, algorithme de prédiction des risques de récidive des inculpés, créé par l’entreprise Northpointe dans les années 1990, semblait en effet ostraciser les membres de la communauté afro-américaine en leur attribuant un risque de récidive supérieur à celui de la population blanche. L’estimation de ce risque s’assortissait d’une probabilité de condamnation plus élevée. À l’inverse, la littérature académique en économie et systèmes d’information a démontré que les décisions de justice recourant aux algorithmes peuvent réduire les discriminations comparées à celles des juges seuls [Kleinberg et al. 2018].
9 Par ailleurs, cette littérature a illustré des biais algorithmiques affectant les objectifs de la publicité ciblée en ligne. En 2017, Facebook a été accusé par le site ProPublica d’avoir permis l’achat d’espaces publicitaires permettant d’identifier des ciblages publicitaires avec des critères antisémites. Afin de contrer les contenus à caractère haineux, Facebook a décidé de supprimer de nombreuses options de ciblage. Selon le réseau social, l’existence de critères antisémites était liée à la création automatique de l’algorithme par les outils d’IA. De ce fait, des tribunes exprimant des points de vue haineux envers la communauté juive étaient apparues. La plate-forme a effacé ensuite plus de 5 000 critères de ciblage publicitaire jugés à risque discriminatoire [Mozilla Foundation, 2019].
10 Outre les risques discriminatoires, les résultats inattendus produits par les algorithmes à travers des processus de décision autonome peuvent soulever des problèmes d’égalité et d’équité [Fisman et Luca, 2016]. Dans une perspective plus large, l’équité algorithmique (algorithmic fairness) représente un réel enjeu de responsabilité pour les entreprises et les décideurs publics [Cowgill et Tucker, 2020]. Une expérience sur les annonces de Google Adword, menée par Datta et Tschantz [2015] au moyen de son outil AdFisher, a ainsi démontré que les hommes étaient plus susceptibles que les femmes de recevoir des offres de coaching pour briguer des emplois mieux rémunérés. Ces biais « apparents » peuvent être le résultat d’un mécanisme économique traduisant un biais de marché [Cecere et al., 2020]. Des travaux comme ceux de Lambrecht et Tucker [2019] montrent par exemple que les publicités en ligne concernant les offres d’emplois à caractère scientifique sont moins proposées aux femmes qu’aux hommes. L’attribution de ce résultat à des préjugés sexistes est écartée par les auteurs. Ils ont montré que cet écart s’analysait par la différence des coûts de diffusion : en tant que consommatrices, les femmes ont une valeur significativement plus élevée que les hommes. Elles représentent par conséquent un groupe démographique plus coûteux à cibler ; l’algorithme pratique ainsi une optimisation de la dépense du budget publicitaire en ciblant davantage les hommes.
11 Pour l’heure, à notre connaissance, il existe peu de travaux de recherche analysant la diffusion d’annonces en lien avec les enjeux sanitaires. Chiou et Tucker [2018] ont étudié le rôle de la publicité sur les réseaux sociaux dans la diffusion de fausses nouvelles sur les vaccins infantiles : ils ont montré que les groupes Facebook antivaccins diffusent de fausses histoires au-delà des groupes et servent de chambre d’écho. Pour ces raisons, dans le contexte de la pandémie de covid-19, il est crucial d’améliorer notre compréhension de ce sujet et d’étudier comment l’information la concernant est diffusée auprès de la population.
12 L’objectif de ce chapitre est donc d’analyser, à partir du cas français, l’équité algorithmique dans l’accès à l’information pendant la crise sanitaire et d’éclairer le rôle des plates-formes numériques dans la régulation de l’information. Plusieurs questions se posent : comment la publicité liée à la covid-19 a-t-elle été distribuée ? Quels niveaux de diffusion a-t-on pu distinguer selon les caractéristiques sociodémographiques des individus et selon leur localisation régionale ? L’information est-elle également distribuée aux différentes catégories d’individus définies sur les plates-formes numériques ? Les publicités émanant des autorités publiques sont-elles diffusées comme celles réalisées par d’autres institutions ? Les informations portant sur des thèmes d’intérêt général sont-elles diffusées de la même façon sur l’ensemble du territoire par un algorithme dit « intelligent » ? Quelles sont les conséquences de la régulation du contenu par les algorithmes sur la diffusion de l’information liée à la pandémie ?
13 La suite de ce chapitre est structurée en deux sections : la première présente la méthode de collecte et notre échantillon de publicités diffusées en France ; la seconde formalise les principaux résultats de nos analyses de cet échantillon.
La constitution d’une base de données de publicités en ligne françaises relatives à la pandémie de covid-19
14 Pour répondre aux questions précédentes, nous avons constitué une base de données originale. Celle-ci inclut toutes les publicités, covid-19 et non-covid-19, émises en France par des organismes ayant diffusé au moins une publicité relative à la pandémie entre janvier et juin 2020. Les plates-formes numériques Facebook et Google ont créé des bibliothèques en ligne, libres d’accès, qui nous ont permis de lister de manière exhaustive ces données. Notre attention s’est portée plus particulièrement sur les messages émis par les organismes publics et sur leur diffusion relative, orchestrée par les algorithmes des réseaux sociaux.
15 Suite à la mise en cause de leur neutralité lors des élections américaines de 2016, les réseaux sociaux tels que Facebook, LinkedIn, Twitter et Instagram ont déclaré assurer la transparence des publicités diffusées sur leurs plates-formes. Et depuis l’émergence de la covid-19, ils ont déclaré être activement impliqués dans la lutte contre la désinformation politique et la désinformation sanitaire. Dans ce souci de transparence, les plates-formes recensent les publicités portant sur un enjeu social, électoral ou politique et les mettent à disposition du public, en libre accès, dans des bibliothèques numériques. Il est ainsi possible de consulter le contenu des publicités et leurs indicateurs de performances. Ceux-ci répertorient le nombre de personnes touchées par le message publicitaire, le nombre de ses affichages, les catégories d’affichage en fonction des caractéristiques sociodémographiques de la population destinataire et, enfin, l’identité de l’émetteur. Facebook a ainsi ajouté une catégorie publicitaire dédiée aux enjeux sociaux, électoraux et politiques. Les publicités liées à la covid-19 sont quant à elles considérées comme du contenu lié à la santé et apparaissent dans cette section spéciale.
16 Ces dernières publicités postées par des institutions publiques ont pour objectif, de manière globale, d’informer les individus sur la prévention et la propagation du virus (voir image ci-après). Nous avons collecté sur la plate-forme Facebook AdLibrary les données concernant les publicités liées à l’épidémie de la covid-19, publiées en France entre janvier et juin 2020.
Exemple de publicité liée à la covid-19 dans notre base de données
Exemple de publicité liée à la covid-19 dans notre base de données
17 Pour ce faire, nous avons utilisé des mots clés tels que « covid » et « coronavirus » sur l’API (protocole d’accès à un système d’information) de la plate-forme. Nous avons identifié chaque publicitaire ayant publié au moins une publicité liée à la pandémie, puis nous avons collecté l’ensemble des productions émises par ce même publicitaire sur la même période, y compris celles non liées à la covid-19. L’échantillon des publicitaires à l’origine de ces publicités s’est révélé très hétérogène. Parmi eux, on retrouve des entreprises, des organisations non gouvernementales ou encore des institutions publiques.
18 Ces données, très riches, permettent d’identifier la typologie des annonceurs finançant le message. Nous avons catégorisé les annonces par type d’émetteur, en distinguant autorités publiques et autres types d’organisations. Dans la catégorie autorités publiques figure par exemple le ministère des Solidarités et de la Santé, répertorié pour ses campagnes de promotion des gestes de prévention contre la transmission du virus.
19 Tout annonceur sur les réseaux sociaux est libre de définir les types de public qu’il veut atteindre. Toutefois, les critères qui président à ses choix de segmentation nous sont inconnus, seules les caractéristiques démographiques lisibles lors de l’affichage algorithmique sont observables. Cet affichage algorithmique constitue l’objet de notre étude. Au sein de notre échantillon, nous comptabilisons un total de 19 162 publicités publiées en France de janvier à juin 2020. Parmi elles, 2 944 se rapportent exclusivement à la covid-19 – soit 15,4 % de l’échantillon.
Présentation des principaux résultats
Diffusion de l’information par genre et par catégorie d’âge
20 Nous avons étudié dans un premier temps la distribution du contenu publicitaire lié à la covid-19. Les premiers résultats indiquent les différences d’affichage publicitaire par genre et par catégorie d’âge de population (figure 1, où la proportion des affichages se lit en ordonnées). Pour les femmes, le taux d’affichage moyen des publicités covid-19 est positivement corrélé avec l’âge. En effet, les catégories d’âge ayant les taux d’affichage moyens les plus élevés correspondent aux tranches des 55-64 ans et des 65 ans et plus. En revanche, les tranches d’âge des 13-17 ans et des 18-24 ans présentent des taux d’affichage plus faibles, avoisinant les 10 %.
Affichage moyen des publicités covid-19 et non covid-19 par genre et âge (janvier-juin 2020)
Affichage moyen des publicités covid-19 et non covid-19 par genre et âge (janvier-juin 2020)
21 Cette tendance n’est toutefois pas valable pour les hommes. À l’inverse, les tranches d’âge des 13-17 ans et des 25-34 ans sont pour eux les deux catégories qui présentent les taux d’affichage moyens les plus élevés. Une différence d’affichage entre hommes et femmes en fonction des catégories d’âge semble ainsi prévaloir pour les publicités liées à la covid-19.
22 La figure 2, à titre de comparaison, illustre la différence d’affichage moyen pour les publicités non relatives à la covid-19. Nous remarquons tout d’abord que, à l’exception des 25-34 ans, le taux d’affichage moyen des messages publicitaires auprès des femmes est supérieur à celui relevé auprès des hommes, et cela pour l’ensemble des catégories d’âge. En effet, un taux d’affichage moyen de 12 % est observé pour les femmes de 55-64 ans contre 7,85 % pour les hommes, à catégorie d’âge et types de contenus analogues.
Proportion des publicités covid-19 et non covid-19 réalisées par les autorités publiques et par les autres annonceurs
Proportion des publicités covid-19 et non covid-19 réalisées par les autorités publiques et par les autres annonceurs
23 Une différence de taux de diffusion liée au genre est donc ici également observable, mais la tendance notée à la figure 1 relative aux tranches d’âge n’est pas retrouvée pour les publicités non covid-19.
Les publicités covid-19 réalisées par les autorités publiques
24 Nous avons ensuite étudié la distribution du contenu publicitaire lié à la covid-19 par type d’annonceur à l’origine du financement. Il est important de noter au préalable que les publicités émises par les autorités publiques sont moins nombreuses dans notre échantillon que celles émises par les autres annonceurs. Pendant la période qui nous occupe, les autorités publiques ont émis 930 publicités au total, dont 234 liées à la covid-19.
25 La figure 2 présente la proportion de publicités covid-19 (à gauche) et non covid-19 (à droite) réalisées par les autorités publiques (en noir) et par les autres institutions (en gris). Parmi celles émanant des autorités publiques, 25 % sont relatives à la covid-19 et 75 % portent sur d’autres sujets. Si on compare ces pourcentages aux publicités réalisées par d’autres annonceurs, nous observons une moindre proportion de publicités liée à la covid-19 (15 %), au profit de publicités non covid-19 (85 %). Ce différentiel de proportions témoigne d’une volonté accrue des autorités publiques d’alerter sur la gravité de la crise sanitaire.
Affichage des publicités covid-19 par type d’annonceur, en fonction du genre et des catégories d’âge
26 Nous avons étudié l’affichage algorithmique des caractéristiques démographiques des populations, ressortant des audiences de publicités covid-19 par type d’annonceur. La figure 3 montre le taux d’affichage moyen de publicité adressé aux hommes en distinguant les publicités émises par les autorités publiques et celles des autres organisations. En moyenne, le taux d’affichage moyen des publicités réalisées par des autorités publiques auprès des hommes de moins de trente-cinq ans est très élevé. Ce taux décroît significativement au-delà de cette tranche d’âge. Néanmoins, lorsque la publicité provient d’autres émetteurs, le taux d’affichage moyen réalisé auprès des hommes est plus homogène entre catégories, avec peu d’écarts d’audiences entre les classes d’âge.
Affichage moyen des publicités émises par les autorités publiques et par les autres annonceurs auprès des hommes
Affichage moyen des publicités émises par les autorités publiques et par les autres annonceurs auprès des hommes
27 La figure 4 montre le taux d’affichage moyen de publicité adressé aux femmes en distinguant les publicités émises par les autorités publiques et les autres organisations. Les résultats par tranche d’âge diffèrent par rapport aux hommes. La figure 5 montre que le taux d’affichage moyen des publicités est assez similaire quelle qu’en soit la source. Néanmoins, la tranche d’âge des femmes de 18-24 ans présente le taux d’affichage moyen le plus élevé chez les deux catégories d’annonceurs.
Affichage moyen des publicités émises par les autorités publiques et par les autres annonceurs auprès des femmes
Affichage moyen des publicités émises par les autorités publiques et par les autres annonceurs auprès des femmes
Affichage moyen des publicités covid-19 émises par les autorités publiques et par les autres institutions auprès des hommes
Affichage moyen des publicités covid-19 émises par les autorités publiques et par les autres institutions auprès des hommes
28 La figure 5 montre quant à elle que le taux d’affichage moyen des publicités liées à la covid-19 auprès des hommes, par catégorie d’âge, est significativement différent selon les émetteurs (autorités publiques et autres organisations). Les hommes âgés de soixante-cinq ans et plus ont été moins destinataires des annonces covid-19 émises par les autorités publiques que ceux des autres tranches d’âge. Cette tendance se constate également pour les affichages émanant des autres annonceurs sur le même thème.
29 Le graphique de la figure 5 montre, pour les publicités covid-19 diffusées par les autorités publiques, un taux d’affichage plus élevé, d’une part pour les catégories d’âge les plus jeunes (inférieures à trente-cinq ans) et, d’autre part, très faible pour les hommes de plus de soixante-cinq ans. La tendance se retrouve dans les diffusions par classes d’âge des messages provenant des autres annonceurs, avec moins d’écarts entre les tranches.
30 En ce qui concerne la population féminine, on relève des différences notoires de taux d’affichage moyen des publicités covid-19 par tranches d’âge et par type d’émetteur. La figure 6 montre tout d’abord que le taux d’affichage moyen de la publicité émise par des autorités publiques est inférieur à celui de la publicité réalisée par d’autres institutions, et cela pour toutes les catégories d’âge. De manière plus générale, indépendamment de l’émetteur de la publicité covid-19, les taux d’affichage moyens pour les femmes de plus de quarante-cinq ans sont supérieurs à ceux des plus jeunes ; un résultat logique car elles représentent une population plus à risque.
Affichage moyen des publicités covid-19 émises par les autorités publiques et par les autres organisations auprès des femmes
Affichage moyen des publicités covid-19 émises par les autorités publiques et par les autres organisations auprès des femmes
31 Ces résultats suggèrent que les publicités covid-19 émanant d’une autorité publique sont distribuées davantage aux femmes qu’aux hommes par l’algorithme de Facebook, contrairement à ce qu’avance la littérature existante.
Dépenses moyennes par types de publicités et d’institutions (en euros)
| Dépenses moyennes | Pour les publicités covid-19 | Pour les publicités non-covid-19 | |
|---|---|---|---|
| Autorités publiques (ex. Parlement européen) | 1 061,62 | 1 660,44 | 864,30 |
| Autres émetteurs (ex. Unicef) | 121,22 | 152,15 | 115,82 |
Dépenses moyennes par types de publicités et d’institutions (en euros)
Coût moyen des publicités covid-19 et non covid-19
32 Afin de vérifier s’il existe des mécanismes économiques qui peuvent expliquer les décisions algorithmiques, nous avons comparé les dépenses moyennes consacrées par les autorités publiques et les autres annonceurs à leurs campagnes publicitaires.
33 Le tableau ci-dessus présente en première ligne les dépenses publicitaires moyennes (en euros) covid-19 et non covid-19 des autorités publiques, en seconde ligne celles des autres annonceurs. Nous notons que les autorités publiques ont un poste de dépenses manifestement plus élevé en moyenne, quel que soit le type de publicité ; et que les dépenses consacrées aux publicités covid-19 sont significativement plus importantes que celles du poste non covid-19 pour l’ensemble des annonceurs. Ce constat illustre l’effort économique important réalisé pour ce type d’information. Cet écart significatif des dépenses moyennes entre publicités covid-19 et non covid-19 peut également s’expliquer par un effet d’entraînement. En effet, l’algorithme de la plate-forme a pu identifier un volume accru du flux des publicités liées à la covid-19 et, de ce fait, pu déterminer une augmentation de leurs tarifs de diffusion.
Affichage de la publicité covid-19 et non covid-19 par région en France
34 Nous avons poursuivi notre étude en nous intéressant aux taux d’affichage moyens par région, à partir de la répartition des affichages publicitaires entre les treize régions françaises définies par le nouveau découpage de 2015.
35 Nous avons tout d’abord prêté attention aux taux d’affichage moyens des publicités sans distinction d’objet. À première vue, la cartographie des diffusions apparaissant sur la figure 7 indique des différences significatives entre les régions françaises. On y constate que les régions les plus peuplées et les plus dynamiques sont celles qui bénéficient de taux élevés pour les moyennes d’affichage. En revanche, les régions représentant un poids économique plus modéré ont des taux d’affichage moyens plus faibles.
Affichage moyen des publicités covid-19 et non covid-19 par région
Affichage moyen des publicités covid-19 et non covid-19 par région
Les zones blanches indiquent les régions à taux d’affichage moyen des publicités, tous types confondus, inférieur à 4 %. Les zones grises figurent les régions ayant un taux compris entre 4 % et 10 %. Enfin, les zones noires concernent les régions bénéficiant d’un taux supérieur à 10 %.36 Lorsqu’on observe uniquement les publicités liées à la covid-19, les résultats diffèrent légèrement. En effet, comme le montre la figure 8, trois régions seulement présentent un taux d’affichage moyen supérieur à 10 % (Île-de-France, Auvergne-Rhône-Alpes et Provence-Alpes-Côte-d’Azur), tandis que cinq régions ont alors un taux d’affichage moyen inférieur à 4 %.
Affichage moyen des publicités covid-19 et non covid-19 par région
Affichage moyen des publicités covid-19 et non covid-19 par région
Les zones blanches indiquent les régions à taux d’affichage moyen de publicités covid-19 inférieur à 4 %. Les zones grises figurent les régions ayant un taux compris entre 4 % et 10 %. Enfin, les zones noires concernent les régions bénéficiant d’un taux supérieur à 10 %.37 Cette disparité semble être corrélée à l’intensité de l’impact de la pandémie par région. En effet, les trois régions qui se distinguent par un taux supérieur à 10 % ont été les plus affectées par la crise sanitaire. Seul le Grand-Est fait exception. Constituant l’un des foyers infectieux de l’épidémie les plus forts en France (troisième région la plus meurtrie), cette région présente pourtant un taux d’affichage moyen inférieur à 10 %. Ces résultats suggèrent une tendance de l’algorithme à combiner impact infectieux et densité de la population pour cibler les diffusions par zone géographique. La cartographie des affichages de publicités non covid-19 présente en effet une répartition complètement différente (voir figure 8).
38 Les réseaux sociaux ont joué un rôle prépondérant dans la diffusion d’informations relatives à l’épidémie de la covid-19 : outil de lutte contre la pandémie et objet de nombreux enjeux sociaux et économiques, la diffusion d’informations par leur canal est un sujet sensible. D’où l’intérêt des résultats présentés dans ce chapitre, qui suggèrent une forte disparité d’affichage publicitaire entre genres. En effet, les femmes de plus de quarante-cinq ans ont fait plus que les hommes l’objet de publicités liées à la covid-19. Par ailleurs, nous avons également mis en évidence que l’algorithme de la plate-forme en charge de l’affichage publicitaire a majoritairement diffusé des publicités liées à la covid-19 dans les régions françaises les plus dynamiques d’un point de vue économique mais aussi les plus touchées par cette crise, à l’exception de la région Grand-Est. Il convient toutefois de souligner qu’il s’agit là de simples statistiques descriptives ne pouvant expliquer de manière causale l’affichage algorithmique effectué. Sur la seule base de ces données, il est impossible d’affirmer qu’il existe un lien de cause à effet.
Bibliographie
- Agrawal A., Gans J., Goldfarb A. (2018), « Prediction machines : the simple economics of artificial intelligence », Harvard Business Press.
- Cecere G., Jean C., Lefrere V., Tucker C. (2020), « Trade-offs in automating platform regulatory compliance by algorithm : evidence from the covid-19 pandemic », SSRN Working Paper, n° 3603341.
- Cecere G., Jean C., Manant M., Tucker C. (2020), « Computer algorithms prefer headless women », AEA Working Paper.
- Chiou L., Tucker C. (2018), « Fake news and advertising on social media : a study of the anti-vaccination movement », NBER Working Paper, n° 25223.
- Cowgill B., Tucker C. (2017), « Algorithmic bias : a counterfactual perspective », NSF trustworthy Algorithms Working Paper.
- Datta A., Tschantz M. C. (2015), « Automated experiments on ad privacy settings », Proceedings on Privacy Enhancing Technologies, n° 1, p. 92-112.
- Fisman R., Luca M. (2016), « Fixing discrimination in online marketplaces », Harvard Business Review, vol. 94, n° 12, p. 88-95.
- Fu R., Yan H., Param V. S. (2020), « Artificial intelligence and algorithmic bias : source, detection, mitigation, and implications », Pushing the Boundaries. Frontiers in Impactful OR/OM Research. INFORMS, p. 39-63.
- Goldfarb A., Tucker C. (2019), « Digital economics », Journal of Economic Literature, vol. 57, n° 1, p. 3-43.
- Kleinberg J., Lakkaraji H., Leskovec J. et al. (2018), « Human decisions and machine predictions », The Quarterly Journal of Economics, vol. 133, n° 1, p. 237-293.
- Lambrecht A., Tucker C. (2019), « Algorithmic bias ? An empirical study of apparent gender-based discrimination in the display of STEM career ads », Management Science, vol. 65, n° 7, p. 2966-2981.
- Mozilla Foundation (2019), Internet Health Report 2019, Transcript Verlag.
- OCDE (2017) « Algorithms and collusion : competition policy in the digital age », Technical Report.
- O’Neil C. (2016), Weapons of Math Destruction. How Big Data Increases Inequality and Threatens Democracy, Crown, New York.
- Sweeney L. (2013)., « Discrimination in online ad delivery : Google ads, black names and white names, racial discrimination, and click advertising », Queue, vol. 11, n° 3, p. 10-29.
- Tucker C. (2019), Comment on « Digital Infrastructure ». Economics of Infrastructure Investment, University of Chicago Press, Chicago.