6. Intelligence artificielle et réseaux face à la pandémie : fracture sociale et virtualisation

Grazia Cecere

doi:10.3917/dec.senik.2022.01.0102

Pandémies Nos sociétés à l'épreuve 2022

Chapitre d’ouvrage

6. Intelligence artificielle et réseaux face à la pandémie : fracture sociale et virtualisation

Par Grazia Cecere

Pages 102 à 118

CECERE, Grazia,

2022. 6. Intelligence artificielle et réseaux face à la pandémie : fracture sociale et virtualisation. In :

Sous la direction de SENIK, Claudia,

Pandémies Nos sociétés à l'épreuve Nos sociétés à l'épreuve. Paris : La Découverte. Recherches/Fondation pour les sciences sociales, p.102-118. DOI : 10.3917/dec.senik.2022.01.0102. URL : https://stm.cairn.info/pandemies--9782348076817-page-102?lang=fr.

Cecere, Grazia.

« 6. Intelligence artificielle et réseaux face à la pandémie : fracture sociale et virtualisation ». Pandémies Nos sociétés à l'épreuve Nos sociétés à l'épreuve, La Découverte, 2022. p.102-118. CAIRN.INFO, stm.cairn.info/pandemies--9782348076817-page-102?lang=fr.

Cecere, G.

(2022). 6. Intelligence artificielle et réseaux face à la pandémie : fracture sociale et virtualisation. Dans

Sous la direction de C. Senik

Pandémies Nos sociétés à l'épreuve : Nos sociétés à l'épreuve (p. 102-118). La Découverte. https://doi.org/10.3917/dec.senik.2022.01.0102.

https://doi.org/10.3917/dec.senik.2022.01.0102

Citer ce chapitre

Cecere, G.

(2022). 6. Intelligence artificielle et réseaux face à la pandémie : fracture sociale et virtualisation. Dans

Sous la direction de C. Senik

Pandémies Nos sociétés à l'épreuve : Nos sociétés à l'épreuve (p. 102-118). La Découverte. https://doi.org/10.3917/dec.senik.2022.01.0102.

Cecere, Grazia.

« 6. Intelligence artificielle et réseaux face à la pandémie : fracture sociale et virtualisation ». Pandémies Nos sociétés à l'épreuve Nos sociétés à l'épreuve, La Découverte, 2022. p.102-118. CAIRN.INFO, stm.cairn.info/pandemies--9782348076817-page-102?lang=fr.

CECERE, Grazia,

2022. 6. Intelligence artificielle et réseaux face à la pandémie : fracture sociale et virtualisation. In :

Sous la direction de SENIK, Claudia,

Pandémies Nos sociétés à l'épreuve Nos sociétés à l'épreuve. Paris : La Découverte. Recherches/Fondation pour les sciences sociales, p.102-118. DOI : 10.3917/dec.senik.2022.01.0102. URL : https://stm.cairn.info/pandemies--9782348076817-page-102?lang=fr.

https://doi.org/10.3917/dec.senik.2022.01.0102

1 Ce chapitre s’intéresse aux traitements algorithmiques de la publicité sur les réseaux sociaux pendant la pandémie de la covid-19, en se plaçant du point de vue de l’économiste. En période de crise sanitaire, les informations officielles sur l’épidémie de la covid-19 sont indispensables à la compréhension du virus responsable et à la prévention de la contagion de la maladie infectieuse qu’il provoque. Les mesures de santé publique, telles que la fermeture d’écoles ou le confinement national, impliquent une communication double auprès du grand public. L’une pour informer sur l’évolution du virus, l’autre pour avertir des mesures sanitaires de prévention déployées. Ainsi, les campagnes d’information menées par les autorités publiques constituent-elles un dispositif d’aide et d’accompagnement indispensable à la mise en œuvre des mesures sanitaires recommandées pour enrayer la pandémie.

Les biais algorithmiques de l’information sur les réseaux sociaux

2 Dans le cadre de la crise pandémique de la covid-19, diverses institutions telles que le Parlement européen ou le ministère français des Solidarités et de la Santé ont été à l’initiative de campagnes d’information sur les réseaux sociaux comme Facebook ou Instagram. Ces publicités en ligne ont comme objectif de promouvoir les gestes barrières qui réduisent la transmission du virus. Les réseaux sociaux sont en effet devenus prépondérants dans l’accès à l’information, car ils en sont la première source pour nombre d’utilisateurs, les jeunes en particulier (47 % des utilisateurs de moins de trente-cinq ans en font leur moyen d’information principal).

3 Contrairement aux médias traditionnels, l’information en libre circulation sur ces plates-formes ne fait pas l’objet d’un traitement par des journalistes ou des éditeurs ; leur bien-fondé et leurs sources ne sont pas vérifiés. Tout individu ou entité disposant d’un compte publicitaire sur ces plates-formes est en droit de diffuser une publicité dont le fondement n’est ni probant ni authentifié. La connaissance de la fiabilité des contenus massivement partagés par un nombre croissant d’utilisateurs constitue donc pour les plates-formes numériques un enjeu de lutte contre la désinformation. En effet, des millions de comptes publicitaires actifs y diffusent de manière régulière leurs campagnes. À titre d’exemple, au troisième trimestre 2020, Facebook a annoncé que 10 millions d’annonceurs dans le monde utilisaient sa plate-forme pour promouvoir leurs produits et services. Ceux-ci ont ainsi permis 28,3 milliards de dollars de revenus publicitaires, soit une augmentation de 33 % par rapport à l’année précédente.

4 De nombreux travaux en économie industrielle ont souligné l’importance de l’exploitation des données, fondements indispensables au fonctionnement du modèle économique des plates-formes en ligne [Goldfarb et Tucker, 2019]. Lesquelles ont un besoin fondamental d’intégrer les algorithmes de l’intelligence artificielle (IA) pour établir des synergies pertinentes à partir de données massives, ou big data [Tucker, 2020]. Ces algorithmes peuvent également aider à éviter les biais révélés par les interactions [Fu, Yan et Param, 2020]. Au-delà du bon déroulement de leur processus de fonctionnement, les plates-formes doivent aussi se conformer à des obligations réglementaires. Le Digital Services Act (DSA) proposé en 2021 par la Commission européenne vise ainsi la mise en responsabilité des plates-formes numériques au regard des risques significatifs qu’elles induisent pour leurs utilisateurs dans la diffusion de contenus et produits illicites, dangereux ou contrefaits. C’est pourquoi divers travaux académiques ont été consacrés à la neutralité des algorithmes « intelligents », qui soulèvent des interrogations sur les risques de collusion ou d’abus de position dominante [OCDE, 2017].

5 Ces algorithmes se sont certes révélés des outils d’aide à la décision performants et un important facteur de croissance économique, car ils améliorent l’efficacité de la gestion de grandes masses d’information en réduisant les coûts de prédiction [Agrawal, Gans et Goldfarb, 2016]. En revanche, plusieurs études examinent la production de biais algorithmiques sur les plates-formes en ligne, en particulier en matière de performance publicitaire. Les publicités s’appuient sur des bases de données massives et les réseaux sociaux utilisent les algorithmes pour organiser leur diffusion. Ceux-ci ont notamment pour but de cibler les contenus publicitaires vers les différentes catégories d’utilisateurs répertoriées selon des critères de classement et de pertinence définis par les plates-formes. En ce sens, ils ont un pouvoir décisionnaire quant au type d’information accessible aux utilisateurs. Or il a été démontré que le traitement de l’information par de tels algorithmes n’est pas neutre, car ils peuvent comporter des biais conduisant à des résultats disparates et désavantageant les membres de groupes sociaux particuliers.

6 Les origines de ces biais sont multiples. La plus connue réside dans l’apprentissage de l’algorithme à partir de bases de données biaisées. Celles-ci peuvent refléter des biais humains relevant d’attitudes de discrimination ou de stéréotypes. L’universitaire étatsunienne Latanya Sweeney [2013] a souligné par exemple que les algorithmes dotés d’une capacité d’apprentissage automatique peuvent exprimer des biais non intentionnels, liés aux données sociodémographiques individuelles. Elle a recherché à l’aide du moteur de recherche de Google les noms les plus représentés chez les Afro-Américains aux États-Unis ; et elle a observé que la plupart du temps ces noms étaient associés à des cas judiciaires. Google avait répondu que les résultats des requêtes étaient entièrement automatisés et reflétaient les intérêts des individus.

7 Cela sera confirmé en 2015, quand Amazon a reconnu les limites de son outil de recrutement. L’entreprise avait élaboré un an plus tôt un algorithme de présélection de candidatures pour optimiser ses recrutements. Cet outil, intégrant de l’intelligence artificielle, s’est révélé pénalisant pour les curriculum vitae des femmes : il privilégiait les candidatures masculines pour les postes à forte composante scientifique au détriment des candidatures féminines, à qui il attribuait des notations plus faibles. Cela est dû à la prédominance statistique des hommes dans les disciplines scientifiques, qui conduisait l’algorithme à sous-évaluer les candidatures féminines, jugées moins pertinentes.

8 Dans un autre domaine, des juristes ont dénoncé aux États-Unis la présence de biais raciaux influençant l’application de la justice pénale. L’utilisation de l’outil Compas, algorithme de prédiction des risques de récidive des inculpés, créé par l’entreprise Northpointe dans les années 1990, semblait en effet ostraciser les membres de la communauté afro-américaine en leur attribuant un risque de récidive supérieur à celui de la population blanche. L’estimation de ce risque s’assortissait d’une probabilité de condamnation plus élevée. À l’inverse, la littérature académique en économie et systèmes d’information a démontré que les décisions de justice recourant aux algorithmes peuvent réduire les discriminations comparées à celles des juges seuls [Kleinberg et al. 2018].

9 Par ailleurs, cette littérature a illustré des biais algorithmiques affectant les objectifs de la publicité ciblée en ligne. En 2017, Facebook a été accusé par le site ProPublica d’avoir permis l’achat d’espaces publicitaires permettant d’identifier des ciblages publicitaires avec des critères antisémites. Afin de contrer les contenus à caractère haineux, Facebook a décidé de supprimer de nombreuses options de ciblage. Selon le réseau social, l’existence de critères antisémites était liée à la création automatique de l’algorithme par les outils d’IA. De ce fait, des tribunes exprimant des points de vue haineux envers la communauté juive étaient apparues. La plate-forme a effacé ensuite plus de 5 000 critères de ciblage publicitaire jugés à risque discriminatoire [Mozilla Foundation, 2019].

10 Outre les risques discriminatoires, les résultats inattendus produits par les algorithmes à travers des processus de décision autonome peuvent soulever des problèmes d’égalité et d’équité [Fisman et Luca, 2016]. Dans une perspective plus large, l’équité algorithmique (algorithmic fairness) représente un réel enjeu de responsabilité pour les entreprises et les décideurs publics [Cowgill et Tucker, 2020]. Une expérience sur les annonces de Google Adword, menée par Datta et Tschantz [2015] au moyen de son outil AdFisher, a ainsi démontré que les hommes étaient plus susceptibles que les femmes de recevoir des offres de coaching pour briguer des emplois mieux rémunérés. Ces biais « apparents » peuvent être le résultat d’un mécanisme économique traduisant un biais de marché [Cecere et al., 2020]. Des travaux comme ceux de Lambrecht et Tucker [2019] montrent par exemple que les publicités en ligne concernant les offres d’emplois à caractère scientifique sont moins proposées aux femmes qu’aux hommes. L’attribution de ce résultat à des préjugés sexistes est écartée par les auteurs. Ils ont montré que cet écart s’analysait par la différence des coûts de diffusion : en tant que consommatrices, les femmes ont une valeur significativement plus élevée que les hommes. Elles représentent par conséquent un groupe démographique plus coûteux à cibler ; l’algorithme pratique ainsi une optimisation de la dépense du budget publicitaire en ciblant davantage les hommes.

11 Pour l’heure, à notre connaissance, il existe peu de travaux de recherche analysant la diffusion d’annonces en lien avec les enjeux sanitaires. Chiou et Tucker [2018] ont étudié le rôle de la publicité sur les réseaux sociaux dans la diffusion de fausses nouvelles sur les vaccins infantiles : ils ont montré que les groupes Facebook antivaccins diffusent de fausses histoires au-delà des groupes et servent de chambre d’écho. Pour ces raisons, dans le contexte de la pandémie de covid-19, il est crucial d’améliorer notre compréhension de ce sujet et d’étudier comment l’information la concernant est diffusée auprès de la population.

12 L’objectif de ce chapitre est donc d’analyser, à partir du cas français, l’équité algorithmique dans l’accès à l’information pendant la crise sanitaire et d’éclairer le rôle des plates-formes numériques dans la régulation de l’information. Plusieurs questions se posent : comment la publicité liée à la covid-19 a-t-elle été distribuée ? Quels niveaux de diffusion a-t-on pu distinguer selon les caractéristiques sociodémographiques des individus et selon leur localisation régionale ? L’information est-elle également distribuée aux différentes catégories d’individus définies sur les plates-formes numériques ? Les publicités émanant des autorités publiques sont-elles diffusées comme celles réalisées par d’autres institutions ? Les informations portant sur des thèmes d’intérêt général sont-elles diffusées de la même façon sur l’ensemble du territoire par un algorithme dit « intelligent » ? Quelles sont les conséquences de la régulation du contenu par les algorithmes sur la diffusion de l’information liée à la pandémie ?

13 La suite de ce chapitre est structurée en deux sections : la première présente la méthode de collecte et notre échantillon de publicités diffusées en France ; la seconde formalise les principaux résultats de nos analyses de cet échantillon.

La constitution d’une base de données de publicités en ligne françaises relatives à la pandémie de covid-19

14 Pour répondre aux questions précédentes, nous avons constitué une base de données originale. Celle-ci inclut toutes les publicités, covid-19 et non-covid-19, émises en France par des organismes ayant diffusé au moins une publicité relative à la pandémie entre janvier et juin 2020. Les plates-formes numériques Facebook et Google ont créé des bibliothèques en ligne, libres d’accès, qui nous ont permis de lister de manière exhaustive ces données. Notre attention s’est portée plus particulièrement sur les messages émis par les organismes publics et sur leur diffusion relative, orchestrée par les algorithmes des réseaux sociaux.

15 Suite à la mise en cause de leur neutralité lors des élections américaines de 2016, les réseaux sociaux tels que Facebook, LinkedIn, Twitter et Instagram ont déclaré assurer la transparence des publicités diffusées sur leurs plates-formes. Et depuis l’émergence de la covid-19, ils ont déclaré être activement impliqués dans la lutte contre la désinformation politique et la désinformation sanitaire. Dans ce souci de transparence, les plates-formes recensent les publicités portant sur un enjeu social, électoral ou politique et les mettent à disposition du public, en libre accès, dans des bibliothèques numériques. Il est ainsi possible de consulter le contenu des publicités et leurs indicateurs de performances. Ceux-ci répertorient le nombre de personnes touchées par le message publicitaire, le nombre de ses affichages, les catégories d’affichage en fonction des caractéristiques sociodémographiques de la population destinataire et, enfin, l’identité de l’émetteur. Facebook a ainsi ajouté une catégorie publicitaire dédiée aux enjeux sociaux, électoraux et politiques. Les publicités liées à la covid-19 sont quant à elles considérées comme du contenu lié à la santé et apparaissent dans cette section spéciale.

16 Ces dernières publicités postées par des institutions publiques ont pour objectif, de manière globale, d’informer les individus sur la prévention et la propagation du virus (voir image ci-après). Nous avons collecté sur la plate-forme Facebook AdLibrary les données concernant les publicités liées à l’épidémie de la covid-19, publiées en France entre janvier et juin 2020.

Exemple de publicité liée à la covid-19 dans notre base de données

Description de l'image par IA : Illustration en noir et blanc montrant des personnes suivant des consignes de sécurité COVID-19.

L'image représente une publicité liée à la COVID-19. Elle contient le logo du Parlement européen et est sponsorisée par le Parlement européen. Le texte principal de la publicité met en garde contre les fausses informations concernant le COVID-19 et leur risque pour la santé. Il encourage les gens à consulter des sources fiables et à éviter de propager de fausses nouvelles. La publicité inclut également un guide court pour aider à reconnaître les fausses informations. L'image montre trois scènes différentes : 1. Une personne debout devant un ordinateur, probablement en train de lire des informations. 2. Une autre personne assise à une table avec un ordinateur portable, également en train de lire des informations. 3. Une troisième personne assise sur un canapé avec une tablette, lisant des informations. Le texte "STAY SAFE. Check Reliable Sources" est affiché de manière proéminente, soulignant l'importance de vérifier les sources fiables pour rester en sécurité. Le hashtag "#EuropeansAgainstCovid19" est également présent, indiquant une campagne de sensibilisation du Parlement européen contre la propagation de fausses informations sur le COVID-19. L'image est en noir et blanc, ce qui donne un ton sérieux et informatif. Les personnes sont représentées de manière stylisée, sans détails spécifiques, ce qui permet de se concentrer sur le message principal de la publicité.

Exemple de publicité liée à la covid-19 dans notre base de données

17 Pour ce faire, nous avons utilisé des mots clés tels que « covid » et « coronavirus » sur l’API (protocole d’accès à un système d’information) de la plate-forme. Nous avons identifié chaque publicitaire ayant publié au moins une publicité liée à la pandémie, puis nous avons collecté l’ensemble des productions émises par ce même publicitaire sur la même période, y compris celles non liées à la covid-19. L’échantillon des publicitaires à l’origine de ces publicités s’est révélé très hétérogène. Parmi eux, on retrouve des entreprises, des organisations non gouvernementales ou encore des institutions publiques.

18 Ces données, très riches, permettent d’identifier la typologie des annonceurs finançant le message. Nous avons catégorisé les annonces par type d’émetteur, en distinguant autorités publiques et autres types d’organisations. Dans la catégorie autorités publiques figure par exemple le ministère des Solidarités et de la Santé, répertorié pour ses campagnes de promotion des gestes de prévention contre la transmission du virus.

19 Tout annonceur sur les réseaux sociaux est libre de définir les types de public qu’il veut atteindre. Toutefois, les critères qui président à ses choix de segmentation nous sont inconnus, seules les caractéristiques démographiques lisibles lors de l’affichage algorithmique sont observables. Cet affichage algorithmique constitue l’objet de notre étude. Au sein de notre échantillon, nous comptabilisons un total de 19 162 publicités publiées en France de janvier à juin 2020. Parmi elles, 2 944 se rapportent exclusivement à la covid-19 – soit 15,4 % de l’échantillon.

Présentation des principaux résultats

Diffusion de l’information par genre et par catégorie d’âge

20 Nous avons étudié dans un premier temps la distribution du contenu publicitaire lié à la covid-19. Les premiers résultats indiquent les différences d’affichage publicitaire par genre et par catégorie d’âge de population (figure 1, où la proportion des affichages se lit en ordonnées). Pour les femmes, le taux d’affichage moyen des publicités covid-19 est positivement corrélé avec l’âge. En effet, les catégories d’âge ayant les taux d’affichage moyens les plus élevés correspondent aux tranches des 55-64 ans et des 65 ans et plus. En revanche, les tranches d’âge des 13-17 ans et des 18-24 ans présentent des taux d’affichage plus faibles, avoisinant les 10 %.

Figure 1

Affichage moyen des publicités covid-19 et non covid-19 par genre et âge (janvier-juin 2020)

Description de l'image par IA : Graphiques comparant l'affichage moyen des publicités COVID et non-COVID par genre et catégories d'âge (janvier-juin 2020).

L'image contient quatre graphiques à barres comparant l'affichage moyen des publicités COVID-19 et non-COVID-19 par genre et par catégorie d'âge, pour la période de janvier à juin 2020. Le premier graphique montre l'affichage moyen des publicités COVID-19 pour les femmes, réparties en cinq catégories d'âge : 13-17 ans, 18-24 ans, 25-34 ans, 35-44 ans, 45-54 ans, 55-64 ans et 65 ans et plus. Les barres sont de couleurs différentes pour chaque catégorie d'âge, avec une tendance générale à l'augmentation de l'affichage moyen avec l'âge. Le deuxième graphique montre l'affichage moyen des publicités COVID-19 pour les hommes, également réparties en cinq catégories d'âge similaires. Les barres sont de couleurs différentes pour chaque catégorie d'âge, avec une tendance générale à la diminution de l'affichage moyen avec l'âge. Le troisième graphique montre l'affichage moyen des publicités non-COVID-19 pour les femmes, réparties en cinq catégories d'âge : 13-17 ans, 18-24 ans, 25-34 ans, 35-44 ans, 45-54 ans, 55-64 ans et 65 ans et plus. Les barres sont de couleurs différentes pour chaque catégorie d'âge, avec une tendance générale à l'augmentation de l'affichage moyen avec l'âge. Le quatrième graphique montre l'affichage moyen des publicités non-COVID-19 pour les hommes, également réparties en cinq catégories d'âge similaires. Les barres sont de couleurs différentes pour chaque catégorie d'âge, avec une tendance générale à la diminution de l'affichage moyen avec l'âge. Les graphiques permettent de visualiser les différences d'affichage moyen des publicités COVID-19 et non-COVID-19 selon le genre et l'âge des individus.

Affichage moyen des publicités covid-19 et non covid-19 par genre et âge (janvier-juin 2020)

21 Cette tendance n’est toutefois pas valable pour les hommes. À l’inverse, les tranches d’âge des 13-17 ans et des 25-34 ans sont pour eux les deux catégories qui présentent les taux d’affichage moyens les plus élevés. Une différence d’affichage entre hommes et femmes en fonction des catégories d’âge semble ainsi prévaloir pour les publicités liées à la covid-19.

22 La figure 2, à titre de comparaison, illustre la différence d’affichage moyen pour les publicités non relatives à la covid-19. Nous remarquons tout d’abord que, à l’exception des 25-34 ans, le taux d’affichage moyen des messages publicitaires auprès des femmes est supérieur à celui relevé auprès des hommes, et cela pour l’ensemble des catégories d’âge. En effet, un taux d’affichage moyen de 12 % est observé pour les femmes de 55-64 ans contre 7,85 % pour les hommes, à catégorie d’âge et types de contenus analogues.

Figure 2

Proportion des publicités covid-19 et non covid-19 réalisées par les autorités publiques et par les autres annonceurs

Description de l'image par IA : Deux graphiques à barres comparant les proportions de publicités COVID et non-COVID.

L'image montre deux histogrammes comparant les proportions de publicités COVID-19 et non COVID-19 réalisées par les autorités publiques et par d'autres annonceurs. Le premier histogramme, intitulé "COVID", présente deux barres : - Une barre noire représentant les publicités COVID-19 émises par les autorités publiques, qui atteint environ 0,3 sur l'axe des proportions. - Une barre grise représentant les publicités COVID-19 émises par d'autres annonceurs, qui atteint environ 0,1 sur l'axe des proportions. Le deuxième histogramme, intitulé "NON COVID", présente également deux barres : - Une barre noire représentant les publicités non COVID-19 émises par les autorités publiques, qui atteint environ 0,7 sur l'axe des proportions. - Une barre grise représentant les publicités non COVID-19 émises par d'autres annonceurs, qui atteint environ 0,9 sur l'axe des proportions. Les deux histogrammes ont des axes étiquetés "Proportions de publicités" allant de 0,0 à 0,9.

Proportion des publicités covid-19 et non covid-19 réalisées par les autorités publiques et par les autres annonceurs

23 Une différence de taux de diffusion liée au genre est donc ici également observable, mais la tendance notée à la figure 1 relative aux tranches d’âge n’est pas retrouvée pour les publicités non covid-19.

Les publicités covid-19 réalisées par les autorités publiques

24 Nous avons ensuite étudié la distribution du contenu publicitaire lié à la covid-19 par type d’annonceur à l’origine du financement. Il est important de noter au préalable que les publicités émises par les autorités publiques sont moins nombreuses dans notre échantillon que celles émises par les autres annonceurs. Pendant la période qui nous occupe, les autorités publiques ont émis 930 publicités au total, dont 234 liées à la covid-19.

25 La figure 2 présente la proportion de publicités covid-19 (à gauche) et non covid-19 (à droite) réalisées par les autorités publiques (en noir) et par les autres institutions (en gris). Parmi celles émanant des autorités publiques, 25 % sont relatives à la covid-19 et 75 % portent sur d’autres sujets. Si on compare ces pourcentages aux publicités réalisées par d’autres annonceurs, nous observons une moindre proportion de publicités liée à la covid-19 (15 %), au profit de publicités non covid-19 (85 %). Ce différentiel de proportions témoigne d’une volonté accrue des autorités publiques d’alerter sur la gravité de la crise sanitaire.

Affichage des publicités covid-19 par type d’annonceur, en fonction du genre et des catégories d’âge

26 Nous avons étudié l’affichage algorithmique des caractéristiques démographiques des populations, ressortant des audiences de publicités covid-19 par type d’annonceur. La figure 3 montre le taux d’affichage moyen de publicité adressé aux hommes en distinguant les publicités émises par les autorités publiques et celles des autres organisations. En moyenne, le taux d’affichage moyen des publicités réalisées par des autorités publiques auprès des hommes de moins de trente-cinq ans est très élevé. Ce taux décroît significativement au-delà de cette tranche d’âge. Néanmoins, lorsque la publicité provient d’autres émetteurs, le taux d’affichage moyen réalisé auprès des hommes est plus homogène entre catégories, avec peu d’écarts d’audiences entre les classes d’âge.

Figure 3

Affichage moyen des publicités émises par les autorités publiques et par les autres annonceurs auprès des hommes

Description de l'image par IA : Barres graphiques comparant l'affichage moyen des publicités par âge pour les autorités publiques et autres institutions.

L'image montre deux graphiques à barres comparant l'affichage moyen des publicités émises par les autorités publiques et par d'autres institutions auprès des hommes, répartis par catégories d'âge. Le premier graphique à gauche représente les autorités publiques. Les catégories d'âge sont codées par couleur : 13-17 ans (gris clair), 18-24 ans (gris moyen), 25-34 ans (gris foncé), 35-44 ans (bleu clair), 45-54 ans (bleu moyen), 55-64 ans (bleu foncé), et 65+ ans (noir). Les hauteurs des barres indiquent l'affichage moyen des publicités pour chaque groupe d'âge. Les valeurs varient, avec les groupes d'âge plus jeunes (13-17 ans et 18-24 ans) ayant des valeurs plus élevées, tandis que les groupes plus âgés (55-64 ans et 65+) ont des valeurs plus basses. Le deuxième graphique à droite montre les autres institutions avec les mêmes catégories d'âge et couleurs. Les valeurs d'affichage moyen des publicités sont également variées, avec une valeur plus élevée pour le groupe d'âge 13-17 ans et des valeurs plus basses pour les groupes plus âgés. Les deux graphiques permettent de comparer l'impact des publicités émises par les autorités publiques et par d'autres institutions auprès des hommes de différentes tranches d'âge.

Affichage moyen des publicités émises par les autorités publiques et par les autres annonceurs auprès des hommes

27 La figure 4 montre le taux d’affichage moyen de publicité adressé aux femmes en distinguant les publicités émises par les autorités publiques et les autres organisations. Les résultats par tranche d’âge diffèrent par rapport aux hommes. La figure 5 montre que le taux d’affichage moyen des publicités est assez similaire quelle qu’en soit la source. Néanmoins, la tranche d’âge des femmes de 18-24 ans présente le taux d’affichage moyen le plus élevé chez les deux catégories d’annonceurs.

Figure 4

Affichage moyen des publicités émises par les autorités publiques et par les autres annonceurs auprès des femmes

Description de l'image par IA : Graphiques à barres comparant l'affichage moyen des publicités par âge.

L'image montre deux graphiques à barres comparant l'affichage moyen des publicités émises par les autorités publiques et par d'autres institutions auprès des femmes, réparties par catégories d'âge. Le graphique de gauche représente les autorités publiques. Les catégories d'âge sont codées par couleur : - 13-17 ans : gris clair - 18-24 ans : gris moyen - 25-34 ans : gris foncé - 35-44 ans : gris très foncé - 45-54 ans : noir clair - 55-64 ans : noir moyen - 65+ ans : noir foncé Les hauteurs des barres indiquent l'affichage moyen des publicités pour chaque catégorie d'âge, avec des valeurs variant approximativement entre 0,07 et 0,13. Le graphique de droite représente les autres institutions avec les mêmes catégories d'âge codées par couleur. Les hauteurs des barres indiquent également l'affichage moyen des publicités pour chaque catégorie d'âge, avec des valeurs variant approximativement entre 0,10 et 0,14. Les deux graphiques montrent des tendances différentes selon les catégories d'âge, avec des variations notables dans l'affichage moyen des publicités émises par les autorités publiques et par les autres institutions.

Affichage moyen des publicités émises par les autorités publiques et par les autres annonceurs auprès des femmes

Figure 5

Affichage moyen des publicités covid-19 émises par les autorités publiques et par les autres institutions auprès des hommes

Description de l'image par IA : Graphiques à barres montrant l'affichage moyen des publicités COVID-19 par âge et institutions.

L'image montre deux graphiques à barres comparant l'affichage moyen des publicités COVID-19 émises par les autorités publiques et par d'autres institutions auprès des hommes, répartis par catégories d'âge. Le premier graphique à gauche représente les autorités publiques. Les catégories d'âge sont codées par couleur : 13-17 ans (blanc clair), 18-24 ans (gris clair), 25-34 ans (gris moyen), 35-44 ans (gris foncé), 45-54 ans (noir), 55-64 ans (noir plus foncé), et 65+ ans (noir très foncé). Le deuxième graphique à droite montre les autres institutions avec les mêmes catégories d'âge codées par couleur. Sur le graphique des autorités publiques, les publicités sont les plus fréquentes pour les hommes âgés de 18-24 ans, suivis par les hommes de 25-34 ans. Les catégories d'âge plus âgées montrent une diminution progressive de l'affichage moyen. Sur le graphique des autres institutions, les publicités sont également les plus fréquentes pour les hommes âgés de 18-24 ans, mais avec une différence moins marquée par rapport aux autres catégories d'âge par rapport aux autorités publiques. Les hommes de 25-34 ans et 35-44 ans montrent également des niveaux élevés d'affichage. Les catégories d'âge plus âgées (45-54 ans, 55-64 ans, et 65+) ont des niveaux d'affichage plus faibles dans les deux graphiques, mais les hommes de 45-54 ans montrent un affichage plus élevé que les autres catégories d'âge plus âgées. En résumé, les jeunes adultes (18-34 ans) reçoivent le plus d'affichage des publicités COVID-19 des deux sources, avec une diminution progressive pour les catégories d'âge plus âgées.

Affichage moyen des publicités covid-19 émises par les autorités publiques et par les autres institutions auprès des hommes

28 La figure 5 montre quant à elle que le taux d’affichage moyen des publicités liées à la covid-19 auprès des hommes, par catégorie d’âge, est significativement différent selon les émetteurs (autorités publiques et autres organisations). Les hommes âgés de soixante-cinq ans et plus ont été moins destinataires des annonces covid-19 émises par les autorités publiques que ceux des autres tranches d’âge. Cette tendance se constate également pour les affichages émanant des autres annonceurs sur le même thème.

29 Le graphique de la figure 5 montre, pour les publicités covid-19 diffusées par les autorités publiques, un taux d’affichage plus élevé, d’une part pour les catégories d’âge les plus jeunes (inférieures à trente-cinq ans) et, d’autre part, très faible pour les hommes de plus de soixante-cinq ans. La tendance se retrouve dans les diffusions par classes d’âge des messages provenant des autres annonceurs, avec moins d’écarts entre les tranches.

30 En ce qui concerne la population féminine, on relève des différences notoires de taux d’affichage moyen des publicités covid-19 par tranches d’âge et par type d’émetteur. La figure 6 montre tout d’abord que le taux d’affichage moyen de la publicité émise par des autorités publiques est inférieur à celui de la publicité réalisée par d’autres institutions, et cela pour toutes les catégories d’âge. De manière plus générale, indépendamment de l’émetteur de la publicité covid-19, les taux d’affichage moyens pour les femmes de plus de quarante-cinq ans sont supérieurs à ceux des plus jeunes ; un résultat logique car elles représentent une population plus à risque.

Figure 6

Affichage moyen des publicités covid-19 émises par les autorités publiques et par les autres organisations auprès des femmes

Description de l'image par IA : Graphiques à barres comparant l'affichage moyen des publicités COVID-19 par âge.

L'image contient deux graphiques à barres côte à côte comparant l'affichage moyen des publicités COVID-19 émises par les autorités publiques et par d'autres institutions auprès des femmes, segmentées par catégories d'âge. Le graphique de gauche montre l'affichage moyen des publicités COVID-19 émises par les autorités publiques. Les catégories d'âge sont représentées par différentes nuances de gris : - 13-17 ans : Gris clair - 18-24 ans : Gris moyen clair - 25-34 ans : Gris moyen foncé - 35-44 ans : Gris foncé - 45-54 ans : Gris très foncé - 55-64 ans : Noir - 65+ ans : Noir très foncé Les valeurs de l'affichage moyen varient entre 0,07 et 0,13. Le graphique de droite montre l'affichage moyen des publicités COVID-19 émises par d'autres institutions. Les mêmes catégories d'âge sont utilisées avec les mêmes nuances de gris : - 13-17 ans : Gris clair - 18-24 ans : Gris moyen clair - 25-34 ans : Gris moyen foncé - 35-44 ans : Gris foncé - 45-54 ans : Gris très foncé - 55-64 ans : Noir - 65+ ans : Noir très foncé Les valeurs de l'affichage moyen varient entre 0,10 et 0,14. Les deux graphiques montrent une tendance générale où l'affichage moyen des publicités augmente avec l'âge. Les catégories d'âge plus jeunes (13-17 ans et 18-24 ans) ont des valeurs d'affichage plus basses, tandis que les catégories d'âge plus âgées (55-64 ans et 65+) ont des valeurs d'affichage plus élevées.

Affichage moyen des publicités covid-19 émises par les autorités publiques et par les autres organisations auprès des femmes

31 Ces résultats suggèrent que les publicités covid-19 émanant d’une autorité publique sont distribuées davantage aux femmes qu’aux hommes par l’algorithme de Facebook, contrairement à ce qu’avance la littérature existante.

Tableau 1

Dépenses moyennes par types de publicités et d’institutions (en euros)

	Dépenses moyennes	Pour les publicités covid-19	Pour les publicités non-covid-19
Autorités publiques (ex. Parlement européen)	1 061,62	1 660,44	864,30
Autres émetteurs (ex. Unicef)	121,22	152,15	115,82

Dépenses moyennes par types de publicités et d’institutions (en euros)

Coût moyen des publicités covid-19 et non covid-19

32 Afin de vérifier s’il existe des mécanismes économiques qui peuvent expliquer les décisions algorithmiques, nous avons comparé les dépenses moyennes consacrées par les autorités publiques et les autres annonceurs à leurs campagnes publicitaires.

33 Le tableau ci-dessus présente en première ligne les dépenses publicitaires moyennes (en euros) covid-19 et non covid-19 des autorités publiques, en seconde ligne celles des autres annonceurs. Nous notons que les autorités publiques ont un poste de dépenses manifestement plus élevé en moyenne, quel que soit le type de publicité ; et que les dépenses consacrées aux publicités covid-19 sont significativement plus importantes que celles du poste non covid-19 pour l’ensemble des annonceurs. Ce constat illustre l’effort économique important réalisé pour ce type d’information. Cet écart significatif des dépenses moyennes entre publicités covid-19 et non covid-19 peut également s’expliquer par un effet d’entraînement. En effet, l’algorithme de la plate-forme a pu identifier un volume accru du flux des publicités liées à la covid-19 et, de ce fait, pu déterminer une augmentation de leurs tarifs de diffusion.

Affichage de la publicité covid-19 et non covid-19 par région en France

34 Nous avons poursuivi notre étude en nous intéressant aux taux d’affichage moyens par région, à partir de la répartition des affichages publicitaires entre les treize régions françaises définies par le nouveau découpage de 2015.

35 Nous avons tout d’abord prêté attention aux taux d’affichage moyens des publicités sans distinction d’objet. À première vue, la cartographie des diffusions apparaissant sur la figure 7 indique des différences significatives entre les régions françaises. On y constate que les régions les plus peuplées et les plus dynamiques sont celles qui bénéficient de taux élevés pour les moyennes d’affichage. En revanche, les régions représentant un poids économique plus modéré ont des taux d’affichage moyens plus faibles.

Figure 7

Affichage moyen des publicités covid-19 et non covid-19 par région

Description de l'image par IA : Carte de France avec régions en blanc (moins de 4%), gris (4-10%) et noir (plus de 10%) selon l'affichage moyen des publicités.

Affichage moyen des publicités covid-19 et non covid-19 par région

Les zones blanches indiquent les régions à taux d’affichage moyen des publicités, tous types confondus, inférieur à 4 %. Les zones grises figurent les régions ayant un taux compris entre 4 % et 10 %. Enfin, les zones noires concernent les régions bénéficiant d’un taux supérieur à 10 %.

36 Lorsqu’on observe uniquement les publicités liées à la covid-19, les résultats diffèrent légèrement. En effet, comme le montre la figure 8, trois régions seulement présentent un taux d’affichage moyen supérieur à 10 % (Île-de-France, Auvergne-Rhône-Alpes et Provence-Alpes-Côte-d’Azur), tandis que cinq régions ont alors un taux d’affichage moyen inférieur à 4 %.

Figure 8

Affichage moyen des publicités covid-19 et non covid-19 par région

Description de l'image par IA : Cartes régionales montrant l'affichage moyen des publicités covid-19 et non covid-19. Zones blanches <4%, grises 4-10%, noires >10%.

L'image montre deux cartes de la France, chacune représentant la distribution moyenne des publicités liées au COVID-19 et des publicités non liées au COVID-19 par région. La carte de gauche, intitulée "Publicités covid-19", montre les régions avec différentes nuances de gris et de noir. Les zones blanches indiquent les régions ayant un taux d'affichage moyen de publicités COVID-19 inférieur à 4 %. Les zones grises représentent les régions avec un taux compris entre 4 % et 10 %. Les zones noires concernent les régions bénéficiant d’un taux supérieur à 10 %. La carte de droite, intitulée "Publicités non covid-19", suit le même code de couleurs. Les zones blanches indiquent les régions avec un taux d'affichage moyen de publicités non liées au COVID-19 inférieur à 4 %. Les zones grises représentent les régions avec un taux compris entre 4 % et 10 %. Les zones noires concernent les régions bénéficiant d’un taux supérieur à 10 %. Les deux cartes montrent une distribution variable des publicités à travers les régions de la France, avec certaines régions ayant un taux d'affichage plus élevé que d'autres.

Affichage moyen des publicités covid-19 et non covid-19 par région

Les zones blanches indiquent les régions à taux d’affichage moyen de publicités covid-19 inférieur à 4 %. Les zones grises figurent les régions ayant un taux compris entre 4 % et 10 %. Enfin, les zones noires concernent les régions bénéficiant d’un taux supérieur à 10 %.

37 Cette disparité semble être corrélée à l’intensité de l’impact de la pandémie par région. En effet, les trois régions qui se distinguent par un taux supérieur à 10 % ont été les plus affectées par la crise sanitaire. Seul le Grand-Est fait exception. Constituant l’un des foyers infectieux de l’épidémie les plus forts en France (troisième région la plus meurtrie), cette région présente pourtant un taux d’affichage moyen inférieur à 10 %. Ces résultats suggèrent une tendance de l’algorithme à combiner impact infectieux et densité de la population pour cibler les diffusions par zone géographique. La cartographie des affichages de publicités non covid-19 présente en effet une répartition complètement différente (voir figure 8).

38 Les réseaux sociaux ont joué un rôle prépondérant dans la diffusion d’informations relatives à l’épidémie de la covid-19 : outil de lutte contre la pandémie et objet de nombreux enjeux sociaux et économiques, la diffusion d’informations par leur canal est un sujet sensible. D’où l’intérêt des résultats présentés dans ce chapitre, qui suggèrent une forte disparité d’affichage publicitaire entre genres. En effet, les femmes de plus de quarante-cinq ans ont fait plus que les hommes l’objet de publicités liées à la covid-19. Par ailleurs, nous avons également mis en évidence que l’algorithme de la plate-forme en charge de l’affichage publicitaire a majoritairement diffusé des publicités liées à la covid-19 dans les régions françaises les plus dynamiques d’un point de vue économique mais aussi les plus touchées par cette crise, à l’exception de la région Grand-Est. Il convient toutefois de souligner qu’il s’agit là de simples statistiques descriptives ne pouvant expliquer de manière causale l’affichage algorithmique effectué. Sur la seule base de ces données, il est impossible d’affirmer qu’il existe un lien de cause à effet.

Bibliographie

Agrawal A., Gans J., Goldfarb A. (2018), « Prediction machines : the simple economics of artificial intelligence », Harvard Business Press.
Cecere G., Jean C., Lefrere V., Tucker C. (2020), « Trade-offs in automating platform regulatory compliance by algorithm : evidence from the covid-19 pandemic », SSRN Working Paper, n° 3603341.
Cecere G., Jean C., Manant M., Tucker C. (2020), « Computer algorithms prefer headless women », AEA Working Paper.
Chiou L., Tucker C. (2018), « Fake news and advertising on social media : a study of the anti-vaccination movement », NBER Working Paper, n° 25223.
Cowgill B., Tucker C. (2017), « Algorithmic bias : a counterfactual perspective », NSF trustworthy Algorithms Working Paper.
Datta A., Tschantz M. C. (2015), « Automated experiments on ad privacy settings », Proceedings on Privacy Enhancing Technologies, n° 1, p. 92-112.
Fisman R., Luca M. (2016), « Fixing discrimination in online marketplaces », Harvard Business Review, vol. 94, n° 12, p. 88-95.
Fu R., Yan H., Param V. S. (2020), « Artificial intelligence and algorithmic bias : source, detection, mitigation, and implications », Pushing the Boundaries. Frontiers in Impactful OR/OM Research. INFORMS, p. 39-63.
Goldfarb A., Tucker C. (2019), « Digital economics », Journal of Economic Literature, vol. 57, n° 1, p. 3-43.
Kleinberg J., Lakkaraji H., Leskovec J. et al. (2018), « Human decisions and machine predictions », The Quarterly Journal of Economics, vol. 133, n° 1, p. 237-293.
Lambrecht A., Tucker C. (2019), « Algorithmic bias ? An empirical study of apparent gender-based discrimination in the display of STEM career ads », Management Science, vol. 65, n° 7, p. 2966-2981.
Mozilla Foundation (2019), Internet Health Report 2019, Transcript Verlag.
OCDE (2017) « Algorithms and collusion : competition policy in the digital age », Technical Report.
O’Neil C. (2016), Weapons of Math Destruction. How Big Data Increases Inequality and Threatens Democracy, Crown, New York.
Sweeney L. (2013)., « Discrimination in online ad delivery : Google ads, black names and white names, racial discrimination, and click advertising », Queue, vol. 11, n° 3, p. 10-29.
Tucker C. (2019), Comment on « Digital Infrastructure ». Economics of Infrastructure Investment, University of Chicago Press, Chicago.

Date de mise en ligne : 17/11/2022

https://doi.org/10.3917/dec.senik.2022.01.0102

Compte personnel

6. Intelligence artificielle et réseaux face à la pandémie : fracture sociale et virtualisation

Citer ce chapitre

Les biais algorithmiques de l’information sur les réseaux sociaux

La constitution d’une base de données de publicités en ligne françaises relatives à la pandémie de covid-19

Exemple de publicité liée à la covid-19 dans notre base de données

Exemple de publicité liée à la covid-19 dans notre base de données

Présentation des principaux résultats

Diffusion de l’information par genre et par catégorie d’âge

Affichage moyen des publicités covid-19 et non covid-19 par genre et âge (janvier-juin 2020)

Affichage moyen des publicités covid-19 et non covid-19 par genre et âge (janvier-juin 2020)

Proportion des publicités covid-19 et non covid-19 réalisées par les autorités publiques et par les autres annonceurs

Proportion des publicités covid-19 et non covid-19 réalisées par les autorités publiques et par les autres annonceurs

Les publicités covid-19 réalisées par les autorités publiques

Affichage des publicités covid-19 par type d’annonceur, en fonction du genre et des catégories d’âge

Affichage moyen des publicités émises par les autorités publiques et par les autres annonceurs auprès des hommes

Affichage moyen des publicités émises par les autorités publiques et par les autres annonceurs auprès des hommes

Affichage moyen des publicités émises par les autorités publiques et par les autres annonceurs auprès des femmes

Affichage moyen des publicités émises par les autorités publiques et par les autres annonceurs auprès des femmes

Affichage moyen des publicités covid-19 émises par les autorités publiques et par les autres institutions auprès des hommes

Affichage moyen des publicités covid-19 émises par les autorités publiques et par les autres institutions auprès des hommes

Affichage moyen des publicités covid-19 émises par les autorités publiques et par les autres organisations auprès des femmes

Affichage moyen des publicités covid-19 émises par les autorités publiques et par les autres organisations auprès des femmes

Dépenses moyennes par types de publicités et d’institutions (en euros)

Dépenses moyennes par types de publicités et d’institutions (en euros)

Coût moyen des publicités covid-19 et non covid-19

Affichage de la publicité covid-19 et non covid-19 par région en France

Affichage moyen des publicités covid-19 et non covid-19 par région

Affichage moyen des publicités covid-19 et non covid-19 par région

Affichage moyen des publicités covid-19 et non covid-19 par région

Affichage moyen des publicités covid-19 et non covid-19 par région

Bibliographie

Accès institutions

Toutes les institutions