8. Le résultat par défaut est-il l’Apocalypse ?

Nick Bostrom

Superintelligence 2017

Chapitre d’ouvrage

8. Le résultat par défaut est-il l’Apocalypse ?

Par Nick Bostrom

Pages 169 à 185

BOSTROM, Nick,

2017. 8. Le résultat par défaut est-il l’Apocalypse ? In : Superintelligence. Paris : Dunod. Quai des Sciences, p.169-185. URL : https://stm.cairn.info/superintelligence--9782100764860-page-169?lang=fr.

Bostrom, Nick.

« 8. Le résultat par défaut est-il l’Apocalypse ? ». Superintelligence, Dunod, 2017. p.169-185. CAIRN.INFO, stm.cairn.info/superintelligence--9782100764860-page-169?lang=fr.

Bostrom, N.

(2017). 8. Le résultat par défaut est-il l’Apocalypse ? Superintelligence (p. 169-185). Dunod. https://stm.cairn.info/superintelligence--9782100764860-page-169?lang=fr.

Notes

[1]
Il y a aussi des risques existentiels dans les scénarios où l’humanité survit dans un très mauvais état ou bien où une large partie de notre potentiel de développement souhaitable est irréversiblement compromis. Le pire scénario serait celui où on en arriverait à une explosion d’intelligence en passant par des guerres entre les pays en concurrence.
[2]
Nous connaîtrions un grand moment de vulnérabilité quand l’IA comprendrait l’intérêt de dissimuler ses progrès. Quand l’idée lui viendrait pour la première fois, elle pourrait ne pas dissimuler délibérément. Mais, ayant compris, l’IA pourrait lentement se mettre à cacher que cette idée lui est venue, et mettre discrètement au point une dynamique interne (éventuellement travestie en un processus inoffensif facile à incorporer à tous les autres processus complexes qui se déroulent dans son esprit) qui lui permettrait de continuer à planifier sa stratégie à long terme en toute confidentialité.
[3]
Même les hackeurs humains peuvent écrire des programmes apparemment inoffensifs qui effectuent totalement des choses inattendues ; par exemple, regardez les entrées aux concours du code C le plus indéchiffrable possible (International Obfuscated C Code Contest).
[4]
Eliezer Yudkowsky souligne aussi que les mesures de contrôle d’une IA peuvent marcher dans un contexte déterminé tout en échouant de manière catastrophique quand le contexte change (Yudkowsky, 2008a).
[5]
Cette expression a semble-t-il été proposée par l’auteur de science-fiction Larry Niven (1973), mais elle est fondée sur des expériences réelles de stimulation de la récompense du cerveau (Olds et Milner, 1954 ; Oshima et Katayama, 2010 ; Ring et Orseau, 2011).
[6]
Bostrom (1997).
[7]
Il serait possible d’implémenter un mécanisme d’apprentissage par renforcement tel que, lorsque l’IA découvrirait la solution du hackage de hardware, elle perdrait ses capacités et ne pourrait plus étendre les infrastructures. Le problème, c’est que cette mesure pourrait facilement mal tourner et échouer pour diverses raisons.
[8]
Ce qui a été suggéré par Marvin Minsky (vide Russell et Norvig, 2010, 1039).
[9]
La question de savoir quels types d’esprits digitaux seraient conscients au sens d’avoir une expérience phénoménale subjective, ou des qualia comme disent les philosophes, est ici importante (mais non pertinente pour d’autres points de ce livre). La question est ouverte de savoir à quel point il serait difficile d’estimer avec exactitude comment un être « human-like » se comporterait dans ces circonstances variées si l’on ne simule pas son cerveau de manière assez détaillée pour que cette simulation devienne consciente. Une autre question consiste à se demander s’il y a des algorithmes généralement utiles pour une superintelligence, des techniques d’apprentissage par renforcement par exemple, telles que l’implantation de ces algorithmes génèrent les qualia. Même si nous pensons que la probabilité pour qu’un tel sous-programme soit conscient est très faible, le nombre d’instanciations pourrait être si grand qu’il nous faut accorder un poids moral significatif au risque même infime qu’elles ressentent de la douleur (Metzinger, 2003, chap. 8).
[10]
Bostrom (2002a, 2003a) ; Elga (2004).

Citer ce chapitre

Bostrom, N.

(2017). 8. Le résultat par défaut est-il l’Apocalypse ? Superintelligence (p. 169-185). Dunod. https://stm.cairn.info/superintelligence--9782100764860-page-169?lang=fr.

Bostrom, Nick.

« 8. Le résultat par défaut est-il l’Apocalypse ? ». Superintelligence, Dunod, 2017. p.169-185. CAIRN.INFO, stm.cairn.info/superintelligence--9782100764860-page-169?lang=fr.

BOSTROM, Nick,

2017. 8. Le résultat par défaut est-il l’Apocalypse ? In : Superintelligence. Paris : Dunod. Quai des Sciences, p.169-185. URL : https://stm.cairn.info/superintelligence--9782100764860-page-169?lang=fr.

Notes

[1]
Il y a aussi des risques existentiels dans les scénarios où l’humanité survit dans un très mauvais état ou bien où une large partie de notre potentiel de développement souhaitable est irréversiblement compromis. Le pire scénario serait celui où on en arriverait à une explosion d’intelligence en passant par des guerres entre les pays en concurrence.
[2]
Nous connaîtrions un grand moment de vulnérabilité quand l’IA comprendrait l’intérêt de dissimuler ses progrès. Quand l’idée lui viendrait pour la première fois, elle pourrait ne pas dissimuler délibérément. Mais, ayant compris, l’IA pourrait lentement se mettre à cacher que cette idée lui est venue, et mettre discrètement au point une dynamique interne (éventuellement travestie en un processus inoffensif facile à incorporer à tous les autres processus complexes qui se déroulent dans son esprit) qui lui permettrait de continuer à planifier sa stratégie à long terme en toute confidentialité.
[3]
Même les hackeurs humains peuvent écrire des programmes apparemment inoffensifs qui effectuent totalement des choses inattendues ; par exemple, regardez les entrées aux concours du code C le plus indéchiffrable possible (International Obfuscated C Code Contest).
[4]
Eliezer Yudkowsky souligne aussi que les mesures de contrôle d’une IA peuvent marcher dans un contexte déterminé tout en échouant de manière catastrophique quand le contexte change (Yudkowsky, 2008a).
[5]
Cette expression a semble-t-il été proposée par l’auteur de science-fiction Larry Niven (1973), mais elle est fondée sur des expériences réelles de stimulation de la récompense du cerveau (Olds et Milner, 1954 ; Oshima et Katayama, 2010 ; Ring et Orseau, 2011).
[6]
Bostrom (1997).
[7]
Il serait possible d’implémenter un mécanisme d’apprentissage par renforcement tel que, lorsque l’IA découvrirait la solution du hackage de hardware, elle perdrait ses capacités et ne pourrait plus étendre les infrastructures. Le problème, c’est que cette mesure pourrait facilement mal tourner et échouer pour diverses raisons.
[8]
Ce qui a été suggéré par Marvin Minsky (vide Russell et Norvig, 2010, 1039).
[9]
La question de savoir quels types d’esprits digitaux seraient conscients au sens d’avoir une expérience phénoménale subjective, ou des qualia comme disent les philosophes, est ici importante (mais non pertinente pour d’autres points de ce livre). La question est ouverte de savoir à quel point il serait difficile d’estimer avec exactitude comment un être « human-like » se comporterait dans ces circonstances variées si l’on ne simule pas son cerveau de manière assez détaillée pour que cette simulation devienne consciente. Une autre question consiste à se demander s’il y a des algorithmes généralement utiles pour une superintelligence, des techniques d’apprentissage par renforcement par exemple, telles que l’implantation de ces algorithmes génèrent les qualia. Même si nous pensons que la probabilité pour qu’un tel sous-programme soit conscient est très faible, le nombre d’instanciations pourrait être si grand qu’il nous faut accorder un poids moral significatif au risque même infime qu’elles ressentent de la douleur (Metzinger, 2003, chap. 8).
[10]
Bostrom (2002a, 2003a) ; Elga (2004).

Un risque existentiel est ce qui menace d’entraîner l’extinction de la vie intelligente ayant pour origine la Terre ou au moins d’annihiler de manière définitive et brutale ses volontés d’expansion. L’idée d’un avantage conféré à qui arrivera le premier à la superintelligence, la thèse de l’orthogonalité et celle de la convergence instrumentale permettent ensemble d’entrevoir les raisons de craindre qu’un résultat par défaut de la création d’une machine superintelligente soit une catastrophe existentielle.Premièrement : nous avons vu comment la superintelligence peut obtenir dès le début un avantage stratégique décisif ; elle peut donc être en position de constituer un singleton et de façonner le futur de la vie intelligente sur Terre. Ce qui se déroule par la suite dépend des motivations de cette superintelligence.Deuxièmement : la thèse de l’orthogonalité affirme qu’on ne peut pas faire en toute tranquillité l’hypothèse que la superintelligence partagera nécessairement toutes les valeurs habituellement associées à la sagesse et au développement intellectuel humain comme la curiosité scientifique, la bienveillance, les lumières spirituelles et leur contemplation, la renonciation aux bien matériels, un goût pour la culture ou pour les plaisirs simples de l’existence, l’humilité et l’altruisme, etc. Nous verrons plus loin s’il serait possible, grâce à un effort volontaire, de mettre au point une superintelligence qui accorderait de la valeur à ces aspirations, ou d’en construire une qui aurait le souci du bien être humain, de la bonté ou de toute autre aspiration que ses concepteurs voudraient qu’elle respecte…

Date de mise en ligne : 09/11/2023

Ce chapitre est en accès conditionnel

Acheter cet ouvrage

14,99 €

464 pages, format électronique (HTML et feuilletage, par chapitre)

Membre d'une institution cliente ?

Compte personnel

8. Le résultat par défaut est-il l’Apocalypse ?

Notes

Citer ce chapitre

Notes

Ce chapitre est en accès conditionnel

Acheter cet ouvrage

Accès institutions

Toutes les institutions