Théorie des jeux et enjeux climatiques

Il paraît, ai-je lu une fois dans un livre de vulgarisation scientifique, que chaque équation divise par deux les ventes en librairies; quelle tristesse! Dans cet article, j’ai envie de parler brièvement de la théorie des jeux et d’expliquer, à l’aide de quelques exemples, pourquoi je trouve qu’elle donne une interprétation intéressante de la situation écologique dans laquelle nous nous trouvons et dont nous n’arrivons pas à sortir.

Aucune inquiétude cependant! Mon article sera parfaitement compréhensible par n’importe qui et ne nécessite aucune connaissance préalable. Si, après l’avoir lu, vous n’avez rien compris, je vous autorise à me jeter un seau d’eau froide à la figure. Nous sommes bien d’accords ? Alors c’est parti !

Faire des choix, c’est stratégique

Imaginez le scénario suivant. Un crime a été commis, vous et un compère êtes devant le tribunal et le juge veut savoir qui de vous deux est le coupable. Chacun de vous (que j’appellerai A) et de votre complice (que j’appellerai B) a deux options identiques: s’accuser soi-même ou accuser l’autre. A et B sont interrogés séparément et ne peuvent se consulter avant de faire leurs déclarations.

Si les déclarations de A et de B concordent (A accuse B et B s’accuse lui-même, ou vice-versa), l’accusé est condamné à dix ans de prison et son compère est acquitté. Si A et B tous deux choisissent d’accuser l’autre, le juge ne peut pas déterminer le coupable et condamne A et B à trois ans de prison pour obstruction à la Justice. Si A et B tous deux choisissent de s’accuser eux-mêmes, le juge ne peut pas attribuer la responsabilité à une seule personne, A et B doivent donc seulement passer une année derrière les barreaux pour participation partielle à activité illégale.

On appelle «jeu» tout scénario à deux ou plus «joueurs» où chaque joueur doit choisir une parmi deux ou plusieurs «stratégies» et ou les stratégies choisies résultent en un «gain» pour chaque joueur (et le gain global est simplement la somme des gains de chaque joueur). Vous aurez compris que le terme jeu est complètement agnostique de la nature du scénario dont il est question, on parle donc du jeu du dilemme du prisonnier même si personne n’aurait l’idée de qualifier le scénario d’un jeu au sens commun du terme.

Avant d’analyser formellement le jeu du dilemme du prisonnier, il faut encore deux choses tout aussi cruciales que les stratégies possibles de A et de B. Premièrement, il faut fixer clairement comment est calculé le gain de chacun des joueurs; dans notre exemple, c’est assez explicite, il s’agit de minimiser le nombre d’années de prison. Deuxièmement, il faut—et c’est souvent omis alors qu’il est absolument décisif—choisir si le jeu est «coopératif» ou «non-coopératif»; est-ce le nombre total d’années que je vais passer en prison qui m’importe ou est-ce la somme des années que mon compère et moi-même allons passer en prison qui m’importe ?

Résoudre le dilemme

Une fois qu’on a posé tout ce qui précède, l’analyse est relativement simple et sans équivoque; sa correcte interprétation permettra ensuite d’extrapoler l’intuition obtenue à n’importe quel jeu, de quelque complexité que ce soit.

Si le jeu est coopératif, chaque joueur choisira de s’accuser lui-même. De cette manière la somme des années en prison accumulées est de deux (une pour chacun). Aucune autre combinaison de stratégies ne permet de baisser ce chiffre. Très bien, voilà qui était rapide et facile!

L’analyse du même jeu, cette fois en mode non-coopératif, demande un tout petit peu de gymnastique mentale. Admettons que vous soyez A, qui accusez-vous? Vous-même? Votre compère? La réponse est que vous allez toujours accuser B et ceci indépendamment de la stratégie de B. J’insiste vraiment sur les mots soulignés; si B choisit de s’accuser lui-même, alors A a tout intérêt à accuser B (son gain est de zéro années, le minimum absolu) et si B accuse A, alors A a également tout intérêt à accuser B (gain de trois ans au lieu de dix).

À ce stade, beaucoup diront: « Oui, soit. Mais tu admets là que chaque joueur est 100 % égoïste et ne qu’il ne tient pas du tout compte de l’autre joueur ». Oui en effet, c’est exactement ce que j’ai admis quand j’ai dit que j’analysais le jeu en mode non-coopératif. A et B savent parfaitement qu’ils s’en tireront moins bien que si tous deux s’accusaient eux-mêmes, mais comme chaque partie obtiendra toujours un gain qui lui est plus favorable en accusant l’autre, aucun ne choisira l’option de s’accuser lui-même.1 Cette dernière phrase est clef, relisez-la au besoin pour être sûr de l’avoir comprise.

Coopérer ou ne pas coopérer ?

Je ne sais pas vous, mais je vais partir du principe que, comme moi, les jeux perdant-perdant vous dépriment et que vous aimez bien plus les jeux gagnant-gagnant.

Alors quoi faire ? Ne jouer qu’en mode coopératif ? Non, bien des jeux ont des règles (stratégies possibles et gains associés) telles que le gain global le plus favorable est atteint lorsque tous les joueurs cherchent uniquement à maximiser leur gain personnel (on pense à la théorie du libéralisme et de la main invisible d’Adam Smith, par exemple). Parfois le gain global le plus favorable possible n’est tout simplement jamais atteint car il nécessiterait que certains joueurs renoncent à une part importante de leur gain personnel sans compensation évidente.

Vous vous dîtes certainement aussi que, dans les jeux réels, on est jamais totalement coopératif ou non-coopératif; et en effet, c’est juste, et on peut formaliser très rigoureusement toutes les variantes possibles entre ces deux extrêmes. Dans le dilemme du prisonnier par exemple, on pourrait très bien dire que le gain de chacun des joueurs est donné pour 3/4 par le nombre d’années de prison encouru personnellement et pour 1/4 par la somme des années encourues par A et B conjointement. Dans ce cadre-là, A et B choisiront les mêmes stratégies que s’ils jouaient en mode 100 % coopératif (gain de 0.75*1 + 0.25*2 = 1.25 contre 0.75*0 + 0.25*10 = 2.5 pour celui qui choisirait de vendre son compère).

Jeux de la vie réelle

Où diriez-vous que se situe le curseur de chaque personne ? Totalement sur le mode coopératif ? Totalement sur le mode non-coopératif ? Probablement quelque part entre les deux pour la plupart. On peut consciemment choisir de bouger son propre curseur un petit peu dans un sens ou dans l’autre, mais généralement il reste plutôt fixe et quand il change, ça prend du temps et c’est uniquement parce qu’il y a une forte volonté personnelle.

Les concepts que j’ai introduit jusqu’ici s’appliquent de manière tellement vaste et large qu’on peut passer sa vie à reconnaître des exemples d’applications concrets auxquels on n’avait pas encore pensé. Je pense notamment que ces concepts s’appliquent très bien à la situation écologique dans laquelle nous nous trouvons. Tout le monde est conscient des enjeux écologiques (à quelques exceptions près, soit), mais nous n’avons pas fait de progrès significatifs depuis la COP21 qui—c’est bien de s’en rappeler—remonte à novembre 2015, ça date ! Trois ans après, le GIEC nous livrait son rapport spécial sur un réchauffement à 1.5 °C. Qu’est-ce qui a changé depuis ? Pas grand chose.

Beaucoup de joueurs et de stratégies contre-productives

On l’a compris, le gain global est déterminé par les stratégies individuelles, et les stratégies individuelles sont déterminée par les curseurs individuels des autres joueurs et les curseurs individuels des autres joueurs sont déterminés par le gain personnel qu’ils peuvent espérer en fonction de tous les autres. Je peux bien avoir envie de coopérer avec mon compère, mais si je sais pertinemment qu’il se servira de moi à la première occasion, c’est contre mon propre intérêt et l’intérêt global de vouloir être coopératif (ne serait-ce qu’à hauteur de 25%).

Chaque individu est un joueur avec ses stratégies propres; les entreprises, les gouvernements et les autres personnes morales sont aussi des joueurs avec leurs stratégies propres. Et tous ces joueurs ont un gain associé à la combinaison des stratégies choisies par l’ensemble des joueurs.

Les enjeux écologiques

Dans le contexte actuel, il est difficile de faire des choix écologiques évidents car les effets bénéfiques sont souvent répartis sur les gains personnels de tous les joueurs mais le joueur qui les met en place se voit imputer une part de son gain personnel inversement proportionnelle au nombre de joueurs qui jouent le jeu. Renoncer à sa voiture pour se rendre au travail quand on habite à la campagne, c’est bien pour tout le monde sauf pour le principal intéressé car il doit se débrouiller avec le peu de transports publics qui lui sont proposés. Pour que renoncer à sa voiture ne soit pas un sacrifice personnel, il faudrait que tout le village fasse de même et en même temps, car ainsi seulement il y aurait la demande nécessaire permettant de mettre en place des transports publics efficaces reliant ledit village au centre urbain le plus proche.

Sociétalement aussi, nous avons toutes les difficultés du monde à réviser nos habitudes en faveur du climat alors que, pour la plupart des gens, on ne peut pas raisonnablement dire que leurs gains personnels en seraient drastiquement péjorés. Dire stop à tous les vols pris juste pour les vacances, par exemple, sonne comme la pire des privations; alors qu’on peut se rendre facilement en train à tant d’endroits à condition de prendre le temps. Les gens n’étaient certainement pas plus malheureux à l’époque où ils partaient en vacances dans le sud de la France, aux Grisons ou à Saignelégier plutôt qu’à Majorque, en Afrique du Sud ou à New York. Sauf qu’on a évidemment tous envie de vivre des expériences comparables et qu’en voulant garder une certaine sobriété, on péjore son propre gain.

Institutionnellement, nous ne sommes pas en mesure d’entreprendre les réformes nécessaires pour ne pas transformer notre Terre en planète étuve. Comment nous convaincre de laisser 90 % des ressources pétrolières connues dans le sol quand il est si profitable d’y investir son argent ? C’est totalement contre nos intérêts personnels que de désinvestir notre argent des énergies fossiles (sauf bien sûr si tout le monde joue le jeu).

Faire bouger les choses

Dans la plupart des forme de lutte en faveur du climat dont on est témoin aujourd’hui, on s’applique et on met de l’énergie mais toujours dans une même optique: faire bouger positivement les curseurs (coopératif vs. non-coopératif) des individus et des preneurs de décisions. Et pourtant—j’espère vous en avoir convaincu—les curseurs de chacun sont très résilients aux injonctions extérieures, ils ne bougent en général qu’avec la volonté de l’intéressé et seulement sur une importante période de temps.

Comment faire bouger les choses alors s’il est utopique de croire qu’on peut changer les curseurs des autres ? Sachant que tout joueur choisit sa stratégie en fonction de son curseur et de son gain espéré, c’est son gain espéré qu’il faut tenter de faire bouger.

Et comment faire change-t-on le gain espéré des autres joueurs alors ? En choisissant judicieusement sa propre stratégie et en faisant appel à un peu de créativité.

Créativité demandée

Dans le dilemme du prisonnier, il n’y a hélas pas de place pour de la créativité. Les stratégies de chaque joueur sont au nombre de deux et il n’y a rien que A ou B puisse y faire; il n’y pas de troisième choix lui permettant d’échapper à la fatalité du deal perdant-perdant en mode non-coopératif.

Mais tel n’est pas le cas des jeux réels ! Accordé, ce n’est pas juste avec un peu de créativité que nous allons trouver de nouvelles stratégies de jeu qui augmenteront le gain global sans péjorer notre propre gain individuel. Nous pouvons cependant trouver de nouvelles stratégies de jeu qui impacteront les gains personnels de ceux dont nous essayons de bouger les curseurs. Nous pouvons mettre au point des stratégies pour forcer leurs gains vers le bas et ainsi contribuer à rendre leurs stratégies sous-optimales et à terme les rendre suffisamment sous-optimales pour que d’autres stratégies, meilleures pour le gain global, leurs deviennent préférables.

Je conclus cet article avec cet appel à votre créativité. J’espère avoir réussi mon pari de parler d’un problème global en le présentant à travers le prisme de ce fascinant domaine qu’est la théorie des jeux.

Soyez créatifs !

Tobias Barblan


[1] On appelle équilibre de Nash un ensemble de stratégies tel qu’aucun joueur n’a avantage à changer unilatéralement de stratégie. John F. Nash Jr. était un mathématicien et économiste américain, il a été lauréat du prix Nobel d’économie pour ses travaux scientifiques, notamment en théorie des jeux. Une adaptation cinématographique de sa bibliographie a été réalisée sous le titre A Beautiful Mind.

Image de couverture: John F. Nash Jr., image de pbs.org

1 Commentaire

Ajoutez les vôtres

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *