Fromage ou dessert ? Nous pouvons rester bloqués longtemps avant d’être capables de prendre une de ces décisions auxquelles nous sommes confrontés chaque jour. Notre cerveau n’est-il donc pas optimisé pour ce type de tâche ? Focus sur une étude rigoureusement… choisie.
Des neuroscientifiques de l’Université de Genève (UNIGE), en collaboration avec l’Université de Harvard, ont représenté mathématiquement la stratégie de choix optimal. Ils démontrent ainsi que les décisions optimales doivent se fonder non pas sur la valeur propre des choix possibles, mais sur la différence de valeur qui existe entre eux. Cette stratégie de décision maximise la sensation de récompense.
Certaines prises de décision sont « perceptuelles », fondées sur des informations sensorielles. Par exemple : « Ai-je le temps de traverser la route avant l’arrivée de cette voiture ? ». D’autres sont « subjectives ». Il n’y a pas alors de bonne ou de mauvaise décision, mais un choix à faire entre plusieurs propositions (« fromage ou dessert ? », donc).
Pour ce type de prise de décision, le choix est fait rapidement lorsqu’il y a une grande différence de qualité entre les propositions. Par contre, lorsque ces propositions sont semblables, la prise de décision devient très complexe alors que dans ce cas nul choix n’est pire qu’un autre. Pourquoi cette complexité ? Pourquoi notre longue hésitation au moment de choisir un type de gâteau ou la couleur d’un vêtement ?
Satohiro Tajima, chercheur au Département de neurosciences fondamentales de l’Université de Genève a conçu un modèle mathématique simple qui démontre que face à deux propositions, la stratégie optimale consiste à faire la somme des valeurs associées aux souvenirs que l’on a de chaque choix, puis de calculer la différence qui existe entre ces deux sommes de valeurs (« Ai-je plus de souvenirs positifs associés aux macarons ou aux éclairs au chocolat ? »).
La décision devient possible lorsque cette différence atteint une valeur seuil, fixée au préalable, et qui détermine le temps de la décision. La prise de décision est rapide lorsque les valeurs des deux possibilités sont très éloignées l’une de l’autre. Mais lorsque deux choix ont presque la même valeur, il nous faut plus de temps, car il nous faut solliciter davantage de souvenirs pour que cette différence atteigne le seuil de décision.
Pour chaque choix, nous voulons maximiser le gain possible en un minimum de temps. Dès lors, « La première étape est identique à celle d’un choix binaire, c’est-à-dire que l’on accumule les souvenirs pour chaque choix, afin d’estimer leur valeur cumulée » explique Alexandre Pouget, professeur dans ce même Département. Au lieu de regarder la valeur cumulée associée à chaque choix indépendamment, la décision se base sur la différence entre la valeur cumulée de chaque choix et la valeur moyenne des valeurs cumulées pour tous les choix (si nous devons choisir entre un pull bleu, vert ou rouge, le cerveau va compter les souvenirs positifs associés à chaque couleur, puis comparer chacun de ces nombres avec la moyenne des trois).
Comme dans le cas précèdent, la décision est prise lorsqu’une de ces différences atteint une valeur seuil prédéterminée. « Le fait que la décision se base sur la valeur cumulée moins la moyenne des valeurs de toutes les possibilités explique pourquoi les choix interfèrent entre eux, même lorsque certaines différences sont criantes », poursuit Alexandre Pouget.
Si les différents choix possibles ont des valeurs similaires, la moyenne sera presque identique à la valeur de chaque choix, d’où un temps de prise de décision très long *. « Faire un choix simple peut prendre 300 millisecondes, mais un choix compliqué est parfois l’affaire de toute une vie », relève le chercheur genevois.
Cette étude démontre que le cerveau ne prend pas de décision en fonction de la valeur propre à chaque possibilité qui s’offre à lui, mais de la différence qui existe entre elles. « Cela souligne l’importance du sentiment de devoir maximiser les gains possibles que l’on peut obtenir », explique Alexandre Pouget.
Prochaine étape pour les chercheurs, comprendre de quelle manière le cerveau « revisite » la mémoire pour faire ressurgir les souvenirs liés à chaque choix possible. Puis découvrir comment il « simule » des informations lorsqu’il est face à l’inconnu, en l’occurrence lorsqu’aucun souvenir ne peut l’aider pour la prise de décision.
* L'augmentation du temps de réaction en fonction du nombre d'alternatives est connue sous le nom de « Loi de Hick ».
Source :
Optimal policy for multi-alternative decisions.
Tajima, Drugowitsch, Patel, Pouget.
Nat Neurosci. 2019 Sep;22(9):1503-1511.
doi: 10.1038/s41593-019-0453-9. Epub 2019 Aug 5.