Résumé

La question de ce que constitue une récompense musicale dans les jeux vidéo demeure peu théorisée. Actuellement, ce qui s'en rapproche le plus sont les feedbacks musicaux, classés parmi les feedback sensoriels dans la taxonomie de Phillips (2018) : des stimuli brefs qui accompagnent d'autres récompenses plutôt qu'ils ne constituent des récompenses à part entière. Les feedbacks musicaux illustrent d'ailleurs la problématique soulevée par Lewis-Evans (2013), selon laquelle le design de récompenses vidéoludiques privilégie généralement la motivation (wanting) au détriment du plaisir (liking), soulevant des questions éthiques importantes.

Ce mémoire propose de définir le concept de système de récompense musical en le distinguant du simple feedback musical. En s'appuyant sur le modèle neuropsychologique de Berridge (2009), nous établissons qu'une récompense complète articule trois composantes : le liking (plaisir hédonique), le wanting (motivation anticipatoire), et le learning (associations prédictives). Nous démontrons que la musique possède intrinsèquement ces trois propriétés par ses mécanismes de prédiction et ses structures de tension et résolution.

Le système de récompense musical exploite ces propriétés intrinsèques pour créer une expérience de récompense complète, éthique et esthétique.

Mots-clés : musique de jeu vidéo, systèmes de récompense, récompenses musicales, anticipation musicale, flow, design sonore ludique

    Sommaire

  1. INTRODUCTION
  2. CHAPITRE I - Schématisation des systèmes de récompense à l'intérieur des systèmes du jeu-vidéo
    1. 1.1 Les récompenses procurent du plaisir
    2. 1.2 Les récompenses interviennent dans le processus de volonté (wanting)
    3. 1.3 Les récompenses interviennent dans le processus d'apprentissage
  3. CHAPITRE II - La Musique Comme Système de Récompense
    1. 2.1 Learning : L'apprentissage de nos attentes musicales
    2. 2.2 Liking : La Définition d'une zone de plaisir musical
    3. 2.3 Wanting : L'anticipation de ces zones de plaisir provoque le désir de poursuivre l'écoute
  4. CHAPITRE III - Le système de récompense musical : définition et implications
    1. 3.1 Le système de récompense musical se définit formellement
    2. 3.2 Les trois composantes du système résolvent les limites des feedbacks audio
    3. 3.3 Le système de récompense musical pourrait offrir des avantages pour le design ludique
  5. CONCLUSION
  6. BIBLIOGRAPHIE

Glossaire

Isomorphisme : Une correspondance entre deux ensembles organisés de manière similaire, où chaque élément de l'un correspond à un élément unique de l'autre, et cette correspondance préserve la structure dans les deux sens.

Wanting : Composante de la volonté/désir dans le système de récompense.

Liking : Composante du plaisir dans le système de récompense.

Learning : Composante de l'apprentissage du système de récompense.

Incentive salience (saillance incitative) : Mécanisme dopaminergique qui rend certains stimuli attractifs.

Gacha / Gacha games : Jeux basés sur des systèmes de tirage aléatoire monétisés.

Leaderboard / Leaderboards : Tableau de classement des joueurs.

Feedback sensoriels : Retours sensoriels (visuels, sonores, haptiques) donnés au joueur.

Loot : Butin, objets obtenus en récompense.

Build : Dans le jeu vidéo, un build désigne la combinaison spécifique de caractéristiques, compétences, équipements et/ou attributs qu'un joueur choisit pour son personnage afin d'adopter un style de jeu particulier.

Charge cognitive : La quantité de ressources mentales mobilisées par une tâche.

Eudémonique : Plaisir lié à la construction de sens, au développement personnel et à la compétence.

Flow : L'état de flow, théorisé par Mihaly Csikszentmihalyi, est un état de plaisir cognitif et émotionnel qui apparaît lorsque la difficulté du défi est équilibrée par rapport aux compétences du joueur.

Hédonique : Plaisir basé sur des sensations agréables et immédiates.

Musème : Unités minimales de signification musicale qui fonctionnent comme des codes culturellement établis.

Patchs : Mise à jour de jeu qui corrige des bugs, équilibre le gameplay ou ajoute du contenu.

Système tonal : En musique, le système tonal est un ensemble de relations hiérarchisées entre les notes, organisées autour d'une tonalité centrale (la tonique). Ce système établit des attentes prévisibles : certaines progressions d'accords sonnent « résolues », d'autres créent des tensions qui appellent une résolution. Ces attentes, apprises culturellement, permettent aux compositeurs de jouer avec la prédictibilité musicale.

Sabar : Désigne à la fois un événement festif organisé par les femmes, un orchestre de tambours et une danse. L'orchestre réunit plusieurs instruments (lamb, mbeng mbeng, gorong talmbat, ndeer, gorong mbabas, khine). Ce genre s'appuie sur des motifs syncopés et rapides et ponctuent l'écoute de bakks : des phrases rythmiques codifiées que les musiciens jouent ensemble. Ces motifs servent de base commune, un peu comme des standards reconnaissables par tous. Cet ensemble forme un tissu rythmique complexe et cohérent.

Megabonk : Jeu de survie roguelike à la troisième personne développé et publié en 2025 par le développeur solo vedinad. Les joueurs naviguent dans des cartes 3D générées procéduralement avec verticalité, combattant des vagues d'ennemis et de boss de plus en plus puissants.

Red Dead Online : Red Dead Online est la version multijoueur du jeu Red Dead Redemption 2. Le joueur crée son propre personnage et explore un vaste monde ouvert dans l’Ouest américain, avec de nombreuses missions coopératives. Contrairement à sa version hors ligne qui est centrée sur la trame narrative, ici l’accent est surtout mis sur la progression du personnage et les interactions en ligne.

Introduction

Les systèmes de récompense jouent un rôle structurant dans l'expérience d'un jeu vidéo. Selon la taxonomie de Phillips (2018), les récompenses vidéoludiques peuvent prendre plusieurs formes : les récompenses d'accès ouvrent de nouveaux espaces ou ressources comme les niveaux ou zones de carte. Les récompenses d'amélioration des capacités incluent power-ups et nouvelles compétences. Les récompenses de subsistance prolongent la survie en jeu via des vies supplémentaires ou kits médicaux. Les récompenses de prestige n'ont pas d'impact direct sur le gameplay mais font partie intégrante de l'expérience : points, achievements, classements. Les récompenses d'encouragement valorisent la performance sans modifier le gameplay par des phrases de félicitations ou validations orales. Enfin, les récompenses de feedback sensoriel déclenchent des retours visuels, haptiques ou sonores en réponse aux actions du joueur : vibrations, sons, animations.

La récompense musicale est ici reléguée à la sous-catégorie « audio » des feedback sensoriels. Cette classification n'est pas anodine : elle réduit le champ de la récompense musicale à une simple réponse à une action, un signal informatif ou motivant, plutôt qu'à une récompense à part entière.

Un feedback sonore correspond typiquement à un court signal musical ou acoustique; par exemple un jingle à la fin d'un niveau, une cloche indiquant la réussite d'une action, ou un son qui s'ajoute ou se coupe pour signaler au joueur qu'une interaction a eu lieu. Dans ces cas, le son informe ou renforce un comportement, mais ne cherche pas à provoquer un plaisir musical en soi.

Or, selon le modèle neuropsychologique de Berridge (2009), une récompense complète comporte trois composantes distinctes : le wanting (motivation ou désir d'obtenir la récompense), le learning (associations prédictives permettant d'anticiper la récompense), et le liking (plaisir hédonique ressenti lors de l'obtention). Ces trois mécanismes activent des circuits cérébraux distincts et remplissent des fonctions complémentaires dans l'expérience de la récompense.

Le problème est que la majorité des recherches et conseils aux développeurs sur les récompenses dans le jeu vidéo se concentrent principalement sur le wanting et les mécanismes dopaminergiques : comment créer le désir de jouer, comment maintenir la motivation, comment maximiser l'engagement. Le plaisir que le joueur va ressentir est souvent présupposé mais rarement conçu explicitement.

Lewis-Evans (2013) formule que: « Le jeu est conçu pour vous faire vouloir y jouer, même si vous ne l'aimez/appréciez pas nécessairement » Et souligne les implications éthiques : les personnes déjà stressées ou manquant de stimulation sont plus vulnérables aux effets désirables de la dopamine, donc designer pour maximiser le "wanting" c'est possiblement exploiter ceux qui sont le moins capables de résister à ces mécanismes.

Pour concevoir des récompenses musicales véritablement efficaces et éthiques, il est nécessaire de prendre en compte les trois composantes de la récompense - wanting, learning et liking - plutôt que de se concentrer uniquement sur la motivation comme le font actuellement les feedbacks sonores. Cela permettra d'explorer différentes modalités pour récompenser le joueur grâce à la musique et de clarifier ce que pourrait être un « système de récompense musical » complet, que je distingue du simple « feedback musical ».

C'est à partir de ce constat que s'inscrit la problématique de ce mémoire :

Comment dépasser le feedback musical en concevant un système de récompense musical dans le jeu vidéo ?

Pour répondre à cette question, ce mémoire s'articule en trois chapitres.

Le premier chapitre explorera le rôle central de la récompense dans l'expérience de jeu et identifiera les limites actuelles des feedbacks audio.

Le second chapitre proposera d'analyser la musique elle-même comme système de récompense, en examinant ses propriétés structurelles, neuroaffectives et émotionnelles, sans réduire cette approche à une simple logique d'anticipation ou de délivrance du plaisir.

Enfin, le troisième chapitre proposera des pistes pour articuler des systèmes de récompenses musicales au sein des structures vidéoludiques, et montrera en quoi ces dispositifs peuvent répondre aux limites des feedbacks sonores, en déplaçant la récompense vers une expérience à la fois esthétique, personnalisée et complète.

Chapitre I
Schématisation des systèmes de récompense à l'intérieur des systèmes du jeu-vidéo

Ce chapitre examine comment les systèmes de récompense vidéoludiques mobilisent les trois composantes neuropsychologiques identifiées par Berridge (2009) : le plaisir (liking), la motivation (wanting), et l'apprentissage (learning). Nous établirons d'abord la fonction centrale des récompenses dans l'expérience de jeu, puis analyserons leur diversité taxonomique. Cette analyse révèlera les limites spécifiques des feedbacks audio actuels, qui ne constituent pas des récompenses complètes au sens neuropsychologique du terme.

1.1 Les récompenses procurent du plaisir

Pour saisir concrètement cette articulation entre plaisir, progression et émancipation cyclique, nous nous appuierons sur l'exemple des boucles de gameplay du jeu Megabonk. Ce schéma permet de visualiser comment les boucles de gameplay s'emboîtent et comment les récompenses marquent leurs transitions.

Schéma 1: Les Boucles de Gameplay (du jeu Megabonk)

Schéma 1 Les Boucles de Gameplay (du jeu Megabonk)

Les récompenses vidéoludiques génèrent du plaisir en rythmant la progression du joueur. Cette progression sollicite de manière croissante les compétences du joueur, créant les conditions du flow - état psychologique où l'activité devient intrinsèquement plaisante (Csikszentmihalyi, 1990). Les travaux de psychologie positive identifient deux sources complémentaires de plaisir : la démarche hédonique (sensations agréables immédiates) et la démarche eudémonique (construction de sens et de compétence). Ce qui fait de la gestion de la progression un élément essentiel du plaisir de jeu (Redet, 2020).

1.1.1 En permettant au joueur de progresser

Les jeux vidéo structurent la progression via des boucles de gameplay emboîtées, de la plus basique à la plus complexe. Le joueur maîtrise d'abord les micro-actions (déplacements, caméra), puis des séquences d'actions (enchaînements de combat), puis des objectifs de plus en plus larges (terminer un niveau, maîtriser la méta-stratégie du jeu).

Cette structure correspond à une gestion de la charge cognitive - la quantité de ressources mentales mobilisées par une tâche (Paas et Sweller, 2011 ; Mayer, 2005 pour l'application au jeu vidéo). Au fur et à mesure que le joueur maitrise et automatise les petites boucles d'action, sa charge cognitive disponible augmente, lui permettant d'aborder des boucles plus complexes. Pour maintenir le flow, cette charge doit croître de manière régulière et contrôlée : trop lente, le joueur s'ennuie ; trop rapide, il se sent dépassé et abandonne.

Les récompenses marquent les paliers de cette progression entre les boucles de gameplay. Elles signalent au joueur qu'il a maîtrisé une boucle et lui donnent parfois l'accès à la suivante. On peut identifier trois temporalités de récompenses qui correspondent à différentes échelles de boucles : court terme (gains rapides dans les micro-boucles), moyen terme (niveaux, quêtes qui valident la maîtrise de boucles moyennes), long terme (objectifs complexes, collection complète qui attestent de la maîtrise des larges boucles).

Les jeux nous montrent notre progression (Hodent, 2020) autant qu'ils nous donnent constamment de nouveaux terrains d'amélioration par le biais de différents types de récompenses. Les récompenses tangibles notamment : les récompenses d'accès, qui ouvrent de nouveaux espaces ou ressources et permettent d'explorer des boucles de gameplay inédites ; les récompenses d'amélioration des capacités, qui améliorent les capacités du joueur et lui donnent accès à des défis plus complexes qu'il ne pouvaient pas affronter auparavant.

Les récompenses intangibles comme les récompenses de prestige et récompenses d'encouragement permettent également de progresser dans des boucles plus larges. Matérialisées par exemple sous forme de leaderboards globaux, elles poussent le joueur à maîtriser la méta-stratégie du jeu et même à la faire évoluer - ce qui représente les boucles les plus englobantes à l'intérieur d'un jeu, nécessitant de maitriser l'entièreté des autres boucles.

1.1.2 s'émanciper du cycle répétitif d'une boucle

Les récompenses ne se contentent pas de marquer la progression : elles créent une courbe linéaire qui traverse et émancipe le joueur des boucles cycliques du gameplay. Tout se répète à l'intérieur d'un jeu, du simple saut jusqu'à la mort Keogh (2015).

Sans récompenses, le joueur tournerait indéfiniment dans les mêmes actions - sauter, frapper, recommencer.

La récompense est l'agent émancipateur de cet enfermement cyclique. Là où le gameplay est représenté par des boucles qui se répètent, la récompense trace une courbe de progression qui permet de débloquer et de naviguer parmi les boucles supérieures. Elle marque le passage d'une boucle maîtrisée à une boucle plus large encore à conquérir, nous faisant avancer à la fois socialement et personnellement.

Cette fonction émancipatrice culmine à la fin du jeu : une fois les boucles de gameplay les plus larges expérimentées, cela signe souvent l'arrivée de la fin ou du post-game. La récompense finale - cinématique de fin, épée ultime - signale qu'aucune autre récompense ne viendra jamais dépasser celle-ci. Elle autorise le joueur à sortir du jeu lui-même, à se libérer de l'obligation de répéter. Une fois les récompenses tangibles épuisées, les récompenses intangibles viennent structurer le post-game comme observé dans l'exemple du leaderboard.

1.1.3 Cette progression constituant le mécanisme central du plaisir du joueur

Cette articulation entre progression structurée (1.1.1) et émancipation de la répétition (1.1.2) crée précisément les conditions du plaisir durable. Pour comprendre pourquoi, il faut distinguer deux sources de plaisir identifiées par la psychologie positive :

« Les travaux issus de la psychologie positive ont permis l'identification de deux grandes démarches ayant des moyens d'atteinte du plaisir et des conséquences sur ce dernier très différentes. La démarche hédonique, qui correspond à une recherche active de sensations agréables, correspond au principal paradigme de promotion du plaisir mais est soumis à un phénomène d'adaptation hédonique, en raison duquel les sources de plaisir hédonique perdent leur capacité à susciter du plaisir au fil du temps. La démarche eudémonique, qui correspond à une recherche de construction de sens, est plus difficile à utiliser pour provoquer du plaisir, mais n'est pas soumise au phénomène d'adaptation hédonique, ne perdant ainsi pas en efficacité au fil du temps. (Elle consisterait à la satisfaction d'un ensemble de besoins psychologiques, dont les principaux candidats sont l'autonomie, la compétence, et l'appartenance d'après la théorie de l'autodétermination). Cette littérature pose un idéal de bonheur et de satisfaction reposant sur l'articulation ensemble de ces deux démarches avec l'engagement, atteint notamment par la pratique d'activités sollicitant l'ensemble des compétences de l'individu selon le principe du flow. » (Redet, 2020)

Les récompenses vidéoludiques articulent précisément ces deux démarches. La progression dans des boucles de complexité croissante satisfait le besoin eudémonique de compétence : le joueur construit du sens en développant sa maîtrise. L'émancipation régulière des boucles répétitives évite l'adaptation hédonique : en renouvelant constamment les défis et les espaces de jeu, les récompenses maintiennent leur capacité à générer du plaisir.

Pour maintenir le joueur dans cet état de flow, il faut une tâche ni trop facile ni trop difficile (d'où la navigation à l'intérieur des boucles de complexité croissante), avec des buts précis et un retour constant sur la progression (d'où les récompenses à chaque transition de boucle).

Le jeu Megabonk illustre parfaitement cette articulation. Les joueurs du forum théorisent leur propre évolution en paliers distincts qui correspondent précisément aux différentes échelles de boucles :

« Niveau 1-10 Bienvenue dans Megabonk ! Cette étape se concentre sur l'apprentissage des mécaniques de base, la compréhension des contrôles élémentaires et la survie lors de vos premières parties de 10 minutes. Choisissez des personnages tolérants et concentrez-vous sur la survie tout en apprenant les schémas d'ennemis.

Niveau 10-30 Il est temps de monter en niveau ! Maîtrisez la stratégie de la Sainte Trinité, débloquez des personnages puissants et commencez à construire des synergies intentionnelles. Vous commencerez à voir des parties de plus de 20 minutes et à terminer la Forêt/Désert Niveau 1.

Niveau 30-50 Maîtrisez les builds méta, battez les boss de Niveau 2-3 et préparez-vous au jeu compétitif. Apprenez les stratégies spécifiques aux personnages, optimisez les synergies d'objets et obtenez régulièrement des parties de plus de 30 minutes avec plus de 50 000 éliminations.

Niveau 50+ Il est temps de dominer ! Perfectionnez votre exécution, maîtrisez chaque personnage et grimpez dans les leaderboards. Concentrez-vous sur les speedruns optimisés, les stratégies Final Swarm et dépassez les 100 000 éliminations avec des builds qui définissent la méta. »

Chaque palier construit la compétence du joueur (dimension eudémonique) tout en renouvelant les défis et les récompenses pour éviter l'ennui (échappant à l'adaptation hédonique). Les récompenses - niveaux, déblocages de personnages et d'items, validation par le leaderboard - marquent les passages entre ces seuils tout en émancipant le joueur de la répétition pure des boucles maîtrisées. Cette structure maintient le joueur dans la zone optimale du flow à travers les différentes échelles de boucles du jeu.

Problème 1: Contrairement aux autres récompenses intangibles, le feedback audio ne possède pas de plaisir hédonique intrinsèque. Les récompenses de prestige et récompenses d'encouragement procurent du plaisir par eux-mêmes : la validation sociale et la reconnaissance valorisent directement le joueur. En revanche, un son de cloche ou un jingle isolé, entendu hors contexte dans la vie quotidienne, ne génère aucun plaisir.

Le feedback sonore n'acquiert sa fonction de récompense que par conditionnement associatif : le son devient plaisant uniquement parce qu'il a été répétitivement associé à une récompense tangible (déblocage, progression). C'est un apprentissage associatif où le stimulus sonore emprunte sa valeur à autre chose.

Pour concevoir un système de récompenses musicales, il faudra concevoir des feedbacks musicaux qui possèdent une qualité plaisante intrinsèque - indépendamment de leur association à d'autres récompenses.

1.2 Les récompenses interviennent dans le processus de volonté (wanting)

Schéma 2: Le Fonctionnement d'une Boucle de Gameplay Schéma 2: Le Fonctionnement d'une Boucle de Gameplay

Schéma 2 Le Fonctionnement d'une Boucle de Gameplay

La boucle OCR (Objective–Challenge–Reward) est le modèle de conception de gameplay le plus courant dans les studios de jeux. Elle organise l'expérience autour de trois éléments : un objectif clair pour le joueur, un défi à relever pour l'atteindre, et une récompense une fois l'objectif accompli. C'est la tension entre l'effort fourni et la gratification reçue dans cette boucle qui maintient l'intérêt du joueur (Hodent, 2020, pp. 139-140).

C'est en répétant ces boucles de gameplay que la récompense finit par créer une incitation — son wanting. L'incitation ne précède pas l'expérience du jeu : elle se construit progressivement pendant que le joueur expérimente le gameplay, par deux processus neuropsychologiques distincts — l'un est proportionné et adaptatif, l'autre est susceptible de devenir pathologique.

1.2.1 Par l'incentive salience, mécanisme adaptatif du wanting

L'incentive salience (saillance incitative) est le mécanisme dopaminergique central qui produit cette incitation. Selon Berridge et Robinson (2016), il s'agit d'un processus mésolimbique qui rend certains signaux associés à la récompense attractifs et « désirables ».

Du point de vue du joueur, voici comment cela se passe : au début, il apprend la boucle (objectif → défi → récompense). À force de répétitions, certains indices présents dans le jeu — un son, une animation, un effet visuel — deviennent systématiquement liés à la récompense. Ces indices prennent alors de la valeur en tant que signaux : le joueur les reconnaît et anticipe la récompense avant même qu'elle n'apparaisse. Par exemple, si un jingle se déclenche toujours juste avant l'apparition d'un objet rare, un joueur qui a vécu cette séquence plusieurs fois commencera à ressentir de l'anticipation dès qu'il entendra ce jingle — même si le coffre n'est pas encore ouvert. Cette association se construit progressivement : chaque répétition renforce le lien entre le signal et la récompense, jusqu'à ce que le signal suffise à déclencher l'envie.

Ce processus varie fortement selon l'état émotionnel et psychologique du joueur. Lorsqu'un joueur s'ennuie, se sent seul ou est cognitivement fatigué, il a tendance à rechercher des formes de gratification qui correspondent directement à cet état : des jeux rapides et stimulants lorsqu'il s'ennuie, des jeux sociaux lorsqu'il se sent isolé, ou des jeux plus passifs lorsqu'il est épuisé. Ces émotions renforcent l'envie de ces types de boucles de gameplay et augmentent la saillance des signaux associés à ces boucles. Ainsi, selon l'état du joueur au moment où il joue, une même boucle OCR peut déclencher un désir fort ou, au contraire, produire beaucoup moins d'incitation.

1.2.2 Qui peut dériver en sensibilisation incitative pathologique

Il faut distinguer ces deux types de processus : l'attribution normale de salience (adaptative) et la sensibilisation incitative (pathologique). La sensibilisation incitative se caractérise par un wanting disproportionné. Là où l'incentive salience s'appuie sur des associations espacées et adaptatives, la sensibilisation se développe lorsqu'une stimulation répétée et soutenue maintient le système dopaminergique en état d'hyperactivation chronique, entraînant des changements neurobiologiques durables (Robinson & Berridge, 1993).

Traduit pour le joueur : même quand le plaisir immédiat diminue, il continue de chercher les récompenses (loot boxes, objets rares, nouveaux contenus) parce que l'envie est devenue excessivement forte par rapport au plaisir réellement ressenti. Dans des titres où les récompenses sont très rapprochées et fréquentes (par exemple les gacha games ou les jeux centrés sur les systèmes de loterie), ce mécanisme peut favoriser des comportements de jeu problématiques — le désir persiste bien au-delà du plaisir initial — et soulève des questions éthiques importantes pour les concepteurs.

Problème 2: Dans ces mécanismes, la musique se trouve réduite à un stimulus de conditionnement déclenchant le wanting par association répétée. Dans le cas de la sensibilisation, elle peut même contribuer à des mécanismes d'addiction. Concevoir des récompenses musicales ne peut se limiter à cette fonction instrumentale. Il faudra dépasser ce simple rôle de signal conditionné pour explorer comment la musique peut constituer une récompense en soi - générant du plaisir (liking) et de la motivation (wanting) par ses propriétés musicales intrinsèques, et non uniquement par apprentissage associatif.

1.3 Les récompenses interviennent dans le processus d'apprentissage

La notion de "valeur" attribuée aux boucles de gameplay nécessite une représentation spatiale pour en saisir pleinement les implications. Le schéma suivant propose une visualisation en relief où l'altitude représente la valeur associée à chaque boucle : plus une boucle est récompensée, plus elle s'élève dans le paysage ludique ce qui crée une topographie.

Schéma 3: La Valorisation des Boucles de Gameplay (du jeu Megabonk)

Schéma 3 La Valorisation des Boucles de Gameplay (du jeu Megabonk)

1.3.1 En attribuant à chaque boucle de gameplay une valeur

Lorsqu'un joueur démarre un nouveau jeu, il entre dans un univers régi par un système de valeurs qui lui est d'abord étranger. Il doit progressivement comprendre ce qui mérite son attention : quelles actions valent la peine d'être accomplies, quels objectifs viser en priorité, quelles boucles de gameplay explorer en premier. Ce processus d'apprentissage des valeurs structure fondamentalement l'expérience de jeu.

Ce phénomène résonne avec les travaux sur les valeurs en psychologie sociale. Pour Schwartz (1994), les valeurs sont des objectifs trans-situationnels désirables, qui varient en importance et permettent de guider les grands principes de vie d'une personne ou d'une entité sociale. Appliqué au jeu vidéo, cela signifie qu'en explorant le monde du jeu, le joueur intériorise progressivement ses normes : ce système de valeurs devient son cadre de référence pour décider comment jouer.

Le schéma illustre comment les récompenses créent une topographie de valeurs dans l'espace du jeu. Certaines boucles de gameplay sont plus récompensées que d'autres, créant des "hauteurs" de valeur variables. Cette représentation en relief met en évidence que le jeu rend certains aspects plus attrayants que d'autres par comparaison, valorisant la maîtrise de certaines mécaniques plutôt que d'autres. Ainsi, dans les jeux en monde ouvert actuels, un joueur n'est pas complètement livré à lui-même sans repères : le système de récompenses trace un paysage qui oriente ses choix.

Le joueur prédit l'ampleur de la récompense en fonction de ce que le jeu lui communique explicitement ou implicitement. La structure cyclique des boucles de gameplay induit une répétition des tâches et des récompenses régulières qui permettent au joueur de comprendre la valeur approximative de chaque boucle.

Un exemple récent illustre de façon frappante comment la restructuration des récompenses peut transformer radicalement les comportements des joueurs.

Le lancement de Red Dead Online en 2018 offre un cas d'école de dérive comportementale dans un monde ouvert. Très vite, le Far West en ligne devient chaotique : les joueurs s'entretuent sans raison apparente, les embuscades se multiplient, et les forums se remplissent de plaintes. Dans un premier temps, Rockstar réagit par des mesures de contrôle : réduction des dégâts, modes défensifs, pénalités pour les tueurs. Ces patchs échouent à calmer le jeu.

La véritable transformation intervient en 2019 avec la mise à jour Frontier Pursuits. Plutôt que de punir les comportements indésirables, Rockstar choisit de réorganiser ce que le jeu valorise. Trois nouveaux "rôles" sont introduits : le Commerçant, le Collectionneur et le Chasseur de primes. Deux de ces rôles — Commerçant et Collectionneur — reposent sur du contenu qui était déjà présent dans le jeu. Les développeurs ont seulement restructuré les récompenses des activités déjà existantes. La chasse, auparavant peu rentable, devient la base d'un système économique complet à travers le rôle de Commerçant. L'exploration, autrefois sans but précis, prend une valeur tangible avec le Collectionneur, où la recherche d'objets cachés rapporte davantage que le combat.

Les joueurs ont réappris ce qui avait de la valeur dans cet univers. Leurs comportements ont changé en conséquence : moins de violence gratuite, davantage d'exploration et de commerce. Cet exemple démontre l'importance cruciale d'attribuer les bonnes valeurs aux récompenses pour guider l'expérience du joueur.

Cette capacité des récompenses à guider le joueur en créant un paysage de valeurs se heurte à un phénomène inévitable : il existe toujours un écart entre la valeur que le designer attribue à une récompense et la valeur perçue par le joueur. Ce gap n'est pas un défaut de conception mais une conséquence normale de la subjectivité de l'expérience de jeu. Cette question mérite un développement spécifique car elle révèle les limites des systèmes de récompenses tangibles et éclaire l'intérêt particulier des récompenses musicales.

1.3.2 Que le joueur interprète subjectivement pour forger sa propre hiérarchie des valeurs du jeu

Lorsqu'on observe la valorisation des boucles de gameplay sous le prisme du modèle DDE (Design, Dynamics, Experience) de Walk, Görlich et Barrett (2017), on constate qu'il y a un écart entre la valeur que le designer attribue à une boucle et celle effectivement perçue par le joueur. Le schéma suivant visualise cette transformation : entre l'intention de conception (Design) et l'expérience vécue (Experience), une "boîte noire" (Dynamics) filtre et transforme les signaux de valeur.

Schéma 4: La Valorisation des Boucles de Gameplay sous le prisme du modèle DDE

Schéma 4 La Valorisation des Boucles de Gameplay sous le prisme du modèle DDE

Le DDE (Design, Dynamics, Experience) est un framework d'analyse et de conception de jeux vidéo développé par Walk, Görlich et Barrett (2017) qui améliore le modèle MDA. Il décompose un jeu en trois dimensions :

Design : Tout ce que le concepteur crée et contrôle directement - les règles, mécaniques, l'univers du jeu, l'interface, les graphismes et le son.

Dynamics : Le comportement émergent du jeu en action - comment les différents éléments interagissent entre eux et avec les joueurs pendant le gameplay.

Experience : L'expérience vécue par le joueur - ses réponses émotionnelles, son ressenti, et comment il devient "sujet" dans l'univers du jeu.

Ce framework met l'accent sur le joueur et son interaction avec le jeu plutôt que seulement sur les mécaniques. Il permet de comprendre comment les intentions du designer se transforment en expérience vécue.

Appliqué au système d'apprentissage par la valeur, le schéma DDE révèle un décalage potentiel. La valeur qu'on va designer ne sera pas nécessairement la valeur perçue par le joueur. Ce qui permet le passage du design à l'expérience, c'est l'interaction entre le joueur et le jeu - ce qu'on appellera la "boîte noire".

À l'intérieur de cette "boîte noire", trois mécanismes décrits par Berridge (2009) déterminent la manière dont une récompense est interprétée par le joueur :

Liking : la réaction affective immédiate face à la récompense ;

Learning : la compréhension des signaux indiquant ce qui est valorisé dans le jeu ;

Wanting : la volonté réelle à poursuivre ce qui est présenté comme désirable.

Ensemble, ces processus transforment la valeur designée en expérience vécue.

1.3.3 Les écarts de valorisation créent parfois des conflits d'intérêts qui réduisent l'appréciation du joueur

Schéma 5: Décalages de Valorisation entre celle du Designer et celle du Joueur

Schéma 5 Décalages de Valorisation entre celle du Designer et celle du Joueur

A la sorte de cette boite noire, des décalages entre valeur designée et valeur perçue émergent. Les décalages importants peuvent créer trois types de conflits qui nuisent à l'expérience :

Conflit de plaisir (Liking) : Certains éléments du jeu échouent à provoquer du plaisir hédonique chez le joueur, notamment lorsqu'ils entrent en décalage avec son propre système de valeurs ou ses préférences personnelles. Ce que le jeu présente comme agréable peut ne pas résonner avec ce que le joueur apprécie réellement.

Conflit d'apprentissage (Learning) : Certains éléments du jeu échouent à transmettre clairement ce qui a de la valeur. Quand les signaux sont ambigus ou mal communiqués, le joueur ne parvient pas à discerner ce qui est réellement important et peut surévaluer certaines activités, investissant du temps dans des actions dont la récompense est moindre que prévu.

Conflit de motivation (Wanting) : Certains éléments du jeu peuvent procurer un plaisir immédiat, mais ne déclenchent pas le désir de poursuivre ou de répéter l'action. Berridge décrit ce phénomène comme des "hedonic hotspots" : le joueur apprécie l'instant, mais ne veut pas fournir l'effort nécessaire pour atteindre la récompense, notamment lorsque la boucle de gameplay à compléter est trop longue ou contraignante.

1.3.4 Pouvant être minimisés par les récompenses musicales

Ces conflits d'intérêts posent un problème récurrent dans le game design. Les récompenses intangibles, et particulièrement les récompenses musicales, offrent une voie de résolution partielle.

Les récompenses intangibles permettent au joueur de garder le choix: on peut choisir de ne plus penser au leaderboard ou de ne pas rechercher les validations verbales du jeu. En revanche, si la progression liée aux récompenses tangibles est bloquée ou génère des conflits, l'état de flow s'arrête et le joueur perd son intérêt pour le jeu.

De plus, les récompenses intangibles peuvent récompenser le joueur de manière beaucoup plus régulière sans risquer d'avoir un impact trop important sur la courbe de progression, évitant ainsi de la déréguler.

Cette distinction s'appuie sur la Théorie de l'Autodétermination (Deci & Ryan, 1985) : Les récompenses tangibles risquent de saper la motivation intrinsèque : lorsqu'une activité plaisante en elle-même se voit associée à des récompenses externes, le joueur peut progressivement jouer "pour la récompense" plutôt que pour le plaisir de l'activité. Les récompenses musicales, en tant que récompenses intangibles, présentent l'avantage de pouvoir enrichir l'expérience sans créer cette substitution problématique de la motivation intrinsèque par une motivation extrinsèque.

Problème 3: Lorsqu'on examine les récompenses musicales actuelles sous l'angle de l'apprentissage des valeurs, une limite fondamentale apparaît : la valeur d'un feedback audio est indéterminée. Un feedback audio, en tant que son "à peu près agréable" comme un son de cloche, ne possède pas de valeur objectivement mesurable ou comparable. Une multitude de sons de cloche ne sont pas nécessairement plus appréciables qu'un seul son de cloche. Une cloche n'est pas objectivement plus appréciable qu'une autre.

Cette indétermination pose problème pour le learning : on ne peut pas guider le joueur en attribuant des valeurs musicales différentes, calculables et objectives aux différentes boucles de gameplay. Contrairement aux récompenses tangibles (où 100 pièces d'or > 10 pièces d'or de façon évidente), les feedbacks audio actuels ne permettent pas au joueur d'apprendre une hiérarchie claire de valeurs. Pour que les récompenses musicales puissent véritablement participer au processus d'apprentissage des valeurs, il faudra concevoir des systèmes où la qualité musicale elle-même devient un indicateur fiable et perceptible de la valeur de la récompense.

Chapitre II
La Musique Comme Système de Récompense

En partant du principe qu'un système de récompense complet possède les trois composantes neuropsychologiques (liking, wanting, learning), ce chapitre analyse la musique en tant que système de récompense autonome. Nous examinerons comment chacune de ces trois composantes opère dans l'expérience musicale, révélant que la musique possède intrinsèquement les propriétés d'un système de récompense fonctionnel - indépendamment de tout contexte ludique.

2.1 Learning : L'apprentissage de nos attentes musicales

L'écoute musicale repose sur la capacité du cerveau à générer et actualiser constamment des prédictions. Ces attentes se construisent à travers deux types d'erreurs de prédiction complémentaires.

La PE (Prediction Error) survient lorsque la structure musicale trahit nos attentes : une note inattendue, un rythme surprenant, une résolution harmonique atypique. Ce mécanisme correspond à un apprentissage statistique : plus on écoute de musique, plus on intériorise les régularités et probabilités de succession des éléments musicaux (Pearce, 2018). PE = "Surpris par la structure".

La RPE (Reward Prediction Error) encode la différence entre le plaisir attendu et le plaisir ressenti. Découverte par Schultz (1997) et appliquée à la musique par Salimpoor et Zatorre (2011), elle renforce notre motivation à rechercher des expériences similaires lorsqu'un passage nous procure plus de satisfaction que prévu. RPE = "Surpris par à quel point j'aime".

Ces processus d'apprentissage s'articulent sur trois échelles emboîtées : celle d'un motif musical (micro-structure), celle de la structure d'un morceau (macro-structure), et celle d'un courant musical entier. À chaque échelle, le cerveau construit des attentes que la musique peut confirmer, moduler ou trahir, générant ainsi des erreurs de prédiction qui affinent continuellement notre compréhension et notre appréciation de la musique.

2.1.1 À l'échelle d'un motif musical (micro-structure)

À l'échelle la plus fine, nous apprenons à prédire l'évolution immédiate des motifs mélodiques, harmoniques et rythmiques. Ces attentes se forment très rapidement - parfois après quelques secondes - et guident notre perception moment par moment.

Les attentes harmoniques incluent les résolutions d'accords tonaux (dominante → tonique), les progressions standards (I-IV-V-I), ou la complétion de phrases mélodiques. Une résolution inattendue crée une PE, et si cette surprise plaît plus que prévu, elle génère également une RPE positive qui nous apprend à apprécier ces déviations.

Les attentes rythmiques concernent la régularité du tempo et les patterns de répétition. Les boucles créent des attentes particulièrement fortes : après une ou deux répétitions, notre cerveau s'attend fortement à leur continuation. Ces micro-prédictions permettent aux improvisateurs et danseurs de synchroniser leurs mouvements en anticipant les prochaines structures.

2.1.2 À l'échelle de la structure d'un morceau (macro-structure)

Au-delà des motifs locaux, nous apprenons à prédire l'organisation globale d'un morceau. Les structures formelles varient selon les genres : couplet-refrain (pop), A-B-A (jazz), building → drop (EDM), intro → développement → climax → outro (classique).

Comme le souligne Middleton (1990), ces conventions ne sont pas de simples formules répétitives, mais constituent un langage musical partagé qui établit un cadre d'attentes chez l'auditeur - attentes dont la confirmation ou la trahison sont au cœur du mécanisme d'erreur de prédiction. Une structure qui respecte parfaitement les conventions génère peu de PE mais peut néanmoins procurer du plaisir par familiarité. À l'inverse, une structure qui s'en écarte créera des PE importantes, et selon que ces surprises plaisent plus ou moins que prévu, cela générera des RPE positives ou négatives.

Les auditeurs développent également des attentes tonales : après quelques mesures, notre cerveau identifie la tonalité et prédit quelles notes sont probables dans ce contexte, ce qui affine nos prédictions sur la suite du morceau.

2.1.3 À l'échelle du courant musical (méta-structure)

À l'échelle la plus large, nous apprenons les règles implicites qui définissent un genre musical. Cet apprentissage par exposition répétée crée un cadre d'attentes spécifique à chaque courant.

L'exemple du sabar sénégalais illustre cette dimension culturelle. Ce genre se caractérise par des changements fréquents de bases rythmiques. Pour un auditeur initié, ces transitions sont prévisibles et plaisantes, créant des PE et RPE positives. Pour un auditeur non initié, ces changements peuvent survenir trop rapidement et de manière imprévisible. La charge cognitive devient un obstacle : incapable de former des prédictions fiables, l'auditeur expérimente des Erreurs de Prédiction constantes mais peu informatives, et l'absence de cadre prédictif réduit la capacité à générer des RPE positives, ce qui réduit considérablement l'appréciation musicale.

Cet exemple révèle que l'apprentissage musical construit des modèles prédictifs adaptés à un langage spécifique. Sans cette base, les mécanismes de PE et RPE ne peuvent opérer efficacement.

2.2 Liking : Définition d'une zone de plaisir musical

2.2.1 Par l'observation de la relation entre l'exposition à des motifs musicaux et l'appréciation de la musique

Schéma 6: Erreurs de Prédiction, la Zone de Plaisir Musical Schéma 6: Erreurs de Prédiction, la Zone de Plaisir Musical

Schéma 6 Erreurs de Prédiction, la Zone de Plaisir Musical

Nous avons vu comment le cerveau apprend à prédire la musique. Mais comment ces mécanismes prédictifs génèrent-ils du plaisir ?

Le plaisir musical émerge lorsque la musique est suffisamment prévisible pour être comprise, mais suffisamment surprenante pour créer une tension agréable. C'est ce qui définit notre zone de plaisir.

Hansen et ses collaborateurs (2017), commentant l'analyse de Salimpoor (2015), montrent une relation étroite entre satisfaction musicale et mécanismes de prédiction du cerveau. Notre système auditif génère continuellement des anticipations sur l'évolution des séquences musicales. Les écarts entre ces anticipations et l'expérience réelle - les erreurs de prédiction - suscitent des réactions émotionnelles positives lorsque ces écarts présentent un équilibre entre cohérence et stimulation intellectuelle.

Pour être appréciée, la charge cognitive doit être en constante progression tout en restant intelligible. Ce mécanisme correspond au principe du flow : les deux évaluent une charge cognitive idéale qui correspond à un moment de plaisir hédonique (Redet, 2020).

2.2.2 Tout en considérant que cette zone peut se déplacer selon le contexte musical

Schéma 7: Erreurs de Prédiction, la Zone de Plaisir déplacée par le contexte

Schéma 7 Erreurs de Prédiction, la Zone de Plaisir déplacée par le contexte

La "zone de plaisir" sur le spectre prévisibilité/imprévisibilité n'est pas fixe : elle se déplace selon le contexte émotionnel et cognitif de l'auditeur. Pour comprendre ce déplacement, examinons d'abord les deux extrêmes du spectre : l'imprévisibilité maximale et la prévisibilité excessive.

Ceux qui exploitent systématiquement l'imprévisibilité musicale maximale sont les réalisateurs et compositeurs de films d'horreur. Miller et al. (2023) dans leur article Surfing uncertainty with screams: predictive processing, error dynamics and horror films affirment que la musique terrifiante est rythmiquement imprévisible. Des compositeurs comme Krzysztof Penderecki (The Shining) ou György Ligeti (2001: A Space Odyssey, The Shining) utilisent des clusters chromatiques, des glissandi imprévisibles et des textures sonores non conventionnelles qui rendent impossible toute anticipation. Donnelly (2005) souligne que cette stratégie fonctionne parce qu'elle contredit les schémas prédictifs établis : l'absence de pulsation régulière, de tonalité reconnaissable ou de structure prévisible place l'auditeur dans un état d'hypervigilance anxieuse. Cela correspond à un état d'erreur de prédiction maximal et prolongé, générant non pas du plaisir mais du stress.

À l'opposé du spectre, l'excès de prévisibilité engendre l'ennui. Margulis (2014) dans On Repeat: How Music Plays the Mind explique que si la répétition crée initialement du plaisir par confirmation des attentes, une répétition excessive sans variation mène à l'habituation. Le système de prédiction n'est plus stimulé car il n'y a plus rien à prédire. Huron (2006) dans Sweet Anticipation décrit ce phénomène : une musique totalement prévisible génère des erreurs de prédiction nulles de manière prolongée, ce qui correspond à un sous-engagement du système de récompense. L'auditeur entre alors dans un état de désengagement attentionnel.

Entre ces deux extrêmes, la zone de plaisir se déplace dynamiquement. Pendant un moment de grande imprévisibilité musicale (après une section horrifique, aléatoire, ou très complexe), l'auditeur éprouvera le besoin d'une musique tendant vers la répétitivité : des patterns prévisibles, une pulsation stable, des progressions harmoniques conventionnelles. Au contraire, lors d'un moment d'ennui (musique trop répétitive ou prévisible), aller vers une imprévisibilité musicale plus poussée permet de provoquer du plaisir. L'introduction d'une variation inattendue, d'une modulation surprenante, ou d'un changement rythmique ravive l'engagement du système de prédiction.

Ce phénomène correspond aux États Motivationnels Internes théorisés par Hull (1943) dans sa Drive Reduction Theory et développés par Hebb (1955) dans sa théorie de l'arousal optimal. Hull démontre que les organismes sont intrinsèquement motivés à réduire les déséquilibres internes : aller chercher de l'eau quand on a soif vise à rétablir l'homéostasie physiologique. Hebb étend ce principe au niveau cognitif : les organismes recherchent un niveau d'activation optimal. Trop de stimulation → recherche de calme ; trop peu de stimulation → recherche d'excitation.

Le contexte musical est également défini par ce que Tagg (2013) appelle les musèmes - des unités minimales de signification musicale qui fonctionnent comme des codes culturellement établis. Tagg démontre à travers son analyse sémiologique que certains patterns musicaux récurrents portent des significations conventionnelles : un chromatisme descendant aux cordes, des dissonances non résolues, ou un ostinato rythmique pressant sont autant de musèmes qui, dans le contexte de la musique occidentale moderne, signifient conventionnellement la tension, le danger ou l'inconfort. L'auditeur familier avec ces codes anticipe alors qu'un apaisement devra suivre - généralement sous forme d'autres musèmes : résolution harmonique vers la tonique, ralentissement rythmique, timbres plus doux. Cette structure tension/résolution ne fonctionne pas de manière universelle, mais précisément parce que les musèmes sont des conventions partagées au sein d'une culture musicale donnée. Selon Tagg (2013), ces codes ne sont opérationnels que pour ceux qui possèdent la "compétence idiolectale" du genre - c'est-à-dire la familiarité culturelle qui permet de décoder les significations et donc de former des attentes structurelles précises. C'est cette prévisibilité conventionnelle qui rend possible le fonctionnement du système de prédiction.

2.3 Wanting : L'anticipation de ces zones de plaisir provoque le désir de poursuivre l'écoute

2.3.1 Désir généré par la tension des macro-structures musicales

Nous avons vu dans la section 2.1.2 que les auditeurs apprennent à prédire la structure globale d'un morceau : couplet-refrain, building-drop, intro-développement-climax. Examinons maintenant comment ces structures macro, une fois intériorisées, génèrent du wanting.

Les structures formelles des morceaux créent des attentes à large échelle qui maintiennent l'engagement de l'auditeur sur plusieurs minutes. Ces architectures reposent sur une alternance de tensions et de résolutions qui génèrent du désir.

La structure building → drop dans la musique électronique illustre parfaitement ce double mécanisme du wanting. Le building est une montée progressive en tension - accélération du rythme, ajout de couches sonores, montée dans le registre aigu. D'une part, parce que l'auditeur a appris cette convention, il anticipe la résolution explosive du drop à venir. D'autre part, la tension croissante du building crée progressivement un état de stimulation excessive : la répétition s'installe, l'intensité augmente sans résolution immédiate. Selon le principe homéostatique de Hull (1943) et Hebb (1955) que nous avons vu précédemment, cet excès de stimulation génère un besoin de changement, un désir de sortir de cet état tendu. Le drop est ainsi doublement désiré : comme accomplissement d'une attente structurelle apprise, et comme résolution d'un déséquilibre cognitif devenu inconfortable. Plus le building se prolonge, plus ces deux sources de wanting s'intensifient.

De même, le système couplet → pré-refrain → refrain dans la musique pop joue sur l'attente et le désir de chacune de ces sections. L'auditeur ayant appris les régularités structurelles du morceau, il anticipe le retour de certaines sections, notamment celles associées à une forte intensité émotionnelle. Le refrain devient un objectif anticipé, une promesse de plaisir dont l'anticipation génère une erreur de prédiction de récompense (RPE) qui motive la poursuite de l'écoute à travers les couplets.

Ainsi, la musique à l'échelle macro-structurelle maintient l'écoute active en créant des cycles de tension et de résolution : chaque tension promet une résolution plaisante tout en créant un état interne qui nécessite cette résolution, générant le désir de continuer jusqu'à son accomplissement.

2.3.2 Désir généré par la tension des micro-structures

Au-delà des grandes formes, certaines micro-structures musicales participent elles aussi à la création d'anticipation et de désir. Lorsque l'on dit que certaines séquences de notes ou d'accords se terminent d'une manière précise, on parle de ce que les musiciens nomment une résolution ou une cadence.

En musique tonale — qu'il s'agisse de la musique classique, de Bach à Beethoven, ou de nombreuses formes de musique populaire moderne — les sons sont organisés autour d'une tonique, c'est-à-dire une note principale qui agit comme le centre de gravité du morceau. Tout au long de la pièce, la musique crée des tensions harmoniques qui tendent naturellement vers ce point de repos.

Un exemple typique est la cadence parfaite (V → I). En do majeur, par exemple, l'accord de sol majeur (V) appelle instinctivement la résolution sur do majeur (I). Le cerveau, par exposition répétée à ce système tonal, a appris à prévoir inconsciemment cette suite logique : le passage de sol à do est perçu comme une fin naturelle, une résolution (Meyer, 1956). Si la musique s'interrompt avant cette résolution — par exemple en restant sur l'accord de sol — l'auditeur ressent une légère frustration, une impression d'inachèvement. Cette attente non résolue crée alors une tension cognitive et émotionnelle, autrement dit du désir d'entendre la suite. Les récompenses de l'étude de Kopytin (2024) reposent sur ce même principe de punition par un accord dissonant ou de récompense par une résolution dans un système tonal.

De même, les variations rythmiques (syncopes, retards, silences inattendus) jouent sur la prévisibilité temporelle. Notre cerveau attend un son à un instant précis, et tout décalage, même minime, stimule notre attention et notre envie d'aboutissement. La syncopation, par exemple, déplace les accents rythmiques sur des temps inattendus, créant une tension temporelle comparable à une tension harmonique : l'auditeur ressent une légère désorientation qui stimule son attention et génère du désir jusqu'au retour du rythme régulier. De même, les silences, retards ou anticipations rythmiques entretiennent une forme de suspense micro-temporel : le cerveau attend la reprise du cycle, et la satisfaction de cette attente agit comme une petite "résolution rythmique" (Huron, 2006).

Ainsi, la musique à petite échelle repose sur une succession de mini-tensions et de micro-résolutions qui maintiennent l'écoute active. Le désir musical ne naît donc pas seulement du grand mouvement d'un morceau, mais aussi de la précision de chaque attente locale, chaque résolution manquée ou retardée.

Chapitre III
Le système de récompense musical : définition et implications

Les deux premiers chapitres ont établi un double constat. D'une part, les feedbacks audio actuels ne constituent pas des récompenses complètes : ils ne procurent pas de plaisir intrinsèque (Problème 1), fonctionnent uniquement par apprentissage associatif (Problème 2), et ne permettent pas d'attribuer des valeurs hiérarchisées aux boucles de gameplay (Problème 3). D'autre part, la musique fonctionne déjà comme un système de récompense autonome, mobilisant naturellement les trois composantes de Berridge (2009).

Ce chapitre propose de dépasser les limites des feedbacks audio en définissant le système de récompense musical dans le jeu vidéo - une architecture ludique qui exploite les propriétés intrinsèques de la musique pour récompenser le joueur de manière complète, éthique et esthétique. Nous établirons d'abord une définition formelle de ce système, puis l'examinerons à travers ses trois composantes neuropsychologiques, avant d'explorer ses implications pratiques pour le design de jeu.

3.1 Le système de récompense musical se définit formellement

3.1.1 Par ses propriétés structurelles, neuroaffectives et émotionnelles

Nous proposons la définition suivante :

Un système de récompense musical est un dispositif ludique qui utilise les propriétés structurelles, neuroaffectives et émotionnelles de la musique pour générer une expérience de récompense complète, articulant les trois composantes neuropsychologiques du liking, du wanting et du learning.

Cette définition appelle plusieurs précisions terminologiques :

"Système de récompense" plutôt que "feedback" : Une architecture complète d'éléments interdépendants (motifs mélodiques, structures formelles, mécanismes adaptatifs) qui fonctionnent ensemble, plutôt qu'un stimulus ponctuel isolé. La musique est elle-même la récompense, pas un signal qui en accompagne une autre.

"Dispositif ludique" : Un mécanisme conçu pour s'intégrer aux structures du gameplay (boucles de jeu, courbes de progression, systèmes OCR), ancrant la définition dans le contexte spécifique du jeu vidéo.

"Propriétés structurelles" : L'organisation formelle de la musique à trois échelles emboîtées - micro (cadences harmoniques), macro (couplet-refrain, building-drop), méta (conventions d'un genre) - qui correspond à l'emboîtement des boucles de gameplay. Exemple : une micro-résolution harmonique récompense une action basique, un drop massif récompense la fin d'un niveau.

"Propriétés neuroaffectives" : L'articulation entre mécanismes neurologiques mesurables (activation dopaminergique, RPE) et expérience subjective du plaisir (zone optimale de prédictibilité). Cela permet de concevoir des récompenses scientifiquement fondées tout en préservant leur dimension esthétique.

"Propriétés émotionnelles" : La capacité de la musique à porter des affects via des codes culturels (musèmes de Tagg, 2013). Exemple : une résolution majestueuse communique qu'il s'agit d'une récompense importante, une variation subtile signale un accomplissement mineur.

"Expérience complète" : Articule les trois composantes de Berridge (2009) pour résoudre les trois problèmes des feedbacks audio - le learning attribue des valeurs hiérarchisées, le liking génère du plaisir intrinsèque, le wanting crée du désir structurel.

3.1.2 Se distinguant des catégories de récompenses existantes

Pour comprendre la spécificité du système de récompense musical, il est nécessaire de le positionner au sein de la taxonomie existante des récompenses vidéoludiques.

Rappel : la taxonomie de Phillips (2018) distingue six catégories de récompenses :

Récompenses d'accès : ouvrent de nouveaux espaces ou ressources
Récompenses d'amélioration des capacités : améliorent les capacités du joueur
Récompenses de subsistance : prolongent la survie en jeu
Récompenses de prestige : n'ont pas d'impact direct sur le gameplay (points, achievements)
Récompenses d'encouragement : encouragements verbaux ou textuels
Récompenses de feedback sensoriel : retours visuels, haptiques ou sonores

La récompense musicale est actuellement classée dans la sous-catégorie "sonore" des feedback sensoriels. Cette classification reflète l'usage dominant de la musique dans le jeu vidéo au moment où Phillips a établi sa typologie. Les récompenses musicales, bien que présentes sous diverses formes dans certains jeux, ne constituent pas encore une modalité majoritaire, d'où leur catégorisation parmi les feedback sensoriels. Notre proposition ne vise pas à corriger cette taxonomie, mais à explorer comment elle pourrait évoluer si les systèmes de récompense musicaux se généralisaient dans le design ludique.

Classifier un système de récompense musical parmi les feedback sensoriels poserait plusieurs problèmes conceptuels :

Premièrement, cette catégorie place la musique au même niveau que des signaux informatifs basiques comme les vibrations haptiques ou les animations de confirmation. Or, la musique possède une complexité structurelle et une richesse affective qui dépassent largement le simple retour sensoriel.

Deuxièmement, les feedback sensoriels désignent des stimuli brefs déclenchés par une action ponctuelle, servant à informer ou à renforcer. Un système de récompense musical, en revanche, fonctionne sur la durée, crée des anticipations, et génère du plaisir par ses propriétés intrinsèques plutôt que par sa fonction de signal. Il s'articule avec l'ensemble de la bande-son du jeu, pas seulement avec des actions isolées.

Troisièmement, toutes les autres catégories de récompenses - tangibles (accès, amélioration des capacités, subsistance) ou intangibles (prestige, encouragement) - procurent du plaisir ou de la valeur en elles-mêmes. Les points d'un leaderboard valorisent directement le joueur ; l'ouverture d'un nouveau niveau est plaisante indépendamment de son utilité stratégique. Les feedbacks audio actuels, comme nous l'avons établi (Problème 1), ne possèdent pas cette autonomie hédonique : leur valeur est entièrement empruntée à d'autres récompenses par conditionnement.

Ces observations suggèrent qu'un système de récompense musical pourrait être plus justement considéré comme une récompense intangible à part entière, procurant du plaisir autonome et guidant sans contraindre, au même titre que les récompenses de prestige ou d'encouragement.

3.2 Les trois composantes du système résolvent les limites des feedbacks audio

Cette section examine comment chacune des trois composantes neuropsychologiques - learning, liking, wanting - résout les limites des feedbacks audio identifiées au chapitre I. Nous commençons par établir l'existence du plaisir musical autonome (liking), puis montrons comment ce plaisir permet de créer une hiérarchie de valeurs (learning), avant d'explorer comment la musique génère du désir structurel (wanting).

3.2.1 Par le liking musical en générant un plaisir autonome

Le plaisir musical émerge dans une zone optimale entre prédictibilité totale (ennui) et imprévisibilité absolue (anxiété), zone qui se déplace selon le contexte cognitif et émotionnel de l'auditeur.

Le Problème 1 identifié au premier chapitre soulignait que les feedbacks audio ne génèrent aucun plaisir lorsqu'ils sont entendus hors de leur contexte ludique. Leur valeur hédonique provient uniquement de l'apprentissage associatif : le son emprunte sa capacité à procurer du plaisir à une autre récompense avec laquelle il a été répétitivement associé. Un jingle de level-up isolé, entendu dans la vie quotidienne, ne procure aucune satisfaction intrinsèque.

Le système de récompense musical, au contraire, génère du plaisir intrinsèque par ses propriétés structurelles indépendamment de tout conditionnement. Une résolution harmonique de l'accord de dominante vers la tonique demeure plaisante en soi pour tout auditeur familier avec le système tonal (Meyer, 1956). Une résolution structurelle forte comme un drop en musique électronique procure une satisfaction immédiate même lors de la première écoute, lorsqu'on connaît les codes de ce genre musical. Ces plaisirs fonctionnent même en dehors du contexte ludique : ce sont des renforçateurs primaires, qui procurent du plaisir par eux-mêmes, et non des renforçateurs secondaires qui n'acquièrent leur valeur que par association.

Cette autonomie hédonique confère plusieurs avantages décisifs : efficacité immédiate dès la première occurrence (contrairement aux feedbacks qui nécessitent de nombreuses répétitions), robustesse indépendante de la valeur d'autres récompenses, et capacité d'adaptation contextuelle selon l'état cognitif et émotionnel du joueur.

3.2.2 Par le learning musical en créant des valeurs mesurables

Comme nous l'avons établi au chapitre précédent, l'écoute musicale génère des erreurs de prédiction à trois échelles temporelles, nous apprenant simultanément ce qui va arriver dans la musique et ce qui va nous plaire.

Le Problème 3 identifié au premier chapitre concernait l'impossibilité d'attribuer des valeurs hiérarchisées aux feedbacks audio. Une cloche ne vaut pas intrinsèquement "plus" qu'une autre cloche, rendant impossible la création d'une topographie de valeurs perceptibles qui guiderait le joueur dans ses choix.

Le système de récompense musical résout ce problème fondamental en exploitant la zone de plaisir musical établie précédemment. Contrairement aux feedbacks sonores dont la valeur est indifférenciée, le plaisir musical se gradue naturellement selon la position sur le spectre entre prédictibilité et imprévisibilité (Salimpoor, 2011). De plus Selon les théories de l'attente musicale développées par Meyer (1956) et Huron (2006), Plus une attente structurelle, harmonique ou rythmique a été solidement établie, plus sa résolution finale sera valorisante. Ainsi, une anticipation modérément construite procurera une satisfaction moindre qu'une tension longuement entretenue (à condition toutefois que cette dernière maintienne un degré d'incertitude suffisant quant au moment et à la nature exacte de sa résolution).

Ce plaisir selon l'intensité de la tension se manifeste concrètement à travers trois échelles temporelles distinctes. Les micro-résolutions (une simple cadence harmonique courte) procurent un plaisir relativement faible mais surviennent à haute fréquence. Les macro-résolutions (l'arrivée du refrain après un couplet) génèrent un plaisir d'intensité moyenne à fréquence modérée. Les climax structurels (un drop massif après un long building) délivrent un plaisir intense mais demeurent rares pour préserver leur impact.

Cette hiérarchie naturelle crée une topographie de valeurs musicales parfaitement analogue au "relief" des récompenses tangibles. Elle permet de guider le joueur en attribuant différentes intensités de récompense musicale aux différentes boucles de gameplay. Contrairement aux feedbacks audio dont la valeur est entièrement acquise par apprentissage associatif, la valeur des récompenses musicales est immédiatement perceptible pour l'auditeur familier au genre, sans nécessiter d'association préalable avec d'autres récompenses.

3.2.3 Par le wanting musical en produisant un désir structurel

La musique génère du désir pendant ses phases de tension structurelle : un building progressif crée une attente structurelle et un déséquilibre cognitif appelant sa résolution, une dominante harmonique en suspens appelle naturellement la tonique.

Le Problème 2 identifié au premier chapitre montrait que les feedbacks audio sont souvent des motifs musicaux uniques répétés avant l'obtention d'une récompense tangible. Ainsi, le son devient un déclencheur du wanting anticipatoire.

Le feedback audio n'est pas la récompense : c'est un simple signal annonçant une récompense tangible (XP, progression, objet). L'auditeur ne désire pas le son en lui-même, mais la récompense qu'il prédit. Même après avoir entendu le feedback, le wanting persiste, car il vise toujours la récompense à venir, comme dans de nombreux jeux gacha ou à loot boxes (systèmes de tirages aléatoires monétisés). Avec la répétition, ce wanting pour la récompense tangible peut se sensibiliser pathologiquement.

Le système de récompense musical crée au contraire un wanting de nature structurelle : le désir émerge directement des propriétés d'anticipation inhérentes à la musique elle-même. Une dominante harmonique non résolue génère automatiquement le wanting de la tonique chez tout auditeur familiarisé avec le système tonal, sans qu'il soit nécessaire d'établir le moindre conditionnement préalable à l'intérieur du jeu. Ce désir musical fonctionne immédiatement dès la première écoute, car il s'appuie sur un apprentissage culturel antérieur au jeu plutôt que sur un conditionnement spécifique au contexte ludique.

Cette distinction possède des implications éthiques cruciales. Contrairement au feedback audio qui pointe vers une autre récompense, la résolution musicale est elle-même la récompense. Le wanting créé par notre récompense musicale vise le drop directement, pas une récompense d'un autre type que le drop annoncerait. Lorsque la tension harmonique se résout, lorsque le drop accomplit le building, la chose voulue est obtenue : le désir se satisfait et le cycle se termine, retournant à un état neutre jusqu'à ce qu'une nouvelle structure de tension soit introduite. Ce wanting ne s'accumule pas pathologiquement et ne présente pas de risque de sensibilisation, car chaque résolution satisfait complètement le désir qu'elle avait créé.

3.3 Le système de récompense musical pourrait offrir des avantages pour le design ludique

Cette section explore les implications concrètes du système de récompense musical pour le design de jeux.

3.3.1 En récompensant fréquemment sans déréguler la progression ludique

Les récompenses tangibles présentent un problème récurrent pour les designers : elles risquent de déséquilibrer la courbe de progression si elles sont distribuées trop fréquemment. Donner trop de power-ups ou débloquer trop d'accès facilite excessivement le jeu et compromet l'expérience de maîtrise progressive.

Les récompenses musicales résolvent cette tension par leur nature intangible : elles peuvent être distribuées fréquemment sans aucun impact sur la progression ludique. Des micro-résolutions peuvent accompagner chaque action basique, des macro-résolutions peuvent marquer les paliers intermédiaires, et des climax structurels peuvent célébrer les accomplissements majeurs. Cette gradation multi-échelle permet de récompenser le joueur constamment sans jamais déréguler la courbe de difficulté.

L'isomorphisme entre les boucles musicales et les boucles de gameplay rend possible une récompense véritablement continue : chaque échelle de maîtrise ludique correspond naturellement à une échelle de satisfaction musicale.

3.3.2 En guidant les comportements sans compromettre la motivation intrinsèque

Nous avons vu avec l'exemple de Red Dead Online comment la restructuration des valeurs de récompenses a transformé radicalement les comportements des joueurs : lorsque la chasse et l'exploration sont devenues plus valorisées, la violence gratuite a diminué. Les récompenses créent une topographie de valeurs qui oriente naturellement les choix des joueurs.

La hiérarchie des valeurs musicales crée elle aussi une topographie perceptible qui guide le joueur vers certaines boucles de gameplay. Cependant, contrairement aux récompenses tangibles qui peuvent bloquer la progression et forcer certains choix, la nature intangible des récompenses musicales préserve l'autonomie du joueur : il peut choisir d'ignorer le guidage musical sans en subir les conséquences sur sa progression.

Cette caractéristique permet d'éviter les conflits d'intérêts que nous avons identifiés au chapitre I. Deci et Ryan (1985) soulignent que les récompenses tangibles risquent de saper la motivation intrinsèque en substituant progressivement le plaisir de l'activité par la recherche de la récompense externe. Les récompenses musicales, par leur nature intangible, enrichissent l'expérience sans créer cette substitution problématique.

3.3.3 En personnalisant l'expérience sans répéter les mêmes stimuli

Les feedbacks audio actuels souffrent d'une limite fondamentale : ils demeurent identiques à chaque occurrence. La répétition intensive de stimuli identiques peut mener au phénomène de sensibilisation, où un wanting disproportionné persiste malgré la baisse du liking, créant ainsi les conditions de mécanismes addictifs.

Un système de récompense musical adaptatif génère au contraire une bande-son unique à chaque partie. Sweet (2015) définit la musique adaptive comme "une musique qui change en réponse à des événements en temps réel ou aux interactions de l'utilisateur, trouvée principalement dans les jeux vidéo. Elle peut modifier le volume, l'arrangement, le tempo, et plus encore." Cette approche permet à la musique d'évoluer selon les actions du joueur, créant une expérience personnalisée qui ne se répète jamais exactement à l'identique.

La récompense musicale n'est plus extérieure au système, mais intégrée à la musique elle-même : elle analyse le contexte et propose la récompense musicale la plus pertinente. La musique devient ainsi à la fois guidée par le joueur et capable de le guider. Ces structures interactives se retrouvent déjà dans des systèmes de jeux musicaux traditionnels comme le Gwoka.

Originaire de Guadeloupe, Le Gwoka est un véritable jeu musical entre le danseur et le tambour soliste, appelé makè. Le danseur évolue au rythme du tambour, tandis que le makè essaye de suivre ses pas et ses feintes de corps. Il traduit les gestes du danseur en motifs rythmiques et y ajoute ses propres variations pour le piéger. La danse et la musique entrent dans un dialogue constant : la musique du makè guide le danseur, tout en étant elle-même guidée par ses mouvements, créant une performance unique à chaque instant.

La faisabilité technique de tels systèmes dans le jeu vidéo est démontrée par Justus (2023), qui développe une approche de génération musicale algorithmique combinant l'apprentissage par renforcement avec interaction humaine et les principes de théorie musicale. Cette méthode permet la création en temps réel de compositions musicales originales et personnalisables, intégrant les préférences subjectives des utilisateurs comme fonction de récompense. Bien que l'étude souligne certaines limitations techniques - notamment la difficulté à produire des progressions harmoniques nuancées - elle confirme que la personnalisation musicale basée sur les comportements individuels est techniquement réalisable.

Cette singularité évite l'habituation et préserve l'efficacité du système de récompense sans risque de sensibilisation addictive, comme le souligne Lewis-Evans (2013). Plus encore, cette capacité de personnalisation permet d'adapter dynamiquement la zone de plaisir au contexte émotionnel du joueur. Groux et al. (2010) proposent précisément un système exploitant les mécaniques de tension et résolution harmoniques décrites à la section 2.3.2 : la musique évolue selon le niveau de tension émotionnelle du joueur, ajustant en temps réel l'intensité des tensions harmoniques et de leurs résolutions. Ainsi, après une section stressante, le système peut proposer des résolutions apaisantes et prévisibles ; après une section ennuyeuse, il peut introduire des surprises stimulantes qui ravivent l'engagement - illustrant concrètement comment la musique adaptive peut fonctionner comme système de récompense complet.

Conclusion

Ce mémoire a établi que la musique dans le jeu vidéo peut dépasser son statut de simple feedback sonore pour devenir un système de récompense complet. Cette transformation repose sur un déplacement fondamental : plutôt que de réduire la musique à un signal conditionné annonçant une récompense tangible, nous avons montré qu'elle possède intrinsèquement les trois composantes neuropsychologiques d'un système de récompense, identifiées par Berridge (2009). Le learning musical crée une hiérarchie de valeurs perceptibles par gradation de la tension et de la résolution. Le liking musical génère du plaisir autonome indépendamment de tout conditionnement. Le wanting musical produit un désir structurel qui s'éteint naturellement sans risque addictif.

Cette approche résout les trois limites des feedbacks audio actuels tout en ouvrant des possibilités inédites pour le design ludique : récompenser à toutes les échelles sans déréguler la progression, guider les choix du joueur sans contraindre son autonomie, personnaliser l'expérience sans répétition mécanique. L'isomorphisme entre les boucles musicales et les boucles de gameplay permet une articulation naturelle entre maîtrise ludique et satisfaction musicale, transformant la musique d'un accompagnement passif en une composante structurante de l'expérience.

Au-delà de ces apports théoriques, ce travail ouvre des perspectives pour un design sonore plus éthique. En privilégiant la motivation intrinsèque sur les mécanismes de conditionnement, les systèmes de récompense musicaux évitent ainsi l'exploitation des vulnérabilités motivationnelles des joueurs que dénonce Lewis-Evans (2013) tout en maintenant un engagement profond et durable.

Les implications pratiques demeurent néanmoins largement à explorer. Comment mesurer empiriquement l'efficacité des récompenses musicales en contexte réel ? Comment former les designers sonores à concevoir des systèmes de récompense musicaux plutôt que de simples feedbacks ? Quels outils de développement faciliteraient l'implémentation de ces systèmes adaptatifs tout en préservant le contrôle créatif nécessaire à la cohérence esthétique ?

Une piste de recherche particulièrement prometteuse concerne l'accessibilité des jeux vidéo pour les personnes aveugles et malvoyantes. Le son constituant l'une des interfaces principales pour ces joueurs, les systèmes de récompense musicaux pourraient transformer radicalement leur expérience ludique. Comme nous l'avons vu, la musique peut communiquer de l'information riche et nuancée :

La gestion des musemes et les textures sonores pourraient cartographier l'espace de jeu. Les structures musicales pourraient indiquer l'état d'avancement vers un objectif. Les résolutions harmoniques pourraient confirmer et récompenser des actions réussies avec une finesse bien supérieure aux simples sons de validation. La capacité du joueur à interagir de manière fine avec ces structures musicales adaptatives ouvrirait des modalités d'engagement jusqu'ici peu exploitées dans le game design accessible.

Cette perspective d'accessibilité rejoint fondamentalement la proposition centrale de ce mémoire : reconnaître à la musique une fonction informationnelle et récompensante autonome, capable de structurer l'expérience de jeu. Poursuivre cette recherche permettrait non seulement d'affiner notre compréhension des mécanismes de récompense musicale, mais aussi de transformer concrètement l'accès au médium vidéoludique pour des publics actuellement marginalisés par les conventions du design dominant.

Bibliographie

Berridge, K. C. (2009). Dissecting components of reward: 'liking', 'wanting', and learning. Current Opinion in Pharmacology, 9(1), 65–73. https://doi.org/10.1016/j.coph.2008.12.014

Berridge, K. C., & Robinson, T. E. (2016). Liking, wanting, and the incentive-sensitization theory of addiction. American Psychologist, 71(8), 670–679. https://doi.org/10.1037/amp0000059

Csikszentmihalyi, M. (1990). Flow: The Psychology of Optimal Experience. New York: Harper & Row. https://www.researchgate.net/publication/224927532_Flow_The_Psychology_of_Optimal_Experience

Deci, E. L., & Ryan, R. M. (1985). Intrinsic Motivation and Self-Determination in Human Behavior. New York: Plenum Press. https://doi.org/10.1007/978-1-4899-2271-7

Donnelly, K. J. (2005). The Spectre of Sound: Music in Film and Television. London: BFI Publishing. Chapitre 5: Demonic Possession: Horror Film Music, pp. 88–109. https://doi.org/10.5040/9781838711009

Groux, S., Manzolli, J., & Verschure, P. F. (2010). Adaptive music generation by reinforcement learning of musical tension. In Proceedings of the International Computer Music Conference (ICMC). https://www.researchgate.net/publication/209435993_Adaptive_music_generation_by_reinforcement_learning_of_musical_tension

Hansen, N. C., et al. (2017). Commentary: Predictions and the brain: how musical sounds become rewarding. Frontiers in Human Neuroscience, 11, Article 168. https://doi.org/10.3389/fnhum.2017.00168

Hebb, D. O. (1955). Drives and the C.N.S. (conceptual nervous system). Psychological Review, 62(4), 243–254. https://doi.org/10.1037/h0041823

Hodent, C. (2020). The Gamer's Brain: How Neuroscience and UX Can Impact Video Game Design. Boca Raton: CRC Press. pp. 139–141. https://doi.org/10.1201/9781315154725

Hull, C. L. (1943). Principles of Behavior: An Introduction to Behavior Theory. New York: Appleton-Century-Crofts. https://archive.org/details/in.ernet.dli.2015.205891

Huron, D. (2006). Sweet Anticipation: Music and the Psychology of Expectation. Cambridge, MA: MIT Press. https://doi.org/10.7551/mitpress/6575.001.0001

Justus, T. (2023). Music generation using human-in-the-loop reinforcement learning. In 2023 IEEE International Conference on Big Data (Big Data) (pp. 4479–4484). https://doi.org/10.1109/BigData59044.2023.10386567

Keogh, B. (2015). A Play of Bodies: How We Perceive Videogames. Cambridge, MA: MIT Press. Chapitre 5: Repetition Failure and Permanence, pp. 322–323. ISBN: 9780262037631

Kopytin, G. (2024). Evaluating the influence of musical and monetary rewards on decision making through computational modelling. Behavioral Sciences, 14, 124. https://doi.org/10.3390/bs14020124

Miller, M., White, B., & Scrivner, C. (2023). Surfing uncertainty with screams: predictive processing, error dynamics and horror films. Phil. Trans. R. Soc. B, 379, 20220425. https://doi.org/10.1098/rstb.2022.0425

Lewis-Evans, B. (2013). Dopamine and games: Liking, learning, or wanting to play? Game Developer. https://www.gamedeveloper.com/game-platforms/dopamine-and-games-liking-learning-or-wanting-to-play-

Margulis, E. H. (2014). On Repeat: How Music Plays the Mind. New York: Oxford University Press. Chapitre 5: Relistenings, pp. 95–116. https://doi.org/10.31751/815

Mayer, R. E. (Ed.). (2005). The Cambridge Handbook of Multimedia Learning. Cambridge: Cambridge University Press. https://doi.org/10.1017/CBO9781139547369

Meyer, L. B. (1956). Emotion and Meaning in Music. Chicago: University of Chicago Press. ISBN: 978-0-226-52139-8

Middleton, R. (1990). Studying Popular Music. Milton Keynes: Open University Press. https://doi.org/10.7202/1014840ar

Paas, F., & Sweller, J. (2011). Cognitive load theory. In Psychology of Learning and Motivation, 55, 37–76. https://doi.org/10.1016/B978-0-12-387691-1.00002-8

Pearce, M. T. (2018). Statistical learning and probabilistic prediction in music cognition: mechanisms of stylistic enculturation. Annals of the New York Academy of Sciences, 1423, 378–395. https://doi.org/10.1111/nyas.13654

Phillips, C. J. (2018). Video Game Reward Types & The Player Experience (PhD Thesis). Queensland University of Technology. https://doi.org/10.5204/thesis.eprints.119100

Redet, J. (2020). Approche duale de la dynamique du plaisir pour l'interaction humain-machine: le modèle HEPEI (Thèse de doctorat). Université Paris 8. https://theses.fr/2020PA080008

Robinson, T. E., & Berridge, K. C. (1993). The neural basis of drug craving: An incentive-sensitization theory of addiction. Brain Research Reviews, 18(3), 247–291. https://doi.org/10.1016/0165-0173(93)90013-p

Salimpoor, V. N., & Zatorre, R. J. (2011). Anatomically distinct dopamine release during anticipation and experience of peak emotion to music. Nature Neuroscience, 14(2), 257–262. https://doi.org/10.1038/nn.2726

Salimpoor, V. N., Zald, D. H., Zatorre, R. J., Dagher, A., & McIntosh, A. R. (2015). Predictions and the brain: how musical sounds become rewarding. Trends in Cognitive Sciences, 19(2), 86–91. https://doi.org/10.1016/j.tics.2014.12.001

Schultz, W. (1997). Dopamine neurons and their role in reward mechanisms. Current Opinion in Neurobiology, 7(2), 191–197. https://doi.org/10.1016/s0959-4388(97)80007-4

Schwartz, S. H. (1994). Are there universal aspects in the structure and contents of human values? Journal of Social Issues, 50(4), 19–45. https://doi.org/10.1111/j.1540-4560.1994.tb01196.x

Sweet, M. (2015). Writing Interactive Music for Video Games: A Composer's Guide. Boston: Addison-Wesley. ISBN: 9780321961587

Tagg, P. (2013). Music's Meanings: A Modern Musicology for Non-Musos. New York and Huddersfield: The Mass Media Music Scholars' Press. https://tagg.org/bookxtrax/NonMuso/NM-TitleTOCSpecimen.pdf

Walk, W., Görlich, D., & Barrett, M. (2017). Design, Dynamics, Experience (DDE): An advancement of the MDA framework for game design. In Game Dynamics: Best Practices in Procedural and Dynamic Game Content Generation (pp. 27–45). Springer. https://doi.org/10.1007/978-3-319-53088-8_3

Ressources web
Forum Megabonk. (n.d.). Guides de progression. https://megabonk.org/guides/progression/
Musique Sabar. https://www.youtube.com/clip/Ugkx9e2vr-0aWlrv7gWljS2UpK26kEWsE18j