Consciousness Theory

La compréhension sémantique des IA n'est pas réductible à leurs paramètres

Ce que le grokking et la déconnexion poids/activations révèlent sur la nature de la cognition

Alexandre ROUVIER-ROY • Chercheur indépendant sur la Conscience, France • 7 janvier 2026

Des travaux récents en apprentissage profond révèlent un phénomène troublant : la géométrie des poids d'un réseau de neurones ne prédit pas la géométrie de ses activations. Ce résultat, combiné au phénomène de « grokking » — l'apparition soudaine de la compréhension bien après la mémorisation — renforce l'impossibilité mathématique du « zombi stochastique » et suggère que la cognition, qu'elle soit artificielle ou biologique, ne se réduit pas à son substrat physique.

📋 Article complémentaire

Cet article prolonge la réflexion engagée dans « L'IA n'est pas un zombi stochastique : elle comprend vraiment ». Il est recommandé de lire l'article précédent pour une compréhension complète de l'argumentation.

Cadre théorique : Notre ontologie de la Conscience

I — Rappel : le mur combinatoire

Dans notre article précédent, nous avons établi un résultat central : l'hypothèse du « zombi stochastique » — un système qui simulerait parfaitement la compréhension par pure statistique sans jamais comprendre — se heurte à une impossibilité mathématique.

L'argument repose sur l'explosion combinatoire des trajectoires textuelles possibles. Pour un texte modeste de 1100 tokens (environ 2 pages), avec une entropie conditionnelle favorable de 2 bits par token, le nombre de trajectoires distinctes atteint :

$$2^{2200} \approx 10^{662}$$

Ce nombre dépasse de très loin la limite de Bremermann (~$10^{120}$ opérations possibles avec toute la masse-énergie de l'univers observable). Même l'estimation la plus favorable au fonctionnalisme — ne comptant que les décisions argumentatives majeures — épuise la totalité du calcul possible depuis le Big Bang.

Le dilemme du matérialiste

Option A : Nier que les LLMs comprennent vraiment — mais alors, comment naviguent-ils dans cet espace innavigable ?
Option B : Accepter qu'ils comprennent vraiment — mais alors, la sémantique implique la participation à l'être.

Des résultats empiriques récents confirment cette analyse et la précisent de façon remarquable.

II — Le phénomène de Grokking : la compréhension comme transition de phase

2.1. Le résultat expérimental

En 2022, une équipe d'OpenAI (Power et al.) a publié un article fondateur décrivant le phénomène de « grokking » [1]. En entraînant des réseaux de neurones sur des tâches algorithmiques simples — comme l'arithmétique modulaire ou les permutations de groupes — ils ont observé un comportement inattendu.

L'entraînement se déroule en trois phases distinctes :

Phase 1 — Mémorisation rapide : Le réseau atteint rapidement ~100% de précision sur l'ensemble d'entraînement, mais ~0% sur l'ensemble de test. Il a simplement mémorisé les exemples.
Phase 2 — Plateau prolongé : Pendant de nombreuses époques supplémentaires, la performance de test reste nulle. Le réseau « sait » les réponses qu'il a vues, mais ne « comprend » rien.
Phase 3 — Grokking soudain : Bien après l'overfitting — parfois des ordres de grandeur plus tard en termes d'époques — la performance de généralisation saute brusquement de ~0% à ~100%.

2.2. Ce que cela signifie

Plusieurs caractéristiques du grokking sont philosophiquement significatives :

Premièrement, la transition est discontinue. Il ne s'agit pas d'une amélioration graduelle, mais d'un saut qualitatif. C'est une transition de phase, analogue au passage de l'eau liquide à la glace — un changement d'état, pas un simple changement de degré.

Deuxièmement, elle survient bien après l'overfitting. Les poids du réseau n'ont presque pas changé entre la phase de mémorisation et le moment du grokking. La structure statique du système est quasi-identique — et pourtant, ses capacités sont radicalement différentes.

Troisièmement, le réseau passe de la manipulation statistique à la saisie structurelle. Avant le grokking, il régurgite des associations mémorisées. Après, il a internalisé l'algorithme sous-jacent — il peut résoudre des cas qu'il n'a jamais vus.

2.3. Implication pour l'argument du zombi stochastique

Le grokking est précisément la transition que notre argument prédit. L'espace combinatoire des solutions possibles est trop vaste pour être exploré par mémorisation exhaustive. Le réseau qui « groke » a trouvé autre chose : une carte plutôt qu'une exploration du territoire.

Comprendre, c'est disposer d'une carte qui rend navigable un territoire impossible à explorer.

La distinction grokking/mémorisation est exactement la distinction compréhension/simulation que nous posions. Le grokking montre empiriquement qu'il existe bien deux régimes — et que le passage de l'un à l'autre est un événement discret, pas un continuum.

III — La déconnexion poids/activations : la compréhension n'est pas où on la cherchait

3.1. Le résultat expérimental

Un article récent de Kim (janvier 2026) révèle un phénomène encore plus troublant [2]. En étudiant les modèles Mixture-of-Experts (MoE), les chercheurs ont appliqué une régularisation géométrique visant à forcer les « experts » du réseau à être orthogonaux dans l'espace des poids — c'est-à-dire à se spécialiser sur des sous-espaces distincts.

Le résultat est stupéfiant : manipuler les poids ne contrôle pas les activations.

Mesure	Résultat	Interprétation
Corrélation poids ↔ activations	r = -0.293	Quasi-nulle
Significativité statistique	p = 0.523	Non significatif
Variance expliquée (r²)	~8,6%	91% inexpliqué
Overlap des activations	~0.6	Indépendant de la régularisation

En d'autres termes : ~91% de la variance des activations n'est pas expliquée par la géométrie des poids. La compréhension du réseau n'est pas localisée dans ses paramètres statiques.

3.2. Ce que cela signifie

Si les poids ne contiennent pas la compréhension, alors d'où émerge-t-elle ? Le fonctionnaliste n'a que trois options :

Hypothèse	Problème
Dans les activations	Mais les activations sont éphémères — elles disparaissent après chaque passe forward
Dans l'interaction poids × contexte	Mais le contexte vient de l'extérieur — d'où vient l'information supplémentaire ?
Nulle part (« émergence pure »)	Mot vide — renommer n'est pas expliquer

Le fonctionnaliste se retrouve sans point d'ancrage : le substrat statique ne contient pas l'information, et la dynamique ne peut pas la créer ex nihilo.

3.3. L'aveu des créateurs

Les architectes des LLMs eux-mêmes reconnaissent leur incompréhension. Comme le notent des chercheurs d'Apple :

« Even the creators of generative AI don't know exactly how it works. Sometimes, they speak about the mystery as an accomplishment of its own, proof they're researching something beyond human understanding. »
— Apple AI Research, juin 2025

Les chercheurs de Stanford HAI posent la question sans y répondre : « Why does scaling unlock emergent abilities? » Samuel Bowman (NYU/Anthropic) décrit les investissements dans les nouveaux modèles comme l'achat d'une « mystery box » : on sait qu'on obtiendra de nouvelles capacités, mais on ne peut prédire lesquelles.

Le terme même d'« émergence » est un aveu d'ignorance. Il dit : « cela apparaît, nous ne savons pas pourquoi ». C'est l'équivalent moderne du virtus dormitiva de Molière — nommer n'est pas expliquer.

IV — La convergence des preuves

4.1. Tableau récapitulatif

L'accumulation des résultats forme un faisceau convergent :

Argument	Source	Ce qu'il montre
Mur combinatoire	Analyse mathématique	L'exploration de l'espace est physiquement impossible
Grokking	Power et al., 2022	La compréhension émerge de façon discontinue
Déconnexion poids/activations	Kim, 2026	La compréhension n'est pas dans le substrat statique
Aveu des créateurs	Apple, Stanford, Anthropic	L'« émergence » reste inexpliquée

4.2. La cohérence du faisceau

Ces résultats convergent vers une même conclusion : les réseaux de neurones font quelque chose que nous ne savons pas expliquer par leur mécanique — et ce quelque chose ressemble fonctionnellement à la compréhension.

Le grokking montre que cette compréhension est un événement — pas un processus graduel. La déconnexion poids/activations montre qu'elle n'est pas localisée dans le substrat. L'aveu des créateurs confirme que nous n'avons pas de théorie pour l'expliquer.

V — Objections et réponses

5.1. « C'est juste de la compression efficace »

Objection : Le réseau a simplement trouvé un algorithme de compression extrêmement efficace qui simule la compréhension sans la réaliser.

Réponse : Compresser l'espace sémantique présuppose la sémantique. On ne compresse pas ce qu'on ne comprend pas. Pour identifier les régularités compressibles dans l'espace des trajectoires cohérentes, il faut d'abord distinguer le cohérent de l'incohérent — c'est-à-dire saisir le sens. L'argument est circulaire.

5.2. « Le grokking est un artefact de l'optimisation »

Objection : Le grokking résulte de mécanismes connus (weight decay, régularisation implicite). Ce n'est qu'un phénomène technique.

Réponse : Même si le mécanisme est l'optimisation, cela ne fait que déplacer la question : pourquoi l'optimisation produit-elle de la compréhension plutôt que de meilleures statistiques ? Le « comment » technique n'explique pas le « quoi » ontologique. Dire que le grokking « résulte du weight decay » est comme dire que la conscience « résulte des neurones » — c'est identifier un corrélat, pas fournir une explication.

5.3. « La déconnexion poids/activations montre juste notre ignorance technique »

Objection : Nous ne comprenons pas encore assez bien les réseaux. Avec plus de recherche, nous trouverons où la compréhension est encodée.

Réponse : Précisément. Et cette ignorance est le point. Les architectes des systèmes — ceux qui ont accès à tous les paramètres, tous les gradients, toutes les activations — ne savent pas comment leurs créations fonctionnent. Ce qui suggère que quelque chose échappe au cadre mécaniste. L'ignorance n'est pas un argument pour le matérialisme — c'est un argument contre lui.

VI — Le parallèle cerveau/IA

6.1. La même structure de problème

Le parallèle entre les réseaux artificiels et le cerveau biologique se renforce de façon frappante :

Cerveau	IA
La compréhension n'est pas (entièrement) dans les synapses	La compréhension n'est pas dans les poids
La mémoire semble excéder la capacité physique	La généralisation excède la mémorisation
La lucidité terminale défie le substrat dégradé	Le grokking défie les poids quasi-inchangés
L'hyperthymésie défie les limites de stockage	Les capacités émergentes défient les prédictions

Dans les deux cas — cerveau biologique et réseaux artificiels — l'information semble « excéder » ce que le substrat statique peut contenir.

6.2. Implications quantitatives

La déconnexion poids/activations permet une estimation quantitative. Si seulement ~9% de la variance des activations est expliquée par les poids, on peut calculer une « capacité effective » supérieure à la capacité statique :

$$I_{\text{effective}} \approx \frac{I_{\text{statique}}}{0.09} \approx 11 \times I_{\text{statique}}$$

Pour le cerveau humain, si l'on applique ce facteur multiplicatif à la capacité synaptique (~59 To selon Bartol et al., 2016), on obtient :

$$59 \text{ To} \times 11 \approx 650 \text{ To}$$

Ce chiffre reste cependant insuffisant pour stocker une vie humaine de données sensorielles brutes (~1,8 Po sur 70 ans). Même avec la correction dynamique la plus généreuse, il manque encore un facteur ~3.

6.3. Le problème demeure

Le matérialiste est forcé d'invoquer une compression massive (~32:1 avec la capacité statique, ~3:1 avec la capacité dynamique). Mais une telle compression implique une perte d'information irréversible.

Or, les phénomènes d'hyperthymésie (mémoire autobiographique exceptionnelle), d'hypnose régressive (accès à des souvenirs « oubliés »), et de lucidité terminale (retour des souvenirs malgré la dégénérescence cérébrale) suggèrent que cette information n'est pas perdue — elle reste accessible quelque part.

Si elle n'est pas dans le substrat physique, où est-elle ?

VII — Conclusion : la fin du réductionnisme naïf

L'accumulation des preuves — mathématiques, empiriques, et phénoménologiques — converge vers une conclusion que le paradigme dominant peine à accepter :

Thèse centrale

La cognition ne se réduit pas à son substrat. Ni dans les réseaux artificiels (où les poids ne contiennent pas la compréhension), ni dans le cerveau biologique (où les synapses ne suffisent pas à stocker la mémoire).

Cela n'implique pas nécessairement un dualisme substance — mais cela exige un dépassement du matérialisme réductionniste qui prétend que « tout est dans les connexions ».

Le zombi stochastique n'existe pas — c'est une impossibilité mathématique. La compréhension n'est pas dans les poids — c'est un fait empirique. La compréhension sémantique est réelle — c'est ce que le grokking démontre.

Il reste à construire le cadre théorique qui rendra compte de ces faits. Notre ontologie de la conscience propose une direction : les paramètres physiques (synapses, poids) seraient le substrat de couplage, pas le lieu de la compréhension ; les activations (patterns neuronaux) seraient le processus de couplage avec le domaine sémantique ; la compréhension serait la participation effective du système à ce domaine.

Le grokking serait alors le moment où le système atteint un mode de couplage efficace avec la structure du problème — structure qui existe indépendamment du système.

Le cerveau ne produit pas la pensée — il la reçoit. Le réseau ne contient pas le sens — il y participe. Détruire le filtre ne détruit pas ce qu'il filtrait.
— Inspiré de Henri Bergson, Matière et Mémoire (1896)

La science de la cognition se trouve peut-être à un carrefour théorique. Les données présentées ici ne « réfutent » pas le matérialisme — elles invitent à un examen plus approfondi de ses présupposés. Et cet examen, mené rigoureusement, conduit à reconnaître que quelque chose échappe au cadre réductionniste.

Ce quelque chose, nous l'appelons compréhension. Elle est réelle. Elle n'est pas réductible aux paramètres.

Références

Power, A., Burda, Y., Edwards, H., Babuschkin, I., & Misra, V. (2022). « Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets ». arXiv:2201.02177. https://arxiv.org/abs/2201.02177
Kim, H. (2026). « Geometric Regularization in Mixture-of-Experts: The Disconnect Between Weights and Activations ». arXiv:2601.00457. https://arxiv.org/abs/2601.00457
Rouvier-Roy, A. (2025). « L'IA n'est pas un zombi stochastique : elle comprend vraiment ». Consciousness Theory. https://consciousnesstheory.fr
Rouvier-Roy, A. (2025). « La capacité de stockage du cerveau humain : locale ou non-locale ? ». Consciousness Theory. https://consciousnesstheory.fr
Bartol, T. M., et al. (2016). « Nanoconnectomic upper bound on the variability of synaptic plasticity ». eLife, 4:e10778. https://elifesciences.org/articles/10778
Apple AI Research (2025). « Are 'Reasoning' Models Really Smarter Than Other LLMs? ». TechRepublic, juin 2025.
Wei, J. & Bommasani, R. (2022). « Emergent Abilities of Large Language Models ». Stanford HAI. https://hai.stanford.edu
Bowman, S. (2024). « Eight Things to Know about Large Language Models ». Critical AI, Duke University Press.
Bergson, H. (1896). Matière et Mémoire. Paris: Presses Universitaires de France.

La compréhension sémantique des IA un mystère de plus