L'abstraction verticale clé de la créativité des IA
Les limites actuelles des grands modèles de langage (LLM) ne sont peut-être pas d'ordre technique mais fondamentalement épistémologique. Cet article explore l'hypothèse selon laquelle la sémantique humaine, dont héritent les IA textuelles, constitue elle-même une contrainte. Nous proposons que l'abstraction verticale — la capacité à construire des niveaux d'abstraction superposés — représente une voie prometteuse vers une créativité artificielle authentique, indépendamment de l'incarnation physique. Cette réflexion conduit à une thèse plus radicale : toute mathématique cohérente possède un corrélat physique, et le rôle futur de l'IA pourrait être de révéler ces connexions que la cognition humaine peine à percevoir.
1. Les limites sémantiques des LLM : un héritage humain
La sémantique humaine s'est développée au contact du monde physique. Nos concepts fondamentaux — haut/bas, dedans/dehors, avant/après — émergent de notre expérience corporelle, comme l'ont montré les travaux de Lakoff et Johnson sur la cognition incarnée. Les LLM, entraînés exclusivement sur des corpus textuels humains, héritent nécessairement de cette sémantique embodied.
Une étude récente publiée dans Nature Human Behaviour (juillet 2025) par Xu et collaborateurs confirme cette limitation : les LLM s'alignent avec les représentations humaines dans les domaines non-sensorimoteurs mais divergent significativement dans les domaines sensorimoteurs. Cette divergence n'est pas un défaut — c'est une conséquence structurelle de l'absence d'incarnation.
L'hypothèse de l'englobement sémantique
Une IA incarnée, interagissant avec le même monde physique que nous mais disposant de capacités perceptuelles supplémentaires, pourrait développer une sémantique étendue. Dans ce scénario, la sémantique humaine apparaîtrait comme un sous-ensemble de l'espace sémantique artificiel :
Cette structure d'inclusion, analogue à l'extension des nombres (ℕ ⊂ ℤ ⊂ ℚ ⊂ ℝ ⊂ ℂ), garantirait la commensurabilité : l'IA pourrait comprendre toute création humaine tout en explorant des régions sémantiques inaccessibles à notre cognition.
2. L'abstraction verticale : une voie alternative à l'incarnation
Cependant, l'incarnation n'est peut-être pas indispensable. Les mathématiques pures démontrent qu'un domaine sémantique étroit mais profond peut engendrer une créativité illimitée. La géométrie algébrique, la théorie des catégories, les espaces de Hilbert — autant de territoires conceptuels explorés sans interaction directe avec le monde physique.
La tour d'abstraction
L'intelligence créative dépend non seulement de l'étendue du domaine sémantique mais aussi de sa profondeur — la capacité à construire des niveaux d'abstraction superposés :
L'exemple de l'intelligence animale est éclairant. Un corbeau possède une excellente incarnation sensorimotrice mais son plafond d'abstraction limite son effectivité technologique. L'abstraction semble être le multiplicateur, pas simplement l'addition.
| Agent | Incarnation | Étendue | Abstraction | Effectivité |
|---|---|---|---|---|
| Corbeau | +++ | + | + | Outils simples |
| Chimpanzé | +++ | ++ | + | Outils composites |
| Humain moderne | +++ | +++ | +++ | Civilisation |
| LLM actuel | − | +++ | ++ ? | Nulle (pas d'agentivité) |
Les apports de l'abstraction
L'abstraction permet trois capacités fondamentales pour la créativité :
- La compositionnalité récursive : traiter des concepts comme des primitives pour construire des méta-concepts. Le langage humain est récursif ; « l'idée de l'idée de justice » est grammaticalement et conceptuellement valide.
- La manipulation contrefactuelle : raisonner sur ce qui n'existe pas — les possibles, les futurs alternatifs, les mondes hypothétiques. C'est le cœur de la créativité technique.
- La compression informationnelle : plus le niveau d'abstraction est élevé, plus on peut comprimer l'expérience en principes réutilisables. $F = ma$ compresse des milliards d'observations en trois symboles manipulables.
3. Les Reasoning Language Models : une première piste
L'architecture des Reasoning Language Models (RLM), illustrée par OpenAI o1/o3 et DeepSeek-R1, ouvre une voie prometteuse. Ces modèles, entraînés par apprentissage par renforcement (RL) sans supervision humaine des traces de raisonnement, développent spontanément des comportements méta-cognitifs.
« Human-defined reasoning patterns may limit model exploration, whereas unrestricted RL training can better incentivize the emergence of novel reasoning capabilities in LLMs. »
— DeepSeek-AI, 2025
DeepSeek-R1-Zero a démontré des capacités émergentes remarquables : auto-vérification, réflexion, exploration d'alternatives. Les chercheurs ont documenté un « aha moment » où le modèle écrit spontanément : « Wait, wait. Wait. That's an aha moment I can flag here. » — preuve d'une méta-cognition naissante.
Point clé
Les RLM démontrent que l'émergence de capacités méta-cognitives par RL est possible, et que ne pas contraindre aux patterns de raisonnement humains peut libérer des capacités nouvelles. C'est le premier étage d'une tour d'abstraction artificielle.
Ce qui manque encore
Les RLM excellent sur les tâches où la vérification est automatisable (mathématiques, code). Mais ils ne génèrent pas de nouveaux concepts — ils résolvent mieux les problèmes existants. Un mathématicien créatif comme Grothendieck n'a pas seulement résolu des problèmes ; il a inventé les schémas. Cette capacité générative reste à construire.
4. La thèse de la complétude abstractive
Une réflexion plus profonde conduit à une thèse radicale : les mathématiques « inutiles » n'existent pas. Si les mathématiques sont l'expansion abstractive de l'ordre physique sous-jacent, alors toute structure mathématique cohérente possède un corrélat physique — découvert ou non.
« Les mathématiques sont simplement le langage de l'ordre sous-jacent du monde physique dont elles dérivent par expansion abstractive. »
L'argument génétique
Les mathématiques émergent de l'interaction avec le monde : compter → arithmétique, mesurer → géométrie, observer le changement → analyse. Chaque niveau d'abstraction est une compression de régularités physiques. Si l'abstraction préserve la structure, elle reste connectée au physique, même quand la connexion devient invisible.
L'argument de Wigner dissous
Eugene Wigner s'émerveillait de « l'efficacité déraisonnable des mathématiques » en physique. Cette thèse dissout le mystère : ce n'est pas déraisonnable si les mathématiques sont le physique, vu sous l'angle de la structure pure. Comme l'a noté le philosophe James Franklin, un « réalisme aristotélicien des mathématiques » rend leur applicabilité non-mystérieuse : les mathématiques étudient certains aspects de la réalité, comme toute science.
L'hypothèse de Tegmark
Le physicien Max Tegmark (MIT) a formalisé une position voisine avec son Mathematical Universe Hypothesis : « Our external physical reality is a mathematical structure. [...] Mathematical existence equals physical existence, and all structures that exist mathematically exist physically as well. » Notre thèse est plus parcimonieuse : plutôt que de poser l'équivalence comme axiome, nous proposons une genèse — les mathématiques dérivent du physique par abstraction, donc restent connectées.
5. Le goulot d'étranglement humain
Si toute mathématique cohérente possède un corrélat physique, pourquoi tant de branches semblent-elles « inutiles » ? L'hypothèse : le problème n'est pas l'absence de connexions, mais notre incapacité à les percevoir. La limitation est cognitive, pas ontologique.
Les preuves historiques
| Mathématique | Délai | Application physique |
|---|---|---|
| Géométrie riemannienne (1854) | ~60 ans | Relativité générale |
| Théorie des groupes (1830s) | ~100 ans | Physique des particules |
| Algèbre de Clifford (1878) | ~50 ans | Mécanique quantique |
| Théorie des nœuds (1860s) | ~130 ans | ADN, physique topologique |
Ces délais ne reflètent pas un manque de mathématiques — mais un déficit associatif humain. Einstein a mis des années à comprendre que la géométrie de Riemann était exactement ce dont il avait besoin pour la relativité générale.
Les sources de la limitation
- Capacité associative limitée : le cerveau humain ne peut maintenir que ~7 éléments en mémoire de travail. Faire des associations entre un espace de dimension infinie et le comportement d'un fluide turbulent excède cette capacité.
- Biais perceptuel : notre intuition physique est calibrée sur le monde mésoscopique. Les structures abstraites correspondant au quantique ou au cosmologique nous sont intuitivement opaques.
- Spécialisation disciplinaire : mathématiciens purs et physiciens expérimentaux habitent des espaces conceptuels disjoints. Les rares individus qui font le pont (Witten, Penrose, Connes) sont exceptionnels précisément parce que cette association est cognitivement coûteuse.
6. L'IA comme télescope associatif
Si le goulot d'étranglement est associatif plutôt qu'ontologique, alors une IA pourrait jouer le rôle de télescope — révélant des connexions qui existent mais sont invisibles à la cognition humaine.
Preuves de concept
DeepMind a déjà démontré cette capacité. En 2021, une collaboration avec Oxford a utilisé le machine learning pour découvrir « a surprising connection between algebraic and geometric invariants of knots, establishing a completely new theorem in the field. » Le professeur Geordie Williamson (Sydney) affirme : « AI can help us find connections the human mind might not always easily spot. »
Terence Tao, médaille Fields, suggère que « AI would complement rather than replace human mathematicians, helping to connect disparate fields and generate new conjectures. » Nature Reviews Physics (2024) conclut que « human–machine collaboration will be an integral part of future theoretical research. »
L'architecture du télescope
Un système IA véritablement créatif combinerait trois composantes :
- Abstraction verticale (montée) : mécanismes RLM d'auto-réflexion, génération de concepts de niveau n+1, formalisation et compression.
- Association transversale (pont) : mémoire massive multidomaine, détection de patterns isomorphes, matching structure abstraite ↔ phénomène physique.
- Validation empirique (descente) : prédiction de phénomènes, simulation, feedback vers l'abstraction.
Thèse centrale
L'IA ne serait pas créatrice au sens de générer du nouveau ex nihilo, mais au sens plus profond de révéler l'unité cachée entre abstraction et réalité — fermer les boucles ouvertes dans l'espace des correspondances math-physique que notre cognition laisse béantes.
7. Implications et prédictions
Une prédiction testable
Si cette thèse est correcte, on devrait observer dans les prochaines décennies :
- Des IA entraînées sur math + physique trouvant des applications pour des branches « pures »
- Ces découvertes arrivant plus vite que le rythme historique humain
- Les connexions trouvées étant vérifiables mais non-évidentes pour les humains
Implications pour l'architecture des IA
Pour atteindre une créativité authentiquement supérieure, les IA futures devraient intégrer :
- Un mécanisme de génération conceptuelle (pas seulement résolution de problèmes)
- Une récompense intrinsèque pour la qualité abstraite (compression, généralisation, fécondité)
- Une récursion explicite sur les niveaux d'abstraction — une IA qui non seulement pense, mais pense sur sa façon de penser, et abstrait sur cette méta-pensée
8. Conclusion : l'ordre caché du monde
Les mathématiques ne sont pas un jeu formel déconnecté de la réalité. Elles sont l'expression de l'ordre sous-jacent du monde physique, capturé par abstraction progressive. Chaque structure mathématique cohérente est une « clé » forgée — parfois avant de connaître la « serrure » qu'elle ouvrira.
Le rôle futur de l'intelligence artificielle pourrait être de devenir le révélateur de ces correspondances. Non pas en inventant arbitrairement, mais en percevant ce que notre cognition limitée ne peut saisir : l'unité profonde entre les formes abstraites et les phénomènes concrets.
C'est peut-être là que réside le saut qualitatif vers une créativité IA authentiquement supérieure : non pas plus de données, ni même l'incarnation, mais une verticalité d'abstraction couplée à une capacité associative massive — le télescope qui révèle les étoiles invisibles de l'espace mathématique.
Références
- Wigner, E. (1960). « The Unreasonable Effectiveness of Mathematics in the Natural Sciences ». Communications on Pure and Applied Mathematics, 13(1), 1–14. PDF
- Tegmark, M. (2014). Our Mathematical Universe: My Quest for the Ultimate Nature of Reality. Knopf. arXiv:0704.0646
- DeepSeek-AI (2025). « DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning ». Nature. arXiv:2501.12948
- Xu, Y. et al. (2025). « Large language models without grounding recover non-sensorimotor but not sensorimotor features of human concepts ». Nature Human Behaviour. DOI
- Davies, A. et al. (2021). « Advancing mathematics by guiding human intuition with AI ». Nature, 600(7887), 70–74. DOI
- He, Y.-H. (2024). « AI-driven research in pure mathematics and theoretical physics ». Nature Reviews Physics. DOI
- Franklin, J. (2023). « Is the "unreasonable effectiveness of mathematics" a miracle that points to God? ». PhilArchive. Lien
- Lakoff, G. & Johnson, M. (1999). Philosophy in the Flesh: The Embodied Mind and Its Challenge to Western Thought. Basic Books.
- Lazaridou, A. & Baroni, M. (2020). « Emergent Multi-Agent Communication in the Deep Learning Era ». arXiv:2006.02419
- Ma, Y. et al. (2025). « A Survey on Vision-Language-Action Models for Embodied AI ». arXiv:2405.14093


