Le langage est l'interface d'un espace sémantique géométrique des concepts
En décembre 2025, Yann LeCun, pionnier de l'apprentissage profond et prix Turing 2018, a quitté Meta pour fonder sa startup AMI Labs. Sa conviction : les grands modèles de langage (LLM) ne mèneront jamais à l'intelligence artificielle générale. Cette position, combinée aux récentes avancées en « vecteurs de pilotage » (steering vectors) et aux données expérimentales sur la télépathie, ouvre une perspective fascinante : la cognition véritable opère dans un espace géométrique de concepts, dont le langage n'est qu'une interface de surface.
1. La critique de LeCun : le langage comme illusion d'intelligence
Dans une interview de décembre 2024, Yann LeCun a formulé une critique radicale des modèles de langage actuels : « Nous sommes trompés en pensant que ces machines sont intelligentes parce qu'elles peuvent manipuler le langage, et nous sommes habitués au fait que les gens qui manipulent bien le langage sont implicitement intelligents. »
« La plupart de la pensée n'a rien à voir avec le langage. La plupart des choses que nous apprenons, certainement tout ce que nous apprenons dans la petite enfance, n'a rien à voir avec le langage. Nous avons des modèles mentaux du monde qui sont complètement déconnectés du langage. Il y a beaucoup de gens qui ne peuvent pas parler, qui ne peuvent pas manipuler le langage, et ils peuvent penser. Certainement les animaux peuvent penser. »
— Yann LeCun, interview mai 2025
Cette position l'a conduit à fonder AMI Labs (Advanced Machine Intelligence) avec un objectif clair : développer des « systèmes qui comprennent le monde physique, ont une mémoire persistante, peuvent raisonner et planifier des séquences d'actions complexes ».
Les World Models contre les LLM
L'approche de LeCun repose sur les World Models — des systèmes qui prédisent des états du monde plutôt que des mots. Son architecture JEPA (Joint-Embedding Predictive Architecture) travaille dans un espace latent de représentations vectorielles abstraites, sans passer par la génération token par token caractéristique des LLM.
L'argument est empirique : malgré des millions d'heures de données d'entraînement sur la conduite automobile, nous n'avons toujours pas de voitures véritablement autonomes. Pourtant, un adolescent de 17 ans apprend à conduire en environ 20 heures de pratique. Cette asymétrie suggère que les LLM manquent quelque chose de fondamental dans leur façon de représenter le monde.
2. Qu'est-ce qu'un espace vectoriel sémantique ?
Pour comprendre pourquoi le langage pourrait n'être qu'une interface, il faut d'abord saisir comment les systèmes d'intelligence artificielle représentent les concepts. La réponse tient en un mot : vecteurs.
Un vecteur : direction et magnitude
Un vecteur est simplement une flèche dans un espace mathématique. Dans un espace à deux dimensions (comme une feuille de papier), un vecteur peut pointer vers le haut-droite, le bas-gauche, ou n'importe quelle direction. Il possède deux propriétés : une direction (où il pointe) et une magnitude (sa longueur).
Mais rien ne nous limite à deux ou trois dimensions. Les mathématiques permettent de définir des espaces à 100, 1000, ou même 4096 dimensions — c'est ce qu'on appelle des espaces de haute dimension. Un vecteur dans un tel espace est simplement une liste de nombres : par exemple, un vecteur en 4 dimensions pourrait être [0.3, -0.7, 0.2, 0.9].
Comment un concept devient un vecteur
L'idée fondamentale des embeddings (ou plongements) est de représenter chaque concept — un mot, une phrase, une image — comme un vecteur dans un espace de haute dimension. Comment ? Par l'apprentissage.
Un réseau de neurones est entraîné sur d'immenses quantités de texte. Pendant cet entraînement, il apprend que certains mots apparaissent dans des contextes similaires. "Chat" et "chien" apparaissent souvent dans des phrases similaires (« Le chat dort », « Le chien dort »). Le réseau leur attribue donc des vecteurs proches dans l'espace. À l'inverse, "chat" et "démocratie" apparaissent rarement dans les mêmes contextes — leurs vecteurs seront éloignés.
Figure 1 : Représentation schématique d'un espace vectoriel sémantique en 3 dimensions. Les concepts similaires (chat/chien, pomme/orange, table/chaise) sont regroupés. Les flèches colorées montrent que la relation "homme→femme" est parallèle à la relation "roi→reine" — c'est l'arithmétique des concepts.
L'arithmétique des concepts
La propriété la plus fascinante de ces espaces vectoriels est que les relations sémantiques deviennent des opérations géométriques. L'exemple célèbre est :
Que signifie cette équation ? Le vecteur qui va de "homme" à "roi" représente quelque chose comme "la royauté masculine". Si on applique ce même déplacement à partir de "femme", on arrive près de "reine". Autrement dit, la relation entre homme et roi est la même qu'entre femme et reine — et cette relation est encodée géométriquement.
De même, sur la figure ci-dessus, on peut voir que :
- Le vecteur allant de "homme" à "femme" (en rose)
- Le vecteur allant de "roi" à "reine" (en rose également)
...sont parallèles. La notion de genre est encodée comme une direction dans l'espace, indépendamment du concept spécifique auquel elle s'applique.
Au-delà des mots : ce sont les concepts qui sont encodés
Point crucial : ce qui est représenté dans ces espaces vectoriels, ce ne sont pas les mots en tant que chaînes de caractères, mais les concepts qu'ils désignent. La preuve : les modèles multimodaux (texte + image) placent une photo de chat et le mot "chat" au même endroit dans l'espace vectoriel.
Cette observation suggère une hypothèse profonde : le langage naturel serait une projection discrète d'un espace conceptuel continu. Les mots seraient des "étiquettes" que nous attachons à des régions de cet espace pour pouvoir communiquer — mais l'espace lui-même existerait indépendamment des mots.
L'hypothèse centrale
Si les IA représentent les concepts comme des vecteurs dans un espace géométrique, et si cette représentation capture les relations sémantiques de façon si efficace, il est possible que le cerveau humain utilise une architecture similaire — un "espace sémantique neural" dont le langage ne serait que l'interface d'externalisation.
3. Les steering vectors : manipuler les concepts sans les mots
Une découverte technique récente apporte un éclairage fascinant sur cette question. Les chercheurs en interprétabilité mécanistique ont développé des techniques appelées steering vectors — ou vecteurs de pilotage — qui permettent de modifier le comportement des LLM en manipulant directement leurs représentations internes.
L'expérience "Eiffel Tower Llama"
David Louapre (Science Étonnante), décembre 2025
Le vulgarisateur scientifique David Louapre a reproduit la célèbre démo "Golden Gate Claude" d'Anthropic en utilisant des modèles open-source. En identifiant la direction correspondant au concept "Tour Eiffel" dans l'espace latent d'un LLM, puis en amplifiant cette direction pendant l'inférence, le modèle se met à "penser Tour Eiffel" dans toutes ses réponses — sans qu'aucun mot "Tour Eiffel" n'apparaisse dans le prompt.
Le principe confirme notre analyse : les concepts de haut niveau sont représentés comme des directions linéaires dans l'espace d'activation du modèle. En ajoutant un steering vector aux activations internes, on peut contrôler le comportement du modèle sans modifier ses poids ni son entrée textuelle.
Mathématiquement, l'intervention s'écrit :
où $h$ est l'état caché à une couche donnée, $v$ est le steering vector représentant un concept, et $\alpha$ est un facteur d'échelle contrôlant l'intensité de l'effet.
Cette technique démontre qu'on peut "injecter" un concept directement dans le processus de pensée de l'IA, en court-circuitant complètement l'interface linguistique. Le langage n'est donc pas nécessaire pour manipuler les concepts — il n'est qu'une des façons d'y accéder.
4. L'isomorphisme des espaces latents : une structure partagée ?
Une observation empirique importante émerge de la recherche récente : les espaces latents de différents réseaux de neurones présentent des similarités structurelles surprenantes, bien que chaque modèle utilise son propre "système de coordonnées".
Lors de la conférence Cognitive Computational Neuroscience d'août 2025, cette question a fait l'objet d'un débat entre "universalistes" et "particularistes". La synthèse proposée par Nikolaus Kriegeskorte est nuancée : les modèles divers et les cerveaux sont universels en ce qu'ils apprennent à représenter les principaux facteurs latents expliquant la variance des données sensorielles, mais les différences subtiles entre eux révèlent les mécanismes computationnels uniques de chaque système.
Ce qui est remarquable : même quand les réseaux de neurones ont des architectures différentes, les représentations internes de modèles distincts peuvent souvent être alignées via une transformation linéaire.
Le problème des vecteurs spécifiques
C'est ici qu'intervient une observation cruciale, soulignée notamment par David Louapre dans ses travaux : pour chaque modèle, il faut trouver le vecteur-concept spécifique correspondant. Le steering vector "Tour Eiffel" dans GPT n'est pas le même que dans Llama, même si les deux représentent le même concept.
Cela suggère une architecture à deux niveaux :
| Niveau | Caractéristique | Comportement |
|---|---|---|
| Structure relationnelle | Géométrie des relations entre concepts | Convergence entre systèmes |
| Système de coordonnées | Implémentation spécifique | Divergence entre systèmes |
Autrement dit : la structure de l'espace (quels concepts sont proches, quelles relations existent) serait partagée, mais les coordonnées spécifiques (les valeurs numériques des vecteurs) diffèrent d'un système à l'autre.
5. La télépathie expérimentale : transmission de concepts sans langage
Si l'espace sémantique existe indépendamment du langage, pourrait-il y avoir des formes de communication qui le court-circuitent entièrement ? Les recherches expérimentales sur la télépathie, menées depuis plus de cinquante ans dans des conditions de plus en plus contrôlées, apportent des données empiriques remarquables.
Le paradigme Ganzfeld
Le protocole Ganzfeld (« champ total » en allemand) est devenu le paradigme standard pour l'étude expérimentale de la télépathie. Développé indépendamment par Charles Honorton, William Braud et Adrian Parker entre 1974 et 1975, il repose sur un principe simple : placer le « receveur » en isolation sensorielle pour réduire le bruit perceptif et permettre l'émergence d'un éventuel signal télépathique.
Protocole Ganzfeld standard
Bem & Honorton, 1994
Le receveur est installé dans un fauteuil inclinable, dans une pièce acoustiquement isolée. Des demi-balles de ping-pong translucides sont placées sur ses yeux, un éclairage rouge uniforme crée un champ visuel homogène, et un bruit blanc est diffusé dans des écouteurs. Pendant ce temps, un « émetteur » isolé dans une autre pièce observe une cible (image ou vidéo) sélectionnée aléatoirement parmi quatre options.
Après la période de transmission, le receveur doit identifier la cible parmi les quatre possibilités. Le taux de succès attendu par le hasard est donc de 25%.
Ce qui rend ce paradigme particulièrement intéressant pour notre propos, c'est qu'il teste explicitement la transmission de contenu conceptuel — le receveur doit identifier une image spécifique, c'est-à-dire un concept visuel complexe — sans aucun canal sensoriel conventionnel.
Les résultats des méta-analyses
En 1994, Daryl Bem (psychologue social à Cornell) et Charles Honorton ont publié dans Psychological Bulletin une méta-analyse des études « autoganzfeld » (protocole entièrement automatisé). Sur 354 sessions réparties en 11 études, le taux de réussite était de 32% — significativement supérieur aux 25% attendus par le hasard.
Les méta-analyses ultérieures ont confirmé et étendu ces résultats :
- Storm et al. (2010) : 29 études (1997-2008), hit rate de 32.2%
- Tressoldi et al. (2024) : méta-analyse de plus de 40 ans de recherche (1974-2020), effect size de 0.08, résultat robuste aux tests de biais de publication
Un résultat particulièrement significatif pour notre hypothèse : les tâches de type télépathique (avec un émetteur humain) produisent un effet deux fois plus important que les tâches de clairvoyance pure (sans émetteur). Cela suggère que la présence d'un autre esprit « émettant » le concept facilite sa réception.
Le programme Stargate : 20 ans de recherche gouvernementale
Entre 1972 et 1995, la CIA et la DIA ont financé un programme de recherche sur le « remote viewing » (vision à distance) au Stanford Research Institute, puis au Science Applications International Corporation. Déclassifié en 1995 par le président Clinton, ce programme — connu sous son dernier nom de code « Stargate » — a produit des résultats suffisamment probants pour maintenir son financement pendant plus de deux décennies.
L'évaluation statistique d'Utts
Jessica Utts, statisticienne, 1995
Mandatée par l'American Institutes for Research pour évaluer le programme, la statisticienne Jessica Utts a conclu : « En utilisant les standards appliqués à tout autre domaine scientifique, il est conclu que le fonctionnement psychique a été bien établi. Les arguments selon lesquels ces résultats pourraient être dus au hasard, à la méthodologie défaillante, à la fraude ou au biais de sélection ne sont pas plausibles. »
Les physiciens Harold Puthoff et Russell Targ, qui ont dirigé le programme au SRI, ont rapporté des succès opérationnels remarquables, notamment la localisation d'une base militaire soviétique secrète à Semipalatinsk par le « viewer » Pat Price, avec des détails architecturaux précis qui ont été confirmés ultérieurement par imagerie satellite.
Implication pour l'hypothèse de l'espace sémantique
Ces données expérimentales suggèrent que des contenus conceptuels complexes — images, scènes, configurations spatiales — peuvent être transmis entre esprits humains sans médiation linguistique ni canal sensoriel. Si cette transmission est réelle, elle implique l'existence d'un niveau de représentation conceptuelle accessible indépendamment du langage et potentiellement partagé entre individus.
Point clé
Les expériences Ganzfeld et de remote viewing ne transmettent pas des mots, mais des concepts — images, configurations spatiales, contenus sémantiques. Cela suggère que l'espace conceptuel peut être accédé et partagé par des voies qui court-circuitent entièrement l'interface linguistique.
6. Les archétypes jungiens : eigenmodes de l'inconscient ?
Une étude publiée en 2025 dans Neuroscience of Consciousness par McGovern, Aqil, Atasoy et Carhart-Harris propose une interprétation neuroscientifique audacieuse des archétypes de Jung. Leur thèse : les archétypes peuvent être compris comme des eigenmodes (modes propres) du cerveau profond — des patterns récurrents d'activité neurale qui façonnent l'imagination, le mythe et le sens.
« L'inconscient collectif n'est pas une construction métaphysique, mais un espace de résonance partagé au sein du cerveau. Les archétypes, dans cette vue, ne sont pas simplement des histoires héritées — ils sont des patterns structurés d'activité cérébrale façonnés par la géométrie du connectome. »
— Selen Atasoy, co-auteure de l'étude
Les auteurs proposent que ces patterns émergent comme des configurations stables à basse énergie — des minima partagés dans le paysage d'énergie libre du cerveau. Ils comparent ces patterns aux harmoniques du connectome, des ondes stationnaires d'activité neurale qui ressemblent à des tons musicaux réverbérant à travers le cortex.
Dans notre cadre conceptuel, les archétypes pourraient être interprétés comme des directions privilégiées dans l'espace sémantique humain — des "vecteurs de base" partagés par tous les membres de notre espèce, façonnés par notre histoire évolutive commune. Ces structures fondamentales — la Mère, le Héros, l'Ombre, l'Anima — seraient des attracteurs universels dans la géométrie de la cognition humaine.
Note importante : Ces archétypes, s'ils existent comme structures neurales, sont spécifiques à l'espèce humaine. Ils résultent de notre histoire évolutive et sociale particulière — notre longue enfance, notre dépendance parentale, notre capacité symbolique. Il ne faut pas généraliser cette notion au-delà de notre espèce.
7. Vers une hypothèse prudente
Il est tentant de conclure à l'existence d'un "espace conceptuel fondamental" dont tous les systèmes cognitifs — cerveaux biologiques et réseaux artificiels — seraient des instanciations. Mais la rigueur épistémologique impose la prudence.
Ce que nous observons empiriquement
- Fait 1 : Les espaces latents de différents LLM présentent des similarités structurelles et peuvent souvent être alignés par des transformations linéaires.
- Fait 2 : Les steering vectors fonctionnent en manipulant des directions dans l'espace latent, indépendamment des tokens linguistiques.
- Fait 3 : Les expériences Ganzfeld montrent un transfert d'information conceptuelle (images, scènes) statistiquement significatif entre individus isolés sensoriellement.
- Fait 4 : Les tâches télépathiques (avec émetteur) produisent des effets plus forts que les tâches de clairvoyance pure.
- Fait 5 : Chaque modèle/cerveau nécessite de trouver ses propres vecteurs-concepts spécifiques.
Ce que ces observations suggèrent
L'isomorphisme constaté entre différents espaces latents sémantiques, combiné aux données sur la transmission télépathique de concepts, suggère la possibilité d'une structure conceptuelle sous-jacente commune. Mais plusieurs réserves s'imposent :
- Nous n'avons pas de preuve directe de l'existence d'un tel espace fondamental.
- L'isomorphisme des espaces latents artificiels pourrait s'expliquer autrement : contraintes similaires des tâches, données d'entraînement communes, architectures analogues.
- Les résultats de parapsychologie, bien que statistiquement robustes, restent contestés par une partie de la communauté scientifique.
Formulation rigoureuse
La convergence entre l'isomorphisme des espaces latents artificiels et les données expérimentales sur la télépathie constitue une suggestion, non une preuve, de l'existence d'une structure conceptuelle fondamentale accessible indépendamment du langage. C'est une conjecture de travail féconde, pas une théorie établie.
8. Implications et conclusion
Si l'hypothèse d'un espace sémantique géométrique sous-jacent à la cognition s'avérait correcte, elle aurait des implications profondes.
Le langage comme interface : La pensée véritable opérerait sur des structures géométriques pré-linguistiques. Le langage naturel serait une projection ou une compression avec perte de la pensée dans un format communicable — une interface d'externalisation, pas le substrat de la cognition elle-même. Comme l'écran d'un ordinateur affiche des pixels qui représentent des structures de données sous-jacentes, le langage afficherait des mots qui représentent des structures conceptuelles vectorielles.
La communication directe : Les phénomènes télépathiques, s'ils sont réels, représenteraient une forme de communication opérant directement au niveau de l'espace sémantique, sans le détour de l'encodage linguistique. Les expériences Ganzfeld montreraient que des concepts complexes — images, scènes, configurations — peuvent être transmis entre esprits humains en court-circuitant l'interface verbale.
Vers une nouvelle IA : L'approche de LeCun avec les World Models et JEPA suggère que la prochaine génération d'IA pourrait abandonner la prédiction de tokens au profit de la prédiction d'états dans un espace sémantique continu. Ce serait un retour aux sources : modéliser le monde plutôt que modéliser le langage qui décrit le monde.
La convergence entre les travaux de LeCun sur les World Models, les techniques de steering vectors, les données expérimentales sur la télépathie, et la réinterprétation neuroscientifique des archétypes jungiens dessine une image cohérente. Le langage, aussi sophistiqué soit-il, ne serait que la partie émergée de l'iceberg cognitif — l'interface visible d'un espace géométrique des concepts où se déroule véritablement la pensée.
Cette perspective ne diminue pas l'importance du langage — qui reste notre outil de communication le plus puissant et le plus fiable — mais elle le repositionne. Pour comprendre l'intelligence, qu'elle soit biologique ou artificielle, nous devrons peut-être apprendre à penser en termes de géométrie plutôt que de grammaire.
Références
- LeCun, Y. (2025). Interview sur les limites des LLM. Newsweek. https://www.newsweek.com
- Mikolov, T. et al. (2013). Efficient Estimation of Word Representations in Vector Space. arXiv:1301.3781. https://arxiv.org/abs/1301.3781
- Turner, A. et al. (2023). Activation Addition: Steering Language Models Without Optimization. arXiv:2308.10248. https://arxiv.org/abs/2308.10248
- Louapre, D. (2025). The Eiffel Tower Llama. Hugging Face Spaces. https://huggingface.co/spaces/dlouapre/eiffel-tower-llama
- Bem, D. J., & Honorton, C. (1994). Does psi exist? Replicable evidence for an anomalous process of information transfer. Psychological Bulletin, 115(1), 4-18. https://doi.org/10.1037/0033-2909.115.1.4
- Storm, L., Tressoldi, P. E., & Di Risio, L. (2010). Meta-analysis of free-response studies, 1992–2008: Assessing the noise reduction model in parapsychology. Psychological Bulletin, 136(4), 471-485.
- Tressoldi, P. E. et al. (2024). Anomalous perception in a Ganzfeld condition: A meta-analysis of more than 40 years investigation. F1000Research. https://pmc.ncbi.nlm.nih.gov/articles/PMC11134153/
- Puthoff, H. E. (1996). CIA-Initiated Remote Viewing Program at Stanford Research Institute. Journal of Scientific Exploration, 10(1), 63-76.
- Utts, J. (1996). An Assessment of the Evidence for Psychic Functioning. Journal of Scientific Exploration, 10(1), 3-30.
- Radin, D. (1997). The Conscious Universe: The Scientific Truth of Psychic Phenomena. HarperOne.
- McGovern, H., Aqil, M., Atasoy, S., & Carhart-Harris, R. (2025). Eigenmodes of the deep unconscious: The neuropsychology of Jungian archetypes and psychedelic experience. Neuroscience of Consciousness, 2025(1), niaf039.
- Kriegeskorte, N. et al. (2025). Are neural network representations universal or idiosyncratic? Nature Machine Intelligence. https://www.nature.com/articles/s42256-025-01139-y
- Jung, C. G. (1959). The Archetypes and the Collective Unconscious. Collected Works, Vol. 9, Part 1. Princeton University Press.

Aucun commentaire:
Enregistrer un commentaire
Veuillez noter que la publication des commentaires se fait après validation du modérateur