Pourquoi votre assistant IA oublie tout d'une conversation à l'autre

Si vous utilisez ChatGPT ou un assistant cloud, vous connaissez le problème : à chaque nouvelle conversation, il repart de zéro. Il a oublié qui vous êtes, ce que vous lui avez expliqué hier, le projet sur lequel vous travaillez depuis trois semaines. Ce n'est pas une panne, c'est leur fonctionnement par défaut : ces assistants n'ont pas de mémoire d'une session à l'autre. La seule façon d'y remédier, c'est un assistant conçu pour persister réellement une mémoire (vos échanges passés, vos documents, un contexte qui se construit avec le temps), sur une infrastructure que vous contrôlez. C'est le choix de conception derrière Gungnir.

Pourquoi ils oublient (ce n'est pas un hasard)

Deux raisons se cumulent. La première est technique : un grand modèle de langage n'a pas de mémoire propre. Il ne voit que ce qu'on lui remet dans sa fenêtre de contexte à chaque requête. Hors de cette fenêtre, rien ne persiste, sauf si le service décide de stocker votre historique et de le réinjecter.

La seconde est plus gênante. Pour se souvenir de vous, un service cloud doit conserver vos données sur ses serveurs. Plus il vous connaît, plus il accumule d'informations personnelles hors de votre contrôle. La mémoire et la confidentialité tirent dans des sens opposés, et la plupart des fournisseurs tranchent en gardant le strict minimum, ou en gardant tout chez eux. Oublier est souvent la solution la plus simple pour eux, pas pour vous.

Une mémoire, en trois couches

Pour qu'un assistant se souvienne vraiment, il faut plus qu'un historique de chat. Gungnir empile trois couches, et chacune reste inspectable.

1. La mémoire des conversations. Chaque échange est enregistré et rechargé à la session suivante. La conversation suit aussi l'interlocuteur d'un canal à l'autre : un message reçu sur Telegram retrouve le fil de la discussion en cours au lieu de répondre dans le vide.

2. Vos documents. Vous constituez une base de connaissance à partir de vos fichiers. L'assistant va y chercher l'information quand votre demande le justifie, au lieu de prétendre savoir ou d'inventer une réponse.

3. Un contexte qui se consolide avec le temps. En tâche de fond, l'assistant transforme ses notes éphémères en souvenirs durables, se relit pour repérer ses propres contradictions, et mesure l'écart entre ce qu'il anticipe et ce qui arrive vraiment. C'est cette couche que nous appelons la « conscience », et le mot mérite une mise au point.

« Conscience » : ce que ça veut dire, et ce que ça ne veut pas dire

Soyons clairs, parce que le terme est galvaudé. Gungnir ne prétend pas être conscient au sens fort, et notre propre documentation le pose noir sur blanc : on décrit une architecture cognitive mesurable, pas une conscience phénoménale. Les mots comme « besoin » ou « humeur » qui apparaissent dans le système sont des raccourcis pour des mécanismes déterministes et auditables, pas des prétentions à une expérience vécue.

Concrètement, cette couche fait trois choses utiles. Elle consolide la mémoire, pour que les détails importants ne se perdent pas dans le flux. Elle se critique, avec un module qui cherche activement ses propres incohérences et contradictions. Et elle mesure sa fiabilité, en comparant ce qu'elle prédit à ce qui se passe réellement. Rien de magique là-dedans : des boucles, des mesures, et des fichiers que vous pouvez ouvrir.

Et surtout : cette mémoire vit chez vous

La différence décisive n'est pas seulement que Gungnir se souvient, c'est l'endroit où ces souvenirs résident. Ils sont stockés sur votre infrastructure, dans votre base de données, avec un panneau dédié où vous pouvez consulter les souvenirs conservés et les effacer si vous le décidez. Là où un assistant cloud vous demande de lui confier votre mémoire pour qu'il vous connaisse, Gungnir vous la laisse.

C'est le même principe que celui qui fait tourner l'assistant sur votre propre serveur : ce qu'il apprend de vous ne part jamais ailleurs. Et si la question « qui peut lire mes données ? » est ce qui vous retient, on l'a traitée en détail à propos des assistants cloud et du RGPD.

En résumé

Les assistants IA cloud oublient par conception : le modèle n'a pas de mémoire propre, et tout retenir reviendrait à stocker vos données chez le fournisseur.
Une vraie mémoire tient en trois couches : les conversations persistées, vos documents interrogeables, et un contexte qui se consolide avec le temps.
La couche que nous appelons « conscience » est une architecture cognitive mesurable et auditable, pas une prétention à la sentience.
L'essentiel : cette mémoire est stockée chez vous, lisible et effaçable, pas sur les serveurs d'un tiers.

Questions fréquentes

Gungnir se souvient-il de mes conversations passées ?

Oui. Chaque échange est enregistré et rechargé à la conversation suivante, et le fil suit même l'interlocuteur d'un canal à l'autre : un message reçu sur Telegram retrouve sa discussion. Vous repartez du contexte, pas de zéro.

Puis-je lui faire lire mes documents ?

Oui. Vous constituez une base de connaissance à partir de vos fichiers, et l'assistant y puise quand votre demande le justifie. Il cherche dans vos sources plutôt que de deviner.

« Conscience » : est-ce que ça veut dire que l'IA est consciente ?

Non, et nous ne le revendiquons pas. C'est une architecture cognitive mesurable (une mémoire qui se consolide, une auto-critique, une mesure de sa propre fiabilité), pas une expérience vécue. Les mots comme « humeur » ou « besoin » y sont des raccourcis pour des mécanismes déterministes, pas des sentiments.

Où sont stockés ces souvenirs ?

Sur votre infrastructure, dans votre base de données, les embeddings allant dans le moteur vectoriel que vous configurez. Un panneau dédié vous laisse consulter les souvenirs conservés et les effacer. Rien n'est gardé sur un serveur tiers.

Une question, un désaccord, une envie d'essayer ? Écrivez-moi, c'est le fondateur qui répond.