CÓMO LEE LA IA TU CHAT
Antes de aprender prompts hay una cosa que cambia todo lo que viene después. Si no la entendés, vas a usar la IA mal sin darte cuenta. Y vas a culpar al prompt cuando el problema es otro.
La pregunta
¿Cómo creés que la IA "se acuerda" de lo que le dijiste hace 5 mensajes en el mismo chat?
Spoiler: no se acuerda. No tiene memoria.
Cada vez que apretás Enviar, pasa esto:
- Se le entrega el chat ENTERO, desde el primer mensaje hasta el último que escribiste vos.
- Lo lee todo de cero.
- Genera la respuesta.
- Se le borra todo.
- Cuando vos volvés a escribir, se repite desde 1.
No es una metáfora. Es literal cómo funciona.
La analogía del actor con la libreta
{"title":"Cómo procesa un turno la IA","steps":[{"label":"Vos escribís\nun mensaje","icon":"✍️","color":"violet"},{"label":"Se entrega el\nchat completo","icon":"📜","color":"amber"},{"label":"La IA lee\ny responde","icon":"🤖","color":"blue"},{"label":"Se borra la\nmemoria","icon":"🧹","color":"green"}]}
Imaginate un actor de improvisación que entra a escena cada turno con una libreta. La libreta tiene impreso todo el chat hasta ese momento. La lee, improvisa una respuesta, sale de escena, y le borran la memoria. Al próximo turno entra de nuevo con la libreta actualizada.
Ese actor es la IA. La libreta es la ventana de contexto. El borrado entre turnos es lo que en jerga técnica se llama stateless.
Por qué esto te cambia la forma de usar la IA
Cuatro consecuencias prácticas que la mayoría aprende mal por su cuenta:
1. Un chat por tema, no un chat eterno. Si mezclás tu plan de marketing, el email a tu suegra y un script de Python en el mismo chat, le estás dando al actor una libreta confusa con tres temas pegados. La respuesta va a ser proporcionalmente confusa. Cambiás de tema, abrís chat nuevo.
2. Cuando el chat se hace largo, la IA empieza a olvidar el principio. La libreta tiene un límite de páginas. Cuando se llena, las páginas más viejas se truncan. Por eso después de 60 mensajes la IA puede contradecir algo que vos le dijiste al principio: ese mensaje literalmente ya no está en la libreta cuando ella responde.
3. La info crítica va en el prompt importante, no escondida 20 mensajes atrás. Si necesitás que la IA sepa que sos contador y que tu cliente factura en USD, no asumas que se acuerda porque "lo dijiste antes". Reponelo en el prompt clave. La libreta pudo haberlo perdido o haberle dado menos peso del que tiene.
4. Chat nuevo no es un "reset mágico", es libreta limpia. Cuando abrís un chat nuevo no apretaste un botón que reinicia algo. Es que la libreta arranca vacía. Por eso el método dos-chats que vas a ver en el capítulo 4 funciona: empezás con una libreta limpia, sin el ruido de las idas y vueltas previas.
Los nombres técnicos (por si los escuchás)
- Token: la unidad mínima que la IA "ve". Aproximadamente 0.75 palabras en español. "Hola" puede ser 1 token. "Anticonstitucionalmente" pueden ser 4.
- Ventana de contexto: la cantidad máxima de tokens que entran en la libreta. ChatGPT y Claude soportan hoy alrededor de 200.000 tokens (unas 150 mil palabras). Gemini soporta más. Cuando vas a pegar un PDF largo, esto importa.
- Stateless: que no guarda estado entre turnos. La memoria está en la libreta, no en el modelo.
Ahora sí, con este modelo mental claro, vamos a la fórmula base.