Context window e "memoria de lucru" a unui LLM — cantitatea maxima de text (in tokens) pe care o poate procesa intr-o singura interogare. ChatGPT 4o: 128K tokens (~96K cuvinte). Claude Sonnet: 200K tokens. Gemini Pro: pana la 2M tokens. Cu cat context window e mai mare, cu atat AI-ul poate "tine minte" mai mult continut din prompt.