Abstract Algorithms

Topic

token optimization

1 article

Context Window Management: Strategies for Long Documents and Extended Conversations

TLDR: 🧠 Context windows are LLM memory limits. When conversations grow past 4K-128K tokens, you need strategies: sliding windows (cheap, lossy), summarization (balanced), RAG (selective), map-reduce

Mar 29, 2026•20 min read