[HEADROOM] Reduza o consumo de tokens em ate 95% comprimindo o contexto antes que ele chegue ao LLM (Open Source)