Rate limiting este mecanismul prin care providerii AI (OpenAI, Anthropic, etc.) limiteaza requesturile per minut/ora de la un cont. In Private Brands implementam rate limiting si pe useri (Free: 4 scanari/luna, Pro: scanari zilnice cu max 1/brand/zi) ca sa controlam costurile LLM. Rata de eroare 429 ("Too Many Requests") e cel mai comun semnal de rate limit atins.