API pricing and rate limits

În 2026, structura de prețuri DeepSeek API urmează un model bazat pe tokens care taxează separat pentru tokens de intrare și de ieșire, tarifele variind în funcție de capacitatea modelului. Modelul emblematic DeepSeek V3 costă 0,27 USD per 1M tokens de intrare și 1,10 USD per 1M tokens de ieșire, fiind poziționat semnificativ sub modelele concurente. Credite gratuite în valoare totală de 5 USD sunt oferite conturilor noi, suficiente pentru aproximativ 4,5M tokens de intrare sau 900K tokens de ieșire pe modelul de chat standard.
Calculele costului per token fac DeepSeek deosebit de competitiv pentru aplicațiile cu volum mare. Actualmente, un schimb tipic de chatbot care consumă 500 tokens de intrare și 200 tokens de ieșire costă aproximativ 0,00036 USD, permițând milioane de interacțiuni în limitele unor bugete modeste. Limitele de rată scalează cu nivelul contului, începând de la 500K tokens zilnic pentru conturile gratuite și ajungând până la 50M tokens zilnic pentru abonamentele enterprise.
| Model | Intrare (per 1M tokens) | Ieșire (per 1M tokens) | Fereastră Context | Limită Rată (tokens/min) |
|---|---|---|---|---|
| DeepSeek V3 | $0.27 | $1.10 | 128K | 90,000 |
| DeepSeek Chat | $0.14 | $0.28 | 64K | 150,000 |
| DeepSeek Coder V2 | $0.14 | $0.28 | 64K | 120,000 |
| DeepSeek Embeddings | $0.002 | N/A | 8K | 200,000 |
Facturarea utilizării funcționează pe un sistem de credit preplătit cu deduceri automate per cerere. Tabloul de bord afișează metrici de consum în timp real defalcate pe model și proiect, cu alerte de cheltuieli configurabile pentru a preveni depășirile neașteptate. Creditele neutilizate nu expiră, iar reducerile de volum se aplică automat la praguri lunare de peste 1.000 USD în consum.
Limitele de rată impun cote de cereri bazate pe tokens pe minut, mai degrabă decât pe numărul brut de cereri, permițând dimensiuni flexibile ale loturilor. API returnează coduri de stare 429 atunci când limitele sunt depășite, cu header-e Retry-After care indică timpii de așteptare. Conturile enterprise accesează rezervări dedicate de debit și configurații personalizate ale limitelor de rată prin canalele de asistență.




