DeepSeek API: Výkonné jazykové modely pro vaše aplikace

Integrujte špičkovou AI s modely V3 a Coder za zlomek ceny prostřednictvím rozhraní kompatibilního s OpenAI.

Přehled API Začínáme Ceník Modely Integrace FAQ

Přehled rozhraní DeepSeek API

Rozhraní DeepSeek API poskytuje programový přístup k sadě rozsáhlých jazykových modelů DeepSeek prostřednictvím rozhraní REST navrženého pro vývojáře a firmy hledající nákladově efektivní integraci AI. Rozhraní API podporuje více variant modelů optimalizovaných pro různé pracovní zátěže, od konverzační AI až po generování kódu a embeddingy. Služba udržuje koncové body kompatibilní s OpenAI, což vývojářům umožňuje měnit poskytovatele s minimálními úpravami kódu.

Přístup k API vyžaduje autentizaci pomocí bearer tokenů vygenerovaných v panelu pro vývojáře. K dispozici jsou oficiální sady SDK pro Python, Node.js, Go and Java, ačkoliv s koncovými body REST může komunikovat jakýkoli klient HTTP. Platforma se zaměřuje na individuální vývojáře budující prototypy, startupy škálující funkce AI i podniky vyžadující předvídatelné ceny pro objemné inferenční úlohy.

Funkce	Specifikace
Dostupné modely	DeepSeek V3, DeepSeek Coder V2, DeepSeek Chat
Limity sazeb	500 tisíc tokenů denně zdarma, až 50 milionů v placeném režimu
Metoda autentizace	Bearer token (API klíč)
Oficiální SDK	Python, Node.js, Go, Java
Podporované jazyky	Vícejazyčné (70+ jazyků, optimalizace pro EN/ZH)

Klíčové technické schopnosti zahrnují streamování odpovědí pro aplikace v reálném čase, volání funkcí pro integraci nástrojů a režim JSON pro strukturovaný výstup. Rozhraní API zvládá kontextová okna o velikosti až 128 tisíc tokenů u vlajkových modelů, což umožňuje analýzu dlouhých dokumentů bez nutnosti kouskování textu. Veškeré požadavky jsou směrovány přes globální sítě CDN s průměrnou latencí pod 200 ms ve většině regionů.

REST API s architekturou kompatibilní s OpenAI pro snadnou migraci.
Nativní podpora pro doplňování chatu, embeddingy a generování kódu.
Automatické vyrovnávání zátěže napříč inferenčními clustery.
Podrobné analýzy využití a sledování spotřeby tokenů.

Dokumentace API pro vývojáře obsahuje interaktivní příklady a konfiguraci webhooků pro asynchronní zpracování. Implementace základních funkcí obvykle vyžaduje přibližně 30 minut, přičemž oficiální sady SDK mají integrované komplexní zpracování chyb a logiku opakovaného pokusu.

Začínáme s rozhraním API

Nastavení přístupu k rozhraní API začíná vytvořením vývojářského účtu na platformě DeepSeek a vygenerováním prvního API klíče v sekci přihlašovacích údajů. Proces rychlého spuštění zahrnuje tři hlavní kroky: konfiguraci autentizace, instalaci sady SDK a provedení prvního požadavku. Většina vývojářů dokončí testování prvního požadavku během 15 minut s využitím poskytnutých šablon kódu.

Autentizace využívá formát bearer tokenu s klíči začínajícími předponou sk-. Základní URL pro všechny koncové body API je https://api.deepseek.com/v1 v souladu s konvencemi RESTful. Požadované hlavičky zahrnují Authorization s vaším API klíčem a Content-Type nastavený na application/json. Omezování sazeb se vztahuje na jednotlivé klíče, nikoli na účet, což týmům umožňuje rozdělit kvóty mezi více projektů.

Pro instalaci sady SDK pro Python použijte správce pip k přidání oficiální klientské knihovny. Následující kód demonstruje kompletní pracovní postup prvního požadavku s využitím koncového bodu pro chatování s modelem DeepSeek V3:

pip install deepseek-sdk

from deepseek import DeepSeek

client = DeepSeek(api_key="sk-your-api-key-here")

response = client.chat.completions.create(
    model="deepseek-chat-v3",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Explain quantum computing in simple terms."}
    ],
    max_tokens=500,
    temperature=0.7
)

print(response.choices[0].message.content)

Pro vývojáře preferující požadavky typu curl vyžaduje ekvivalentní volání HTTP explicitní konfiguraci hlaviček. Tento přístup funguje pro testování bez závislostí na sadách SDK:

curl https://api.deepseek.com/v1/chat/completions \
  -H "Authorization: Bearer sk-your-api-key-here" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-chat-v3",
    "messages": [{"role": "user", "content": "Hello, API!"}],
    "max_tokens": 100
  }'

Rozhraní API vrací odpovědi ve formátu JSON obsahující vygenerovaný text, statistiky využití tokenů a metadata požadavku. Úspěšné odpovědi zahrnují pole choices s výstupem modelu, zatímco chyby vrací standardizované kódy pro ladění. Počty tokenů se objevují v objektu usage a sledují prompt_tokens, completion_tokens a total_tokens pro přesné účtování.

Získejte nastavení API klíče v zabezpečení na panelu pro vývojáře.
Nainstalujte Python SDK nebo použijte přímé požadavky HTTP podle potřeby.
Otestujte připojení jednoduchým doplňováním chatu před integrací do produkce.
Sledujte hlavičky odpovědí pro stav limitů sazeb a zbývající kvóty.

Příručky pro rychlý start v dokumentaci pokrývají další jazyky včetně Node.js a Go s příklady pro frameworky Express, Flask a FastAPI. Konfigurace webhooků pro asynchronní zpracování vyžaduje ověření koncového bodu během počátečního nastavení.

Ceny API a limity sazeb

V roce 2026 se ceny DeepSeek API řídí modelem založeným na tokenech, kdy jsou účtovány zvlášť vstupní a výstupní tokeny v závislosti na schopnostech modelu. Vlajkový model DeepSeek V3 stojí 0,27 USD za 1 milion vstupních tokenů a 1,10 USD za 1 milion výstupních tokenů, což jej staví výrazně pod cenu konkurenčních špičkových modelů. Nové účty získávají bezplatný kredit 5 USD, což v roce 2026 postačuje na přibližně 4,5 milionu vstupních tokenů u standardního modelu.

Výpočty nákladů na token činí DeepSeek obzvláště konkurenceschopným pro aplikace s vysokým objemem dat. Typická výměna v chatbotu spotřebovávající 500 vstupních a 200 výstupních tokenů stojí přibližně 0,00036 USD, což umožňuje miliony interakcí v rámci skromných rozpočtů. Limity sazeb se zvyšují s úrovní účtu, začínají na 500 tisících tokenech denně pro bezplatné účty a dosahují až 50 milionů tokenů denně pro podnikové předplatné.

Model	Vstup (1M tokenů)	Výstup (1M tokenů)	Kontextové okno	Limit (tokenů/min)
DeepSeek V3	$0.27	$1.10	128K	90 000
DeepSeek Chat	$0.14	$0.28	64K	150 000
DeepSeek Coder V2	$0.14	$0.28	64K	120 000
DeepSeek Embeddings	$0.002	N/A	8K	200 000

Účtování probíhá pomocí kreditního systému s automatickým odečítáním za každý požadavek. Ovládací panel zobrazuje metriky spotřeby v reálném čase rozdělené podle modelů a projektů s možností nastavit upozornění na útratu. Nevyužité kredity neexpirují a objemové slevy se uplatňují automaticky při měsíční spotřebě nad 1 000 USD.

Limity sazeb vynucují kvóty na základě tokenů za minutu namísto prostého počtu požadavků, což umožňuje flexibilní velikosti dávek. Rozhraní API vrací stavové kódy 429 při překročení limitů, přičemž hlavičky Retry-After indikují dobu čekání. Podnikové účty mají přístup k vyhrazené propustnosti a vlastní konfiguraci limitů prostřednictvím podpory. Ceny se mohou měnit s 30denním předstihem, ačkoliv historická data ukazují stabilitu od spuštění verze V3.

Dostupné modely a koncové body

Koncové body DeepSeek API nabízejí pět produkčních modelů optimalizovaných pro konkrétní úlohy od běžné konverzace po specializované generování kódu. Výběr modelu probíhá přes parametr model v požadavku, přičemž identifikátory následují vzor deepseek-{schopnost}-{verze}. Starší modely zůstávají přístupné po dobu 90 dnů od uvedení náhradních verzí, o čemž jsou aktivní uživatelé informováni.

ID Modelu	Typ	Kontextové okno	Nejlepší využití
deepseek-chat-v3	Chatování	128K tokenů	Konverzační AI, uvažování, vícejazyčný dialog
deepseek-coder-v2	Kódování	64K tokenů	Generování kódu, ladění, technická dokumentace
deepseek-reasoner	Uvažování	128K tokenů	Složité řešení problémů, chain-of-thought postupy
deepseek-embed	Embeddingy	8K tokenů	Sémantické vyhledávání, RAG, shoda podobnosti
deepseek-vision-preview	Multimodální	32K tokenů + obrázky	Analýza obrazu, OCR, vizuální otázky

Koncový bod pro doplňování chatu na /v1/chat/completions obstarává konverzační interakce s podporou systémových promptů a volání funkcí. Tento bod spolupracuje s modely deepseek-chat-v3 i deepseek-reasoner, z nichž druhý jmenovaný přidává do odpovědí explicitní stopy uvažování. Parametry temperature a top_p řídí náhodnost výstupu, zatímco max_tokens omezuje délku generování.

Chatovací modely podporují streamování odpovědí pro interakci v reálném čase.
Modely pro kódování zahrnují optimalizace pro Python, JavaScript, Java a C++.
Seznam embeddingových modelů vrací vektory o rozměru 1024 pro sémantické operace.
Vizuální model přijímá URL obrázků nebo data v kódování base64 vedle textu.

Aktuálně dostupné modely mají rozsah od 7 miliard do 671 miliard parametrů, i když uživatelé vybírají modely podle schopností. DeepSeek Coder V2 vyniká v benchmarcích HumanEval s přesností 88,4 %, zatímco vlajková loď V3 dosahuje 87,1 % v MMLU pro obecné znalosti. Všechny produkční modely podporují režim JSON pro strukturované výstupy a integraci externích nástrojů.

Beta modely mohou vykazovat vyšší latenci a vyvíjející se schopnosti v průběhu dalšího tréninku. Koncový bod pro seznam modelů na /v1/models vrací aktuální dostupnost a stav ukončení podpory programově. Starší modely jako deepseek-chat-v2 zůstávají přístupné do poloviny roku 2026 pro zajištění zpětné kompatibility.

Příklady použití a integrace

Praktické scénáře integrace API zahrnují chatboty pro zákazníky, procesy generování obsahu, nástroje pro vývoj i analytické toky. Kompatibilita s OpenAI umožňuje přímou náhradu stávajících integrací LLM, zatímco specifické funkce DeepSeek, jako jsou rozšířená kontextová okna, umožňují zcela nové aplikace. Produkční nasazení běžně využívají streamování pro lepší odezvu a volání funkcí pro přístup k externím datům.

Vývoj chatbotů představuje nejčastější vzor integrace, kdy firmy vkládají konverzační AI do platforem podpory a mobilních aplikací. Kontextové okno 128 tisíc tokenů pojme celou dokumentaci podpory nebo historii konverzace bez krácení. Volání funkcí umožňuje vyhledávání dat v reálném čase, což botům dovoluje dotazovat se do databází nebo kontrolovat stavy účtů přímo během konverzace.

Automatizace tvorby marketinkových textů a popisů produktů pomocí vzorkování.
Nástroje pro asistované kódování integrující DeepSeek Coder V2 do prostředí IDE.
Potrubí pro analýzu dat zpracovávající výzkumné zprávy nebo právní dokumenty.
Implementace RAG kombinující embeddingy pro vyhledávání s chatovacími modely.

Typická integrace RAG využívá koncový bod pro embeddingy k vektorizaci dokumentů znalostní báze a následně vyhledává relevantní úseky pro vložení do promptu. Tato architektura snižuje halucinace modelu při zachování plynulosti konverzace. Režim JSON zajišťuje strukturovaný výstup pro následné zpracování, což je cenné zejména v automatizovaných procesech vyžadujících parsovatelné odpovědi.

Streamování odpovědí je zásadní pro uživatelské aplikace, kde vnímaná latence ovlivňuje celkovou zkušenost. Rozhraní API doručuje tokeny postupně, což umožňuje uživatelskému rozhraní zobrazovat text během jeho generování. Definice volání funkcí specifikují dostupné nástroje pomocí schémat JSON, což modelu umožňuje určit, kdy je potřeba externí akce, a správně naformátovat požadavek. Tyto schopnosti se kombinují při vytváření sofistikovaných agentů řešících víceúrovňové úkoly.

FAQ

Jak získám API klíč pro DeepSeek?

Zaregistrujte se na platformě DeepSeek pro vývojáře a vygenerujte svůj klíč v sekci 'API Keys'.

Je DeepSeek API kompatibilní s knihovnami OpenAI?

Ano, DeepSeek využívá architekturu REST kompatibilní s OpenAI, takže stačí změnit základní URL a API klíč.

Kolik stojí model DeepSeek V3 v roce 2026?

Cena je 0,27 USD za 1 milion vstupních tokenů a 1,10 USD za 1 milion výstupních tokenů.

Existuje bezplatná verze API?

Nové účty získávají bezplatný kredit 5 USD a k dispozici je limit 500 tisíc tokenů denně zdarma.

Jaké programovací jazyky SDK podporují?

Oficiálně jsou podporovány Python, Node.js, Go a Java.

Jak velké je kontextové okno modelu V3?

Model DeepSeek V3 nabízí rozšířené kontextové okno o velikosti až 128 000 tokenů.

Podporuje DeepSeek generování kódu?

Ano, model DeepSeek Coder V2 je speciálně optimalizován pro programování ve více než 90 jazycích.

Co se stane, když překročím limit sazeb?

API vrátí chybu 429 a hlavička 'Retry-After' vám sdělí, za jak dlouho můžete poslat další požadavek.