Deepseek Chat App Try Now

Přehled rozhraní DeepSeek API

Přehled rozhraní DeepSeek API

Rozhraní DeepSeek API poskytuje programový přístup k sadě rozsáhlých jazykových modelů DeepSeek prostřednictvím rozhraní REST navrženého pro vývojáře a firmy hledající nákladově efektivní integraci AI. Rozhraní API podporuje více variant modelů optimalizovaných pro různé pracovní zátěže, od konverzační AI až po generování kódu a embeddingy. Služba udržuje koncové body kompatibilní s OpenAI, což vývojářům umožňuje měnit poskytovatele s minimálními úpravami kódu.

Přístup k API vyžaduje autentizaci pomocí bearer tokenů vygenerovaných v panelu pro vývojáře. K dispozici jsou oficiální sady SDK pro Python, Node.js, Go and Java, ačkoliv s koncovými body REST může komunikovat jakýkoli klient HTTP. Platforma se zaměřuje na individuální vývojáře budující prototypy, startupy škálující funkce AI i podniky vyžadující předvídatelné ceny pro objemné inferenční úlohy.

Funkce Specifikace
Dostupné modely DeepSeek V3, DeepSeek Coder V2, DeepSeek Chat
Limity sazeb 500 tisíc tokenů denně zdarma, až 50 milionů v placeném režimu
Metoda autentizace Bearer token (API klíč)
Oficiální SDK Python, Node.js, Go, Java
Podporované jazyky Vícejazyčné (70+ jazyků, optimalizace pro EN/ZH)

Klíčové technické schopnosti zahrnují streamování odpovědí pro aplikace v reálném čase, volání funkcí pro integraci nástrojů a režim JSON pro strukturovaný výstup. Rozhraní API zvládá kontextová okna o velikosti až 128 tisíc tokenů u vlajkových modelů, což umožňuje analýzu dlouhých dokumentů bez nutnosti kouskování textu. Veškeré požadavky jsou směrovány přes globální sítě CDN s průměrnou latencí pod 200 ms ve většině regionů.

  • REST API s architekturou kompatibilní s OpenAI pro snadnou migraci.
  • Nativní podpora pro doplňování chatu, embeddingy a generování kódu.
  • Automatické vyrovnávání zátěže napříč inferenčními clustery.
  • Podrobné analýzy využití a sledování spotřeby tokenů.

Dokumentace API pro vývojáře obsahuje interaktivní příklady a konfiguraci webhooků pro asynchronní zpracování. Implementace základních funkcí obvykle vyžaduje přibližně 30 minut, přičemž oficiální sady SDK mají integrované komplexní zpracování chyb a logiku opakovaného pokusu.

Začínáme s rozhraním API

Začínáme s rozhraním API

Nastavení přístupu k rozhraní API začíná vytvořením vývojářského účtu na platformě DeepSeek a vygenerováním prvního API klíče v sekci přihlašovacích údajů. Proces rychlého spuštění zahrnuje tři hlavní kroky: konfiguraci autentizace, instalaci sady SDK a provedení prvního požadavku. Většina vývojářů dokončí testování prvního požadavku během 15 minut s využitím poskytnutých šablon kódu.

Autentizace využívá formát bearer tokenu s klíči začínajícími předponou sk-. Základní URL pro všechny koncové body API je https://api.deepseek.com/v1 v souladu s konvencemi RESTful. Požadované hlavičky zahrnují Authorization s vaším API klíčem a Content-Type nastavený na application/json. Omezování sazeb se vztahuje na jednotlivé klíče, nikoli na účet, což týmům umožňuje rozdělit kvóty mezi více projektů.

Pro instalaci sady SDK pro Python použijte správce pip k přidání oficiální klientské knihovny. Následující kód demonstruje kompletní pracovní postup prvního požadavku s využitím koncového bodu pro chatování s modelem DeepSeek V3:

pip install deepseek-sdk
from deepseek import DeepSeek

client = DeepSeek(api_key="sk-your-api-key-here")

response = client.chat.completions.create(
    model="deepseek-chat-v3",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Explain quantum computing in simple terms."}
    ],
    max_tokens=500,
    temperature=0.7
)

print(response.choices[0].message.content)

Pro vývojáře preferující požadavky typu curl vyžaduje ekvivalentní volání HTTP explicitní konfiguraci hlaviček. Tento přístup funguje pro testování bez závislostí na sadách SDK:

curl https://api.deepseek.com/v1/chat/completions \
  -H "Authorization: Bearer sk-your-api-key-here" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-chat-v3",
    "messages": [{"role": "user", "content": "Hello, API!"}],
    "max_tokens": 100
  }'

Rozhraní API vrací odpovědi ve formátu JSON obsahující vygenerovaný text, statistiky využití tokenů a metadata požadavku. Úspěšné odpovědi zahrnují pole choices s výstupem modelu, zatímco chyby vrací standardizované kódy pro ladění. Počty tokenů se objevují v objektu usage a sledují prompt_tokens, completion_tokens a total_tokens pro přesné účtování.

  • Získejte nastavení API klíče v zabezpečení na panelu pro vývojáře.
  • Nainstalujte Python SDK nebo použijte přímé požadavky HTTP podle potřeby.
  • Otestujte připojení jednoduchým doplňováním chatu před integrací do produkce.
  • Sledujte hlavičky odpovědí pro stav limitů sazeb a zbývající kvóty.

Příručky pro rychlý start v dokumentaci pokrývají další jazyky včetně Node.js a Go s příklady pro frameworky Express, Flask a FastAPI. Konfigurace webhooků pro asynchronní zpracování vyžaduje ověření koncového bodu během počátečního nastavení.

Dostupné modely a koncové body

Dostupné modely a koncové body

Koncové body DeepSeek API nabízejí pět produkčních modelů optimalizovaných pro konkrétní úlohy od běžné konverzace po specializované generování kódu. Výběr modelu probíhá přes parametr model v požadavku, přičemž identifikátory následují vzor deepseek-{schopnost}-{verze}. Starší modely zůstávají přístupné po dobu 90 dnů od uvedení náhradních verzí, o čemž jsou aktivní uživatelé informováni.

ID Modelu Typ Kontextové okno Nejlepší využití
deepseek-chat-v3 Chatování 128K tokenů Konverzační AI, uvažování, vícejazyčný dialog
deepseek-coder-v2 Kódování 64K tokenů Generování kódu, ladění, technická dokumentace
deepseek-reasoner Uvažování 128K tokenů Složité řešení problémů, chain-of-thought postupy
deepseek-embed Embeddingy 8K tokenů Sémantické vyhledávání, RAG, shoda podobnosti
deepseek-vision-preview Multimodální 32K tokenů + obrázky Analýza obrazu, OCR, vizuální otázky

Koncový bod pro doplňování chatu na /v1/chat/completions obstarává konverzační interakce s podporou systémových promptů a volání funkcí. Tento bod spolupracuje s modely deepseek-chat-v3 i deepseek-reasoner, z nichž druhý jmenovaný přidává do odpovědí explicitní stopy uvažování. Parametry temperature a top_p řídí náhodnost výstupu, zatímco max_tokens omezuje délku generování.

  • Chatovací modely podporují streamování odpovědí pro interakci v reálném čase.
  • Modely pro kódování zahrnují optimalizace pro Python, JavaScript, Java a C++.
  • Seznam embeddingových modelů vrací vektory o rozměru 1024 pro sémantické operace.
  • Vizuální model přijímá URL obrázků nebo data v kódování base64 vedle textu.

Aktuálně dostupné modely mají rozsah od 7 miliard do 671 miliard parametrů, i když uživatelé vybírají modely podle schopností. DeepSeek Coder V2 vyniká v benchmarcích HumanEval s přesností 88,4 %, zatímco vlajková loď V3 dosahuje 87,1 % v MMLU pro obecné znalosti. Všechny produkční modely podporují režim JSON pro strukturované výstupy a integraci externích nástrojů.

Beta modely mohou vykazovat vyšší latenci a vyvíjející se schopnosti v průběhu dalšího tréninku. Koncový bod pro seznam modelů na /v1/models vrací aktuální dostupnost a stav ukončení podpory programově. Starší modely jako deepseek-chat-v2 zůstávají přístupné do poloviny roku 2026 pro zajištění zpětné kompatibility.

Příklady použití a integrace

Příklady použití a integrace

Praktické scénáře integrace API zahrnují chatboty pro zákazníky, procesy generování obsahu, nástroje pro vývoj i analytické toky. Kompatibilita s OpenAI umožňuje přímou náhradu stávajících integrací LLM, zatímco specifické funkce DeepSeek, jako jsou rozšířená kontextová okna, umožňují zcela nové aplikace. Produkční nasazení běžně využívají streamování pro lepší odezvu a volání funkcí pro přístup k externím datům.

Vývoj chatbotů představuje nejčastější vzor integrace, kdy firmy vkládají konverzační AI do platforem podpory a mobilních aplikací. Kontextové okno 128 tisíc tokenů pojme celou dokumentaci podpory nebo historii konverzace bez krácení. Volání funkcí umožňuje vyhledávání dat v reálném čase, což botům dovoluje dotazovat se do databází nebo kontrolovat stavy účtů přímo během konverzace.

  • Automatizace tvorby marketinkových textů a popisů produktů pomocí vzorkování.
  • Nástroje pro asistované kódování integrující DeepSeek Coder V2 do prostředí IDE.
  • Potrubí pro analýzu dat zpracovávající výzkumné zprávy nebo právní dokumenty.
  • Implementace RAG kombinující embeddingy pro vyhledávání s chatovacími modely.

Typická integrace RAG využívá koncový bod pro embeddingy k vektorizaci dokumentů znalostní báze a následně vyhledává relevantní úseky pro vložení do promptu. Tato architektura snižuje halucinace modelu při zachování plynulosti konverzace. Režim JSON zajišťuje strukturovaný výstup pro následné zpracování, což je cenné zejména v automatizovaných procesech vyžadujících parsovatelné odpovědi.

Streamování odpovědí je zásadní pro uživatelské aplikace, kde vnímaná latence ovlivňuje celkovou zkušenost. Rozhraní API doručuje tokeny postupně, což umožňuje uživatelskému rozhraní zobrazovat text během jeho generování. Definice volání funkcí specifikují dostupné nástroje pomocí schémat JSON, což modelu umožňuje určit, kdy je potřeba externí akce, a správně naformátovat požadavek. Tyto schopnosti se kombinují při vytváření sofistikovaných agentů řešících víceúrovňové úkoly.