DeepSeek API + Guide

Kraftfull AI-integration för utvecklare med OpenAI-kompatibla slutpunkter och marknadsledande prissättning.

Översikt Kom igång Prissättning Modeller Integration FAQ

Översikt av DeepSeek API

Det DeepSeek API ger programmatisk tillgång till DeepSeeks serie av stora språkmodeller via ett REST-baserat gränssnitt designat för utvecklare och företag som söker kostnadseffektiv AI-integration. Tjänsten stöder flera modellvarianter optimerade för olika arbetsbelastbelastningar, från konversations-AI till kodgenerering och embeddings. Plattformen tillhandahåller OpenAI-kompatibla slutpunkter, vilket gör det möjligt för utvecklare att byta leverantör med minimala kodändringar.

API-åtkomst kräver autentisering via bearer-tokens som genereras i utvecklarpanelen. Officiella SDK-paket finns tillgängliga för Python, Node.js, Go och Java, men alla typer av HTTP-klienter kan interagera med REST-slutpunkterna. Tjänsten riktar sig till enskilda utvecklare som bygger prototyper, startups som skalar AI-funktioner och storskaliga företag som kräver förutsägbara priser för tunga inferensarbeten.

Funktion	Specifikation
Tillgängliga modeller	DeepSeek V3, DeepSeek Coder V2, DeepSeek Chat
Anropsgränser	500K tokens per dag gratis, upp till 50M tokens per dag betald
Autentiseringsmetod	Bearer token (API-nyckel)
Officiella SDK-paket	Python, Node.js, Go, Java
Språkstöd	Flerspråkig (70+ språk, optimerad för EN/ZH)

Viktiga tekniska funktioner inkluderar strömmande svar för realtidsapplikationer, funktionsanrop för verktygsintegration och JSON-läge för strukturerad utdata. Gränssnittet hanterar kontextfönster på upp till 128K tokens för flaggskeppsmodellerna, vilket möjliggör analys av långa dokument utan uppstyckning. Alla anrop dirigeras via globala CDN-slutpunkter med en genomsnittlig latens under 200 ms för de flesta regioner.

REST API med OpenAI-kompatibel struktur för enkel migrering.
Inbyggt stöd för chat completions, embeddings och kodgenerering.
Automatisk lastbalansering mellan olika inferenskluster.
Detaljerad användningsstatistik och spårning av tokenförbrukning.

Dokumentationen för utvecklare innehåller interaktiva exempel och konfiguration av webhooks för asynkron bearbetning. Integration kräver normalt sett cirka 30 minuter för en grundläggande implementering, med omfattande felhantering och omprövningslogik inbyggd i de officiella biblioteken.

Kom igång med gränssnittet

Processen att sätta upp API-åtkomst börjar med att skapa ett konto på DeepSeek-plattformen och generera din första API-nyckel under säkerhetsinställningarna. Startprocessen omfattar tre centrala steg: konfiguration av autentisering, installation av SDK samt utförande av ditt första anrop. De flesta utvecklare slutför testningen av det första anropet inom 15 minuter med hjälp av de färdiga kodmallarna.

Autentisering använder bearer token-format där nycklar börjar med prefixet sk-. Basadressen för alla slutpunkter är https://api.deepseek.com/v1, vilket följer gängse REST-standarder. Obligatoriska rubriker inkluderar Authorization med din API-nyckel och Content-Type inställd na application/json. Anropsbegränsningar tillämpas per nyckel snarare än per konto, vilket gör att team kan fördela kvoter på flera projekt.

För installation av Python-biblioteket används pip för att lägga till det officiella klientbiblioteket. Följande kodblock visar ett komplett arbetsflöde för ett första anrop med chat completion-slutpunkten för DeepSeek V3:

pip install deepseek-sdk

from deepseek import DeepSeek

client = DeepSeek(api_key="sk-din-api-nyckel-här")

response = client.chat.completions.create(
    model="deepseek-chat-v3",
    messages=[
        {"role": "system", "content": "Du är en hjälpsam assistent."},
        {"role": "user", "content": "Förklara kvantdatorer på ett enkelt sätt."}
    ],
    max_tokens=500,
    temperature=0.7
)

print(response.choices[0].message.content)

För utvecklare som föredrar curl-baserade anrop kräver motsvarande HTTP-anrop en explicit konfiguration av rubrikerna. Denna metod fungerar utmärkt för testning utan externa beroenden:

curl https://api.deepseek.com/v1/chat/completions \
  -H "Authorization: Bearer sk-din-api-nyckel-här" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-chat-v3",
    "messages": [{"role": "user", "content": "Hallå API!"}],
    "max_tokens": 100
  }'

Systemet returnerar JSON-svar som innehåller genererad text, statistik över tokenanvändning och metadata för anropet. Framgångsrika svar inkluderar en choices-array med modellens resultat, medan felmeddelanden returnerar standardiserade koder för felsökning. Mängden tokens visas i objektet usage, vilket spårar prompt_tokens, completion_tokens och total_tokens för exakt fakturering.

Hämta din API-nyckel från säkerhetsfliken i utvecklarpanelen.
Installera Python SDK eller använd direkta HTTP-anrop för flexibilitet.
Testa anslutningen med en enkel chattfråga innan full integration.
Bevaka svarshuvuden för status gällande anropsgränser och kvarvarande kvot.

Snabbguider i dokumentationen täcker ytterligare språk som Node.js och Go, med ramverksspecifika exempel för Express och FastAPI. Konfigurationer för asynkrona processer via webhooks kräver verifiering av slutpunkten under den initiala konfigurationen.

Prissättning och tekniska begränsningar

Under 2026 följer DeepSeeks prissättning en tokenbaserad modell där indata och utdata debiteras separat, med priser som varierar beroende på modellens kapacitet. Flaggskeppet DeepSeek V3 kostar $0,27 per 1 miljon indatatokens och $1,10 per 1 miljon utdatatokens, vilket placerar den betydligt lägre än jämförbara modeller. Gratis krediter till ett värde av $5 delas ut till nya konton, vilket räcker till cirka 4,5 miljoner indatatokens.

Beräkningar av kostnad per token gör tjänsten särskilt konkurrenskraftig för applikationer med hög volym. Ett typiskt utbyte i en chatbot som förbrukar 500 indatatokens och 200 utdatatokens kostar ungefär $0,00036, vilket möjliggör miljontals interaktioner inom en rimlig budget. Anropsgränserna skalar efter kontonivå och börjar på 500K tokens per dag för gratiskonton.

Modell	Indata (per 1M tokens)	Utdata (per 1M tokens)	Kontextfönster	Gräns (tokens/min)
DeepSeek V3	$0,27	$1,10	128K	90 000
DeepSeek Chat	$0,14	$0,28	64K	150 000
DeepSeek Coder V2	$0,14	$0,28	64K	120 000
DeepSeek Embeddings	$0,002	Saknas	8K	200 000

Faktureringen fungerar via ett förbetalt system där avdrag görs automatiskt per anrop. Instrumentpanelen visar förbrukning i realtid uppdelat på modell och projekt, med möjlighet att ställa in utgiftsvarningar för att undvika oväntade kostnader. Outnyttjade krediter förfaller inte, och volymrabatter tillämpas automatiskt vid månatliga tröskelvärden över $1 000.

För närvarande i 2026 tillämpas gränser baserat på tokens per minut snarare än antal anrop, vilket ger flexibilitet för batch-bearbetning. Systemet returnerar statuskod 429 när gränserna överskrids, tillsammans med Retry-After-rubriker som anger väntetid. Företagskonton kan få tillgång till dedikerad genomströmning och anpassade gränser via supportkanaler. Priserna kan komma att ändras med 30 dagars förvarning till befintliga användare.

Tillgängliga modeller och slutpunkter

Gränssnittet exponerar fem produktionsmodeller som är optimerade för allt från allmän konversation till specialiserad kodgenerering. Val av modell sker via parametern model i anropet, där id följer mönstret deepseek-{kapacitet}-{version}. Äldre modeller förblir tillgängliga i 90 dagar efter att ersättningsversioner har lanserats, och meddelanden skickas ut till aktiva användare i god tid.

Modell-ID	Typ	Kontextfönster	Bästa användningsområde
deepseek-chat-v3	Chat Completion	128K tokens	Konversations-AI, resonemang, flerspråkig dialog
deepseek-coder-v2	Code Completion	64K tokens	Kodgenerering, felsökning, teknisk dokumentation
deepseek-reasoner	Chat Completion	128K tokens	Komplex problemlösning, logiska resonemangskedjor
deepseek-embed	Embeddings	8K tokens	Semantisk sökning, RAG-pipelines, likhetsmatchning
deepseek-vision-preview	Multimodal (Beta)	32K tokens + bild	Bildanalys, OCR, visuella frågor och svar

Slutpunkten för /v1/chat/completions hanterar interaktioner med stöd för systeminstruktioner, flerstegsdialoger och funktionsanrop. Denna fungerar med både DeepSeek V3 och DeepSeek Reasoner, där den senare inkluderar explicita resonemangsspår i svaren. Parametrar som temperature och top_p styr slumpmässigheten i utdatan, medan max_tokens sätter taket för generationens längd.

Chattmodeller stöder strömmande svar via parametern stream för bättre användarupplevelse.
Kodmodeller inkluderar optimeringar för Python, JavaScript, Java, C++ och Go.
Embeddings-modellen returnerar 1024-dimensionella vektorer för semantiska operationer.
Vision-modellen accepterar bildadresser eller base64-data tillsammans med textinstruktioner.

Modellerna sträcker sig från 7B till 671B parametrar, även om dessa detaljer är abstraherade för användaren som väljer baserat på förmåga. DeepSeek Coder V2 presterar särskilt väl i HumanEval-tester med hög exakthet, medan flaggskeppet V3 når toppresultat på MMLU för allmänna kunskapsuppgifter. Alla produktionsmodeller stöder JSON-läge för strukturerad datautmatning.

Betamodeller som vision-preview kan uppvisa högre latens medan träningen fortsätter. Slutpunkten /v1/models returnerar aktuell tillgänglighet och status för avveckling på ett programmatiskt sätt. Modeller uppdateras regelbundet för att säkerställa högsta möjliga prestanda och säkerhet för slutanvändaren.

Användningsområden och exempel på integration

Praktiska scenarier för integration omfattar allt från kundtjänstklienter till automatiserade innehållsflöden och utvecklingsverktyg. Den höga kompatibiliteten med OpenAI gör DeepSeek till en ersättare som kan sättas in i befintliga system utan omfattande ombyggnad. Produktioner drar ofta nytta av strömning för responsiva gränssnitt och funktionsanrop för att nå extern data.

Utveckling av chatbotar är det vanligaste mönstret där företag bäddar in AI i supportplattformar och appar. Kontextfönstret på 128K tokens rymmer hela manualer eller långa konversationshistoriker utan att information går förlorad. Funktionsanrop möjliggör sökningar i realtid, vilket låter en bot fråga databaser eller kontrollera lagerstatus mitt under ett pågående samtal.

Automatisering av marknadsföringstexter, blogginlägg och produktbeskrivningar med kontrollerad variation.
Kodassistenter som integrerar Coder V2 i utvecklingsmiljöer för autokomplettering och felsökning.
Pipelines för dataanalys där gränssnittet bearbetar forskningsrapporter eller juridiska dokument.
RAG-system som kombinerar embeddings för informationshämtning med chattmodeller för svar.

En typisk RAG-integration använder embeddings-slutpunkten för att transformera dokument till vektorer, lagrar dessa i en vektordatabas och hämtar sedan relevanta stycken för att ge kontext till chattmodellen. Denna arkitektur minskar risken för hallucinationer och håller samtalet relevant. JSON-läget säkerställer att svaren kan tolkas maskinellt, vilket är kritiskt i automatiserade flöden.

Strömmande svar är avgörande för applikationer där användaren förväntar sig omedelbar respons. Gränssnittet levererar tokens stegvis via server-sent events, vilket gör att texten kan visas i realtid istället för att användaren ska behöva vänta på ett helt svar. Genom att definiera verktyg med JSON-scheman kan modellen själv avgöra när externa åtgärder krävs och formatera anropen korrekt.

FAQ

Vad är DeepSeek API?

Det är ett REST-baserat gränssnitt som ger utvecklare tillgång till DeepSeeks AI-modeller för chatt, kod och embeddings.

Är DeepSeek API kompatibelt med OpenAI?

Ja, slutpunkterna är OpenAI-kompatibla, vilket gör det enkelt att migrera befintlig kod med minimala ändringar.

Hur mycket kostar DeepSeek V3 via API?

Priset är $0,27 per 1 miljon indatatokens och $1,10 per 1 miljon utdatatokens.

Finns det en gratis provperiod?

Nya konton får vanligtvis $5 i gratis krediter för att testa tjänsten.

Vilka programmeringsspråk stöds av officiella SDK:er?

Det finns officiella bibliotek för Python, Node.js, Go och Java.

Vad är det maximala kontextfönstret?

Flaggskeppsmodeller som DeepSeek V3 stöder upp till 128K tokens.

Stöder DeepSeek funktionsanrop (function calling)?

Ja, API:et har inbyggt stöd för funktionsanrop och ett dedikerat JSON-läge för strukturerad utdata.

Hur hanteras anropsgränser?

Gränser tillämpas baserat på tokens per minut (TPM) och varierar beroende på kontonivå.