DeepSeek: Framúrskarandi gervigreind með hámarks skilvirkni

Upplifðu næstu kynslóð gervigreindar með DeepSeek-V3 og R1 líkönunum sem bjóða upp á ótrúlega rökfærslu og skilvirkni fyrir brot af kostnaðinum.

Prófaðu DeepSeek núna

Hvað er DeepSeek?

DeepSeek er áberandi vettvangur fyrir gervigreind sem byggir á opnum líkönum og rannsóknarstofa þróuð af Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd. Fyrirtækið er þekkt fyrir mjög skilvirkan Mixtur-of-Experts (MoE) arkitektúr. Vettvangurinn kom fram sem verulegur truflunaraðili í gervigreindariðnaðinum með því að ögra hefðbundnum lögmálum um skölun. Á meðan keppinautar eyddu hundruðum milljóna dollara í að þjálfa þétt líkön, sýndi DeepSeek fram á að nýsköpun í arkitektúr gæti skilað sambærilegri frammistöðu fyrir brot af kostnaðinum. Þessi áhersla á skilvirkni hefur gjörbreytt forsendum iðnaðarins um hvað þarf til að smíða háþróuð mállíkön.

Helstu líkön vettvangsins eru DeepSeek-V3 fyrir almenn verkefni og DeepSeek-R1 fyrir flókna rökfærslu, en þau keppa beint við GPT-4o og Claude 3.5 Sonnet í helstu prófunum. Það sem aðgreinir DeepSeek eru tæknilegar nýjungar eins og Multi-head Latent Attention (MLA) sem dregur úr minnisnotkun við vinnslu, ásamt DeepSeekMoE kerfinu sem virkjar aðeins lítinn hluta af færibreytum fyrir hvert tákn (token). Þetta leiðir til þess að þjálfunarkostnaður var áætlaður um 5,5 milljónir dollara fyrir DeepSeek-V3, samanborið við áætlanir sem fara yfir 100 milljónir dollara fyrir sambærileg vestræn líkön.

Árið 2026 starfar DeepSeek sem alhliða gervigreindarvettvangur sem er aðgengilegur í gegnum margar rásir: vefviðmót, snjallforrit fyrir iOS og Android, og API fyrir forritara með endapunktum sem eru samhæfir við OpenAI. Kóðagrunnur vettvangsins er gefinn út undir MIT-leyfi og líkönin hafa leyfi til almennrar notkunar, sem gerir bæði skýjalausnir og staðbundna hýsingu mögulega. Þetta mætir þörfum fyrirtækja sem vilja tryggja gagnaöryggi og forðast fulla háð einum þjónustuaðila.

Tæknilegar forskriftir og grunnur

Tæknilegur grunnur DeepSeek hvílir á hagkvæmni í hönnun fremur en gríðarlegri fjölgun færibreyta.

Forskrift	Upplýsingar
Hönnuður	DeepSeek-AI (Hangzhou DeepSeek Artificial Intelligence)
Útgáfudagur	Upphafleg útgáfa 2023; stórar V3/R1 uppfærslur í janúar 2025
Arkitektúr	Mixture-of-Experts (MoE) með Multi-head Latent Attention (MLA)
Samhengisgluggi	128.000 tokens (DeepSeek-V3 og R1)
Aðgangur	Vefviðmót, REST API, Snjallforrit, staðbundið (Ollama/vLLM)
Leyfismál	MIT leyfi fyrir kóða / Sérsniðið viðskiptaleyfi fyrir líkön
Verðlagning	Ókeypis vefspjall / API greitt eftir notkun

Helstu eiginleikar og geta

Háþróuð rökfærsla með DeepSeek-R1

DeepSeek-R1 er svar vettvangsins við o1-línunni frá OpenAI og innleiðir aukna rökfærslu (chain-of-thought) með styrkingarnámi (reinforcement learning). Ólíkt hefðbundnum aðferðum var R1 þjálfað með reiknirritum sem verðlauna líkanið fyrir að leysa verkefni rétt, óháð því hvaða leið er valin. Þetta gerir líkaninu kleift að þróa innra „hugsunarferli“ sem er sýnilegt notandanum, þar sem það kannar margar lausnir áður en lokasvarið er gefið.

Í AIME 2024 stærðfræðiprófinu náði DeepSeek-R1 79,8% skori, sem setti það í hóp fremstu rökfærslulíkana í ársbyrjun 2026. Líkanið sýnir sérstakan styrk í rökfræðilegum ályktunum, formlegum sönnunum og flóknum stærðfræðilegum útreikningum. Við prófanir tókst R1 stöðugt betur upp en staðlaða DeepSeek-V3 líkaninu við verkefni sem krefjast sannprófunar á milliskrefum, þótt það hafi í för með sér meiri tafir vegna hins lengra rökfærsluferlis.

Hæfnin til rökfærslu nýtist einnig við villuleit í kóða, greiningu á flóknum leikjaaðferðum og mat á vísindalegum tilgátum. Notendur geta fylgst með hugsun líkansins í rauntíma, sem gerir það sérstaklega verðmætt fyrir nám og aðstæður þar sem skýring á bak við svarið skiptir jafn miklu máli og svarið sjálft.

Skilvirkni með Mixture of Experts

Arkitektúr DeepSeek-V3 inniheldur samtals 671 milljarð færibreyta, en virkjar aðeins 37 milljarða fyrir hvert tákn við vinnslu. Þetta dreifða virkjunarmynstur er einkennandi fyrir MoE nálgunina: líkanið sendir hvert tákn til lítils hluta sérhæfðra „sérfræðinga“ (expert networks), á meðan meirihluti færibreytanna hvílir. Þessi stýring er lærð við þjálfun og hámarkar hvaða sérfræðingar meðhöndla ákveðnar tegundir inntaks.

Í reynd þýðir þetta vinnsluhraða sem nálgast mun minni líkön. DeepSeek-V3 nær um 60 táknum á sekúndu á stöðluðum GPU vélbúnaði, samanborið við um 20-30 tákn á sekúndu hjá stórum þéttum líkönum eins og LLaMA 3.1 405B. Færri virkar færibreytur þýða einnig minni kröfur um minni við vinnslu, sem gerir það kleift að keyra V3 á 8x80GB GPU uppsetningum á skilvirkan hátt.

Hagræðingin nær einnig til þjálfunarinnar. DeepSeek greindi frá notkun 2,788 milljóna GPU-stunda á H800 flögum fyrir alla V3 þjálfunina. Til samanburðar benda áætlanir í iðnaðinum til þess að þjálfun GPT-4 hafi krafist mun meiri tölvukrafts. Þessi kostnaðarkostur hefur gert það að verkum að vestrænar rannsóknarstofur hafa endurskoðað hönnun sína og kynnt MoE-líkön í kjölfar útgáfu DeepSeek-V3.

Kóðun og stærðfræðileg færni

DeepSeek líkönin sýna framúrskarandi árangur í forritun, þar sem V3 skoraði 85,7% í HumanEval og 75,4% í MBPP í útgáfunni frá janúar 2025. Þessar prófanir mæla getu líkansins til að búa til réttan kóða úr náttúrulegu máli og prófa bæði reiknirit og málfræðilega nákvæmni í mörgum forritunarmálum. Í Codeforces keppnum náði DeepSeek-V3 Elo-stigum sem setja það í hóp efstu 5% mannlegra þátttakenda.

Vettvangurinn styður gerð kóða, útskýringar og endurbætur á yfir 80 forritunarmálum, með sérstaklega góðri frammistöðu í Python, JavaScript, C++, Java og Rust. Í hagnýtum prófunum tókst DeepSeek að breyta eldri Java kóða yfir í nútímalegan Python kóða, búa til heil FastAPI forrit og finna lúmskar villur í samtímaforritun. Samhengisgluggi upp á 128k tákn gerir líkaninu kleift að hafa yfirsýn yfir stóra kóðagrunna og mörg skjöl samtímis.

Á SWE-bench, sem metur líkön á raunverulegum vandamálum af GitHub, leysti DeepSeek-V3 47,8% verkefna. Þetta gerir það samkeppnishæft við GPT-4o og Claude 3.5 Sonnet í raunverulegum hugbúnaðarverkefnum, þó að sérhæfð líkön eins og Claude Sonnet 4.0 geti enn haft forskot í mjög flóknum kerfisbreytingum.

Skilningur á margmiðlun

Margmiðlunargeta DeepSeek kemur úr Janus og Janus-Pro líkönunum, sem samþætta sjónrænan skilning við tungumálalið líkansins. Ólíkt aðferðum sem einungis tengja myndmerki við texta, notar Janus kerfi sem aðskilur sjónræna kóðun. Þetta þýðir að líkanið notar mismunandi leiðir til að greina myndir annars vegar og búa þær til hins vegar, sem byggir á rannsóknar sem sýna að besti skilningur á myndum krefst annars konar úrvinnslu en myndsköpun.

Í ársbyrjun 2026 ræður þessi virkni við að lesa skjöl, greina línurit, skilja skjáskot og svara spurningum um myndir. Við prófanir náði kerfið gögnum úr flóknum fjárhagstöflum, túlkaði læknisfræðilegar skýringarmyndir (með viðeigandi fyrirvara) og greindi drög að notendaviðmóti til að búa til tilheyrandi forritunarkóða. Myndvinnsla styður upplausn allt að 4096x4096p með snjallri klippingu fyrir stærra inntak.

Árangurinn í MMMU prófinu náði 71,3%, sem er á svipuðu ról og hjá GPT-4V og Gemini 1.5 Pro. Hins vegar er myndsköpun enn takmarkaðri en hjá sérhæfðum tólum eins og DALL-E 3 eða Midjourney, og einbeitir sér frekar að tæknilegum teikningum en listrænni sköpun.

Hagnýt notkunardæmi

Hugbúnaðarteymi hafa tekið DeepSeek API í notkun fyrir sjálfvirka kóðun, sérstaklega þar sem kostnaður við GPT-4 er of hár fyrir stór verkefni. Dæmigerð innleiðing felur í sér að nota DeepSeek-V3 til að skrifa kóða og endurbæta hann, og nota svo sjálfvirkar prófanir til að staðfesta gæðin. Fyrirtæki nota API-viðmótið einnig til að búa til dýpstu gögn (documentation) og athugasemdir í kóða. Kostnaðurinn er um það bil einn tíundi af verði GPT-4o, sem gerir fyrirtækjum kleift að nota gervigreind við hverja einustu kóðabreytingu án þess að sprengja fjárhagsáætlunina.

Vísindastofnanir hafa samþætt DeepSeek-R1 í vinnuferla sem krefjast strangrar rökfærslu. Eðlisfræðingar nota líkanið fyrir táknræna stærðfræði og til að sannreyna jöfnur í fræðilegri vinnu. Tölvunarfræðideildir nota R1 til að búa til sannanir í verkefnum sem krefjast formlegrar sannprófunar. Hæfnin til að sýna hugsunarferlið nýtist vel í kennslu, þar sem nemendur sjá mismunandi leiðir að lausn vandamála. Rannsóknarstofur sem vinna með viðkvæm gögn nýta sér einnig möguleikann á að keyra minni útgáfur af líkaninu staðbundið til að uppfylla öryggiskröfur.

Stofnanir sem leggja áherslu á persónuvernd hafa sett upp DeepSeek líkön staðbundið með tólum eins og Ollama. Heilbrigðisfyrirtæki nota staðbundna hýsingu til að vinna úr sjúkraskrám án þess að senda gögn til utanaðkomandi aðila. Lögfræðistofur greina samninga og dómafordæmi algjörlega innanhúss. Fjármálastofnanir nýta kóðunargetuna til að þróa innri tól á meðan þær halda dýrmætum reiknirritum innan síns eigin öryggissvæðis. Þótt minni líkön fórni örlítilli getu miðað við fullu API útgáfurnar, halda þau um 95% af afköstunum í mörgum prófunum á meðan þau keyra á öflugum leikjatölvum.

Vistkerfi líkana og verðlagning

DeepSeek API býður upp á mismunandi útgáfur líkana sem eru fínstillt fyrir ólíka notkun, með verði sem er verulega lægra en hjá vestrænum keppinautum. Öll verð sem hér eru talin upp eiga við í ársbyrjun 2026 og geta breyst.

Heiti líkans	Tegund getu	Verð inntak (milljón tokens)	Verð úttak (milljón tokens)	Skyndiminni (Cache hit)
DeepSeek-V3	Almennt spjall og rökfærsla	$0.14	$0.28	$0.014
DeepSeek-R1	Aukin rökfærsla með CoT	$0.14	$0.28	$0.014
DeepSeek-Chat	Fínstilt fyrir samræður	$0.14	$0.28	$0.014
DeepSeek-Coder-V2	Sérhæfð kóðunarverkefni	$0.14	$0.28	$0.014

Verðmunurinn er sláandi í samanburði við GPT-4o, sem kostar um $2.50 fyrir hvert milljón tákn í inntaki í upphafi árs 2026. Fyrir dæmigert forrit sem vinnur með 100 milljón tákn á mánuði gæti kostnaður hjá DeepSeek verið um 42.000 dollarar á ári samanborið við um 1,25 milljónir dollara hjá GPT-4o. Sértök athygli beinist að verði fyrir skyndiminni, sem er aðeins $0.014, en það gerir tæknilega kleift að minnka kostnað um allt að 90% í verkefnum þar sem sami upplýsingagrunnur er notaður oft í röð.

Ókeypis aðgangur er rausnarlegur fyrir einstaka forritara. Hægt er að fá 500.000 tákn daglega í gegnum vefviðmótið, sem dugar í flest smærri verkefni. API aðgangur krefst stofnunar reiknings og staðfestingar á símanúmeri, en nýir notendur fá yfirleitt um 10 milljón tákn í inneign til að prófa kerfið. Stærri fyrirtæki nota fyrirframgreidda inneign þar sem hægt er að fá magn afslætti ef eyðsla fer yfir ákveðin mörk.

Leiðbeiningar fyrir nýja notendur

Farið á DeepSeek Open Platform á platform.deepseek.com og búið til reikning með tölvupósti. Ferlið krefst staðfestingar í tölvupósti og í flestum tilfellum þarf einnig að staðfesta farsímanúmer með SMS-skilaboðum. Notendur á ákveðnum svæðum gætu þurft að gangast undir frekari skráningu vegna staðbundinna reglna. Skráning tekur yfirleitt örfáar mínútur en tafir geta orðið á staðfestingu símanúmers þegar álag er mikið.
Búið til API-lykil í stjórnborðinu undir hlutanum API Keys. Vettvangurinn styður marga lykla með mismunandi takmörkunum, sem auðveldar að halda prufukeyrslu og raunverulegri notkun aðskildri. Geymið lykilinn á öruggum stað þar sem hann veitir fullan aðgang að inneigninni þinni og ekki er hægt að endurheimta hann ef hann týnist. Stjórnborðið sýará nákvæmar tölfræði og kostnað sem uppfærist á klukkutíma fresti.
Innleiddid API-viðmótið með því að nota sömu söfn og fyrir OpenAI en breytið slóðinni (base URL). DeepSeek er hannað til að vera samhæft við OpenAI Python SDK, þannig að aðeins þarf að breyta base_url í https://api.deepseek.com og setja inn réttan lykil. Kerfi sem þegar nota OpenAI geta skipt yfir með lágmarks fyrirhöfn. API-viðmótið styður svör í rauntíma (streaming), skipanir (function calling) og kerfisaboð með sama hætti og OpenAI.
Notið vefviðmótið eða snjallforrit ef ekki er þörf á tæknilegri innleiðingu. Spjallviðmótið á chat.deepseek.com veitir tafarlausan aðgang sem hentar vel fyrir skrif, rannsóknir og almennar spurningar. Snjallforrit í App Store og Google Play leyfa samstillingu á samtölum á milli tækja. Farsímaupplifunin inniheldur raddstýringu og möguleika á að hlaða upp myndum til greiningar. Ókeypis notendur fá sömu gæði og API notendur nema þegar álag á kerfið er mjög mikið.

Kostir og takmarkanir

Styrkleikar DeepSeek liggja fyrst og fremst í kostnaðarhagkvæmni og sveigjanleika:

API kostnaður sem er um tífalt lægri en hjá GPT-4o gerir nýja tegund forrita mögulega eins og stöðuga kóðagreiningu í rauntíma.
Opinn aðgangur að líkönum og leyfi sem leyfa staðbundna hýsingu mæta kröfum um gagnaöryggi í heilbrigðiskerfi og fjármálum.
Framúrskarandi árangur í tæknilegum prófum eins og HumanEval (85,7%) sýnir að tækið er samkeppnishæft við dýrustu líkön heims.
MIT-leyfi fyrir kóða og rannsóknir auðveldar vísindastarf og þróun nýrra lausna úr grunni DeepSeek án bindandi samninga.
Samhengisgluggi upp á 128k tákn gerir líkaninu kleift að vinna með mjög löng skjöl og heila kóðagrunna án þess að missa þráðinn.
MoE arkitektúrinn gerir keyrslu á hagkvæmari vélbúnaði mögulega miðað við önnur líkön með svipaða getu.

Hins vegar eru nokkur atriði sem þarf að hafa í huga áður en ákvörðun um notkun er tekin:

Upplýsingar um gagnaöryggi og hýsingu í Kína gera það að verkum að fyrirtæki þurfa að fara vel yfir reglugerðir eins og GDPR eða HIPAA.
Innihaldssíun getur takmarkað svör um pólitískt viðkvæm málefni sem tengjast Kína, sem gæti haft áhrif á ákveðna rannsóknarvinnu.
Stöðugleiki netþjóna hefur stundum verið ábótavant þegar ásókn er mikil, sem hefur leitt til niðurtíma eða hægari svara.
Skapandi skrif þykja oft síðri en hjá Claude eða GPT-4, þar sem textinn getur verið formúlukenndari og sögur ekki eins grípandi.
Þjónusta við viðskiptavini fer að miklu leyti fram á kínversku og takmarkað efni er til á ensku eða öðrum tungumálum til aðstoðar.
Stefna um uppfærslur og breytingar á líkönum er ekki eins föst í sessi og hjá stóru vestrænu tæknifyrirtækjunum.

Algengar spurningar

Er DeepSeek ókeypis í notkun?

DeepSeek býður upp á ókeypis aðgang í gegnum vefviðmótið með daglegu hámarki sem dugar flestum í almennri notkun. API-notkun kostar peninga en er mjög ódýr miðað við önnur sambærileg tól. Nýir notendur fá yfirleitt inneign til að byrja með án endurgjalds. Fyrir þá sem þurfa örugga vinnslu og meiri hraða er mælt með því að nota greiddu útgáfuna af API-viðmótinu, en samt er kostnaðurinn áfram mun lægri en hjá öðrum þjónustuaðilum.

Hvernig er DeepSeek-V3 miðað við ChatGPT?

DeepSeek-V3 stendur jafnfætis GPT-4o í flestum staðfestum prófunum en kostar aðeins brot af verðinu í gegnum API. Í forritun er árangurinn sambærilegur eða jafnvel betri í sumum tilfellum. Fyrir flókna rökfærsla býður DeepSeek-R1 upp á svipaða getu og o1-lína OpenAI. ChatGPT hefur þó vinninginn þegar kemur að skapandi skrifum, tengimöguleikum við önnur forrit og öflugri stuðningsþjónustu fyrir stór fyrirtæki.

Get ég keyrt DeepSeek á minni eigin tölvu?

Já, DeepSeek líkönin styðja staðbundna hýsingu í gegnum kerfi eins og Ollama eða vLLM. Meðalútgáfur af líkaninu geta keyrt á öflugum heimilistölvum með góðu skjákorti (svo sem NVIDIA RTX 4090). Þetta er frábær kostur fyrir þá sem vilja algjöra stjórn á sínum gögnum og vilja ekki borga fyrir hverja spurningu, þó svo að það krefjist tækniþekkingar að setja það upp í upphafi.

Er DeepSeek öruggt fyrir fyrirtækjagögn?

Þetta veltur á því hvernig tækið er notað. Ef notað er opinbera API-viðmótið eru gögnin send til netþjóna DeepSeek, sem fylgja þeirra eigin reglum um gagnaöryggi. Fyrir fyrirtæki á Íslandi eða innan Evrópu þarf að skoða vel hvort þetta samræmist GDPR reglugerðinni. Ef fyllsta öryggis er krafist er best að hýsa líkanið á eigin vélbúnaði eða í lokuðu skýjaumhverfi, því þá fara engin gögn út fyrir fyrirtækið.

Hversu mikið textamagn ræður líkanið við í einu?

Bæði V3 og R1 styðja 128.000 tákn, sem samsvarar um 300 til 400 síðum af texta. Þetta þýðir að hægt er að setja inn heilar skýrslur, mörg forritunarskjöl eða mjög löng samtöl án þess að líkanið gleymi því sem kom fram í upphafi. Þó skal hafa í huga að eftir því sem samhengið verður lengra, getur nákvæmnin minnkað lítillega varðandi smáatriði sem voru alveg í byrjun textans.

Hver á DeepSeek?

DeepSeek er þróað af Hangzhou DeepSeek Artificial Intelligence sem er dótturfyrirtæki High-Flyer Capital Management, sem er stór kínverskur vogunarsjóður. Fyrirtækið var stofnað af Liang Wenfeng til að rannsaka hvernig hægt væri að nota gervigreind í fjármálum og tækni. DeepSeek starfar samt sem áður að miklu leyti sem sjálfstæð eining sem gefur út opnar rannsóknir og styðst ekki við hefðbundið vestrænt áhættufjármagn eins og mörg önnur gervigreindarfyrirtæki.

Hvaða forritunarmál styður DeepSeek?

Vettvangurinn styður yfir 80 forritunarmál, þar á meðal Python, JavaScript, C++, Java og Rust með framúrskarandi nákvæmni.