Hvað er DeepSeek?

DeepSeek er áberandi vettvangur fyrir gervigreind sem byggir á opnum líkönum og rannsóknarstofa þróuð af Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd. Fyrirtækið er þekkt fyrir mjög skilvirkan Mixtur-of-Experts (MoE) arkitektúr. Vettvangurinn kom fram sem verulegur truflunaraðili í gervigreindariðnaðinum með því að ögra hefðbundnum lögmálum um skölun. Á meðan keppinautar eyddu hundruðum milljóna dollara í að þjálfa þétt líkön, sýndi DeepSeek fram á að nýsköpun í arkitektúr gæti skilað sambærilegri frammistöðu fyrir brot af kostnaðinum. Þessi áhersla á skilvirkni hefur gjörbreytt forsendum iðnaðarins um hvað þarf til að smíða háþróuð mállíkön.
Helstu líkön vettvangsins eru DeepSeek-V3 fyrir almenn verkefni og DeepSeek-R1 fyrir flókna rökfærslu, en þau keppa beint við GPT-4o og Claude 3.5 Sonnet í helstu prófunum. Það sem aðgreinir DeepSeek eru tæknilegar nýjungar eins og Multi-head Latent Attention (MLA) sem dregur úr minnisnotkun við vinnslu, ásamt DeepSeekMoE kerfinu sem virkjar aðeins lítinn hluta af færibreytum fyrir hvert tákn (token). Þetta leiðir til þess að þjálfunarkostnaður var áætlaður um 5,5 milljónir dollara fyrir DeepSeek-V3, samanborið við áætlanir sem fara yfir 100 milljónir dollara fyrir sambærileg vestræn líkön.
Árið 2026 starfar DeepSeek sem alhliða gervigreindarvettvangur sem er aðgengilegur í gegnum margar rásir: vefviðmót, snjallforrit fyrir iOS og Android, og API fyrir forritara með endapunktum sem eru samhæfir við OpenAI. Kóðagrunnur vettvangsins er gefinn út undir MIT-leyfi og líkönin hafa leyfi til almennrar notkunar, sem gerir bæði skýjalausnir og staðbundna hýsingu mögulega. Þetta mætir þörfum fyrirtækja sem vilja tryggja gagnaöryggi og forðast fulla háð einum þjónustuaðila.
Helstu eiginleikar og geta

Háþróuð rökfærsla með DeepSeek-R1
DeepSeek-R1 er svar vettvangsins við o1-línunni frá OpenAI og innleiðir aukna rökfærslu (chain-of-thought) með styrkingarnámi (reinforcement learning). Ólíkt hefðbundnum aðferðum var R1 þjálfað með reiknirritum sem verðlauna líkanið fyrir að leysa verkefni rétt, óháð því hvaða leið er valin. Þetta gerir líkaninu kleift að þróa innra „hugsunarferli“ sem er sýnilegt notandanum, þar sem það kannar margar lausnir áður en lokasvarið er gefið.
Í AIME 2024 stærðfræðiprófinu náði DeepSeek-R1 79,8% skori, sem setti það í hóp fremstu rökfærslulíkana í ársbyrjun 2026. Líkanið sýnir sérstakan styrk í rökfræðilegum ályktunum, formlegum sönnunum og flóknum stærðfræðilegum útreikningum. Við prófanir tókst R1 stöðugt betur upp en staðlaða DeepSeek-V3 líkaninu við verkefni sem krefjast sannprófunar á milliskrefum, þótt það hafi í för með sér meiri tafir vegna hins lengra rökfærsluferlis.
Hæfnin til rökfærslu nýtist einnig við villuleit í kóða, greiningu á flóknum leikjaaðferðum og mat á vísindalegum tilgátum. Notendur geta fylgst með hugsun líkansins í rauntíma, sem gerir það sérstaklega verðmætt fyrir nám og aðstæður þar sem skýring á bak við svarið skiptir jafn miklu máli og svarið sjálft.
Skilvirkni með Mixture of Experts
Arkitektúr DeepSeek-V3 inniheldur samtals 671 milljarð færibreyta, en virkjar aðeins 37 milljarða fyrir hvert tákn við vinnslu. Þetta dreifða virkjunarmynstur er einkennandi fyrir MoE nálgunina: líkanið sendir hvert tákn til lítils hluta sérhæfðra „sérfræðinga“ (expert networks), á meðan meirihluti færibreytanna hvílir. Þessi stýring er lærð við þjálfun og hámarkar hvaða sérfræðingar meðhöndla ákveðnar tegundir inntaks.
Í reynd þýðir þetta vinnsluhraða sem nálgast mun minni líkön. DeepSeek-V3 nær um 60 táknum á sekúndu á stöðluðum GPU vélbúnaði, samanborið við um 20-30 tákn á sekúndu hjá stórum þéttum líkönum eins og LLaMA 3.1 405B. Færri virkar færibreytur þýða einnig minni kröfur um minni við vinnslu, sem gerir það kleift að keyra V3 á 8x80GB GPU uppsetningum á skilvirkan hátt.
Hagræðingin nær einnig til þjálfunarinnar. DeepSeek greindi frá notkun 2,788 milljóna GPU-stunda á H800 flögum fyrir alla V3 þjálfunina. Til samanburðar benda áætlanir í iðnaðinum til þess að þjálfun GPT-4 hafi krafist mun meiri tölvukrafts. Þessi kostnaðarkostur hefur gert það að verkum að vestrænar rannsóknarstofur hafa endurskoðað hönnun sína og kynnt MoE-líkön í kjölfar útgáfu DeepSeek-V3.
Kóðun og stærðfræðileg færni
DeepSeek líkönin sýna framúrskarandi árangur í forritun, þar sem V3 skoraði 85,7% í HumanEval og 75,4% í MBPP í útgáfunni frá janúar 2025. Þessar prófanir mæla getu líkansins til að búa til réttan kóða úr náttúrulegu máli og prófa bæði reiknirit og málfræðilega nákvæmni í mörgum forritunarmálum. Í Codeforces keppnum náði DeepSeek-V3 Elo-stigum sem setja það í hóp efstu 5% mannlegra þátttakenda.
Vettvangurinn styður gerð kóða, útskýringar og endurbætur á yfir 80 forritunarmálum, með sérstaklega góðri frammistöðu í Python, JavaScript, C++, Java og Rust. Í hagnýtum prófunum tókst DeepSeek að breyta eldri Java kóða yfir í nútímalegan Python kóða, búa til heil FastAPI forrit og finna lúmskar villur í samtímaforritun. Samhengisgluggi upp á 128k tákn gerir líkaninu kleift að hafa yfirsýn yfir stóra kóðagrunna og mörg skjöl samtímis.
Á SWE-bench, sem metur líkön á raunverulegum vandamálum af GitHub, leysti DeepSeek-V3 47,8% verkefna. Þetta gerir það samkeppnishæft við GPT-4o og Claude 3.5 Sonnet í raunverulegum hugbúnaðarverkefnum, þó að sérhæfð líkön eins og Claude Sonnet 4.0 geti enn haft forskot í mjög flóknum kerfisbreytingum.
Skilningur á margmiðlun
Margmiðlunargeta DeepSeek kemur úr Janus og Janus-Pro líkönunum, sem samþætta sjónrænan skilning við tungumálalið líkansins. Ólíkt aðferðum sem einungis tengja myndmerki við texta, notar Janus kerfi sem aðskilur sjónræna kóðun. Þetta þýðir að líkanið notar mismunandi leiðir til að greina myndir annars vegar og búa þær til hins vegar, sem byggir á rannsóknar sem sýna að besti skilningur á myndum krefst annars konar úrvinnslu en myndsköpun.
Í ársbyrjun 2026 ræður þessi virkni við að lesa skjöl, greina línurit, skilja skjáskot og svara spurningum um myndir. Við prófanir náði kerfið gögnum úr flóknum fjárhagstöflum, túlkaði læknisfræðilegar skýringarmyndir (með viðeigandi fyrirvara) og greindi drög að notendaviðmóti til að búa til tilheyrandi forritunarkóða. Myndvinnsla styður upplausn allt að 4096x4096p með snjallri klippingu fyrir stærra inntak.
Árangurinn í MMMU prófinu náði 71,3%, sem er á svipuðu ról og hjá GPT-4V og Gemini 1.5 Pro. Hins vegar er myndsköpun enn takmarkaðri en hjá sérhæfðum tólum eins og DALL-E 3 eða Midjourney, og einbeitir sér frekar að tæknilegum teikningum en listrænni sköpun.
Hagnýt notkunardæmi

Hugbúnaðarteymi hafa tekið DeepSeek API í notkun fyrir sjálfvirka kóðun, sérstaklega þar sem kostnaður við GPT-4 er of hár fyrir stór verkefni. Dæmigerð innleiðing felur í sér að nota DeepSeek-V3 til að skrifa kóða og endurbæta hann, og nota svo sjálfvirkar prófanir til að staðfesta gæðin. Fyrirtæki nota API-viðmótið einnig til að búa til dýpstu gögn (documentation) og athugasemdir í kóða. Kostnaðurinn er um það bil einn tíundi af verði GPT-4o, sem gerir fyrirtækjum kleift að nota gervigreind við hverja einustu kóðabreytingu án þess að sprengja fjárhagsáætlunina.
Vísindastofnanir hafa samþætt DeepSeek-R1 í vinnuferla sem krefjast strangrar rökfærslu. Eðlisfræðingar nota líkanið fyrir táknræna stærðfræði og til að sannreyna jöfnur í fræðilegri vinnu. Tölvunarfræðideildir nota R1 til að búa til sannanir í verkefnum sem krefjast formlegrar sannprófunar. Hæfnin til að sýna hugsunarferlið nýtist vel í kennslu, þar sem nemendur sjá mismunandi leiðir að lausn vandamála. Rannsóknarstofur sem vinna með viðkvæm gögn nýta sér einnig möguleikann á að keyra minni útgáfur af líkaninu staðbundið til að uppfylla öryggiskröfur.
Stofnanir sem leggja áherslu á persónuvernd hafa sett upp DeepSeek líkön staðbundið með tólum eins og Ollama. Heilbrigðisfyrirtæki nota staðbundna hýsingu til að vinna úr sjúkraskrám án þess að senda gögn til utanaðkomandi aðila. Lögfræðistofur greina samninga og dómafordæmi algjörlega innanhúss. Fjármálastofnanir nýta kóðunargetuna til að þróa innri tól á meðan þær halda dýrmætum reiknirritum innan síns eigin öryggissvæðis. Þótt minni líkön fórni örlítilli getu miðað við fullu API útgáfurnar, halda þau um 95% af afköstunum í mörgum prófunum á meðan þau keyra á öflugum leikjatölvum.
Leiðbeiningar fyrir nýja notendur

- Farið á DeepSeek Open Platform á platform.deepseek.com og búið til reikning með tölvupósti. Ferlið krefst staðfestingar í tölvupósti og í flestum tilfellum þarf einnig að staðfesta farsímanúmer með SMS-skilaboðum. Notendur á ákveðnum svæðum gætu þurft að gangast undir frekari skráningu vegna staðbundinna reglna. Skráning tekur yfirleitt örfáar mínútur en tafir geta orðið á staðfestingu símanúmers þegar álag er mikið.
- Búið til API-lykil í stjórnborðinu undir hlutanum API Keys. Vettvangurinn styður marga lykla með mismunandi takmörkunum, sem auðveldar að halda prufukeyrslu og raunverulegri notkun aðskildri. Geymið lykilinn á öruggum stað þar sem hann veitir fullan aðgang að inneigninni þinni og ekki er hægt að endurheimta hann ef hann týnist. Stjórnborðið sýará nákvæmar tölfræði og kostnað sem uppfærist á klukkutíma fresti.
- Innleiddid API-viðmótið með því að nota sömu söfn og fyrir OpenAI en breytið slóðinni (base URL). DeepSeek er hannað til að vera samhæft við OpenAI Python SDK, þannig að aðeins þarf að breyta base_url í https://api.deepseek.com og setja inn réttan lykil. Kerfi sem þegar nota OpenAI geta skipt yfir með lágmarks fyrirhöfn. API-viðmótið styður svör í rauntíma (streaming), skipanir (function calling) og kerfisaboð með sama hætti og OpenAI.
- Notið vefviðmótið eða snjallforrit ef ekki er þörf á tæknilegri innleiðingu. Spjallviðmótið á chat.deepseek.com veitir tafarlausan aðgang sem hentar vel fyrir skrif, rannsóknir og almennar spurningar. Snjallforrit í App Store og Google Play leyfa samstillingu á samtölum á milli tækja. Farsímaupplifunin inniheldur raddstýringu og möguleika á að hlaða upp myndum til greiningar. Ókeypis notendur fá sömu gæði og API notendur nema þegar álag á kerfið er mjög mikið.



