Клучни карактеристики и способности

Напредно расудување со DeepSeek-R1
DeepSeek-R1 претставува одговор на платформата на серијата o1 на OpenAI, имплементирајќи проширено chain-of-thought расудување преку чисто засилено учење (reinforcement learning). За разлика од традиционалните пристапи со надгледувано фино подесување, R1 е обучен првенствено со користење на RL алгоритми кои го наградуваат моделот за правилно решавање проблеми без оглед на патот на расудување. Ова му овозможува на моделот да развие внатрешни процеси на „размислување“ видливи во излезот, каде што истражува повеќе стратегии пред да се одлучи за конечен одговор.
Ефикасност преку Mixture of Experts
Архитектурата на DeepSeek-V3 опфаќа вкупно 671 милијарда параметри, но активира само 37 милијарди параметри по токен за време на инференцијата. Оваа ретка шема на активација е дефинирачка карактеристика на Mixture-of-Experts пристапот. DeepSeek-V3 постигнува приближно 60 токени во секунда на стандардни GPU конфигурации.
Програмирање и математичка стручност
Моделите на DeepSeek покажуваат исклучителни перформанси во задачи за програмирање, со резултат на V3 од 85.7% на HumanEval. Платформата поддржува над 80 програмски јазици.
Мултимодално разбирање
Мултимодалните способности на DeepSeek произлегуваат од сериите модели Janus и Janus-Pro, кои го интегрираат визуелното разбирање со јадрото на јазичниот модел.