Доступні моделі та кінцеві точки

Кінцеві точки DeepSeek API відкривають доступ до п'яти виробничих моделей, кожна з яких оптимізована під конкретні завдання — від звичайного спілкування до спеціалізованої генерації коду. Вибір моделі відбувається через параметр model у запитах до API, де ідентифікатори відповідають шаблону deepseek-{capability}-{version}. Застарілі моделі залишаються доступними протягом 90 днів після виходу нових версій, про що користувачі отримують відповідні сповіщення.
| ID моделі | Тип | Контекст | Кращий варіант використання |
|---|---|---|---|
| deepseek-chat-v3 | Chat Completion | 128K tokens | Розмовний ШІ, загальні міркування, діалоги |
| deepseek-coder-v2 | Code Completion | 64K tokens | Написання коду, дебагінг, документація |
| deepseek-reasoner | Chat Completion | 128K tokens | Складні задачі, логічні ланцюжки міркувань |
| deepseek-embed | Embeddings | 8K tokens | Семантичний пошук, RAG, пошук схожості |
| deepseek-vision-preview | Multimodal (Beta) | 32K + images | Аналіз зображень, OCR, візуальні питання |
Кінцева точка /v1/chat/completions обробляє діалогові взаємодії з підтримкою системних інструкцій, багатокрокових діалогів та виклику функцій. Вона працює як з deepseek-chat-v3, так і з deepseek-reasoner, причому остання додає у відповіді явні логічні ланцюжки. Параметри temperature та top_p контролюють випадковість результату, а max_tokens обмежує довжину генерації.
- Підтримка потокової передачі відповідей через параметр stream для швидкого інтерфейсу.
- Оптимізація моделей генерації коду для Python, JavaScript, Java, C++ та Go.
- Повернення 1024-вимірних векторів моделлю ембедінгів для семантичних операцій.
- Прийом зображень через URL або base64 у мультимодальній моделі vision.
Доступні моделі містять від 7 млрд до 671 млрд параметрів, проте користувачі обирають їх за функціональністю, а не за розміром. DeepSeek Coder V2 демонструє високі результати в тестах HumanEval (88.4% pass@1), тоді як флагманська V3 досягає 87.1% в MMLU для завдань на загальні знання. Усі моделі підтримують режим JSON та виклик функцій для інтеграції зовнішніх інструментів.
Бета-моделі, такі як deepseek-vision-preview, можуть мати вищу затримку та змінювані характеристики під час донавчання. Кінцева точка /v1/models дозволяє програмно перевірити доступність моделей та статус їх виведення з експлуатації. Старі моделі, наприклад deepseek-chat-v2, будуть доступні до березня 2026 року для забезпечення зворотної сумісності, хоча нові інтеграції варто будувати на базі V3.




