Доступні моделі та кінцеві точки

Доступні моделі та кінцеві точки

Кінцеві точки DeepSeek API відкривають доступ до п'яти виробничих моделей, кожна з яких оптимізована під конкретні завдання — від звичайного спілкування до спеціалізованої генерації коду. Вибір моделі відбувається через параметр model у запитах до API, де ідентифікатори відповідають шаблону deepseek-{capability}-{version}. Застарілі моделі залишаються доступними протягом 90 днів після виходу нових версій, про що користувачі отримують відповідні сповіщення.

ID моделі Тип Контекст Кращий варіант використання
deepseek-chat-v3 Chat Completion 128K tokens Розмовний ШІ, загальні міркування, діалоги
deepseek-coder-v2 Code Completion 64K tokens Написання коду, дебагінг, документація
deepseek-reasoner Chat Completion 128K tokens Складні задачі, логічні ланцюжки міркувань
deepseek-embed Embeddings 8K tokens Семантичний пошук, RAG, пошук схожості
deepseek-vision-preview Multimodal (Beta) 32K + images Аналіз зображень, OCR, візуальні питання

Кінцева точка /v1/chat/completions обробляє діалогові взаємодії з підтримкою системних інструкцій, багатокрокових діалогів та виклику функцій. Вона працює як з deepseek-chat-v3, так і з deepseek-reasoner, причому остання додає у відповіді явні логічні ланцюжки. Параметри temperature та top_p контролюють випадковість результату, а max_tokens обмежує довжину генерації.

  • Підтримка потокової передачі відповідей через параметр stream для швидкого інтерфейсу.
  • Оптимізація моделей генерації коду для Python, JavaScript, Java, C++ та Go.
  • Повернення 1024-вимірних векторів моделлю ембедінгів для семантичних операцій.
  • Прийом зображень через URL або base64 у мультимодальній моделі vision.

Доступні моделі містять від 7 млрд до 671 млрд параметрів, проте користувачі обирають їх за функціональністю, а не за розміром. DeepSeek Coder V2 демонструє високі результати в тестах HumanEval (88.4% pass@1), тоді як флагманська V3 досягає 87.1% в MMLU для завдань на загальні знання. Усі моделі підтримують режим JSON та виклик функцій для інтеграції зовнішніх інструментів.

Бета-моделі, такі як deepseek-vision-preview, можуть мати вищу затримку та змінювані характеристики під час донавчання. Кінцева точка /v1/models дозволяє програмно перевірити доступність моделей та статус їх виведення з експлуатації. Старі моделі, наприклад deepseek-chat-v2, будуть доступні до березня 2026 року для забезпечення зворотної сумісності, хоча нові інтеграції варто будувати на базі V3.