핵심 기술 사양

DeepSeek의 기술적 토대는 단순한 파라미터 확장이 아닌 아키텍처 효율성에 집중되어 있습니다.
| 사양 | 세부 정보 |
|---|---|
| 개발사 | DeepSeek-AI (Hangzhou DeepSeek Artificial Intelligence) |
| 출시일 | 2023년 최초 출시, 2025년 1월 V3 및 R1 주요 업데이트 |
| 아키텍처 | Mixture-of-Experts (MoE) 및 Multi-head Latent Attention (MLA) |
| 컨텍스트 윈도우 | 128,000 토큰 (DeepSeek-V3 및 R1) |
| 배포 옵션 | 웹 인터페이스, REST API, 모바일 앱, 로컬 배포 (Ollama, vLLM 등) |
| 라이선스 | MIT 라이선스 (코드) / 맞춤형 상업 라이선스 (모델 가중치) |
| 가격 모델 | 무료 티어 (웹 채팅) / 토큰 기반 종량제 (API) |
주요 기능 및 성능

DeepSeek-R1을 통한 고도화된 추론
DeepSeek-R1은 순수 강화 학습을 통해 확장된 사고 체인(chain-of-thought) 추론을 구현함으로써 OpenAI의 o1 시리즈에 대응하는 모델입니다. 전통적인 지도 미세 조정 방식과 달리 R1은 추론 경로와 관계없이 문제를 올바르게 해결했을 때 모델에 보상을 주는 RL 알고리즘을 사용하여 학습되었습니다. 이를 통해 모델은 최종 답변을 내놓기 전 여러 해결 전략을 탐색하는 내부 사고 과정을 출력 창에 명시적으로 보여줄 수 있습니다.
2026년 초 기준으로 DeepSeek-R1은 AIME 2024 수학 벤치마크에서 79.8%의 점수를 기록하며 최상위권 추론 모델로 자리매김했습니다. 이 모델은 다단계 논리 연역, 형식적 정리 증명, 복잡한 수학적 유도에서 특히 강력한 성능을 발휘합니다. 테스트 과정에서 R1은 중간 단계의 검증이 필요한 문제에서 표준 DeepSeek-V3를 지속적으로 능가했으나 확장된 추론 과정으로 인해 레이턴시가 다소 높게 나타나는 특성을 보였습니다.
이러한 추론 능력은 수학을 넘어 코드 디버깅, 전략적 게임 분석, 과학적 가설 평가로 확장됩니다. 사용자는 모델이 생성하는 추론 추적을 실시간으로 관찰할 수 있으며 이는 교육용 애플리케이션이나 최종 답변만큼이나 과정의 설명 가능성이 중요한 시나리오에서 특히 유용합니다.
Mixture of Experts 구조의 효율성
DeepSeek-V3의 아키텍처는 총 6,710억 개의 파라미터로 구성되어 있지만 추론 시 토큰당 370억 개의 파라미터만 활성화합니다. 이 희소 활성화 패턴은 MoE 방식의 결정적인 특징으로 모델이 각 토큰을 전문화된 전문가 네트워크의 소그룹으로 라우팅하고 나머지 파라미터는 휴면 상태로 유지하는 방식입니다. 라우팅 메커니즘 자체는 학습 중에 최적화되어 어떤 전문가가 어떤 유형의 입력을 처리할지 결정합니다.
실제 사용 측면에서 이는 훨씬 작은 고밀도 모델에 필적하는 생성 속도로 이어집니다. DeepSeek-V3는 표준 GPU 구성에서 초당 약 60토큰의 속도를 기록하는데 이는 LLaMA 3.1 405B와 같은 모델이 초당 20~30토큰을 기록하는 것과 비교됩니다. 활성 파라미터 수가 적다는 것은 추론 중 메모리 요구 사항이 낮다는 것을 의미하며 V3는 8x80GB GPU 설정에서 효율적으로 실행될 수 있습니다.
효율성 이득은 학습 단계에서도 나타납니다. DeepSeek는 V3의 사전 학습 및 사후 학습을 포함한 전체 과정에 H800 칩 기준 278만 GPU 시간을 사용했다고 발표했습니다. 업계에서 추정하는 GPT-4의 연산 요구량과 비교하면 이는 획기적인 수준입니다. 이러한 비용 우위는 서구권 AI 연구소들이 아키텍처 선택을 재고하게 만들었으며 V3 출시 이후 여러 MoE 기반 모델이 발표되는 계기가 되었습니다.
코딩 및 수학적 숙련도
DeepSeek 모델은 프로그래밍 작업에서 탁월한 성능을 보여주며 2025년 1월 릴리스 기준으로 HumanEval에서 85.7%, MBPP에서 75.4%를 기록했습니다. 이 벤치마크는 자연어 설명에서 기능적으로 올바른 코드를 생성하는 능력을 측정하며 다양한 프로그래밍 언어에 걸친 알고리즘 사고와 구문 정확도를 테스트합니다. Codeforces와 같은 경쟁 프로그래밍 챌린지에서 DeepSeek-V3는 인간 참가자의 상위 5%에 해당하는 Elo 레이팅을 달성했습니다.
이 플랫폼은 Python, JavaScript, C++, Java, Rust를 포함한 80개 이상의 언어에 대해 코드 생성, 설명 및 리팩토링을 지원합니다. 실제 테스트에서 DeepSeek은 기존 Java 코드베이스를 asyncio 패턴을 사용하는 현대적 Python 코드로 변환하거나 사양서로부터 전체 FastAPI 애플리케이션을 생성하는 복잡한 작업을 수행했습니다. 128k 토큰 컨텍스트 윈도우 덕분에 대규모 코드베이스 작업을 할 때 여러 파일 간의 의존성을 동시에 파악하는 능력이 뛰어납니다.
실제 GitHub 이슈 해결 능력을 평가하는 SWE-bench에서 DeepSeek-V3는 검증된 하위 집합 문제의 47.8%를 해결했습니다. 이는 실무 소프트웨어 엔지니어링 작업에서 GPT-4o 등과 대등하게 경쟁할 수 있음을 보여주지만 가장 복합적인 리포지토리 수준의 변경 작업에서는 Claude Sonnet 4.0과 같은 특화 모델이 여전히 우위를 점하고 있습니다.
멀티모달 이해 능력
DeepSeek의 멀티모달 기능은 Janus 및 Janus-Pro 모델 시리즈에서 비롯되며 시각적 이해를 언어 모델 아키텍처와 통합합니다. 단순히 이미지 임베딩을 텍스트 토큰과 결합하는 방식과 달리 Janus는 이해 작업과 생성 작업을 위한 별도의 경로를 통해 이미지를 처리하는 분리형 시각 인코딩 시스템을 구현합니다. 이는 이미지 분석과 생성에 필요한 최적의 표현 방식이 서로 다르다는 연구 통찰을 반영한 결과입니다.
2026년 초 현재 멀티모달 기능은 문서 이해, 차트 분석, 스크린샷 이해 및 시각적 질의응답을 처리합니다. 테스트 결과 시스템은 복잡한 금융 테이블에서 구조화된 데이터를 정확히 추출하고 의료 도표를 해석하며 UI 목업을 분석해 구현 코드를 생성했습니다. 시각적 프로세싱은 최대 4096x4096 픽셀의 이미지를 지원하며 대형 입력물의 경우 지능형 크로핑 및 타일링 기능을 제공합니다.
MMMU 벤치마크에서 DeepSeek의 멀티모달 성능은 71.3%에 도달하여 GPT-4V 및 Gemini 1.5 Pro와 경쟁 가능한 범위에 들어섰습니다. 다만 이미지 생성 능력은 DALL-E 3나 Midjourney와 같은 특화 모델에 비해 제한적이며 주로 기술 도표나 시각화 작업에 초점이 맞춰져 있습니다.
DeepSeek 모델 생태계 및 가격

DeepSeek API는 용도에 최적화된 여러 모델 변체를 제공하며 서구권 경쟁사보다 훨씬 낮은 가격 구조를 갖추고 있습니다. 아래 명시된 모든 가격은 2026년 기준이며 플랫폼 규모에 따라 변경될 수 있습니다.
| 모델명 | 역량 유형 | 입력 가격 (1M 토큰당) | 출력 가격 (1M 토큰당) | 캐시 히트 가격 |
|---|---|---|---|---|
| DeepSeek-V3 | 일반 채팅 및 추론 | $0.14 | $0.28 | $0.014 |
| DeepSeek-R1 | CoT 기반 확장 추론 | $0.14 | $0.28 | $0.014 |
| DeepSeek-Chat | 대화 최적화 | $0.14 | $0.28 | $0.014 |
| DeepSeek-Coder-V2 | 특화 코딩 작업 | $0.14 | $0.28 | $0.014 |
2026년 초 기준으로 100만 입력 토큰당 약 $2.50, 출력 토큰당 $10.00를 부과하는 GPT-4o와 비교하면 가격 우위는 극명합니다. 월 1억 토큰을 처리하는 일반적인 애플리케이션의 경우 DeepSeek를 사용하면 연간 비용이 약 42,000달러인 반면 GPT-4o는 약 125만 달러가 소요됩니다. 특히 캐시 히트 가격인 100만 토큰당 $0.014는 대규모 정적 프롬프트나 지식 베이스를 가진 애플리케이션에서 비용을 최대 90%까지 추가로 절감할 수 있게 해줍니다.
무료 티어는 개인 개발자와 연구자에게 넉넉한 혜택을 제공하며 웹 인터페이스를 통해 매일 50만 토큰을 지원합니다. API 액세스를 위해서는 계정 생성 및 전화번호 인증이 필요하며 신규 계정에는 초기 테스트를 위한 약 1,000만 토큰의 무료 크레딧이 제공됩니다. 상용 배포는 주로 선불 크레딧 방식으로 운영되며 월 지출이 10,000달러를 초과하는 경우 볼륨 할인이 적용됩니다.
플랫폼 시작하는 방법

- DeepSeek Open Platform 웹사이트에 접속하여 이메일 인증을 통해 계정을 생성합니다. 등록 과정에는 이메일 확인과 대부분의 지역에서 요구되는 SMS 휴대폰 번호 인증이 포함됩니다. 특정 관할권의 사용자는 지역 규정 준수 요건으로 인해 추가 인증 단계를 거칠 수 있으며 트래픽이 몰리는 시간에는 인증 지연이 발생할 수 있습니다.
- 대시보드의 API Keys 섹션에서 API 키를 생성합니다. 플랫폼은 개발 및 운영 환경을 분리할 수 있도록 속도 제한 및 지출 한도를 설정할 수 있는 멀티 키 기능을 지원합니다. 생성된 키는 계정 잔액에 대한 모든 권한을 가지므로 안전하게 보관해야 하며 분실 시 복구가 불가능합니다. 대시보드에서는 모델별 토큰 소비량과 시간별 비용 분석 데이터를 확인할 수 있습니다.
- 기본 URL 엔드포인트를 수정하여 OpenAI 호환 클라이언트 라이브러리를 통해 API를 통합합니다. DeepSeek는 OpenAI Python SDK와의 호환성을 유지하므로 base_url 파라미터를 https://api.deepseek.com으로 설정하고 API 키를 제공하기만 하면 됩니다. 기존에 OpenAI를 사용하던 코드베이스는 최소한의 수정만으로 마이그레이션이 가능하며 스트리밍 응답, 함수 호출, 시스템 메시지 설정 등을 동일하게 지원합니다.
- 비기술적 용도의 경우 웹 인터페이스나 모바일 애플리케이션을 통해 직접 접속합니다. chat.deepseek.com 채팅 인터페이스는 별도의 통합 과정 없이 즉시 사용할 수 있어 콘텐츠 초안 작성이나 연구 보조에 적합합니다. App Store 및 Google Play에서 제공되는 모바일 앱은 대화 기록 동기화와 음성 입력 기능을 지원합니다. 무료 티어 사용자도 API 사용자와 동일한 품질의 대화를 나눌 수 있으나 서버 부하가 극심한 경우에만 제한이 적용됩니다.
자주 묻는 질문
DeepSeek는 무료로 사용할 수 있나요?
DeepSeek는 웹 채팅 인터페이스를 통해 매일 약 50만 토큰의 무료 액세스를 제공하며 이는 개인적 연구에 충분한 양입니다. API 사용은 토큰 소비에 따라 비용이 발생하며 2026년 기준 100만 입력 토큰당 $0.14가 부과됩니다.
DeepSeek-V3는 ChatGPT와 어떻게 다른가요?
DeepSeek-V3는 성능면에서 GPT-4o와 대등하면서도 API 비용은 약 10분의 1 수준입니다. ChatGPT가 창의적 글쓰기와 플러그인에 강점이 있다면, DeepSeek는 비용 효율성과 로컬 배포 옵션에서 우위를 점합니다.
DeepSeek를 로컬에서 실행할 수 있나요?
네, Ollama, vLLM 등을 통해 로컬 배포를 지원합니다. 8비트 양자화 모델은 소비자용 GPU인 RTX 4090 등에서도 원활하게 작동하며 데이터 프라이버시를 완벽히 확보할 수 있습니다.
기업 데이터 보안에 안전한가요?
API 데이터는 모델 개선에 쓰일 수 있으므로 민감한 정보를 다루는 기업은 오픈 웨이트 모델을 온프레미스에 로컬 배포하는 방식이 권장됩니다.
컨텍스트 윈도우 크기는 어느 정도인가요?
DeepSeek-V3 및 R1은 128,000 토큰의 컨텍스트 윈도우를 지원하여 약 300~400페이지 분량의 텍스트를 한 번에 처리할 수 있습니다.
DeepSeek의 소유주는 누구인가요?
DeepSeek는 중국의 퀀트 헤지펀드인 High-Flyer Capital Management가 자금을 지원하는 항저우 딥시크 인공지능 기초 기술 연구소에서 운영합니다.
DeepSeek API는 OpenAI와 호환되나요?
네, OpenAI Python SDK와 호환되므로 base_url만 수정하면 전환이 가능할 만큼 호환성이 뛰어납니다.
R1 모델의 '사고 과정'은 무엇인가요?
DeepSeek-R1은 최종 답변 전에 논리적 해결 전략을 탐색하는 사고 과정을 출력하며, 이는 특히 복잡한 수학이나 추론 작업에서 유용합니다.
모바일 앱도 지원하나요?
네, iOS 및 Android용 모바일 앱을 제공하며 대화 기록 동기화와 음성 입력 기능을 지원합니다.
API 결제 방식은 어떻게 되나요?
주로 선불 크레딧 방식으로 운영되며, 신규 계정에는 일정량의 무료 크레딧이 제공됩니다.



