DeepSeek 소개
2024년 초 공개된 DeepSeek-R1은 강화학습(GRPO)으로 추론 능력을 극대화한 모델로, OpenAI o1과 동등한 수학·코딩·논리 추론 성능을 보여줬습니다. 특히 MIT 라이선스로 완전히 자유로운 상업적 사용이 가능하다는 점이 업계에 큰 충격을 주었습니다.
왜 DeepSeek인가?
- MIT 라이선스 — 상업적 사용, 모델 수정, 재배포 완전 자유
- 추론 특화 — R1은 수학·코딩·논리 문제에서 o1 수준
- 비용 효율 — V3 학습 비용이 GPT-4 대비 약 1/30 수준
- 체인-오브-생각 — 응답 전 사고 과정을 명시적으로 출력
모델 라인업
| 모델 | 파라미터 | VRAM | 특징 |
|---|---|---|---|
| R1-Distill-Qwen-1.5B | 1.5B | 2GB | 초경량 추론 모델 |
| R1-Distill-Qwen-7B | 7B | 6GB | 로컬 추론용 경량 |
| R1-Distill-Llama-8B | 8B | 8GB | Llama 기반 Distill |
| DeepSeek-R1 | 671B (MoE) | 700GB+ | 풀 추론 모델 |
| DeepSeek-V3 | 671B (MoE) | 700GB+ | 범용 최고 성능 |
R1 추론 특징 — Chain-of-Thought
DeepSeek-R1의 가장 독특한 특징은 응답 전에 사고 과정을 명시적으로 출력한다는 점입니다. <think> 태그 안에 단계별 추론 내용이 담깁니다.
# R1 응답 예시
<think>
1부터 100까지 홀수는 1, 3, 5, ..., 99입니다.
홀수의 개수: (99 - 1) / 2 + 1 = 50개
등차수열의 합: n(첫항 + 끝항) / 2 = 50 × (1 + 99) / 2 = 2500
</think>
1부터 100까지 홀수의 합은 **2500**입니다.text
Ollama로 실행
# DeepSeek-R1 경량 (Distill 7B)
ollama run deepseek-r1:7b
# DeepSeek-R1 14B
ollama run deepseek-r1:14b
# DeepSeek-V2.5 (범용)
ollama run deepseek-v2.5bash
DeepSeek 공식 API
from openai import OpenAI
client = OpenAI(
api_key="YOUR_DEEPSEEK_API_KEY",
base_url="https://api.deepseek.com",
)
# 추론 모드 (R1)
response = client.chat.completions.create(
model="deepseek-reasoner",
messages=[{"role": "user", "content": "9.11과 9.9 중 어느 것이 더 큰가요?"}],
)python
Python 활용 패턴
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
model_id = "deepseek-ai/DeepSeek-R1-Distill-Qwen-7B"
tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
model_id,
torch_dtype=torch.bfloat16,
device_map="auto",
)python
성능 비교
| 모델 | AIME 2024 (수학) | Codeforces (코딩) | MMLU |
|---|---|---|---|
| DeepSeek-R1 | 79.8% | 96.3 percentile | 90.8% |
| OpenAI o1 | 79.2% | 96.6 percentile | 91.8% |
| GPT-4o | 9.3% | 62.6 percentile | 88.7% |