DeepSeek 완전 가이드

DeepSeek 소개

2024년 초 공개된 DeepSeek-R1은 강화학습(GRPO)으로 추론 능력을 극대화한 모델로, OpenAI o1과 동등한 수학·코딩·논리 추론 성능을 보여줬습니다. 특히 MIT 라이선스로 완전히 자유로운 상업적 사용이 가능하다는 점이 업계에 큰 충격을 주었습니다.

왜 DeepSeek인가?

MIT 라이선스 — 상업적 사용, 모델 수정, 재배포 완전 자유
추론 특화 — R1은 수학·코딩·논리 문제에서 o1 수준
비용 효율 — V3 학습 비용이 GPT-4 대비 약 1/30 수준
체인-오브-생각 — 응답 전 사고 과정을 명시적으로 출력

모델 라인업

모델	파라미터	VRAM	특징
R1-Distill-Qwen-1.5B	1.5B	2GB	초경량 추론 모델
R1-Distill-Qwen-7B	7B	6GB	로컬 추론용 경량
R1-Distill-Llama-8B	8B	8GB	Llama 기반 Distill
DeepSeek-R1	671B (MoE)	700GB+	풀 추론 모델
DeepSeek-V3	671B (MoE)	700GB+	범용 최고 성능

R1 추론 특징 — Chain-of-Thought

DeepSeek-R1의 가장 독특한 특징은 응답 전에 사고 과정을 명시적으로 출력한다는 점입니다. <think> 태그 안에 단계별 추론 내용이 담깁니다.

# R1 응답 예시
<think>
1부터 100까지 홀수는 1, 3, 5, ..., 99입니다.
홀수의 개수: (99 - 1) / 2 + 1 = 50개
등차수열의 합: n(첫항 + 끝항) / 2 = 50 × (1 + 99) / 2 = 2500
</think>

1부터 100까지 홀수의 합은 **2500**입니다.text

Ollama로 실행

# DeepSeek-R1 경량 (Distill 7B)
ollama run deepseek-r1:7b

# DeepSeek-R1 14B
ollama run deepseek-r1:14b

# DeepSeek-V2.5 (범용)
ollama run deepseek-v2.5bash

DeepSeek 공식 API

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_DEEPSEEK_API_KEY",
    base_url="https://api.deepseek.com",
)

# 추론 모드 (R1)
response = client.chat.completions.create(
    model="deepseek-reasoner",
    messages=[{"role": "user", "content": "9.11과 9.9 중 어느 것이 더 큰가요?"}],
)python

Python 활용 패턴

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

model_id = "deepseek-ai/DeepSeek-R1-Distill-Qwen-7B"
tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto",
)python

성능 비교

모델	AIME 2024 (수학)	Codeforces (코딩)	MMLU
DeepSeek-R1	79.8%	96.3 percentile	90.8%
OpenAI o1	79.2%	96.6 percentile	91.8%
GPT-4o	9.3%	62.6 percentile	88.7%

💡

다른 모델 비교: Llama · Mistral · Gemma