AI 오픈소스 모델 가이드

DeepSeek 완전 가이드

👥 방문자 수

중국 AI 스타트업 DeepSeek의 오픈소스 모델. DeepSeek-R1은 체인-오브-생각 추론으로 OpenAI o1과 동등한 성능을, DeepSeek-V3는 GPT-4o 수준의 범용 성능을 제공합니다.

DeepSeek-R1 (추론) DeepSeek-V3 (범용) MIT License 671B MoE
🧪 실전 예제 보기 → ← TestForge 홈으로

DeepSeek 소개

2024년 초 공개된 DeepSeek-R1은 강화학습(GRPO)으로 추론 능력을 극대화한 모델로, OpenAI o1과 동등한 수학·코딩·논리 추론 성능을 보여줬습니다. 특히 MIT 라이선스로 완전히 자유로운 상업적 사용이 가능하다는 점이 업계에 큰 충격을 주었습니다.

왜 DeepSeek인가?

모델 라인업

모델파라미터VRAM특징
R1-Distill-Qwen-1.5B1.5B2GB초경량 추론 모델
R1-Distill-Qwen-7B7B6GB로컬 추론용 경량
R1-Distill-Llama-8B8B8GBLlama 기반 Distill
DeepSeek-R1671B (MoE)700GB+풀 추론 모델
DeepSeek-V3671B (MoE)700GB+범용 최고 성능

R1 추론 특징 — Chain-of-Thought

DeepSeek-R1의 가장 독특한 특징은 응답 전에 사고 과정을 명시적으로 출력한다는 점입니다. <think> 태그 안에 단계별 추론 내용이 담깁니다.

# R1 응답 예시
<think>
1부터 100까지 홀수는 1, 3, 5, ..., 99입니다.
홀수의 개수: (99 - 1) / 2 + 1 = 50개
등차수열의 합: n(첫항 + 끝항) / 2 = 50 × (1 + 99) / 2 = 2500
</think>

1부터 100까지 홀수의 합은 **2500**입니다.text

Ollama로 실행

# DeepSeek-R1 경량 (Distill 7B)
ollama run deepseek-r1:7b

# DeepSeek-R1 14B
ollama run deepseek-r1:14b

# DeepSeek-V2.5 (범용)
ollama run deepseek-v2.5bash

DeepSeek 공식 API

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_DEEPSEEK_API_KEY",
    base_url="https://api.deepseek.com",
)

# 추론 모드 (R1)
response = client.chat.completions.create(
    model="deepseek-reasoner",
    messages=[{"role": "user", "content": "9.11과 9.9 중 어느 것이 더 큰가요?"}],
)python

Python 활용 패턴

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

model_id = "deepseek-ai/DeepSeek-R1-Distill-Qwen-7B"
tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto",
)python

성능 비교

모델AIME 2024 (수학)Codeforces (코딩)MMLU
DeepSeek-R179.8%96.3 percentile90.8%
OpenAI o179.2%96.6 percentile91.8%
GPT-4o9.3%62.6 percentile88.7%
💡
다른 모델 비교: Llama · Mistral · Gemma