Fine-tuning LLM 2025: Khi nào cần, chi phí và cách làm
Lập Trình

Fine-tuning LLM 2025: Khi nào cần, chi phí và cách làm

Kid Nihon
21 tháng 12, 2025
5 phút đọc
0 lượt xem
#NestJS #Lập trình

Fine-tuning là quá trình "dạy lại" LLM để phù hợp với use case cụ thể của bạn.

KHI NÀO CẦN FINE-TUNING?

✅ NÊN fine-tune khi:

  • Cần output theo format cực kỳ cụ thể (JSON schema phức tạp)
  • Domain knowledge đặc thù (y tế, luật, tài chính)
  • Cần giảm latency (model nhỏ hơn, nhanh hơn)
  • Cần giảm chi phí (dùng model nhỏ thay vì GPT-4)

❌ KHÔNG cần fine-tune khi:

  • Prompt engineering đủ tốt
  • RAG giải quyết được vấn đề
  • Chỉ cần general knowledge

SO SÁNH CHI PHÍ

Model Training Cost Inference Cost
GPT-4 Fine-tune $0.08/1K tokens $0.12/1K tokens
GPT-3.5 Fine-tune $0.008/1K tokens $0.012/1K tokens
Llama 2 (Self-hosted) GPU cost Free

Ví dụ: Fine-tune GPT-3.5 với 10,000 examples = ~$80

QUY TRÌNH FINE-TUNING

1. Chuẩn bị data:

[
  {"messages": [
    {"role": "system", "content": "Bạn là chuyên gia tư vấn luật"},
    {"role": "user", "content": "Hợp đồng lao động có hiệu lực bao lâu?"},
    {"role": "assistant", "content": "Theo Bộ luật Lao động 2019..."}
  ]},
  ...
]

Số lượng: Tối thiểu 50 examples, tối ưu 500-1000.

2. Upload & Train:

import openai

# Upload file
file = openai.File.create(
  file=open("training_data.jsonl"),
  purpose='fine-tune'
)

# Start fine-tuning
openai.FineTuningJob.create(
  training_file=file.id,
  model="gpt-3.5-turbo"
)

Thời gian: 10 phút - 2 giờ (tùy data size).

3. Evaluate:

  • Test trên validation set
  • So sánh với base model
  • Đo accuracy, F1-score

FINE-TUNING LLAMA 2 (OPEN SOURCE)

Ưu điểm:

  • Miễn phí inference
  • Kiểm soát hoàn toàn
  • Privacy (data không rời server)

Nhược điểm:

  • Cần GPU mạnh (A100, H100)
  • Phức tạp hơn OpenAI

Tech stack:

  • Framework: Hugging Face Transformers, Axolotl
  • Technique: LoRA, QLoRA (giảm VRAM)
  • Hardware: RunPod, Lambda Labs (thuê GPU)

KẾT LUẬN

Fine-tuning không phải lúc nào cũng cần. Hãy thử Prompt Engineering + RAG trước!

Chia sẻ

Nhận tin mới nhất

Cập nhật AI & Tech hàng tuần

Bài viết liên quan