RAG (Retrieval Augmented Generation): Tăng độ chính xác AI

RAG = Retrieval (Tìm kiếm) + Augmented (Tăng cường) + Generation (Sinh text)

VẤN ĐỀ CỦA LLM THÔNG THƯỜNG

Hallucination (bịa đặt)
Kiến thức cũ (cutoff date)
Không biết data nội bộ công ty

RAG GIẢI QUYẾT NHƯ THẾ NÀO?

Quy trình:

User hỏi: "Chính sách nghỉ phép?"
Tìm kiếm trong database công ty
Lấy top 5 đoạn văn liên quan
Đưa vào context của LLM
LLM trả lời dựa trên context

TECH STACK

Vector DB: Pinecone, Weaviate, Chroma
Embedding: OpenAI ada-002, Cohere
LLM: GPT-4, Claude
Framework: LangChain, LlamaIndex

CODE EXAMPLE

from langchain import OpenAI, VectorStore

# 1. Embed documents
vectorstore = VectorStore.from_documents(docs)

# 2. Retrieve
relevant_docs = vectorstore.similarity_search(query)

# 3. Generate
llm = OpenAI()
answer = llm(context=relevant_docs, question=query)

KẾT LUẬN

RAG là must-have cho chatbot doanh nghiệp.

RAG (Retrieval Augmented Generation): Tăng độ chính xác AI

VẤN ĐỀ CỦA LLM THÔNG THƯỜNG

RAG GIẢI QUYẾT NHƯ THẾ NÀO?

TECH STACK

CODE EXAMPLE

KẾT LUẬN

Chia sẻ

Nhận tin mới nhất

Bài viết liên quan