Phần 1: Kiến Trúc Hội Tụ (The Convergence)

1. Lời mở đầu: Chấm Dứt Cuộc Chiến “Vô Nghĩa” Đầu năm 2024, thế giới công nghệ từng nổ ra một cuộc tranh cãi nảy lửa: “Khi LLM có Context Window lên tới 2 triệu token (như Gemini 1.5 Pro), liệu RAG có chết?” Hoặc “Liệu Agentic AI có thay thế hoàn toàn RAG truyền thống?” Đến năm 2026, câu trả lời đã rõ ràng: Không có ai bị giết chết. ...

May 17, 2026 · 5 min · Tuan Anh

GraphRAG và Naive RAG: Hướng Dẫn Kiến Trúc Doanh Nghiệp

Đại đa số các phương án triển khai RAG (Retrieval-Augmented Generation) đều mang bộ mặt giống nhau: băm tài liệu thành từng mảng nhỏ (chunk), nhồi embedding vào thành vector, quăng vào một cái cơ sở dữ liệu vector (vector database), lôi kéo trích xuất lại thông qua tương quan cosine (cosine similarity), và dồn ép cụm top-K chunk đấy vào cái context LLM. Cú đánh này rất mượt cho mấy dạng câu hỏi đáp Q&A quanh một trang văn bản cỏn con. Nhưng nó lại nát bét 1 cách rập khuôn (systematically) hễ chạm tay vào đống kho tri thức doanh nghiệp cỡ bự, nơi mà mẩu đáp án cho 1 câu hỏi ứ chịu bám dính vào độc 1 cái chunk tài liệu rời rạc, mà vắt cựa dính nhằng nhịt vào những mối dây mơ rễ má liên hệ (relationships) kết chéo chằng chịt hàng tá thực thể (entities) xuyên nhau. ...

June 1, 2026 · 27 min · Tuan Anh

Sự Đứt Gãy Của Naive RAG Và Kỷ Nguyên GraphRAG

Nếu bạn đã từng xây dựng một chatbot nội bộ cho công ty bằng cách cắt nhỏ tài liệu (chunking), tạo vector (embedding), và nhét vào Pinecone hoặc Milvus… bạn chắc chắn đã gặp phải cảnh này: User: “Doanh thu quý 3 của sản phẩm A là bao nhiêu, và nó ảnh hưởng thế nào đến chiến lược quý 4?” Bot: (Trả lời ngập ngừng, đưa ra con số của quý 2 năm ngoái, và hoàn toàn mất bối cảnh về chiến lược). ...

May 17, 2026 · 3 min · Tuan Anh