RAG | Learn by Tanhdev

Data Ingestion & Atomic Chunking Dữ Liệu Sản Phẩm

Trong Phần 1: The Paradigm Shift - Kiến Trúc Agentic & Sức Mạnh Điều Phối Của Golang, chúng ta đã thiết lập bộ não điều phối (Orchestration Engine) bằng Golang và Eino. Tuy nhiên, một bộ não thông minh đến đâu cũng sẽ trở nên vô dụng nếu nó được tiếp nạp thông tin sai lệch, thiếu cấu trúc hoặc bị cắt vụn. Trong bài toán e-commerce, dữ liệu catalog sản phẩm thay đổi liên tục từng giây: giá cả biến động, tồn kho cập nhật, sản phẩm mới được thêm vào. Đồng thời, việc chia nhỏ (chunking) dữ liệu sản phẩm để đưa vào Vector Database (Qdrant) hoàn toàn khác biệt so với việc chia nhỏ một tài liệu PDF hay một bài báo. ...

Phần 2 — State, Memory & Context Management

Prerequisite: Để nắm vững các khái niệm nền tảng về Memory Architecture trong hệ thống AI, vui lòng xem lại Kiến Trúc Hệ Thống AI-Native Toàn Diện. Sau khi đã giải quyết bài toán giao tiếp giữa các Agent ở Phần 1, chúng ta phải đối mặt với “kẻ thù” lớn nhất của LLM: Giới hạn Context Window. Một Orchestrator giỏi đến mấy cũng vô dụng nếu các Worker Agent quên mất yêu cầu ban đầu của User chỉ sau vài lượt (turns) chạy tool. ...

GraphRAG và Naive RAG: Hướng Dẫn Kiến Trúc Doanh Nghiệp

🇬🇧 Read the English version of this article on tanhdev.com Đại đa số các phương án triển khai RAG (Retrieval-Augmented Generation) đều mang bộ mặt giống nhau: băm tài liệu thành từng mảng nhỏ (chunk), nhồi embedding vào thành vector, quăng vào một cái cơ sở dữ liệu vector (vector database), lôi kéo trích xuất lại thông qua tương quan cosine (cosine similarity), và dồn ép cụm top-K chunk đấy vào cái context LLM. Cú đánh này rất mượt cho mấy dạng câu hỏi đáp Q&A quanh một trang văn bản cỏn con. Nhưng nó lại nát bét 1 cách rập khuôn (systematically) hễ chạm tay vào đống kho tri thức doanh nghiệp cỡ bự, nơi mà mẩu đáp án cho 1 câu hỏi ứ chịu bám dính vào độc 1 cái chunk tài liệu rời rạc, mà vắt cựa dính nhằng nhịt vào những mối dây mơ rễ má liên hệ (relationships) kết chéo chằng chịt hàng tá thực thể (entities) xuyên nhau. ...

Kỹ thuật đặt câu lệnh vs Tinh chỉnh vs RAG — Khung quyết định năm 2026 cho kỹ sư LLM

Tinh chỉnh (Fine-Tuning) vs Kỹ thuật đặt câu lệnh (Prompt Engineering): Cẩm nang quyết định năm 2026

🇬🇧 Read the English version of this article on tanhdev.com Trả lời nhanh (Answer-first): Hãy chọn kỹ thuật đặt câu lệnh (prompt engineering) cho việc thử nghiệm nhanh và các lĩnh vực chung. Triển khai RAG khi ứng dụng của bạn yêu cầu truy xuất thời gian thực từ một cơ sở tri thức được cập nhật thường xuyên. Chỉ áp dụng tinh chỉnh (fine-tuning) QLoRA khi bạn cần định dạng đầu ra nghiêm ngặt, tuân thủ phong cách nhất quán trước các đầu vào độc hại, hoặc cần nén lượng lớn token của câu lệnh. ...

Tech Radar 01/05/2026: Sạp AI-Native Cloud Của DigitalOcean - Rẽ Luồng Inference, Quản Trị Retrieval, kẹp Bãi Chồng Đồ Nghề Agents Tích Hợp

🇬🇧 Read the English version of this article on tanhdev.com Màn bóc tem AI-Native Cloud của tay DigitalOcean hồi 28/04/2026 đéo phải là quả announcement AI infrastructure khổng lồ nhất trong tuần, cơ mà nó dư sức quất danh hiệu rành rọt chóp bu nhất. Thay vì vọc AI y xì đúc như một bãi feature rẻ rách đắp chắp vá vô cái legacy cloud (cloud đồ cổ), tay DigitalOcean xắn tay reorganizing (tái cơ cấu) banh chành nguyên cái platform đặng ôm trọn cái hình hài thực thụ của mớ production AI systems hiện tại: multi-model inference (nhai suy luận đa model), retrieval (móc data), routing (rẽ luồng), state (neo trạng thái), kẹp đống long-running agent workflows (mớ luồng agent cày bừa dai nhách). ...