Active RAG & Strict Tool Calling Với Real-time API

Trong Phần 3: Làm Chủ Qdrant Hybrid Search - Giải Bài Toán Semantic và Hard Filters, chúng ta đã xây dựng thành công một engine tìm kiếm Hybrid mạnh mẽ, kết hợp giữa Dense Semantic và Sparse Lexical Search. Tuy nhiên, một hệ thống tìm kiếm e-commerce thực chiến không chỉ đơn thuần là việc lấy ra các văn bản tĩnh từ cơ sở dữ liệu vector. Ví dụ, người dùng hỏi: “Tôi muốn mua tủ lạnh Samsung Inverter 400L có sẵn tại chi nhánh Quận 1 và đang được áp dụng khuyến mãi.” Nếu chỉ dựa vào Vector Database, chúng ta sẽ gặp hai lỗi nghiêm trạng: ...

May 22, 2026 · 9 min · Vesviet Team

Phần 6: Kỷ Nguyên Của AI Agents - Từ Đọc Hiểu Đến Tự Trị

1. Sự Thoái Trào Của RAG Tĩnh (Static RAG) Trong 5 phần trước, chúng ta đã xây dựng một cỗ máy RAG hoàn hảo: dữ liệu thời gian thực (CDC), bảo mật tuyệt đối, và phân quyền chặt chẽ. Nhưng dù hoàn hảo đến đâu, RAG truyền thống vẫn mắc một điểm yếu chí mạng: Nó chỉ biết “Đọc” và “Nói”, không biết “Làm”. Nếu bạn yêu cầu một hệ thống RAG: “Hãy kiểm tra xem server có đang bị quá tải không, nếu có hãy tự động khởi động thêm 2 server nữa”, nó sẽ hoàn toàn bất lực. RAG là một đường ống tĩnh (Static Pipeline) chạy theo đường một chiều. ...

May 17, 2026 · 5 min · Tuan Anh

Generative UI với MCP: Thiết Kế Kiến Trúc Frontend AI-Native

Thế hệ đầu tiên của giao diện chat tích hợp AI đi theo một mô típ đơn giản: người dùng gõ tin nhắn, LLM tạo văn bản (text), UI hiển thị văn bản đó. Thế hệ thứ hai bổ sung tool calls (lệnh gọi công cụ) — LLM có thể gọi các hàm (functions) và hiển thị kết quả dưới dạng văn bản. Thế hệ thứ ba — Generative UI (UI Sinh Tự Động) — tiến xa hơn thế: LLM không chỉ tạo ra các câu trả lời bằng văn bản mà còn tạo ra các thành phần UI tương tác (interactive UI components) được render (kết xuất) trực tiếp trong trình duyệt, mang đến những trải nghiệm không giống như đang trò chuyện với một khung văn bản mà giống như đang sử dụng một ứng dụng thông minh, phản hồi siêu nhạy. ...

June 1, 2026 · 18 min · Tuan Anh