<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Data Engineering on Learn by Tanhdev</title><link>https://learn.tanhdev.com/categories/data-engineering/</link><description>Recent content in Data Engineering on Learn by Tanhdev</description><generator>Hugo</generator><language>en-us</language><lastBuildDate>Mon, 01 Jun 2026 15:20:00 +0700</lastBuildDate><atom:link href="https://learn.tanhdev.com/categories/data-engineering/index.xml" rel="self" type="application/rss+xml"/><item><title>Phần 1: Kiến Trúc Hội Tụ (The Convergence)</title><link>https://learn.tanhdev.com/series/ai-data-engineering-pipeline/part-1-agentic-graphrag-long-context/</link><pubDate>Sun, 17 May 2026 12:00:00 +0700</pubDate><guid>https://learn.tanhdev.com/series/ai-data-engineering-pipeline/part-1-agentic-graphrag-long-context/</guid><description>Khám phá sự hội tụ giữa Agentic RAG (Bộ não), GraphRAG (Trí nhớ) và Long-Context LLMs (2M+ Tokens) trong hệ thống Enterprise AI 2026.</description></item><item><title>Phần 2: Agentic Ingestion &amp; Multimodal Knowledge Graphs</title><link>https://learn.tanhdev.com/series/ai-data-engineering-pipeline/part-2-agentic-ingestion-multimodal/</link><pubDate>Sun, 17 May 2026 12:00:00 +0700</pubDate><guid>https://learn.tanhdev.com/series/ai-data-engineering-pipeline/part-2-agentic-ingestion-multimodal/</guid><description>Giải quyết ác mộng dữ liệu phi cấu trúc (PDF, bảng biểu, hình ảnh, audio) bằng kỹ thuật Agentic Ingestion, ColPali, và Multimodal Knowledge Graphs.</description></item><item><title>Phần 3: Nghệ Thuật Chunking &amp; Semantic Caching</title><link>https://learn.tanhdev.com/series/ai-data-engineering-pipeline/part-3-late-chunking-semantic-caching/</link><pubDate>Sun, 17 May 2026 12:00:00 +0700</pubDate><guid>https://learn.tanhdev.com/series/ai-data-engineering-pipeline/part-3-late-chunking-semantic-caching/</guid><description>Khám phá kỹ thuật Late Chunking, Contextual Retrieval và cách giảm 70% chi phí API LLM thông qua Semantic Caching trong môi trường Enterprise.</description></item><item><title>Phần 4: Streaming CDC &amp; Federated RAG</title><link>https://learn.tanhdev.com/series/ai-data-engineering-pipeline/part-4-streaming-cdc-federated-rag/</link><pubDate>Sun, 17 May 2026 12:00:00 +0700</pubDate><guid>https://learn.tanhdev.com/series/ai-data-engineering-pipeline/part-4-streaming-cdc-federated-rag/</guid><description>Kiến trúc RAG thời gian thực với Streaming CDC (Debezium/Kafka) và giải bài toán GDPR bằng Federated RAG qua Apollo GraphQL.</description></item><item><title>Phần 5: Bảo Mật Enterprise &amp; Data Poisoning</title><link>https://learn.tanhdev.com/series/ai-data-engineering-pipeline/part-5-enterprise-security-data-poisoning/</link><pubDate>Sun, 17 May 2026 12:00:00 +0700</pubDate><guid>https://learn.tanhdev.com/series/ai-data-engineering-pipeline/part-5-enterprise-security-data-poisoning/</guid><description>Phân tích lỗ hổng Indirect Prompt Injection trong RAG và cách thiết lập AI Firewall bằng NVIDIA NeMo Guardrails, Llama Guard.</description></item><item><title>Phần 6: Kỷ Nguyên Của AI Agents - Từ Đọc Hiểu Đến Tự Trị</title><link>https://learn.tanhdev.com/series/ai-data-engineering-pipeline/part-6-rise-of-ai-agents/</link><pubDate>Sun, 17 May 2026 12:00:00 +0700</pubDate><guid>https://learn.tanhdev.com/series/ai-data-engineering-pipeline/part-6-rise-of-ai-agents/</guid><description>Sự dịch chuyển kiến trúc từ RAG tĩnh sang AI Agents tự trị. Tìm hiểu chuẩn giao tiếp MCP, kiến trúc LangGraph và Human-in-the-Loop.</description></item><item><title>Phần 7: Agentic Memory - Giải Quyết Lời Nguyền 'Cá Vàng</title><link>https://learn.tanhdev.com/series/ai-data-engineering-pipeline/part-7-agentic-memory-long-term/</link><pubDate>Sun, 17 May 2026 12:00:00 +0700</pubDate><guid>https://learn.tanhdev.com/series/ai-data-engineering-pipeline/part-7-agentic-memory-long-term/</guid><description>Tại sao Context Window 1 triệu token không phải là bộ nhớ. Giải phẫu kiến trúc Episodic/Semantic Memory với Mem0 và Zep.</description></item><item><title>Tối Ưu Hóa Inference &amp; Triển Khai vLLM Trên Production</title><link>https://learn.tanhdev.com/series/ai-data-engineering-pipeline/part-8-inference-optimization-vllm/</link><pubDate>Sun, 17 May 2026 12:00:00 +0700</pubDate><guid>https://learn.tanhdev.com/series/ai-data-engineering-pipeline/part-8-inference-optimization-vllm/</guid><description>Vượt qua giới hạn VRAM và tối ưu chi phí Server khi triển khai LLM 70B với vLLM, PagedAttention và Quantization FP8/AWQ.</description></item><item><title>Giám Sát &amp; Gỡ Lỗi Luồng Suy Nghĩ Của AI</title><link>https://learn.tanhdev.com/series/ai-data-engineering-pipeline/part-9-agentic-observability-monitoring/</link><pubDate>Sun, 17 May 2026 12:00:00 +0700</pubDate><guid>https://learn.tanhdev.com/series/ai-data-engineering-pipeline/part-9-agentic-observability-monitoring/</guid><description>Phá bỏ &amp;#39;hộp đen&amp;#39; của AI Agents bằng OpenTelemetry, cấu trúc Span phân cấp và kỹ thuật gỡ lỗi xuyên không (Time-Travel Debugging).</description></item><item><title>Phần 10: Production Evals &amp; CI/CD Cho AI</title><link>https://learn.tanhdev.com/series/ai-data-engineering-pipeline/part-10-production-evals-cicd/</link><pubDate>Sun, 17 May 2026 12:00:00 +0700</pubDate><guid>https://learn.tanhdev.com/series/ai-data-engineering-pipeline/part-10-production-evals-cicd/</guid><description>Chấm dứt kỷ nguyên test cảm tính. Xây dựng hệ thống tự động chấm điểm AI (LLM-as-a-judge) và tích hợp cổng chặn CI/CD với GitHub Actions.</description></item><item><title>Kiến Trúc Thuật Toán Giá Bão (Surge Pricing) &amp; Mạng Không Gian</title><link>https://learn.tanhdev.com/posts/surge-pricing-optimization-architecture/</link><pubDate>Mon, 01 Jun 2026 15:20:00 +0700</pubDate><guid>https://learn.tanhdev.com/posts/surge-pricing-optimization-architecture/</guid><description>Mổ xẻ cái dàn kiến trúc của 1 thuật toán Giá Bão (Surge Pricing) thời gian thực. Bươi xem Uber xài cái rổ mạng không gian H3 (H3 spatial index), Kafka, với Flink để nặn ra cái giá nhún nhảy kiểu gì.</description></item><item><title>Sự Đứt Gãy Của Naive RAG Và Kỷ Nguyên GraphRAG</title><link>https://learn.tanhdev.com/series/ai-data-engineering-pipeline/executive-summary-graphrag-data-pipeline/</link><pubDate>Sun, 17 May 2026 12:05:00 +0700</pubDate><guid>https://learn.tanhdev.com/series/ai-data-engineering-pipeline/executive-summary-graphrag-data-pipeline/</guid><description>Tổng quan về sự sụp đổ của Naive RAG trong môi trường Enterprise và tại sao GraphRAG cùng một Data Pipeline chuẩn mực là chìa khóa sống còn cho hệ thống AI.</description></item></channel></rss>