<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Data Engineering on Learn by Tanhdev</title><link>https://learn.tanhdev.com/tags/data-engineering/</link><description>Recent content in Data Engineering on Learn by Tanhdev</description><generator>Hugo</generator><language>en-us</language><lastBuildDate>Fri, 22 May 2026 08:00:00 +0700</lastBuildDate><atom:link href="https://learn.tanhdev.com/tags/data-engineering/index.xml" rel="self" type="application/rss+xml"/><item><title>Data Engineering SFT: NEFTune &amp; SemDeDup | SLM Playbook</title><link>https://learn.tanhdev.com/series/slm-playbook/part-2-sft-data-engineering/</link><pubDate>Fri, 22 May 2026 08:00:00 +0700</pubDate><guid>https://learn.tanhdev.com/series/slm-playbook/part-2-sft-data-engineering/</guid><description>Hướng dẫn kỹ nghệ dữ liệu SFT cho SLM. Tìm hiểu cơ chế toán học NEFTune chống học vẹt và triển khai thuật toán SemDeDup bằng Python để tinh lọc dữ liệu.</description></item><item><title>Sự Đứt Gãy Của Naive RAG Và Kỷ Nguyên GraphRAG</title><link>https://learn.tanhdev.com/series/ai-data-engineering-pipeline/executive-summary-graphrag-data-pipeline/</link><pubDate>Sun, 17 May 2026 12:05:00 +0700</pubDate><guid>https://learn.tanhdev.com/series/ai-data-engineering-pipeline/executive-summary-graphrag-data-pipeline/</guid><description>Tổng quan về sự sụp đổ của Naive RAG trong môi trường Enterprise và tại sao GraphRAG cùng một Data Pipeline chuẩn mực là chìa khóa sống còn cho hệ thống AI.</description></item></channel></rss>