AI Engineering on Learn by Tanhdev

AI Engineering on Learn by Tanhdevhttps://learn.tanhdev.com/tags/ai-engineering/Recent content in AI Engineering on Learn by TanhdevHugoen-usTue, 26 May 2026 08:00:00 +0700Kiến Trúc Hybrid AI & Tự Host vLLM | SLM Playbookhttps://learn.tanhdev.com/series/slm-playbook/part-1-slm-hybrid-architecture/Thu, 21 May 2026 08:00:00 +0700https://learn.tanhdev.com/series/slm-playbook/part-1-slm-hybrid-architecture/Phân tích kinh tế TCO khi tự host mô hình nhỏ (SLM). Tìm hiểu công thức VRAM và thiết lập Hybrid Routing Gateway kết hợp sức mạnh SLM với Frontier LLM.Data Engineering SFT: NEFTune & SemDeDup | SLM Playbookhttps://learn.tanhdev.com/series/slm-playbook/part-2-sft-data-engineering/Fri, 22 May 2026 08:00:00 +0700https://learn.tanhdev.com/series/slm-playbook/part-2-sft-data-engineering/Hướng dẫn kỹ nghệ dữ liệu SFT cho SLM. Tìm hiểu cơ chế toán học NEFTune chống học vẹt và triển khai thuật toán SemDeDup bằng Python để tinh lọc dữ liệu.Thực Chiến QLoRA Fine-tuning: Axolotl & Unslothhttps://learn.tanhdev.com/series/slm-playbook/part-3-lora-qlora-tuning/Sat, 23 May 2026 08:00:00 +0700https://learn.tanhdev.com/series/slm-playbook/part-3-lora-qlora-tuning/Hướng dẫn fine-tune LoRA/QLoRA cho AI. Tìm hiểu lượng tử hóa kép Double Quantization, cấu hình Axolotl YAML và cách tăng tốc 3x bằng Unsloth.Knowledge Distillation: Chắt Lọc Tri Thức DeepSeek-R1https://learn.tanhdev.com/series/slm-playbook/part-4-knowledge-distillation-r1/Sun, 24 May 2026 08:00:00 +0700https://learn.tanhdev.com/series/slm-playbook/part-4-knowledge-distillation-r1/Cách chắt lọc tri thức suy luận (CoT) từ DeepSeek-R1 sang Qwen Coder. Hướng dẫn tạo pipeline dữ liệu synthetic distillation tự động bằng Python.Preference Alignment: Thuật Toán DPO, KTO và GRPOhttps://learn.tanhdev.com/series/slm-playbook/part-5-preference-alignment/Mon, 25 May 2026 08:00:00 +0700https://learn.tanhdev.com/series/slm-playbook/part-5-preference-alignment/Tìm hiểu học tăng cường căn chỉnh LLMs. So sánh DPO, KTO và giải mã thuật toán GRPO của DeepSeek giúp tiết kiệm 50% GPU VRAM do không cần Critic Model.Tối Ưu vLLM Serving: So Sánh AWQ, GPTQ và GGUFhttps://learn.tanhdev.com/series/slm-playbook/part-6-vllm-deployment-evals/Tue, 26 May 2026 08:00:00 +0700https://learn.tanhdev.com/series/slm-playbook/part-6-vllm-deployment-evals/Cẩm nang vận hành SLM trên vLLM. So sánh các định dạng lượng tử hóa AWQ, GPTQ, GGUF và thiết lập cấu hình Dynamic LoRA tiết kiệm RAM GPU hiệu quả.