Model Serving on Learn by Tanhdev

Model Serving on Learn by Tanhdevhttps://learn.tanhdev.com/tags/model-serving/Recent content in Model Serving on Learn by TanhdevHugoen-usTue, 26 May 2026 08:00:00 +0700Tối Ưu vLLM Serving: So Sánh AWQ, GPTQ và GGUFhttps://learn.tanhdev.com/series/slm-playbook/part-6-vllm-deployment-evals/Tue, 26 May 2026 08:00:00 +0700https://learn.tanhdev.com/series/slm-playbook/part-6-vllm-deployment-evals/Cẩm nang vận hành SLM trên vLLM. So sánh các định dạng lượng tử hóa AWQ, GPTQ, GGUF và thiết lập cấu hình Dynamic LoRA tiết kiệm RAM GPU hiệu quả.