Series

Preference Alignment: Thuật Toán DPO, KTO và GRPO

Huấn luyện tinh chỉnh có giám sát (SFT) là bước đệm đưa tri thức vào mô hình, nhưng nó không dạy mô hình cách xử lý các tình huống phức tạp: Khi nào câu trả lời là an toàn hay độc hại, hoặc làm thế nào để tự nhận lỗi sai và sửa lại trong quá trình suy luận. Để mô hình ngôn ngữ thực sự tương tác thông minh và hữu ích theo ý muốn của con người, chúng ta phải tiến hành bước Căn chỉnh hành vi (Preference Alignment). ...

Phần 4 — Policy-as-Code: Rào Chắn CI/CD Cho Dòng Code AI

Năng suất 10x của AI-Native Developer là một “lời nguyền” nếu hệ thống CI/CD (Continuous Integration / Continuous Deployment) của bạn vẫn chạy ở tốc độ 1x. Khi một Dev dùng Cursor sinh ra 1,500 dòng code trong 10 phút, không một Tech Lead nào đủ sức review thủ công số lượng Pull Request (PR) khổng lồ đó. Hậu quả là: Hoặc PR bị ngâm hàng tuần (tắc nghẽn quy trình), hoặc người duyệt nhắm mắt bấm Approve (tích lũy nợ kỹ thuật). ...

Testing Generative UI & Semantic Caching at Edge

Kiến trúc Generative UI mang lại một chân trời mới về trải nghiệm người dùng, nhưng nó lại là cơn ác mộng tồi tệ nhất của đội ngũ QA (Kiểm thử) và DevOps. Làm thế nào để bạn viết một kịch bản kiểm thử tự động (E2E Test) cho một giao diện mà bạn không biết trước AI sẽ sinh ra nội dung gì? Và làm thế nào để đảm bảo hệ thống không bị “đốt tiền” API khi hàng ngàn user hỏi cùng một câu hỏi? ...

Góc nhìn BOD: Kỳ vọng, Chi phí, Rủi ro Pháp lý & AI Nội bộ

Cho đến giờ, chúng ta đã bàn rất nhiều về AI dưới góc nhìn của Lập trình viên và Tester. Nhưng nếu bước vào phòng họp của Ban Giám Đốc (BOD) hay các Giám đốc Công nghệ (CTO), bạn sẽ thấy một lăng kính hoàn toàn khác. Giới chủ (BOD) không quan tâm bạn dùng AI xịn thế nào, hay prompt dài bao nhiêu. Lăng kính của họ được cấu thành từ 3 biến số sinh tử: Chi phí (Cost), Tốc độ ra mắt (Time-to-Market), và Quản trị Rủi ro (Risk Management). ...

Phần 5: Chuyển đổi Schema EAV — Cái bẫy lớn nhất của Magento

Cấu trúc EAV schema chính là lý do khiến phần lớn các dự án chuyển đổi khỏi Magento chuốc lấy thất bại. Nhìn từ bên ngoài, nó có vẻ dễ xơi: dữ liệu của sản phẩm bị băm ra rải rác ở catalog_product_entity, catalog_product_entity_varchar, catalog_product_entity_int, catalog_product_entity_decimal, catalog_product_entity_datetime, và catalog_product_entity_text. Sáu cái bảng, viết một cái job ETL đơn giản, làm một cuối tuần là xong. Nhưng rồi bạn phát hiện ra rằng attribute_id = 75 mang ý nghĩa “tên sản phẩm” (product name) trong cái database của bạn, nhưng nó lại mang nghĩa “màu sắc” (color) trong cái database trên môi trường staging. Mỗi một mã ID thuộc tính (attribute ID) được sinh ra tự động ngay tại thời điểm cài đặt (install time) và nó hoàn toàn khác biệt giữa các môi trường với nhau. Bất kỳ script ETL nào dám cả gan gán cứng (hardcode) các mã attribute ID này sẽ lập tức đẻ ra một đống dữ liệu rác bẹp dí (corrupted data) khi mang lên chạy ở production. ...

Tối Ưu vLLM Serving: So Sánh AWQ, GPTQ và GGUF

Huấn luyện và căn chỉnh hành vi thành công một mô hình ngôn ngữ nhỏ (SLM) mới chỉ giải quyết được một nửa chặng đường. Trong môi trường doanh nghiệp thực tế, đưa mô hình lên hệ thống phục vụ (Production Serving) đòi hỏi bạn phải giải quyết ba thách thức cực kỳ khắc nghiệt: Lượng truy cập đồng thời lớn (Concurrency), Độ trễ phản hồi thấp (Low Latency) và Chi phí máy chủ tối giản (Compute Cost). ...

Operating Model: Lột Xác Mô Hình Vận Hành Kỷ Nguyên AI

Nếu dạo một vòng LinkedIn hoặc Twitter, bạn sẽ thấy vô số bài viết với những tuyên bố gây sốc: “AI sẽ thay thế QA”, “Product Manager sẽ tự viết code”, hay “1 Dev bây giờ bằng 10 Dev ngày xưa”. Dưới góc nhìn của một Engineering Manager hoặc System Architect, những tuyên bố này vừa thiếu dữ liệu thực tế (Data), vừa làm mất uy tín (Credibility). Trong môi trường Enterprise, việc áp dụng AI không làm biến mất các vai trò, mà nó làm Dịch chuyển Nút thắt cổ chai (Shift the Bottleneck). ...

Generative UI Boilerplate & Strangler Fig Migration

Đây là phần kết luận của series. Mọi lý thuyết kiến trúc tốt nhất cũng chỉ nằm trên giấy nếu chúng ta không có một đường hướng thực thi rõ ràng. Trong phần này, chúng sẽ định nghĩa một cấu trúc mã nguồn mẫu (Reference Repository) và chiến lược áp dụng (Migration Strategy) để đưa Generative UI vào các hệ thống đang hoạt động. 7.1. Cấu trúc thư mục Boilerplate (Astro + Svelte) Để kiến trúc Framework-Agnostic phát huy tối đa sức mạnh, chúng ta chọn Astro làm Orchestrator. Svelte được chọn làm UI framework vì nó biên dịch ra mã Vanilla JS cực nhẹ, không có Virtual DOM overhead như React, hoàn hảo cho các UI Component sinh động. ...

Phần 6: Giai đoạn 1 — Strangler Fig: Di dời Chỉ-đọc (Read-Only) + CDC

Giai đoạn 1 (Phase 1) là giai đoạn an toàn nhất trong toàn bộ cuộc di dời — đó là chủ ý thiết kế (by design). Sẽ không có bất kỳ thao tác ghi (write) dữ liệu nào chạm tới hệ thống microservice mới. Magento vẫn là nguồn sự thật duy nhất (source of truth) cho mọi sửa đổi dữ liệu. Việc duy nhất mà Giai đoạn 1 làm, đó là chứng minh rằng đống microservice của bạn có thể phục vụ các thao tác đọc (read) với tốc độ nhanh hơn và độ ổn định cao hơn Magento. ...

Phần 6 — Chuyển dịch vai trò: Từ Coder đến AI Orchestrator

Ở Phần 5, chúng ta đã thấy Ban Giám Đốc (BOD) đang ráo riết trang bị hệ thống AI nội bộ để ép KPI năng suất. Lúc này, nếu bạn vẫn cố chấp ngồi gõ từng dòng lệnh từ đầu đến cuối, bạn sẽ bị bỏ lại. Để tồn tại, lập trình viên buộc phải vứt bỏ chiếc áo “Coder” để khoác lên mình chiếc áo “AI Orchestrator” (Người chỉ huy AI). ...

Phần 7: Giai đoạn 2 — Ghi Kép (Dual-Write): Dapr PubSub + Xử lý Xung đột

Ở Giai đoạn 1, cả hai hệ thống đều tồn tại song song nhưng chỉ có duy nhất một thằng được phép ghi dữ liệu: Magento. Sang Giai đoạn 2, cả hai hệ thống sẽ cùng thi nhau ghi dữ liệu cùng một lúc (simultaneously). Đây là giai đoạn phức tạp nhất về mặt kỹ thuật — và cũng là nơi mà phần lớn các dự án di dời tự tay làm hỏng (corrupt) dữ liệu của chính mình nếu họ không chuẩn bị sẵn một chiến lược phân xử xung đột (conflict resolution strategy) rõ ràng sòng phẳng. ...

Phần 6 — AI Observability & Evals: Xóa Bỏ 'Điểm Mù' Vận Hành

Rất nhiều kỹ sư trên thị trường hiện nay có thể xây dựng một ứng dụng AI (AI App) trong vòng một ngày cuối tuần. Nhưng số lượng người biết cách Vận hành hệ thống AI trên Production (AI Platform Operations) chỉ đếm trên đầu ngón tay. Sự khác biệt lớn nhất giữa một cái “Demo” và một “Enterprise Platform” nằm ở chữ Observability (Khả năng quan sát/Giám sát). 1. Lỗ Hổng Tử Huyệt (Blind Spots) Của AI Production Khi ứng dụng web truyền thống gặp lỗi (ví dụ: mất kết nối Database), hệ thống sẽ báo mã lỗi 500. Kỹ sư SRE (Site Reliability Engineer) nhìn vào log là biết cách sửa ngay lập tức. ...

System Design: Lãnh địa sinh tồn vô giá của Developer

Dù bạn có kỹ năng Prompt Engineering đỉnh cao đến đâu, sớm muộn gì bạn cũng sẽ va phải một bức tường hiện thực: Viết code tạo ra một tính năng thì dễ, nhưng thiết kế một hệ thống chịu tải hàng triệu user thì vô cùng khó. Trong kỷ nguyên mà AI đang làm thay công việc “gõ phím”, System Design (Thiết kế hệ thống) chính là chiếc phao cứu sinh, là vùng “lãnh địa bất khả xâm phạm” giúp bạn không bị đào thải. ...

Phần 8: Giai đoạn 3 — Chuyển Đổi Hoàn Toàn (Full Cutover): Zero Downtime + ArgoCD GitOps

Giai đoạn 3 (Phase 3) là hồi kết: 100% traffic chuyển hẳn sang hệ thống microservice, Magento chính thức lùi về làm một kho lưu trữ thụ động (passive archive), và toàn bộ nền tảng vận hành hoàn toàn trên các microservice Go thông qua quy trình GitOps. Sẽ không còn bóng dáng của PHP trong những luồng request quan trọng nữa. Và cũng chấm dứt luôn chuỗi ngày phải è cổ ra đóng tiền gia hạn giấy phép (license) cho Magento. ...

Áo Giáp Thép Cho Bề Mặt Tấn Công Mới

Trong nhiều năm, Security Engineer đã quen với việc chống lại các lỗ hổng mang tính tất định (như SQL Injection, XSS, hay tràn bộ đệm). Nhưng sự xuất hiện của Generative AI đã mở ra một Bề mặt tấn công (Attack Surface) hoàn toàn mới mang tính xác suất. Rất nhiều công ty ngây thơ cho rằng: “Bảo mật AI tức là không dán (paste) API Key bừa bãi và không gửi thông tin mật cho ChatGPT”. Đó là tư duy của người dùng cuối (End-user), không phải của một System Architect. Khi bạn cấp cho LLM quyền gọi hàm (Function Calling) và truy cập Database nội bộ, bạn đang mời gọi thảm họa. ...

Xây nền tảng thế nào khi AI làm hết việc cơ bản?

Đến lúc này, chúng ta đã vẽ ra một viễn cảnh tương đối tươi sáng: Lập trình viên thoát khỏi cảnh gõ code nhàm chán, trở thành Kiến trúc sư hệ thống và điều phối AI. Nhưng viễn cảnh này chỉ đúng với Senior Developers — những người đã có sẵn nền tảng chuyên môn vững chắc để thẩm định độ đúng/sai của mã nguồn. Còn với những lập trình viên mới vào nghề (Fresher/Junior), sự xuất hiện của AI lại vô tình tạo ra một cuộc khủng hoảng đào tạo tồi tệ nhất trong lịch sử: Nghịch lý Junior (The Junior Paradox). ...

Phần 9: Transactional Outbox & Saga đảm bảo giao sự kiện

Khi một khách hàng bấm nút đặt hàng trên nền tảng Composable Commerce, có tới 7 sự kiện bắt buộc phải diễn ra theo chuỗi vắt ngang qua 4 service hoàn toàn độc lập: Tạo Đơn hàng (Order created) → Duyệt Thanh toán (Payment authorized) → Giữ chỗ Tồn kho (Stock reserved) → Kích hoạt Giao nhận (Fulfillment triggered) → Bắn Thông báo (Notification sent) → Cộng Điểm thưởng (Loyalty points awarded) → Tạo Mã vận đơn (Shipping label generated). Bất kỳ mắc xích nào trong số này cũng có thể đứt. Mạng có thể rớt. Database có thể sập. Một cái cổng thanh toán (payment gateway) của bên thứ ba có thể bị timeout. ...

Grand Finale: Kiến Trúc Hệ Thống AI-Native Toàn Diện

Từ Bài 1 đến Bài 7, chúng ta đã từng bước lắp ráp các mảnh ghép: Ngữ cảnh, Gateway, Dữ liệu, CI/CD, Quy trình, Giám sát và Bảo mật. Nhưng nếu chỉ dừng lại ở đó, tổ chức của bạn vẫn chỉ đang “gắn thêm” (add-on) AI vào một hệ thống phần mềm cũ kỹ. Đích đến cuối cùng (End-game) của quá trình chuyển đổi là: Quy hoạch lại toàn bộ công ty (và hệ thống Backend) xoay quanh các cỗ máy AI. ...

Phần 9 — Tích hợp LLM: Tư duy xây dựng AI-Native Application

Trong 8 phần trước (từ Phần 1: Sự sụp đổ của “Thợ gõ code” đến Phần 8: Nghịch lý Junior), chúng ta đã mổ xẻ việc dùng AI như một công cụ (Tool) để hỗ trợ lập trình viên (tăng năng suất, test code, xử lý legacy). Nhưng ở phần cuối cùng này, chúng ta sẽ lật ngược lại vấn đề. Nhiệm vụ tối thượng của một Kiến trúc sư Hệ thống (AI-Driven Architect) không chỉ là code nhanh hơn, mà là đưa AI vào làm “trái tim” của chính sản phẩm mà mình đang xây dựng. Chúng ta gọi đó là kiến trúc AI-Native Application. ...

Phần 10: Dạo Quanh ADR — Giải Ngố 24 Quyết Định Kiến Trúc

21 services. 24 quyết định. 3.5 tháng trời cân lên đặt xuống được ghi chép cẩn thận vào các bản Ghi nhận Quyết định Kiến trúc (Architecture Decision Records - ADR). ADR là một tài liệu ngắn gọn gọn gàng trả lời rạch ròi câu hỏi: “Tại sao chúng ta lại cắm đầu chọn phương án X trong khi hai thằng Y và Z cũng ngon lành không kém?” Nếu không có ADR, mọi tri thức kiến trúc (architectural knowledge) sẽ chỉ tồn tại mỏng manh trong đầu các kỹ sư. Lỡ ngày đẹp trời nào đó họ nộp đơn nghỉ việc, mớ tri thức đó cũng đội nón ra đi — và thế là team mới vào tiếp quản sẽ lại cặm cụi đập đi xây lại cái component y chang cái cách mà đội ngũ cũ đã từng hăm hở thử nghiệm rồi vứt sọt rác (tried and rejected). ...

Từ Thợ Gõ Code Thành AI-Driven Engineer

Lời Nói Đầu: Hành Trình Lột Xác Đọc xong 9 bài viết của series này, bạn có thể đang cảm thấy “ngợp” hoặc hoang mang. Đó là cảm giác bình thường khi một tư duy cũ (viết code kiếm tiền) bị phá vỡ. Để chuyển đổi từ một “Thợ gõ code” sang một “AI-Driven Engineer” thực thụ, bạn không thể làm trong một đêm. Dưới đây là Lộ trình 30-60-90 Ngày được thiết kế dưới dạng khung huấn luyện thực chiến. Không lý thuyết suông, chỉ có Action Items (Hành động). ...

Thực Tế Của C10M: Sống Sót Qua Lưu Lượng Khổng Lồ — Tóm Tắt Dành Cho Lãnh Đạo

Bất chấp những tiến bộ vượt bậc của công nghệ điện toán đám mây, các ứng dụng doanh nghiệp đối mặt với sự bùng nổ lưu lượng truy cập (traffic) sớm muộn cũng sẽ đâm sầm vào một bức tường khắc nghiệt: Database và Network layer. Cội nguồn của sự cố không nằm ở phần cứng, mà là ở Architecture (Kiến trúc). Chúng ta thường cố giải quyết bài toán “Hàng triệu Requests mỗi giây” (C10M) bằng cách cứ thế quăng thêm server vào (Vertical/Horizontal Scaling), chỉ để rồi bàng hoàng nhận ra những điểm thắt cổ chai về trạng thái, bão cache stampedes, và tính không nhất quán của dual-write đánh sập cả một hệ thống cluster khổng lồ. ...

Generative UI là gì? Tại sao Chatbot đang thoái trào

Bất chấp cơn sốt LLM, các ứng dụng phần mềm doanh nghiệp tích hợp AI đang đối mặt với một vấn đề lớn: Tỷ lệ giữ chân người dùng (Retention Rate) thấp. Nguyên nhân sâu xa không nằm ở độ thông minh của Model, mà nằm ở lớp Giao diện người dùng (User Interface). Chúng ta đang cố gắng nhồi nhét những công việc nghiệp vụ phức tạp vào một khung chat (Chatbot) chật hẹp, buộc người dùng phải giao tiếp bằng ngôn ngữ tự nhiên thay vì các thao tác đồ họa trực quan. ...