Architecture

Executive Summary: MCP - Control Plane Của Hệ Sinh Thái AI

Trong chưa đầy hai năm kể từ khi ra mắt, Model Context Protocol (MCP) đã chuyển mình từ một sáng kiến nội bộ của Anthropic thành một tiêu chuẩn công nghiệp mở. Hiện được quản lý bởi Agentic AI Foundation thuộc Linux Foundation, MCP đã và đang định hình lại cách chúng ta thiết kế hệ thống phần mềm. Nếu TCP/IP kết nối các máy tính, REST kết nối các microservices, thì giao thức MCP sinh ra để kết nối trực tiếp các LLM (Large Language Models) và AI Agents với dữ liệu và công cụ của thế giới thực. ...

Phần 1: Protocol Fundamentals & Transport Evolution

Khi Anthropic lần đầu giới thiệu Model Context Protocol (MCP) vào tháng 11 năm 2024, nó giống như một món đồ chơi dành cho các developer chạy Claude Code trên terminal. Nhưng với việc dự án được chuyển giao cho Agentic AI Foundation (thuộc Linux Foundation), MCP đã rũ bỏ mác “vendor-lock-in” để trở thành một chuẩn mở (open standard) thực thụ cho toàn ngành. Để triển khai MCP lên production, trước hết chúng ta phải hiểu rõ cấu trúc lõi và sự tiến hóa trong tầng Network Transport của nó. ...

Phần 4: MCP Gateway Architecture

Trong giai đoạn PoC, kiến trúc MCP thường rất đơn giản: Một Agent kết nối 1-1 với một MCP Server. Tuy nhiên, khi tổ chức của bạn mở rộng hệ sinh thái Agentic, bức tranh sẽ lập tức hỗn loạn. Hãy tưởng tượng bạn có 20 AI Agents khác nhau (Code Review, DevOps, Customer Support…) và 50 MCP Servers (Jira, GitHub, Internal Database, Cloud Provisioning…). Nếu sử dụng kết nối trực tiếp, bạn sẽ có 1000 đường kết nối (N×M connectivity problem). ...

Phần 7: Enterprise Scaling & Governance

Đến bài viết này, bạn đã xây dựng thành công một MCP Server an toàn, có khả năng quan sát (observability), và được bảo vệ bởi Gateway. Nhưng hành trình đưa MCP lên môi trường Enterprise (quy mô hàng trăm teams, hàng nghìn tools) đòi hỏi một lớp năng lực cuối cùng: Governance (Quản trị). Kiến trúc của bạn chỉ thực sự hoàn thiện khi nó khớp nối với mô hình Agentic System Architecture mở rộng. ...

Phần 10: Dạo Quanh ADR — Giải Ngố 24 Quyết Định Kiến Trúc

21 services. 24 quyết định. 3.5 tháng trời cân lên đặt xuống được ghi chép cẩn thận vào các bản Ghi nhận Quyết định Kiến trúc (Architecture Decision Records - ADR). ADR là một tài liệu ngắn gọn gọn gàng trả lời rạch ròi câu hỏi: “Tại sao chúng ta lại cắm đầu chọn phương án X trong khi hai thằng Y và Z cũng ngon lành không kém?” Nếu không có ADR, mọi tri thức kiến trúc (architectural knowledge) sẽ chỉ tồn tại mỏng manh trong đầu các kỹ sư. Lỡ ngày đẹp trời nào đó họ nộp đơn nghỉ việc, mớ tri thức đó cũng đội nón ra đi — và thế là team mới vào tiếp quản sẽ lại cặm cụi đập đi xây lại cái component y chang cái cách mà đội ngũ cũ đã từng hăm hở thử nghiệm rồi vứt sọt rác (tried and rejected). ...

Phần 6: Kỷ Nguyên Của AI Agents - Từ Đọc Hiểu Đến Tự Trị

1. Sự Thoái Trào Của RAG Tĩnh (Static RAG) Trong 5 phần trước, chúng ta đã xây dựng một cỗ máy RAG hoàn hảo: dữ liệu thời gian thực (CDC), bảo mật tuyệt đối, và phân quyền chặt chẽ. Nhưng dù hoàn hảo đến đâu, RAG truyền thống vẫn mắc một điểm yếu chí mạng: Nó chỉ biết “Đọc” và “Nói”, không biết “Làm”. Nếu bạn yêu cầu một hệ thống RAG: “Hãy kiểm tra xem server có đang bị quá tải không, nếu có hãy tự động khởi động thêm 2 server nữa”, nó sẽ hoàn toàn bất lực. RAG là một đường ống tĩnh (Static Pipeline) chạy theo đường một chiều. ...

Phần 7: Agentic Memory - Giải Quyết Lời Nguyền 'Cá Vàng

1. Cú Lừa Của Context Window & Lời Nguyền “Cá Vàng” Nhiều Giám đốc công nghệ (CTO) năm 2024 từng tin rằng: Khi các mô hình như Gemini 1.5 Pro hay Claude 3 ra mắt với Context Window 1-2 triệu tokens, bài toán “trí nhớ” của AI đã được giải quyết. Họ nhồi toàn bộ lịch sử chat, hàng chục file PDF vào mỗi câu prompt và hy vọng AI sẽ tự hiểu bối cảnh. ...

Tối Ưu Hóa Inference & Triển Khai vLLM Trên Production

1. Nút Cổ Chai Của LLM: Tại Sao GPU Vẫn Thất Nghiệp? Sau khi thiết kế xong toàn bộ kiến trúc Agent ở 7 phần trước, đến lúc bạn đưa hệ thống lên Production (chạy thực tế). Mọi start-up đều sớm nhận ra một sự thật cay đắng: Kẻ thù của LLM không phải là Sức mạnh tính toán (Compute), mà là Băng thông bộ nhớ (Memory Bandwidth). Để chạy mô hình Llama-3 70B (chuẩn FP16), bạn cần khoảng 140GB VRAM chỉ để chứa mô hình. Nhưng khi có 100 User cùng gửi prompt, hệ thống phải sinh ra một vùng nhớ tạm gọi là KV Cache để giữ lại bối cảnh của 100 cuộc hội thoại đó. Ngay lập tức, KV Cache phình to ra và ăn cạn bộ nhớ VRAM còn lại. Hệ thống báo lỗi Out-Of-Memory (OOM) và sụp đổ, mặc dù sức mạnh xử lý của GPU lúc đó chỉ mới xài hết 30%. Làm sao để “nhồi” nhiều User hơn vào GPU mà không bị tràn RAM? ...

Quyết định cơ sở dữ liệu khi chuyển đổi Magento: Shared DB vs CDC vs Event Bus — So sánh Kiến trúc

Shared DB, CDC hay Event Bus? Quyết định Cơ sở dữ liệu khi Chuyển đổi Magento

🇬🇧 Read the English version of this article on tanhdev.com Answer-first: Khi chuyển đổi từ Magento sang Golang, bạn có ba chiến lược cơ sở dữ liệu (database): (A) Dùng chung DB (Shared DB) để tối ưu compute ngay lập tức, (B) CDC + Outbox để tách DB dần dần mà không cần đụng vào code PHP, hoặc (C) Tách biệt hoàn toàn bằng Event Bus. Phương án A là một trạng thái chuyển giao tuyệt vời nhưng lại là một trạng thái cuối cùng thảm họa. Phương án B là con đường được khuyến nghị trong ngành công nghiệp cho hầu hết các hệ thống Magento — nó cho phép Go làm chủ schema của riêng mình và làm phẳng cấu trúc EAV mà không yêu cầu PHP Magento phải phát ra dù chỉ một sự kiện nào. Phương án C chỉ khả thi khi đội ngũ Magento của bạn có thể xây dựng và duy trì một hệ thống phát hành sự kiện (event publisher) đáng tin cậy. ...

Orchestrated Saga Pattern với Temporal: Thiết Kế Giao Dịch Phân Tán Bền Bỉ Trong Go

🇬🇧 Read the English version of this article on tanhdev.com Nỗi Đau của Giao Dịch Phân Tán trong Hệ Thống Core Banking Trong kiến trúc Monolith nguyên khối truyền thống, việc đảm bảo tính ACID (Atomicity, Consistency, Isolation, Durability) của một giao dịch tài chính cực kỳ đơn giản. Bạn chỉ cần mở một Database Transaction, thực thi hàng loạt câu lệnh SQL (trừ tiền tài khoản A, cộng tiền tài khoản B, ghi log kiểm toán), và cuối cùng gọi COMMIT. Nếu có bất kỳ lỗi gì xảy ra giữa chừng, bạn gọi ROLLBACK, và database engine sẽ tự động hoàn tác mọi thứ về trạng thái nguyên sơ ban đầu một cách hoàn hảo. ...

Kiến trúc OSRM Shared Memory trên Kubernetes: Cập nhật Bản đồ và Traffic Tức thời với Zero-Downtime

🇬🇧 Read the English version of this article on tanhdev.com Thử Thách Vận Hành OSRM Quy Mô Lớn Trên Kubernetes Khi tự vận hành hệ thống định tuyến OSRM (Open Source Routing Machine) với dữ liệu bản đồ quy mô cực lớn (như toàn bộ bản đồ Bắc Mỹ hoặc Đông Nam Á), bạn sẽ đối mặt với một rào cản vận hành cực kỳ khó chịu: Vấn đề Khởi động nguội (Cold Start Problem). ...

OSRM vs GraphHopper: Đối Chiếu Kiến Trúc và Lựa Chọn Động Cơ Định Tuyến Cho Hệ Thống Giao Vận Lớn

🇬🇧 Read the English version of this article on tanhdev.com Giới thiệu: Khi Nào Bạn Vượt Ngưỡng Cloud Route APIs? Trong giai đoạn đầu xây dựng hệ thống logistics, giao hàng Last-Mile, hoặc gọi xe (ride-hailing), việc sử dụng các dịch vụ đám mây như Google Maps Directions API, HERE Maps API hay Mapbox là lựa chọn an toàn không thể bàn cãi. Chúng cung cấp dự đoán thời gian đến (ETA) cực kỳ chính xác, tài liệu rõ ràng, và quan trọng nhất là bạn không tốn công sức vận hành hạ tầng (zero infrastructure maintenance). ...

Phát triển Go MCP Server với Model Context Protocol Go SDK chính thức

Xây dựng Production Go MCP Servers: Hướng dẫn toàn tập

🇬🇧 Read the English version of this article on tanhdev.com Answer-first: Các Go MCP servers chuẩn production yêu cầu sử dụng thư viện chính thức modelcontextprotocol/go-sdk và tuân thủ các schema JSON nghiêm ngặt. Bởi vì giao thức stdio transport sử dụng luồng standard output (stdout), bạn bắt buộc phải định tuyến tất cả các log nội bộ sang stderr để tránh làm crash ứng dụng client. Trả về các lỗi kiểm chứng dữ liệu (validation errors) dưới dạng lỗi cấp công cụ (tool-level failures) thay vì lỗi hệ thống nhằm duy trì kết nối bền vững. ...

Kubernetes In-Place Pod Resizing: Nâng hạ CPU & Memory Mà Không Cần Restart

🇬🇧 Read the English version of this article on tanhdev.com Answer-first: Tính năng In-Place Pod Resizing (Nâng hạ Pod Tại Chỗ - đã đạt mốc GA ổn định ở Kubernetes v1.35) trao quyền cho bạn thay đổi cấu hình requests/limits của cả CPU và memory (bộ nhớ) trên các containers đang trong quá trình chạy mà chẳng thèm phải restart (khởi động lại) cái pod đó — triệt tiêu hoàn toàn sự gián đoạn của các đợt khởi động lạnh (cold-start disruptions) dành riêng cho nhóm tải việc AI inference (suy luận AI), hệ thống cơ sở dữ liệu (databases), và cả mấy cái khối xử lý mang thuộc tính stateful (cần lưu trạng thái) cứng đầu. Cuốn cẩm nang này sẽ moi móc hết rạch ròi về yêu cầu mấu chốt, hàng mẫu YAML dùng cho production, kiểu tích hợp chung bộ VPA, các nước cờ tối ưu hóa tiền bạc, cùng mấy cái bẫy chết người (gotchas). ...

Go microservices architecture production guide 2026

Kiến trúc Go Microservices: Hướng dẫn Production

Go microservices từ thiết kế domain đến triển khai Kubernetes — gRPC, Dapr, OpenTelemetry, và mô hình GitOps từ một dự án chuyển đổi 21-service thực tế.

Magento development Vietnam hiring guide 2026

Phát triển Magento tại Việt Nam: Cẩm nang Tuyển dụng 2026

Nguồn nhân lực Magento ở Việt Nam rất sâu rộng — nhưng tìm được kỹ sư đủ trình độ xử lý kiến trúc production lại khó hơn nhiều. Các phân khúc chi phí, tín hiệu đánh giá, và khi nào nên chuyển đổi nền tảng.

Golang gRPC Microservices chuẩn Production

🇬🇧 Read the English version of this article on tanhdev.com Tại sao chọn gRPC cho Go Microservices? Answer-first: gRPC chính là sự lựa chọn chuẩn xác dành cho hệ thống Go microservices khi mà bạn đang cần: chức năng tuần tự hóa (serialization) hiệu quả dạng nhị phân (binary-efficient) (Protobuf sở hữu kích thước nhỏ hơn JSON từ 3–10 lần), cơ chế luồng dữ liệu hai chiều (bidirectional streaming) phục vụ cho giao tiếp dữ liệu thời gian thực (real-time data), những bản hợp đồng giao ước mang kiểu dữ liệu chặt chẽ (strongly-typed contracts) trải dài liên tục giữa các dịch vụ, và một ngưỡng độ trễ giao tiếp chéo dịch vụ (inter-service latency) đạt dưới mức một mili-giây. Google, Uber, Netflix, và Square đều dùng gRPC để làm giao thức giao tiếp liên dịch vụ chính yếu (primary inter-service communication protocol) của mình. Cẩm nang này sẽ dìu dắt bạn cách thức xây dựng ra những bộ Go gRPC services đạt tầm production (production-grade) kể từ con số 0 tròn trĩnh. ...

GraphHopper Distance Matrix: Triển khai Routing Engine

🇬🇧 Read the English version of this article on tanhdev.com GraphHopper Distance Matrix Là Cái Gì? Answer-first: GraphHopper distance matrix chính là điểm kết nối /matrix API trực thuộc thư viện tìm đường mã nguồn mở (open-source routing engine) GraphHopper. Nó sẽ thu nạp thông tin tọa độ của N điểm trạm và ói trả về nguyên một ma trận kết quả kích cỡ N×N chứa toàn bộ dữ liệu thời gian di chuyển (tính theo giây) cộng thêm độ dài lộ trình khoảng cách (tính theo mét) rạch ròi bám dựa trên lưới đường xá giao thông thực tế được cung cấp bởi bản đồ OpenStreetMap — tuyệt vời nhất là mọi thứ này sẽ tính phí zero (hoàn toàn miễn phí) khi bạn chọn cách tự mang về nhà cắm điện xài (self-hosted). Thử thách với lượng chạm mốc 100 điểm dừng giao hàng (delivery stops), cỗ máy này dễ dàng xử lý phay vèo toàn vẹn 10,000 cặp lộ trình đôi chỉ trong ngưỡng chớp mắt dưới 50 mili-giây (50ms) dẫu cho chạy tàng tàng trên một con máy chủ ảo VPS hạng bèo. ...

Kiến trúc Composable Banking: Từ Monolith đến Modular Core

🇬🇧 Read the English version of this article on tanhdev.com Answer-first: Cách các ngân hàng thay thế core banking nguyên khối (Temenos, Finacle) bằng kiến trúc composable banking (ngân hàng cấu thành) thông qua việc sử dụng Go microservices, điều phối Saga (Saga orchestration), NewSQL ledgers và mô hình Strangler Fig. Các hệ thống core banking cũ (legacy) được thiết kế trong một thời đại khác. Temenos T24, Finacle và Flexcube đều chia sẻ một giả định chung mang tính quyết định: toàn bộ danh mục sản phẩm của ngân hàng — tiền gửi (deposits), cho vay (lending), thanh toán (payments), tài trợ thương mại (trade finance) — sẽ nằm bên trong một ứng dụng được liên kết chặt chẽ (tightly coupled) duy nhất và một database dùng chung duy nhất. Giả định đó có thể đúng khi ngành ngân hàng di chuyển với tốc độ của con người. Nhưng nó hoàn toàn sụp đổ khi các chu kỳ release (phát hành sản phẩm) cần phải rút ngắn từ vài tháng xuống vài ngày, khi việc cập nhật một engine chống gian lận (fraud engine) không được phép gây rủi ro ngừng hoạt động (outage) cho hệ thống thanh toán, và khi các kỹ sư đang làm việc trên nền codebase COBOL nghỉ hưu nhanh hơn tốc độ họ có thể được thay thế. ...

Mở Rộng MySQL: Read Replicas, Sharding & TiDB

🇬🇧 Read the English version of this article on tanhdev.com Mở rộng MySQL (MySQL scalability) là khả năng gia tăng thông lượng của database — số lượt đọc mỗi giây, số lượt ghi mỗi giây, hoặc khối lượng dữ liệu — mà không cần phải viết lại ứng dụng. Một điểm khác biệt vô cùng quan trọng: scale đọc (read scaling - thêm replicas) và scale ghi (write scaling - sharding hoặc distributed SQL) đòi hỏi các phương pháp tiếp cận kiến trúc hoàn toàn khác nhau. Chọn sai hướng đi sẽ tạo ra technical debt (nợ kỹ thuật) phải mất nhiều tháng mới có thể giải quyết. ...

Kiến trúc Phân tán Tracing Go Microservices (2026)

🇬🇧 Read the English version of this article on tanhdev.com Việc giám sát (Monitoring) các hệ thống Go microservices phức tạp đòi hỏi nhiều thứ hơn là chỉ các file logs độc lập riêng lẻ. Khi một request (yêu cầu) đi xuyên qua các HTTP APIs, luồng sự kiện (event streams) Kafka, và các worker pools bất đồng bộ (asynchronous worker pools), bạn cần một mức độ hiển thị tuyệt đối (absolute visibility) để có thể xác định chính xác các điểm nghẽn độ trễ (latency bottlenecks) cũng như các lỗi thất bại. ...

Kiến Trúc Thuật Toán Giá Bão (Surge Pricing) & Mạng Không Gian

🇬🇧 Read the English version of this article on tanhdev.com Hỏi khí không phải, sao cứ hễ trời ụp cơn mưa, giá xe vọt gấp đôi, hay tới nóc gấp 3? Chả phải có khứa nào ngồi gác chân bóp gõ đổi giá đằng sau cái màn hình đâu. Rặt là 1 cỗ máy xào luồng thời gian thực (Stream Processing engine) khủng khiếp lẩn khuất đang cạp 1 cái thuật toán Giá Bão (surge pricing algorithm) đó. ...

Kiến trúc Microservices Ngân hàng với Go: Mẫu Saga, event sourcing, và sổ cái phân tán

Kiến trúc Microservices Ngân hàng: Go, Saga & Event Sourcing

🇬🇧 Read the English version of this article on tanhdev.com 1. Giới thiệu: Phá vỡ Core Banking truyền thống Trả lời nhanh: Một kiến trúc microservices ngân hàng hiện đại sẽ thay thế các sổ cái nguyên khối cũ (như T24 hoặc Flexcube) bằng cách sử dụng Go để định tuyến giao dịch với thông lượng cao. Hệ thống đạt được tính nhất quán phân tán mà không cần dùng two-phase commit (2PC) bằng cách kết hợp Event Sourcing (luồng sự kiện bất biến của sổ cái), Điều phối Saga (dùng Temporal hoặc Dapr), mẫu Transactional Outbox và ràng buộc unique của PostgreSQL để đảm bảo API luôn idempotent. ...

MySQL Horizontal Scaling: Vitess & GORM Sharding

🇬🇧 Read the English version of this article on tanhdev.com Ngóc mọc lướt Khi ứng dụng của bạn vươn mình chạm ngõ ngóc mọc hàng triệu người dùng, một vọc lướt cỗ máy database ngóc mọc đơn độc (single database instance) lướt sớm muộn rọc vọc mọc cũng sẽ tự mình phình ngóc mọc lướt thành cái bọc cổ chai lướt rọc to ngóc mọc tướng nhất trong trọn ngóc mọc vọc bộ kiến trúc. Hòng rọc vọc đục để lướt vọc mọc giải quyết ngóc vọc mọc, việc vọc lướt rọc ngóc mọc mở rộng quy mô database MySQL (MySQL database scaling) rọc vọc mọc lướt lọt ngóc mọc thành vọc lướt rọc ngóc mọc điều rọc vọc bắt lướt mọc buộc (mandatory). Bạn vọc lướt rọc ngóc mọc phải vọc Bung Rộng DB mọc lướt cho Microservices (Scale DB for Microservices) vọc lướt sài mọc ngóc rọc các kỹ lướt mọc ngóc rọc thuật Horizontal Scaling (Bung Rộng Ngang). ...

Alipay Double 11: Giải Thích Kiến Trúc 583,000 TPS

🇬🇧 Read the English version of this article on tanhdev.com Vào lúc nửa đêm ngày 11 tháng 11, khoảng 1,5 tỷ người trên khắp châu Á đồng loạt mở một ứng dụng duy nhất và bắt đầu chạm vào “Mua ngay”. Trong 60 giây đầu tiên, Alipay xử lý nhiều giao dịch hơn một ngân hàng lớn ở phương Tây xử lý trong cả một ngày. Đỉnh điểm của Ngày Lễ Độc Thân (Singles’ Day) năm 2023 — 583.000 giao dịch thanh toán mỗi giây (TPS) — không chỉ là một tiêu đề báo. Đó là sản phẩm của mười bốn năm tiến hóa kiến trúc đã định nghĩa lại ý nghĩa của từ “sẵn sàng cho production” đối với một nền tảng tài chính. ...

Generative UI với MCP: Thiết Kế Kiến Trúc Frontend AI-Native

🇬🇧 Read the English version of this article on tanhdev.com Thế hệ đầu tiên của giao diện chat tích hợp AI đi theo một mô típ đơn giản: người dùng gõ tin nhắn, LLM tạo văn bản (text), UI hiển thị văn bản đó. Thế hệ thứ hai bổ sung tool calls (lệnh gọi công cụ) — LLM có thể gọi các hàm (functions) và hiển thị kết quả dưới dạng văn bản. Thế hệ thứ ba — Generative UI (UI Sinh Tự Động) — tiến xa hơn thế: LLM không chỉ tạo ra các câu trả lời bằng văn bản mà còn tạo ra các thành phần UI tương tác (interactive UI components) được render (kết xuất) trực tiếp trong trình duyệt, mang đến những trải nghiệm không giống như đang trò chuyện với một khung văn bản mà giống như đang sử dụng một ứng dụng thông minh, phản hồi siêu nhạy. ...

GraphRAG và Naive RAG: Hướng Dẫn Kiến Trúc Doanh Nghiệp

🇬🇧 Read the English version of this article on tanhdev.com Đại đa số các phương án triển khai RAG (Retrieval-Augmented Generation) đều mang bộ mặt giống nhau: băm tài liệu thành từng mảng nhỏ (chunk), nhồi embedding vào thành vector, quăng vào một cái cơ sở dữ liệu vector (vector database), lôi kéo trích xuất lại thông qua tương quan cosine (cosine similarity), và dồn ép cụm top-K chunk đấy vào cái context LLM. Cú đánh này rất mượt cho mấy dạng câu hỏi đáp Q&A quanh một trang văn bản cỏn con. Nhưng nó lại nát bét 1 cách rập khuôn (systematically) hễ chạm tay vào đống kho tri thức doanh nghiệp cỡ bự, nơi mà mẩu đáp án cho 1 câu hỏi ứ chịu bám dính vào độc 1 cái chunk tài liệu rời rạc, mà vắt cựa dính nhằng nhịt vào những mối dây mơ rễ má liên hệ (relationships) kết chéo chằng chịt hàng tá thực thể (entities) xuyên nhau. ...

Kiến Trúc Gọi Xe Thời Gian Thực: Ngăn Xếp Kỹ Thuật Của Uber & Grab

🇬🇧 Read the English version of this article on tanhdev.com Ngay cái giây bạn bật cái app Uber hay Grab lên, 1 thác hệ thống thời gian thực (real-time systems) ồ ạt nổ máy cùng 1 lúc: điện thoại của bạn lăm le nhả tọa độ GPS, cái bản đồ không gian (geospatial index) xào lại vị trí của bạn, 1 cỗ máy ghép kèo (matching engine) soi lại mớ tài xế đang rảnh rỗi quanh đó, 1 mô hình tính tiền (pricing model) rặn ra cái giá mới toanh dựa trên tỷ lệ giành giật (supply-demand ratios), và 1 cái ống phụt tin nhắn (push notification pipeline) lên nòng hòng bắn cái tin chốt kèo tới tay trong vòng dưới 3 giây. ...

Kiến Trúc PayPay: Bung Rộng Hệ Thống Thanh Toán Lên 70 Triệu Users

🇬🇧 Read the English version of this article on tanhdev.com PayPay vừa bấm nút chạy hồi tháng 10 năm 2018 thì đã hốt trọn 10 triệu người dùng chỉ trong vỏn vẹn 3 tháng — cái đà phi mã mà chả có mống fintech Nhật Bản nào từng ngó thấy. Tới tận năm 2025, cái nền tảng này đã cán mốc 70 triệu user đăng ký và cày 7.8 tỷ lượt thanh toán mỗi năm. Chống lưng cho cú vọt mọc đó là 1 đội ngũ kỹ sư ứ những phải còng lưng bung rộng cái dàn hạ tầng của họ, mà còn phải xới tung cả cái văn hóa làm kỹ thuật: từ vụ ốp chuẩn dịch vụ (service standardization) và đẩy code kiểu GitOps (GitOps-driven deployments) cho tới trò chọc phá hệ thống (chaos engineering) và nhúng AI vô để túm bọn lừa đảo (fraud detection). ...

Kiến Trúc Shopee Flash Sale: Ngắt Họng & Redis

🇬🇧 Read the English version of this article on tanhdev.com Điểm đúng boong 0 giờ mùa 11.11, cái rớ con nghiện Shopee tuốt tuột dải Đông Nam Á với Đài Loan đè ngón vô xào chung 1 cái nút bấm nẩy. Độc trong 10 giây nòng châm hỏa (first 10 seconds) của 1 cái mùa săn sale chớp nhoáng (flash sale), 1 cái trang quầy rác (single product page) có thể bị cả triệu mống (millions of concurrent sessions) nã liên thanh — bu xâu nhào zô giành mớ 1,000 nhúm đồ lổn nhổn nhét kho (inventory). Thẩy lố 1 cục (One oversell), đứt bóng 1 cục máy (server crash), hay cái cục kho quẹt chết lâm sàng (database deadlock) lọt chỏm ở khúc đó hất đổ 1 sớ ná thở đâm chọc móc tiền (cascade of chargebacks), rớ con dân nhảy đổng (angry users), dìm mặt ụp bãi rác tờ đầu mốc nhép giang hồ bới (front-page news headlines). ...