Agent nhà bạn đang đá bóng không trọng tài

Agent nhà bạn đang đá bóng không trọng tài

Khi công ty có hàng chục AI agent mà không ai biết ai làm gì, đã đến lúc cần "ban tổ chức giải đấu" — AWS vừa tung ra một lựa chọn.

Khi sân bóng AI không có ai thổi còi

Phần lớn công ty đang build agent AI đều mắc chung một sai lầm: chỉ lo tuyển cầu thủ mà quên mất cần trọng tài, ban huấn luyện, và cả danh sách đội hình.

Hình dung thế này: team backend build một agent xử lý hoá đơn. Team data science build một agent phân tích sentiment. Team support build một agent trả lời khách hàng. Ba tháng sau, công ty có 30 agent — nhưng không ai biết chính xác agent nào đang chạy, agent nào dùng model gì, và agent nào đang trùng việc với agent khác.

Đây không phải kịch bản giả tưởng — đây là agent sprawl, vấn đề mà bất kỳ tổ chức nào scale agent đều sẽ gặp. Và AWS vừa ra một công cụ để giải quyết nó: Agent Registry, nằm trong bộ Amazon Bedrock AgentCore.

Khoan — chuyện phức tạp hơn "một cái danh sách"

Nghe "registry" thì tưởng chỉ là spreadsheet liệt kê agent. Nhưng ba bài toán đau đầu nhất khi quản lý agent ở quy mô lớn khác hoàn toàn:

Visibility — Bạn có bao nhiêu agent đang chạy? Lấy góc nhìn đội bóng: nếu huấn luyện viên không biết mình có bao nhiêu cầu thủ trên sân, không biết ai đang đá vị trí nào, thì chiến thuật gì cũng vô nghĩa.

Control — Ai được phép "đăng ký cầu thủ mới" cho đội? Không có quy trình duyệt, mỗi bộ phận tự deploy agent riêng, compliance risk tăng theo cấp số nhân.

Reuse — Team A đã build xong agent đọc PDF chất lượng cao, nhưng team B không biết, lại xây từ đầu. Giống CLB mua 5 tiền đạo mà thiếu thủ môn — lãng phí tài nguyên ở chỗ thừa, thiếu ở chỗ cần.

AWS Agent Registry xử lý cả ba bằng cách tạo một catalog trung tâm — nơi mọi agent, tool, MCP server, và agent skill đều được đăng ký metadata, kèm approval workflow, và khả năng discover xuyên suốt tổ chức. Điểm đáng chú ý: registry này index agent bất kể chúng chạy ở đâu — trên AWS, cloud khác, hay on-premises.

Hai kịch bản thực tế đáng suy nghĩ

Kịch bản 1 — Startup fintech, giả sử team 8 người:

Bạn có 3 agent: một agent KYC verify CCCD, một agent phân tích rủi ro tín dụng, một chatbot hỗ trợ khách. Hiện tại mọi thứ quản lý bằng... Notion doc và trí nhớ của anh lead. Khi agent KYC cần upgrade model, không ai nhớ nó đang gọi API nào, version mấy, và chatbot có đang depend vào output của nó không.

Với một registry (dù là AWS hay self-built), mỗi agent có một "hồ sơ cầu thủ" rõ ràng: model nào, input/output schema gì, ai own, status ra sao. Khi cần thay đổi, bạn biết chính xác impact radius.

Kịch bản 2 — Công ty e-commerce, giả sử hơn 40 agent:

Team platform muốn chuẩn hoá: mọi agent mới phải qua review trước khi lên production. Nhưng team marketing tự build agent gửi email promo bằng CrewAI, team logistics dùng LangChain cho agent tracking đơn hàng, team product dùng Bedrock Agent trực tiếp. Ba framework khác nhau, ba cách deploy khác nhau.

Đây chính là lúc một registry framework-agnostic phát huy giá trị — nó không bắt bạn dùng một framework duy nhất, mà đóng vai "ban tổ chức giải đấu" chấp nhận mọi CLB tham gia, miễn là đăng ký đúng quy cách.

Cái bẫy "sưu tập agent"

Có một hiện tượng mà mình gọi là hội chứng sưu tập agent: team cứ build agent mới cho mỗi use case nhỏ, vì build nhanh hơn tìm. Giống cầu thủ cứ phất bóng dài cho thủ môn chạy nhặt, rồi than "sân bận quá, đá không nổi".

Một team mình biết có 12 agent, trong đó 4 cái cùng làm nhiệm vụ "đọc PDF rồi trích xuất thông tin" — mỗi cái do một người viết ở thời điểm khác nhau, dùng cách parse khác nhau (như mình từng chia sẻ trong bài về tài liệu "bất trị", chuyện agent đọc document phức tạp không hề đơn giản). Không ai biết cái nào tốt hơn. Chi phí inference nhân lên một cách vô lý.

Nhưng nói thẳng ra: registry đắt tiền mà không có culture quản lý thì cũng như mua hệ thống VAR mà trọng tài không thèm xem lại. Tool chỉ là điều kiện cần — mindset mới là điều kiện đủ.

Thử chiều nay: kiểm kê trước, registry sau

Trước khi nhảy vào AWS Agent Registry hay bất kỳ platform nào, hãy làm bài tập nền tảng:

  1. Kiểm kê đội hình — Liệt kê tất cả agent đang chạy, kể cả mấy cái "thí nghiệm" mà ai đó quên tắt. Ghi rõ: tên, owner, model sử dụng, mục đích, trạng thái (active / deprecated / thí nghiệm).
  1. Tìm trùng lặp — Hai agent khác team có đang làm cùng một việc không? Có agent nào đang gọi tool mà agent khác đã wrap sẵn?
  1. Chấm điểm mức cần govern — Nếu team dưới 10 agent, một file YAML + review process có thể đủ. Trên 30 agent, multi-team, multi-framework — lúc đó mới nên đánh giá registry chuyên dụng.

Về phía open-source, CrewAILangChain đều có cơ chế tổ chức agent ở mức framework, nhưng chưa ai cung cấp registry cross-framework ngang tầm AWS. Đây là khoảng trống mà cộng đồng open-source có thể lấp — và mình đoán sẽ sớm có project xuất hiện để giải bài toán này. Nếu muốn thử Agent Registry của AWS, nó đang ở preview trong Amazon Bedrock AgentCore — bạn cần tài khoản AWS và enable AgentCore trong console.

Đội hình cần huấn luyện viên, không chỉ cầu thủ

Mình không nghĩ mọi công ty đều cần AWS Agent Registry — nhưng mọi công ty đang vận hành nhiều hơn một nhúm agent đều cần một hình thức quản lý nào đó. Dù là Notion doc, YAML file, hay platform chuyên dụng, điều quan trọng nhất vẫn là: biết mình có gì, ai dùng gì, cái gì nên cho "nghỉ hưu".

Spoiler: không có silver bullet — nhưng có trọng tài trên sân thì trận đấu ít nhất còn đáng xem.

---

Bụi Wire — nghiện đọc release notes lúc 2 giờ sáng

Nguồn tham khảo