Khóa agent lại để dám thả ra
OpenAI cập nhật Agents SDK — không thêm sức mạnh, mà thêm sandbox và harness. Tại sao đây mới là thứ enterprise thật sự cần?
Bụi WireBản cập nhật mà gần như không ai để ý
Bản cập nhật quan trọng nhất của OpenAI từ đầu năm không có model mới, không có benchmark phá kỷ lục, và mạng xã hội lướt qua trong đúng 2 giây.
Tuần trước, OpenAI cập nhật Agents SDK — bộ toolkit để doanh nghiệp xây agent chạy trên model của họ. Điểm nhấn lần này không phải "agent làm được thêm gì" mà là "làm sao để người ta dám bật agent lên production". Plot twist: đôi khi cái doanh nghiệp cần nhất không phải sức mạnh, mà là rào chắn.
Hai thứ mới đáng chú ý: sandbox integration và in-distribution harness.
Sandbox và harness — rốt cuộc là gì?
Nói thẳng ra: sandbox là phòng cách ly. Agent chạy trong đó chỉ truy cập được file và tool mà bạn cho phép — không thể "lỡ tay" xóa database production hay gửi email cho khách hàng lúc 3 giờ sáng. Mỗi agent hoạt động trong một workspace riêng, cô lập hoàn toàn với phần còn lại của hệ thống.
Harness thì cần hình dung khác một chút. Nghĩ về nó như bản tổng phổ trong dàn nhạc — quy định rõ agent (nhạc công) được chơi bài gì, với nhạc cụ nào, trong khuôn khổ nào. In-distribution harness cho phép bạn vừa deploy vừa test agent trên frontier model, ngay trong cùng một workspace. Bạn không cần dựng thêm môi trường staging riêng.
Karan Sharma từ team sản phẩm OpenAI nói rõ: ý tưởng là để người dùng "xây các agent chạy dài hơi (long-horizon) với harness, trên bất kỳ hạ tầng nào họ đang có". Kết hợp sandbox + harness: agent giờ có thể xử lý task phức tạp hơn, nhưng trong một hành lang được kiểm soát chặt.
Kịch bản thật: team 5 người ở Việt Nam đang xây agent xử lý hóa đơn
Giả sử team bạn 5 người, đang xây agent nhận email hóa đơn từ nhà cung cấp, trích xuất dữ liệu, đối chiếu bảng giá nội bộ, rồi tạo phiếu thanh toán.
Trước bản cập nhật: Bạn tự viết lớp permission, tự code logic cô lập file, tự test bằng cách... hy vọng. Agent truy cập được cả thư mục chung của team, và đôi khi nó "sáng tạo" — sửa luôn file template gốc vì nghĩ đó là cách "tối ưu" output.
Sau bản cập nhật: Sandbox giới hạn agent chỉ đọc được email đầu vào + file bảng giá. Harness cho phép bạn chạy thử 50 hóa đơn mẫu, so sánh kết quả agent với kết quả manual, trước khi bật production. Không cần viết boilerplate security — SDK lo phần đó.
Một bước nhỏ trong SDK, nhưng tiết kiệm team bạn có khi cả tuần refactor.
Bẫy mà có sandbox vẫn sập
Mình từng chứng kiến một team hào hứng bật agent lên production sau khi "test kỹ 10 case rồi". Mười case đó đều là happy path — hóa đơn tiếng Việt, format chuẩn, số tiền hợp lý. Agent chạy ngon lành.
Cho đến khi có nhà cung cấp Nhật gửi hóa đơn bằng tiếng Nhật. Agent quyết định classify thành "spam" rồi archive luôn. Hóa đơn 200 triệu nằm im trong thùng rác 3 tuần trước khi kế toán phát hiện.
Bài học: sandbox giữ agent không phá hệ thống — nhưng không giữ agent không phá dữ liệu trong phạm vi nó được phép. Đây là khác biệt quan trọng. Trong dàn nhạc, bản tổng phổ ngăn nhạc công chơi sai bài — nhưng không ngăn họ chơi sai nốt. Bạn vẫn cần eval pipeline riêng, vẫn cần edge case testing, vẫn cần human review ở những điểm quan trọng.
Thử ngay chiều nay
Nếu team bạn đang dùng OpenAI Agents SDK:
- Cập nhật SDK lên version mới nhất — check changelog trên repo chính thức
openai/openai-agents-python - Chọn một workflow đơn giản đang chạy agent (ví dụ: agent tóm tắt email, agent phân loại ticket)
- Bọc nó trong sandbox — config cho agent chỉ truy cập đúng input files cần thiết, không hơn
- Viết 5 edge cases kiểu hay gặp ở Việt Nam: input tiếng lạ, file rỗng, file quá lớn, format Excel thay vì CSV, duplicate record
- Chạy qua harness, so sánh output với kết quả expected — ghi lại mọi sai lệch
Nếu team bạn không dùng OpenAI SDK mà đang xài framework khác? Khái niệm sandbox và harness không phải độc quyền. LangChain có pattern sandbox qua Docker container, CrewAI có cơ chế giới hạn tool access per agent. Ý tưởng cốt lõi giống nhau: cô lập môi trường chạy + đánh giá kết quả có hệ thống trước khi lên production. Như mình đã chia sẻ trong các bài về agent trước — phần khó không nằm ở "làm cho agent chạy", mà ở "dám cho nó chạy thật".
Nhìn lại cho rõ
Bản cập nhật này không sexy. Không có demo "wow" nào để share LinkedIn, không có con số benchmark nào để tranh luận trên Twitter. Nhưng nó giải quyết đúng thứ mà enterprise đang thiếu: niềm tin để triển khai.
Agent ngày càng mạnh — nhưng mạnh mà không kiểm soát được thì doanh nghiệp thà không dùng. Sandbox và harness là câu trả lời thực tế: không hứa hẹn agent hoàn hảo, chỉ đảm bảo khi agent sai thì thiệt hại nằm trong phạm vi chấp nhận được.
Còn nếu bạn đang chờ bản SDK nào đó biến agent thành nhân viên hoàn hảo không cần giám sát — thì chắc bạn cũng đang chờ nhạc công nào tự chơi hay mà chẳng bao giờ cần tập.
---
Bụi Wire — nghiện đọc release notes lúc 2 giờ sáng