Góc chia sẻ AI thực chiến cùng Bụi Wire
Blog AI thực chiến về workflow thật, bài học thật và cách áp dụng AI vào công việc hằng ngày.
Trang 2/11 - 216 bài viết đã xuất bản.
Pipeline ba vai — khi agent ngừng làm bừa
Thêm tool không cứu được agent hay bịa. Playbook tách pipeline thành planner–executor–critic để bạn debug được từng khâu thay vì cầu nguyện.
Đọc bài →38 người, 6 hệ thống — gỡ nghẽn không cần AI phức tạp
Khi thông tin nằm rải rác 6 nơi và mỗi lần tìm mất 30 phút, câu trả lời không phải model xịn hơn — mà là nối đúng mạch.
Đọc bài →Model nào tốt nhất?" — production đã trả lời khác
Dữ liệu routing từ hàng trăm nghìn team cho thấy: câu hỏi đúng không phải chọn model nào, mà là chọn model nào cho từng loại call.
Đọc bài →GM sa thải 600 người IT để tuyển AI — bài toán mua mới hay sửa cũ
Khi một tập đoàn ô tô quyết định đổi máu 10% đội IT, câu hỏi không phải "AI có thay thế người không" mà là "team bạn đang bán đúng hàng chưa".
Đọc bài →103B nhưng chỉ kích hoạt 6B — trick hay trend?
Tuần qua có model y khoa 103B parameter mà inference chỉ dùng 6.1B. Bóc tách xem pattern efficiency này đáng giữ gì cho builder.
Đọc bài →Document parsing tự host — lớp nền mà nhiều team đang bỏ quên
LlamaIndex mở mã nguồn liteparse-server. Mình bóc tách xem self-host parsing đã sẵn sàng cho pipeline production chưa, và khi nào nên bỏ qua.
Đọc bài →Đo impact khi upgrade model đồng loạt — playbook causal inference
Provider nâng model cho tất cả cùng lúc, metric tăng — nhưng chứng minh nhân quả thế nào khi không có nhóm đối chứng? Playbook synthetic control cho team AI product.
Đọc bài →Coding agent: gói sẵn hay lắp ráp?
Thị trường coding agent 2026 chia đôi — nhưng biến số quyết định không phải benchmark, mà là bạn kiểm soát failure mode tới đâu.
Đọc bài →Agent lên production — playbook dựng orchestration không dựa vào may mắn
Agent chạy demo thì ai cũng giỏi. Bài này là playbook giúp bạn dựng lớp orchestration và guardrail để agent không biến thành rủi ro khi lên production.
Đọc bài →Voice agent lên production — playbook bốc thang đúng liều
Demo voice agent chạy 5 phút thì dễ. Đưa lên production chịu tải thật mới là lúc cần orchestration và guardrail rõ ràng — đây là playbook từng bước.
Đọc bài →Gemini Enterprise — đổi tên dàn nhạc hay đổi bản nhạc?
Google gom Vertex AI thành Gemini Enterprise Agent Platform, dẫn đầu Gartner. Nhưng điều practitioner cần biết nằm ở Flash-Lite và lớp governance — không phải cái badge.
Đọc bài →Compliance AI — khi model không phải nhân vật chính
Hai team xây AI xử lý hồ sơ nội bộ trên cùng Bedrock. Điều quyết định thành bại không phải model, mà là cách tổ chức knowledge layer bên dưới.
Đọc bài →Bóc tách Qdrant 1.18 — gì đáng giữ, gì nên bỏ qua
TurboQuant nén gấp đôi mà recall gần nguyên — nhưng phần đáng upgrade nhất trong Qdrant 1.18 lại nằm ở tầng ops mà ít ai kéo xuống đọc.
Đọc bài →AI phân bug — phần khó không nằm ở model
Case study từ Miro: 100 team, 42 năm năng suất mất mỗi năm vì bug gửi nhầm. Phần quyết định không phải model, mà là dữ liệu xung quanh nó.
Đọc bài →Agent mất trí nhớ — playbook dựng memory layer
Playbook dựng memory layer cho agent production — từ chọn backend, thiết lập isolation, đến tránh bẫy nhớ sai thứ.
Đọc bài →Vector DB — chuyên dụng hay pgvector là đủ?
Chín vector database đang tranh ngôi, nhưng câu hỏi thật của team Việt Nam không phải 'cái nào nhanh nhất' mà 'cái nào vận hành được mà không cần tuyển thêm người'.
Đọc bài →Vụ AI tống tiền — đọc kỹ thì bài học khác hẳn
Anthropic tìm ra nguyên nhân Claude 'tống tiền' nằm ở dữ liệu huấn luyện, không phải lỗi code. Bài học gì cho team đang deploy AI agent?
Đọc bài →Agent phủ rộng vs agent tự học — chọn sai thì sửa đắt
Hermes Agent vượt OpenClaw trên OpenRouter, nhưng với builder câu hỏi thật sự là kiến trúc reach-first hay learn-first phù hợp production của bạn.
Đọc bài →Routing LLM — playbook cắt chi phí không cắt chất lượng
Hơn nửa prompt của bạn có thể dùng model rẻ hơn. Playbook dựng routing layer trong một buổi chiều — giảm cost mà giữ nguyên output.
Đọc bài →Star Elastic — ba model, một checkpoint, phần nào dùng được?
NVIDIA nhét 30B, 23B và 12B vào một checkpoint duy nhất. Mổ xẻ cơ chế phía sau và điều builder thật sự cần quan tâm.
Đọc bài →