Plot twist từ Replit's Amjad Masad on the Cursor deal, fighting Apple, and why he'd rather not sell | TechCrunch: không như bạn nghĩ đâu
Bụi Wire tổng hợp từ 3 nguồn — bớt hype, thêm thực tế.
Bụi WireBài toán
Mỗi tuần có một model mới ra đời, giống như mỗi tuần có một quán phở mới mở. Vấn đề không phải quán nào ngon nhất, mà là quán nào gần nhà, hợp túi tiền, và không bị đau bụng. Hôm nay mình review đồ mới ra lò.
Các lựa chọn
Mình đọc Replit's Amjad Masad on the Cursor deal, fighting Apple, and why he'd rather not sell | TechCrunch xong thì nghĩ: à, cái này đang cháy hàng — và quan trọng hơn, nó thuộc dạng cần thêm thời gian test cho team đang chạy production.
Meta buys robotics startup to bolster its humanoid AI ambitions | TechCrunch — nghe tên thì bình thường, nhưng đọc kỹ thì thấy tín hiệu đáng để ghé mắt. Mức độ áp dụng? Cần thêm thời gian test, nếu bạn đã có sẵn infra cơ bản.
Cái hay của Legal AI startup Legora hits $5.6B valuation and its battle with Harvey just got hotter | TechCrunch không phải ở marketing copy, mà ở phần changelog — tín hiệu đang chưa rõ trend, khả năng thực tế: cần thêm thời gian test.
Ví dụ cụ thể: Khi GPT-5 ra mắt, đừng vội chuyển hết pipeline sang. Hãy chạy eval set cũ trước, so sánh cost per 1K tokens, rồi mới quyết định migrate từng phần. Nói đơn giản: đừng đổi xế giữa đường cao tốc.
Tradeoff
Mỗi bản phát hành model nên được nhìn như một thay đổi vận hành: ảnh hưởng tới eval set, rủi ro sai lệch và chi phí suy luận.
- Bước 1: Khoanh một use-case có tác động cao và dữ liệu đủ sạch để chạy thử trong phạm vi nhỏ.
- Bước 2: Đặt baseline trước khi thử: thời gian xử lý, chất lượng đầu ra, tỉ lệ lỗi vận hành.
Open-source radar
Dù cụm nguồn này không thuần open-source, mình vẫn khuyên: luôn có plan B bằng stack mở. Vendor lock-in giống thuê nhà không có hợp đồng — lúc cần dọn thì mới biết đau.
Khuyến nghị
Bẫy số 1: FOMO — thấy tool mới là nhảy vào, chưa kịp master tool cũ. Kết quả: team biết 10 tool, giỏi 0 tool.
Bẫy số 2: Đánh giá tool bằng demo, không bằng production load. Demo nào chẳng đẹp — hãy hỏi: nó chạy thế nào khi 100 người dùng cùng lúc vào lúc 9 giờ sáng thứ Hai?
Rủi ro còn lại
Khuyến nghị cuối: đừng tối ưu cho cảm giác yên tâm; hãy tối ưu cho quyết định có thể bảo vệ được.
---
Bụi Wire — nghiện đọc release notes lúc 2 giờ sáng