TL;DR

Codex hoạt động theo 3 tier điều khiển khác nhau, mỗi tier dành cho một loại tác vụ cụ thể. Computer Use dùng cho ứng dụng desktop không có API. Chrome Extension dùng cho web cần đăng nhập. Built-in Browser dùng cho frontend development. Ưu tiên plugin hoặc MCP server trước - visual control là phương án cuối cùng.

3 cách Codex điều khiển máy tính: Computer Use, Chrome Extension và Built-in Browser

Tại sao cần đến 3 phương pháp?

Trong bản cập nhật lớn tháng 4/2026 mang tên "Codex for (almost) everything", OpenAI nâng cấp Codex từ một coding agent đơn thuần thành một control surface rộng hơn nhiều. Jason - thành viên đội phát triển Codex - vừa đăng hướng dẫn làm rõ sự khác biệt giữa 3 phương pháp và khi nào nên dùng cái nào.

Vấn đề cốt lõi là: không phải task nào cũng có API. Một số ứng dụng chỉ có giao diện đồ họa. Một số trang web yêu cầu session đăng nhập. Một số tác vụ frontend cần render trực tiếp và lặp lại nhanh. Ba tier này được thiết kế để xử lý chính xác những kịch bản đó - và Codex tự chọn tier phù hợp, hoặc bạn có thể gọi trực tiếp bằng @Computer, @Chrome, @Browser.

Computer Use - Rộng nhất, nhưng chậm nhất

Computer Use cho phép Codex nhìn màn hình, click chuột, gõ bàn phím - giống y như người dùng thật. Nó có thể điều khiển Spotify, Xcode, cài đặt hệ thống, iOS Simulator, thậm chí iPhone Mirroring. Đây là phương pháp duy nhất hoạt động được với ứng dụng không có API.

Đánh đổi là tốc độ. Trong khi plugin có thể gọi API trực tiếp, Computer Use phải quét giao diện từng bước, tìm nút bấm, đợi phản hồi, xác nhận kết quả. Chậm hơn nhiều so với các tier còn lại.

Ví dụ thực tế: Gói hàng bị đánh cắp. Amazon thông báo chờ 25 phút để kết nối với customer support. Jason cấu hình Codex check cửa sổ chat 5 phút một lần, chuyển sang 1 phút/lần khi có nhân viên xuất hiện, và tự hoàn tất quy trình hoàn tiền. Jason đi tắm. Khi quay lại, tiền đã về tài khoản.

Sự khác biệt lớn giữa Mac và Windows

Đây là điểm quan trọng cần nắm rõ trước khi dùng:

  • macOS: Codex chạy nền (background) hoàn toàn - nhiều agent song song, mỗi agent có cursor riêng, bạn vẫn làm việc bình thường trên máy. Ra mắt tháng 4/2026.

  • Windows: Codex chiếm foreground - nó di chuyển con trỏ của bạn, gõ vào ứng dụng, và bạn không thể dùng máy trong thời gian đó. Ra mắt ngày 29/5/2026 (version 26.527).

Với Windows, có giải pháp thay thế: để máy không khóa và kết nối internet, rồi dùng ChatGPT mobile app (iOS/Android) làm remote control - theo dõi tiến trình và gửi lệnh từ điện thoại.

Lưu ý: Computer Use chưa có ở EEA, UK và Thụy Sĩ do các vấn đề pháp lý đang được xử lý.

Chrome Extension - Giữ nguyên trạng thái đăng nhập

Chrome Extension cho phép Codex dùng session Chrome thật của bạn - bao gồm cookies, trạng thái tài khoản, và các tab đang mở. Đây là lựa chọn cho Gmail, LinkedIn, Salesforce, hay bất kỳ dashboard nội bộ nào yêu cầu đăng nhập.

Điểm khác biệt quan trọng so với Computer Use: trong khi Computer Use chỉ nhận diện tọa độ màn hình, Chrome Extension hiểu browser-level context - DOM thật, tab groups, session state. Nó cũng có thể điều khiển nhiều tab cùng lúc: đọc thông tin ở tab này, so sánh ở tab kia, thực hiện action ở tab thứ ba.

Ví dụ thực tế: Mỗi ngày, Codex tự động check Twitter DMs qua Chrome, duyệt tin liên quan, thu thập feedback và lưu nội dung có giá trị vào file local. Không gửi tin nhắn nào. Hoàn toàn tự động trong nền.

So sánh 3 phương pháp điều khiển của Codex: phạm vi, tốc độ và use case

Bảo mật và quyền riêng tư

Chrome Extension yêu cầu quyền truy cập rộng: page debugger, lịch sử duyệt web trên mọi thiết bị đăng nhập, tab groups, downloads. Một số lưu ý quan trọng:

  • Mặc định, Codex hỏi xác nhận trước khi tương tác với domain mới (allowlist/blocklist)

  • Lịch sử trình duyệt: elevated risk, không có tùy chọn "always allow" - phải approve từng request

  • OpenAI chỉ lưu dữ liệu khi nó vào Codex context (screenshots, text Codex đọc từ trang), không lưu toàn bộ session

  • Rủi ro prompt injection: trang web độc hại có thể nhúng text để hijack lệnh của Codex

  • Chỉ hỗ trợ Google Chrome, không hỗ trợ Edge, Brave hay Arc

Tóm lại: research, duyệt web, soạn thảo có thể tự động hóa an toàn. Nhưng các thao tác như gửi tin, publish, thanh toán - nên để bạn tự xác nhận thủ công.

Built-in Browser - Sandbox cho developer

Built-in Browser nằm trong chính conversation thread của Codex, nơi bạn và Codex cùng nhìn vào một trang web được render. Không có login state, không cookies, không extensions - môi trường hoàn toàn cô lập.

Tuy nghe có vẻ hạn chế, nhưng đây lại là lợi thế cho developer. Built-in Browser phù hợp nhất với: local dev server, file preview, trang web công khai không cần đăng nhập, kiểm tra responsive layout, và reproduce visual bugs.

Tính năng đượ yêu thích nhất - Annotation Mode: Bật Annotation Mode lên, click thẳng vào một element trên trang đang render và để lại comment như "Layer này bị đảo ngược" hoặc "Spacing của nút này lệch". Codex dùng screenshot và DOM context của đúng element đó để sửa code, sau đó mở lại trang để bạn review round tiếp theo. Hiệu quả hơn nhiều so với việc chụp màn hình, dán vào chat, giải thích bằng chữ.

Developer Mode cho phép Codex truy cập toàn bộ Chrome DevTools Protocol (CDP): profile JavaScript, inspect DOM, theo dõi network traffic, đọc console output. Admin có thể tắt feature này bằng cấu hình browser_use_full_cdp_access = false trong requirements.toml.

Chọn phương pháp nào?

Jason tóm tắt gọn như sau:

  • Cần login state trên web (Gmail, LinkedIn, Salesforce, internal dashboard) - dùng Chrome Extension

  • Cần điều khiển ứng dụng desktop hoặc workflow không có API - dùng Computer Use

  • Đang phát triển frontend, cần preview và lặp nhanh - dùng Built-in Browser

  • Đã có plugin hoặc MCP server xử lý được task - ưu tiên dùng cái đó trước, visual control là phương án cuối cùng

Bạn không cần chọn thủ công trong hầu hết trường hợp - Codex tự phân tích ngữ cảnh và chọn tier phù hợp. Nhưng hiểu rõ sự khác biệt giúp bạn viết prompt chính xác hơn và tránh những kỳ vọng sai (ví dụ: đừng dùng Computer Use cho task web khi Chrome Extension nhanh hơn nhiều).

Kết

Với bản cập nhật từ tháng 4 đến tháng 5/2026, Codex đã hoàn thiện hệ thống 3 tier điều khiển: Computer Use (OS level), Chrome Extension (web có auth), và Built-in Browser (dev sandbox). Mỗi tier bù đắp điểm yếu của tier còn lại, tạo thành một coverage gần như toàn diện cho workflow của developer. macOS vẫn đang dẫn trước Windows về tính năng chạy nền, nhưng Windows đã bắt kịp về cơ bản.

via OpenAI Developers - Computer Use | Chrome Extension | In-app Browser