TL;DR

OpenAI vừa công bố một báo cáo nội bộ về cách chính các kỹ sư của họ dùng Codex mỗi ngày. Dữ liệu rút từ phỏng vấn engineer và usage data thực tế, trải dài nhiều team: Security, Product Engineering, Frontend, API, Infrastructure và Performance Engineering. Tài liệu gói gọn thành 7 use case và 6 best practice. Điểm đáng chú ý: Codex không phải để giao những task khổng lồ, mà mạnh nhất với việc well-scoped tốn khoảng 1 giờ công sức hoặc vài trăm dòng code.

OpenAI dùng Codex: một AI agent xử lý nhiều loại task kỹ thuật
Codex được các team OpenAI dùng cho đủ loại task: hiểu code, refactor, tối ưu, viết test, tăng tốc dev.

Codex là gì

Codex là một software engineering agent chạy trên cloud, có thể xử lý nhiều task song song trong các sandbox cô lập. Nó được vận hành bởi codex-1, một bản OpenAI o3 được tinh chỉnh cho coding bằng reinforcement learning trên các task thực tế. Codex có hai chế độ: Ask mode để hỏi về codebase, và Code mode để giao việc viết hoặc sửa code. Tool vẫn đang ở research preview.

Bảy cách các team OpenAI dùng Codex

1. Hiểu codebase

Khi onboarding, debug hoặc điều tra sự cố, engineer dùng Codex để ramp nhanh vào phần code lạ. Nó giúp locate core logic của một feature, map quan hệ giữa các service hay module, trace data flow qua hệ thống, và surface các architecture pattern hoặc chỗ thiếu documentation. Trong incident response, dán stack trace rồi hỏi auth flow nằm ở đâu sẽ được Codex nhảy thẳng tới đúng file để triage.

2. Refactor và migration

Codex hợp với các thay đổi span nhiều file hoặc package: update API, đổi cách một pattern được implement, hay migrate sang dependency mới. Nó đặc biệt hữu ích khi cùng một update phải áp dụng across hàng chục file mà regex hay find-and-replace không bắt được vì cần hiểu cấu trúc và dependency.

Codex swap mọi getUserById() legacy sang service pattern mới rồi mở PR. Việc đáng lẽ tốn hàng giờ, nó làm trong vài phút. - Backend Engineer, ChatGPT Web

3. Tối ưu hiệu năng

Engineer prompt Codex để phân tích các code path chậm hoặc tốn memory: loop kém hiệu quả, thao tác thừa, query đắt, rồi gợi ý phương án tối ưu. Nó cũng giúp soi các pattern rủi ro hoặc deprecated còn đang active để giảm tech debt và phòng regression. Một anecdote trong báo cáo: tiết kiệm 30 phút việc bằng cách bỏ ra 5 phút viết prompt.

4. Tăng test coverage

Codex viết test nhanh ở những chỗ coverage mỏng hoặc thiếu hẳn. Khi fix bug hay refactor, engineer nhờ nó gợi ý test cho edge case và failure path; với code mới, nó generate unit hoặc integration test từ function signature. Codex giỏi bắt boundary condition: input rỗng, max length, hay các trạng thái bất thường nhưng hợp lệ thường bị bỏ sót.

5. Tăng tốc độ phát triển

Codex tăng tốc cả đầu lẫn cuối chu kỳ dev. Khi mở một feature mới, nó scaffold boilerplate: folder, module, API stub để có code chạy được nhanh. Khi gần release, nó lo các task nhỏ nhưng cần thiết như triage bug, rollout script, telemetry hook hay config file. Một Product Engineer kể: họp cả ngày vẫn merge được 4 PR vì Codex chạy nền.

Codex chạy nhiều task song song: viết test, refactor, fix bug
Một engineer có thể giao nhiều task cùng lúc; mỗi task chạy trong sandbox riêng.

6. Giữ flow

Khi lịch bị fragmented vì meeting và interrupt, Codex giúp engineer giữ năng suất. Nó capture việc dang dở, biến note thành prototype, hoặc spin các task khám phá để quay lại sau. Nhờ vậy việc pause và resume không làm mất context, đặc biệt khi đang on-call. Gặp một drive-by fix, engineer fire luôn một task Codex thay vì phải swap branch.

7. Khám phá và lên ý tưởng

Với các việc open-ended, Codex giúp tìm giải pháp thay thế, validate quyết định thiết kế và pressure-test giả định, từ đó surface các tradeoff. Nó cũng dùng để identify related bug: cho một issue đã biết, Codex tìm các pattern tương tự ở nơi khác trong code, giúp bắt regression hoặc hoàn tất việc cleanup.

Sáu thói quen để Codex chạy hiệu quả

Báo cáo đúc kết các thói quen mà các team OpenAI đang nuôi để Codex cho giá trị ổn định:

  • Bắt đầu bằng Ask mode. Với change lớn, prompt Codex ra một implementation plan bằng Ask mode trước, rồi dùng plan đó làm input cho Code mode. Two-step flow này giữ Codex grounded và giảm lỗi.
  • Cải thiện dần môi trường dev của Codex. Set startup script, environment variable và internet access sẽ giảm đáng kể error rate. Soi các build error để sửa trong config môi trường.
  • Viết prompt như viết GitHub Issue. Kèm file path, component name, diff và doc snippet. Pattern kiểu implement cái này giống cách đã làm trong module X cho kết quả tốt hơn.
  • Dùng task queue như backlog nhẹ. Fire task để capture ý tưởng tangential, việc dở hoặc fix tình cờ - không cần ép ra full PR trong một lần.
  • Dùng AGENTS.md để cấp context bền. File này chứa naming convention, business logic, các quirk đã biết và dependency mà Codex không tự suy ra từ code.
  • Tận dụng Best-of-N. Generate đồng thời nhiều response cho một task để chọn cái tốt nhất; với task phức tạp có thể ghép phần từ nhiều response để ra kết quả mạnh hơn.

Khi nào Codex hợp nhất

Thông điệp xuyên suốt báo cáo là Codex không thay thế engineer cho những bài toán lớn, mà là một cộng sự giỏi cho các task rõ ràng, kích thước vừa phải. Sweet spot: việc tốn khoảng một giờ công sức của bạn hoặc một teammate, hoặc cỡ vài trăm dòng code. OpenAI lưu ý kích thước task mà Codex gánh được sẽ tăng dần khi model cải thiện. Tài liệu cũng nhấn mạnh hai điểm cần đầu tư: dùng two-step Ask sang Code, và config môi trường để giảm error rate qua vài lần iterate.

Kết

Điều thú vị của báo cáo này là nó cho thấy chính OpenAI dùng Codex theo cách rất đời thường: không phải để tạo ra những phép màu, mà để dọn dẹp tech debt, viết test còn thiếu, hiểu nhanh code lạ và làm những việc lẽ ra không bao giờ được prioritize. OpenAI nói Codex vẫn ở research preview nhưng đã tạo impact thật, và họ kỳ vọng sẽ tích hợp nó sâu hơn vào workflow. via OpenAI