OpenAI Codex khép kín vòng "build & verify": agent tự code, tự mở browser, tự QA

TL;DR

OpenAI vừa gắn một in-app browser thẳng vào Codex. Agent giờ không chỉ viết code backend — nó có thể tự build frontend, tự mở trang render, tự click như user thật, đọc console + network logs, phát hiện lỗi, sửa code, rồi rerun test. Lần đầu tiên Codex khép kín được vòng build & verify cho dev local. Công bố chính thức 16/04/2026, app version 0.124.0 ra 23/04/2026 chạy mặc định trên GPT-5.5.

What's new

Trước đây Codex giỏi viết code, nhưng ai verify UI? Dev vẫn phải F5, click thủ công, đọc DevTools, copy log lại cho agent. Update mới xoá cái gap đó:

Codex spin up browser của chính nó cho local dev server hoặc file-backed page.
Dùng vision + DOM alignment — map tọa độ screenshot sang DOM node và ngược lại, highlight bounding box, select element bằng mô tả ("the blue CTA button").
Đọc trực tiếp console logs, network requests, performance traces, storage (cookies, localStorage) ngay trong lúc test.
Nếu lỗi → agent tự debug code → sửa → rerun. Attach screenshot kết quả vào task và GitHub PR làm bằng chứng.

Kích hoạt bằng cách gọi @Browser trong prompt hoặc phím tắt Cmd+Shift+B (Mac) / Ctrl+Shift+B (Windows).

Why it matters

Coding agent thế hệ trước dừng ở "prompt-and-pray": bạn mô tả → nó viết → bạn tự chạy thử. Codex giờ chuyển sang point-and-instruct: bạn comment thẳng lên phần tử render ("move this up", "bolder"), agent consume comment làm instruction rồi tự verify bằng mắt. Với frontend, game dev, admin panel — những nơi không có API để assert — đây là lần đầu một agent thực sự đóng được cả vai trò QA.

Cái "khó" lớn nhất với coding agent không phải là viết code — LLM đã khá ổn khoản đó. Cái khó là feedback loop: làm sao agent biết code nó viết có work đúng trong browser thật không. Trước đây feedback loop đó cần người ngồi giữa. Giờ Codex tự chạy dev server, tự screenshot, tự đọc log, tự ra phán quyết — loop đóng trong chính 1 session.

Technical facts

Thuộc tính	Chi tiết
Model mặc định	GPT-5.5 (từ 23/04/2026)
App version	Codex 0.124.0
Browser engine	In-app browser bundled qua Browser plugin
DevTools signals	Console, network, performance, storage
Interaction	Click, type, screenshot, verify
Phím tắt	Cmd/Ctrl+Shift+B
Plugin integrations	111 (CodeRabbit, GitLab, Slack, Google Calendar...)

Comparison

So với Codex cũ, khác biệt lớn nhất là vòng lặp "code → render → test → fix" giờ chạy tự động, không cần dev đứng giữa. So với Anthropic Claude Code (đã announce tháng 3/2026 rằng Claude có thể remote control Mac desktop), TechCrunch mô tả động thái của OpenAI là "seem to resemble those previously released by Anthropic" — phản đòn cạnh tranh trong cuộc low-grade war giành chỗ đứng coding tool giữa hai hãng.

So với Playwright / Cypress: không cần viết test script. Agent tự ra quyết định test case dựa vào mô tả feature và vision-based interaction — phù hợp với iteration nhanh, không phù hợp cho regression suite có deterministic coverage.

Use cases

Iterate frontend CSS/layout: sửa spacing, font-weight, màu CTA — agent tự verify pixel-perfect bằng screenshot.
Reproduce visual bug: đưa screenshot bug report, Codex tự navigate tới trang, tái hiện, fix.
Test app không có API: game dev, landing page, admin tool.
PR evidence: screenshot rendered + console sạch attach vào PR như bằng chứng QA.
Designer → dev loop: designer comment thẳng trên trang live, agent sửa.
Flaky UI test triage: thay vì maintain Playwright suite dễ break, để Codex chạy smoke test vision-based lên các flow chính mỗi PR.

Thực tế dev sẽ thấy rõ giá trị nhất ở pha iteration — khi feature đang trong quá trình polish, thay đổi 10-20 lần/giờ. Đây là pha truyền thống Playwright/Cypress trả giá cao nhất (test cũng đổi theo) còn human QA thì không scale nổi.

Limitations & pricing

Không hỗ trợ: authentication flows, signed-in pages, browser profile của bạn, cookies cá nhân, extensions, existing tabs.
Scope: localhost + file-backed + public page không cần login. OpenAI nói sẽ mở rộng "beyond localhost" sau.
Security: page content = untrusted context. OpenAI cảnh báo không paste secret vào browser flow. Có allowlist/blocklist site trong settings, Codex phải xin phép trước khi truy cập site ngoài list.
Pricing: Codex app đi kèm ChatGPT subscription; OpenAI vừa thêm option pay-as-you-go cho ChatGPT Enterprise & Business để linh hoạt về usage.

What's next

Roadmap OpenAI: mở rộng browser control beyond localhost — đi thẳng tới computer-use level giống Anthropic, cho phép Codex điều khiển web app thật của user (không chỉ dev server). Kết hợp với desktop automation (cursor click/type trên Mac) đã có sẵn, viễn cảnh là một agent vừa code, vừa QA, vừa deploy, vừa verify production trong cùng một session.

Nguồn: OpenAI Developers — In-app browser, Codex changelog, TechCrunch.

OpenAI Codex khép kín vòng "build & verify": agent tự code, tự mở browser, tự QA

TL;DR

What's new

Why it matters

Technical facts

Comparison

Use cases

Limitations & pricing

What's next

Tiếp tục lướt

termDRAW: vẽ sơ đồ ASCII ngay trong terminal để prompt agent đỡ tốn token

Codex + gpt-image-2: workflow viết PRD → vẽ UI → code SwiftUI "god-tier fidelity"

Clawsweeper: 50 Codex chạy song song 24/7, đóng 4.000 issue trong một ngày

Codex giờ tự mở browser: build, click, debug frontend như một user thật

GPT-5.5 trên ParseBench: thắng bảng biểu, thua giá tiền — và Opus 4.7 vẫn dẫn về độ trung thực