Đừng Khoán Việc Học Cho AI

TL;DR

Addy Osmani - engineering lead tại Google Chrome - tổng hợp ba nghiên cứu độc lập năm 2026 và đưa ra một kết luận đáng lo: chúng ta đang âm thầm đánh đổi năng lực tương lai để lấy tốc độ hôm nay khi dùng AI. Không phải vì AI tệ. Mà vì cách chúng ta dùng nó mặc định tối ưu cho một thứ duy nhất: hoàn thành task.

Điểm mấu chốt: cùng một công cụ, cùng một task - nhưng kỹ sư hỏi AI để hiểu khái niệm đạt trên 65% trong bài kiểm tra, còn kỹ sư copy-paste generated code rơi xuống dưới 40%. Tool không quyết định outcome. Posture mới quyết định.

Ba nghiên cứu, một kết luận

Trong vòng chưa đến sáu tháng đầu năm 2026, ba luồng nghiên cứu với phương pháp hoàn toàn khác nhau đều hội tụ về cùng một điểm.

Anthropic RCT (tháng 1/2026): 52 junior engineer học Trio - một Python library về async programming mà tất cả đều chưa biết. Nhóm dùng AI kết thúc task chỉ nhanh hơn 2 phút - không có ý nghĩa thống kê. Nhưng trong bài kiểm tra ngay sau đó, nhóm AI chỉ đạt 50% so với 67% của nhóm code tay. Chênh lệch 17%, tương đương gần hai bậc điểm, với Cohen's d=0.738. Khoảng cách lớn nhất nằm ở câu hỏi debugging.

MIT "Your Brain on ChatGPT" (tháng 6/2026): 54 người viết essay được chia thành ba nhóm - LLM, Search Engine, Brain-only - và đo EEG trong khi làm việc. Kết quả: brain connectivity giảm tuyến tính theo mức độ phụ thuộc vào tool bên ngoài. Nhóm LLM có kết nối não yếu nhất. Sau khi hoàn thành, 83% người dùng LLM không thể quote lại một câu nào trong bài họ vừa viết. Các tác giả gọi đây là cognitive debt - tiết kiệm công sức não hôm nay, trả giá bằng khả năng tư duy phản biện ngày mai.

Wharton Study (Shaw & Nave, 1.372 người): Khi AI đưa ra câu trả lời sai có chủ đích, 73% người tham gia vẫn chấp nhận đáp án sai đó. Tệ hơn: độ tự tin của họ còn tăng lên dù half the answers đã được cố tình làm sai. Họ đang "mượn" sự tự tin của model và xem đó là của mình.

Posture quyết định tất cả

Bên trong chính nhóm dùng AI trong nghiên cứu Anthropic, có một phát hiện quan trọng hơn cả kết quả trung bình: cách bạn tương tác với AI quan trọng hơn việc bạn có dùng AI hay không.

Anthropic Study: Passive Delegation đạt dưới 40%, Conceptual Inquiry đạt trên 65%

Những kỹ sư thuộc nhóm Passive Delegation - copy-paste generated code, nhờ AI debug, giao hết việc cho model - chỉ đạt trung bình dưới 40%. Họ hoàn thành task nhanh nhất nhưng không nhớ gì cả.

Những kỹ sư thuộc nhóm Conceptual Inquiry - hỏi AI để hiểu khái niệm, khám phá tradeoffs, rồi tự code dựa trên hiểu biết vừa xây được - đạt trên 65%. Họ không nhanh hơn ai, nhưng họ thực sự học được.

Sự khác biệt không nằm ở tool. Nó nằm ở một câu hỏi đơn giản: bạn dùng AI để lấy đáp án, hay để xây hiểu biết?

Cognitive surrender là gì - và tại sao nó nguy hiểm

Osmani phân biệt hai khái niệm thường bị lẫn lộn:

Cognitive offloading: giao "how" cho AI, nhưng vẫn giữ judgment về "what". Bạn vẫn đánh giá liệu kết quả có hợp lý không, và can thiệp khi cần. Đây là cách dùng máy tính, search engine, GPS - hoàn toàn hợp lý.
Cognitive surrender: chấp nhận output của AI mà không bao giờ hình thành independent view để so sánh. Output của AI trở thành output của bạn. Không có gì để override, vì bạn chưa bao giờ có quan điểm riêng.

Surrender xảy ra khi chi phí tự suy nghĩ cảm thấy quá cao so với task. Một PR 600 dòng. Variable names trông hợp lý. Tests xanh. Bạn approve. Đâu đó ở giữa có một thay đổi nhỏ trong transaction boundary mà bạn không để ý. Bạn không review code - bạn ratify nó.

Khi cognitive surrender tích lũy theo thời gian, nó tạo ra comprehension debt - khoảng cách ngày càng rộng giữa lượng code tồn tại trong system và lượng code mà bất kỳ human nào thực sự hiểu. Codebase trông sạch. Tests xanh. Nhưng không ai có thể giải thích tại sao các quyết định thiết kế được đưa ra. Khi framework update hoặc security review phát hiện vấn đề structural, bạn không thể re-prompt ra khỏi đó.

Ai bị ảnh hưởng nhất

Cả junior lẫn senior đều dễ tổn thương, nhưng theo những cách khác nhau.

Junior developer: đang ở giai đoạn critical skill formation. Passive delegation không chỉ làm họ học ít hơn - nó cụ thể làm suy yếu khả năng debugging, vốn là kỹ năng cốt lõi để oversight AI-generated code. Và market đang phản ánh điều này: employment của junior developer đã giảm 20% từ năm 2022. Những kỹ sư chỉ có thể ship code khi có AI, nhưng không thể làm việc không có AI, đang bước vào một thị trường lao động đang re-price lại giá trị của expertise.

Senior engineer: phải maintain "theory of the system" - khả năng biết behavior nào là load-bearing, nhớ tại sao quyết định kiến trúc đó được đưa ra tám tháng trước, phân biệt refactor an toàn và refactor đang âm thầm thay đổi thứ user phụ thuộc vào. AI tạo code nhanh hơn human có thể audit - và khi senior engineer bắt đầu surrender vì mệt mỏi, cả tổ chức tích lũy liability mà không ai nhận ra.

Osmani cũng chỉ ra: AI xuất sắc với những vấn đề đã được giải quyết hàng triệu lần trên GitHub - "the median". Càng rời xa median, AI càng kém. Những vấn đề khó, chưa có documentation, là những vấn đề justify salary của senior engineer - và chúng vẫn đòi hỏi deep understanding.

Cách fix - nằm ở cách bạn prompt

Tin tốt: cùng một công cụ có thể tạo ra cognitive debt hoặc sharper engineers. Sự khác biệt nằm ở những gì bạn yêu cầu từ nó.

Hình thành hypothesis trước khi hỏi. Viết 2-3 câu về điều bạn nghĩ vấn đề là gì. Dùng câu trả lời của AI để kiểm tra theory của bạn, không phải để thay thế nó.
Hỏi explanation trước code. Khi vào territory lạ, prompt đầu tiên nên là "giải thích cách này hoạt động, các lựa chọn thay thế là gì, và tradeoffs là gì". Chỉ hỏi code sau khi bạn đã nắm concept.
Bật Learning Mode khi bạn đang mò mẫm. Claude có Learning Mode, ChatGPT có Study Mode, Gemini có Guided Learning. Chúng dùng Socratic questioning - cảm giác chậm hơn. Đó chính là điểm mấu chốt.
Treat AI output như PR từ junior engineer. Đọc nó. Critique nó. Không merge chỉ vì tests pass.
Thi thoảng re-derive bằng tay. Lấy một đoạn code AI đã viết và thử tái tạo lại từ đầu. Đây là calibration check nói cho bạn biết mình đã mất bao nhiêu mà không nhận ra.
Hỏi model dạy bạn những gì nó vừa làm. Sau khi nó viết một function phức tạp, hỏi xem nó dùng concept nào và bạn cần đọc gì để hiểu design choice đó. Một prompt thêm thay đổi hoàn toàn những gì bạn mang về từ buổi làm việc.

Hai chỉ số thay vì một

Osmani kết thúc với một thói quen đơn giản: sau mỗi coding session, tự hỏi - hôm nay tôi học được gì, hay tôi chỉ close tickets?

Đôi khi câu trả lời trung thực là "chỉ close issues" - và điều đó ổn. Nếu đó là câu trả lời suốt nhiều tháng liên tiếp, cognitive debt đang tích lũy trong nền.

Ship và Learn là hai chỉ số tách biệt. Manager và customer sẽ chỉ hỏi về cái đầu tiên. Cái thứ hai là trách nhiệm của bạn.

Bạn không phải chọn giữa dùng AI và học. Nhưng bạn phải chọn một workflow làm được cả hai - vì defaults sẽ không chọn thay bạn.

Kết

Ba nghiên cứu độc lập, ba phương pháp khác nhau - neural, behavioral, controlled experiment - đều đến cùng một nơi: dùng AI mà không có intent to learn sẽ âm thầm làm suy yếu kỹ năng bạn đang được trả tiền để có.

Không có công cụ nào buộc bạn phải học. Không có công cụ nào buộc bạn phải không học. Task tiếp theo bạn định delegate cho AI là nơi tốt để bắt đầu lại.

via Addy Osmani | Anthropic Study | MIT Media Lab