TL;DR

Bạn đang mất bao nhiêu thời gian giải thích lại cùng một quy tắc cho AI mỗi session? Bài này giải quyết 2 vấn đề cốt lõi: Skill để đóng gói workflow lặp thành slash command, và Memory Repository để AI thực sự "nhớ" bạn qua nhiều cuộc hội thoại.

Vấn đề của việc lặp lại

Mỗi lần bắt đầu project mới, bạn phải giải thích lại:

  • Design Doc phải viết vào memory/docs/design.md

  • Chọn template Lite hay Full tùy quy mô project

  • Architecture diagram phải vẽ từ user entry point, không phải internal backend

  • Phải có đủ các section: Overview, Tech Stack, Architecture, Feature Status...

  • Section chưa điền thì đánh dấu TBD, không được bịa

10 lần project = 10 lần copy paste hoặc nhớ lại. Mỗi lần đều có nguy cơ thiếu một điều kiện, và mỗi project Design Doc lại có format khác nhau.

Skill - prompt template có entry point

Skill về bản chất là "prompt template đã đặt tên + danh sách tool được phép dùng". Khi bạn gõ /init-design, Claude Code tự load đúng template, đúng rules, đúng tool allowlist - bạn không cần nhắc lại gì.

Ví dụ thực tế: thay vì giải thích 10 điều kiện mỗi lần, bạn chỉ cần:

/init-design Project này là hệ thống quản lý đơn hàng cho SMB

10 giây sau, Design Doc chuẩn format xuất hiện. Template cố định, path cố định, rules cố định.

Cách xác định xem có nên đóng gói thành Skill không: Bạn đang gõ lại prompt từng viết trước đây và thấy bực bội? Đóng gói ngay.

Một số Skill hữu dụng trong thực tế:

  • /new-component UserAvatar - tạo boilerplate component đúng structure trong vài giây

  • /bug-report - format bug ticket chuẩn với repro steps, environment, stack trace

  • /api-endpoint - tạo route + controller + validation + tests + docs một lúc

  • api-conventions (auto-fire) - tự động apply RESTful naming rules mỗi khi làm việc với API

Skill không chỉ là slash command thủ công. Skill có thể tự động kích hoạt khi description của nó match với context hiện tại - không cần gọi, nó tự load khi cần.

Memory Repository - để AI thực sự nhớ bạn

Context window của Claude Code, dù 1M tokens, vẫn clear sau mỗi session. Prompt engineering không giải quyết được vấn đề này. Thứ thực sự cho AI "nhớ" bạn là một hệ thống file có cấu trúc, cross-conversation.

Memory repository structure: USER.md, NOW.md, daily-logs, lessons, projects

Cấu trúc Memory Repository đơn giản nhất:

~/memory/
├── USER.md           # Bạn là ai - background, preferences, working style
├── NOW.md            # Bạn đang làm gì - update sau mỗi session
├── docs/INDEX.md     # Bản đồ tài liệu của tất cả project
├── daily-logs/       # Log hội thoại 14 ngày gần nhất
├── lessons/          # Kinh nghiệm rút ra - hook tự động điền
└── projects/         # Design Doc và plan của từng project

File quan trọng nhất là NOW.md. Sau mỗi session kết thúc, hook tự động ghi vào đây: hôm nay làm gì, đang ở đâu trong workflow, next step là gì. Session mới bắt đầu, việc đầu tiên là đọc NOW.md - AI phục hồi context trong vài giây thay vì bạn phải brief lại từ đầu.

File lessons/ là nơi tích lũy kinh nghiệm từ thực tế. Mỗi lần AI mắc lỗi và được sửa, hook tự trích xuất lesson và lưu vào đây. Session sau, lesson đó load sẵn - AI không lặp lại lỗi cũ.

Bốn layer memory của Claude Code

Claude Code thực ra có 4 layer memory khác nhau:

  • Layer 1 - CLAUDE.md: Explicit rules bạn tự viết, load mỗi session

  • Layer 2 - MEMORY.md (Auto Memory): Claude tự học pattern trong quá trình làm việc và ghi lại, 200 dòng đầu load tự động

  • Layer 3 - Memory Tool: Dành cho long-running programmatic agents, dùng claude-progress.txt làm checkpoint

  • Layer 4 - Subagent Memory: Memory scoped cho từng subagent riêng tại ~/.claude/agent-memory/<name>/

Với hầu hết developer, Layer 1 (CLAUDE.md) và Layer 2 (MEMORY.md) là đủ. CLAUDE.md là "thứ bạn chủ động muốn AI biết", MEMORY.md là "thứ AI học được khi làm việc với bạn". Hai thứ bổ sung cho nhau, không thay thế nhau.

Kết

Skill và Memory là 2 thứ biến Claude Code từ "công cụ tốt" thành "partner thực sự". Skill giúp bạn không lặp lại. Memory giúp AI không quên. Bài tiếp theo sẽ đi vào Hooks - cách tự động hóa những thứ không thể rely vào prompt để thực hiện đúng 100% thời gian.

via Claude Code Agent Memory 2026