TL;DR

Ngày 23/04/2026, Anthropic đưa built-in memory cho Claude Managed Agents lên public beta. Thay vì mỗi session phải khởi động với context rỗng, dev attach memory stores — tập hợp text document mount sẵn tại /mnt/memory/ trong container của agent. Agent đọc/ghi bằng file tools tiêu chuẩn, thay đổi được sync qua mọi session share cùng store. Giới hạn beta: 8 stores/session, 100KB/memory, 100MB/store, version history giữ 30 ngày. Yêu cầu beta header managed-agents-2026-04-01.

Có gì mới

Managed Agents ra public beta 08/04/2026 với sandboxing, session management và permission scoping. Điểm yếu lớn nhất lúc đó: mỗi session là một tờ giấy trắng — hết session, agent quên sạch. Version mới vá đúng chỗ đó.

Memory store là một workspace-scoped collection of text documents, attach vào session qua session.resources[] lúc tạo session. Store được mount như directory /mnt/memory/<store-name>, agent thao tác bằng bash/read/write/edit/glob/grep — không cần tool riêng. Mỗi mount tự động được mô tả trong system prompt (path, access mode, store description, instructions) để agent biết chỗ nào chứa gì.

Writes persist về store và auto-sync qua các session khác cùng attach store đó. Mỗi lần sửa tạo một memory version (memver_...) immutable — có audit trail, point-in-time recovery, và redact endpoint để scrub PII khỏi version cũ khi có compliance request.

Vì sao nó quan trọng

Memory là mảnh ghép cuối cùng để agent đi từ "one-shot task runner" sang "assistant nhớ bạn là ai". Trước đó, cách duy nhất để giữ context qua nhiều session là: (a) compaction + memory tool standalone — nhưng bắt agent phải quyết định bất khả hồi token nào giữ, token nào bỏ; hoặc (b) dev tự build RAG + vector store bên ngoài — tốn hạ tầng, stateful, phải tự lo ACL.

Managed Agents memory dịch chuyển cả hai gánh nặng đó sang Anthropic: context sống ngoài context window (trong session log của Managed Agents), còn memory stores là lớp persistent thêm nữa, có ACL, versioning và audit built-in. Dev chỉ cần nghĩ "store này ai đọc được, ai ghi được", không phải tự viết cơ sở hạ tầng.

Technical facts

Các giới hạn và đặc tả chính trong beta:

SpecValue
Mount path/mnt/memory/
Access modesread_write (default) hoặc read_only
Stores per session8
Size per memory (1 file)100 KB (~25K tokens)
Memories per store2,000
Total storage per store100 MB
Versions per store250,000 immutable
Version retention30 ngày (recent versions luôn giữ)
Stores per organization1,000
Instructions per attachment4,096 chars
Beta headermanaged-agents-2026-04-01

API primitives: memory_stores.create/retrieve/update/list/archive/deletememories.create/retrieve/update/delete. memories.create không overwrite — muốn sửa content phải dùng update. Safe concurrent edits qua content_sha256 precondition (optimistic concurrency); hash lệch thì retry.

Mọi read/write của agent hiện lên event stream như agent.tool_useagent.tool_result — inspect được trong Claude Console như mọi tool call khác.

So với các cách làm trước

Managed Agents đã externalize session context ra khỏi context window của Claude (agent đọc lại qua getEvents()). Memory stores là lớp persistent thêm nữa — context kiên trì vượt ngoài một session.

ApproachScopeVersioningACLInfra tự lo
Standalone Memory tool (cũ)1 agent, 1 file namespaceKhôngKhôngÍt
Tự build RAG + vector DBTuỳ bạnTuỳ bạnTuỳ bạnNhiều
Managed Agents memory storesWorkspace-scoped, 8/sessionImmutable versions, 30-day retention, redactread_only / read_write mountKhông

Use case thực tế

Customers launch đi kèm memory beta cho thấy các pattern rõ ràng:

  • Coding agents (Sentry Seer): đi thẳng từ flagged bug sang agent viết patch + mở PR. Store nhớ repo conventions, past fixes.
  • Workspace agents (Notion Custom Agents): delegate task mở (code, slides, spreadsheet) ngay trong workspace — store mỗi user giữ preference và context dự án.
  • Enterprise specialist agents (Rakuten): agent sales/marketing/finance qua Slack + Teams; mỗi phòng ban có store riêng, share một read-only store chuẩn công ty.
  • AI Teammates (Asana): agent join project, pick task, giữ ngữ cảnh qua các iteration.
  • Meeting prep: agent nhớ lịch sử participant, CRM notes, outcome các buổi họp trước.

Pattern chuẩn: một read_only store cho chuẩn công ty (style guide, API conventions) + một read_write store per-user hoặc per-project. Mix tối đa 8 stores/session để compose.

Limitations & pricing

Prompt injection là rủi ro #1. Store mặc định read_write. Nếu agent xử lý input untrusted (user prompt, fetched web content, third-party tool output), injection có thể ghi nội dung độc vào store và session sau đọc như "trusted memory". Khuyến nghị của Anthropic: dùng read_only cho mọi reference material và tách session xử lý untrusted input khỏi các shared store.

Ràng buộc hành vi: stores chỉ attach lúc tạo session (không add/remove giữa chừng); archive là one-way; không redact được current head (phải viết version mới hoặc delete trước).

Pricing: standard Claude platform token rates + $0.08/session-hour active runtime (đo đến millisecond, idle không tính) + $10 per 1,000 searches nếu dùng built-in web search. Không có storage fee riêng công bố cho memory stores trong beta.

Roadmap

Vẫn còn trong research preview (request access): outcomes/self-evaluation (agent tự đánh giá và lặp tới khi đạt success criteria — Anthropic claim cải thiện 10 điểm trên structured file generation), multi-agent coordination (agent spawn và điều phối agent con), và advanced memory tooling vượt memory stores cơ bản.

Thông điệp kiến trúc của Anthropic: harness sẽ tiếp tục tiến hoá theo model. Họ từng thêm context reset vào harness để chống "context anxiety" của Sonnet 4.5 — rồi Opus 4.5 ra, hành vi biến mất, reset thành "dead weight". Managed Agents cố tình thiết kế như meta-harness: interface chung để thay đổi harness bên trong khi model cải thiện.

Nguồn: Claude Blog, Platform Docs, Anthropic Engineering, The New Stack.