vibe working & agentic AI

// Posts#anthropic

#6182026-05-13

Từ Agent đến Skill: Đơn vị mới của AI đang thay đổi cách xây hệ thống

Bốn paper AI xuất hiện cùng tuần 5/2026 đều chỉ về một hướng: skill - quy trình tái sử dụng được - đang thay thế agent làm đơn vị tiến bộ chính. Skill1 đạt 97.5% trên ALFWorld, vượt baseline tốt nhất 2.6 điểm. SkillOS chứng minh mô hình 8B có thể vượt Gemini-2.5-Pro khi được train để quản lý skill. Anthropic đã mở chuẩn SKILL.md từ tháng 12/2025, hiện được 32 công cụ hỗ trợ gồm Claude, Copilot, Codex CLI, Gemini CLI.

agent-skillsai-researchllm-agent

7 phút đọc

#6082026-05-12

Xây dựng hệ thống 4-agent với Claude: Từ zero đến production trong một cuối tuần

Hệ thống 4 agent chuyên biệt outperform single agent lên đến +90.2% theo đo lường nội bộ của Anthropic. Orchestrator-worker pattern chiếm 70% production deployments thực tế, execution song song giảm thời gian xử lý đến 90%. Bài này hướng dẫn từng bước xây team 4 agent trên Claude Code - Research, Production, Quality, Distribution - và kết nối chúng qua một orchestrator điều phối.

multi-agentclaudeai-agent

8 phút đọc

#5852026-05-10

Claude Managed Agents: xây agent AI trong vài giờ thay vì vài tháng

Anthropic ra mắt Claude Managed Agents ngày 8/4/2026 - infrastructure layer cho phép triển khai agent tự động trong vài ngày, không cần tự xây sandbox hay quản lý credential. Tính năng Dreaming giúp Harvey Legal tăng completion rate lên 6x mà không thay đổi model. Multiagent Orchestration (công bố 6/5/2026) cho phép tối đa 20 agent chuyên biệt chạy song song. Giá $0.08/session-hour cộng token rate thông thường.

claudeanthropicai-agents

7 phút đọc

#5772026-05-09

HTML là Markdown mới: Tại sao kỹ sư Anthropic dừng viết file .md

Thariq Shihipar từ team Claude Code tuyên bố đã dừng viết Markdown files và chuyển sang dùng Claude Code generate HTML. Tweet đạt 1.7 triệu views trong 24 giờ. Gallery 20 demo HTML minh hoạ: SVG diagrams, slide deck với phím mũi tên, PR review với margin annotations - tất cả chỉ trong 1 file tự chứa. Consensus cộng đồng: HTML cho output, scripts/Markdown cho instructions.

claude-codehtmlmarkdown

6 phút đọc

#5602026-05-07

Anthropic cho Claude agent biết "ngủ mơ": tính năng Dreams có gì đặc biệt?

Anthropic ra mắt Dreams cho Claude Managed Agents ngày 6/5/2026, cho phép agent tổng hợp memory qua nhiều phiên làm việc như não người khi ngủ. Harvey báo cáo completion rate tăng 6 lần sau khi triển khai. Dreams đọc tối đa 100 transcript, tạo memory store mới mà không chỉnh sửa dữ liệu gốc. Hiện trong research preview, truy cập qua claude.com/form/claude-managed-agents.

anthropicclaude-agentsai-memory

6 phút đọc

#5242026-05-06

OpenAI và Anthropic chi $5.5 tỷ chơi bài Palantir, AI doanh nghiệp bước sang chương mới

OpenAI rót $4 tỷ vào Deployment Company với 19 đối tác và 150 Forward Deployed Engineers từ Tomoro. Anthropic lập liên doanh $1.5 tỷ cùng Blackstone, Hellman & Friedman và Goldman Sachs để đưa Claude vào lõi vận hành doanh nghiệp. Cả hai cùng học theo mô hình Palantir, cử kỹ sư ngồi tại chỗ thay vì bán API. Nhóm 180 người triển khai IT truyền thống coi như hết cửa.

openaianthropicenterprise-ai

6 phút đọc

#4902026-05-06

AI tự nghiên cứu AI Safety: Anthropic dùng Claude để giải bài toán kiểm soát siêu AI

Anthropic Fellows công bố kết quả đột phá: 9 AI agent (Claude Opus 4.6) đạt PGR 0.97 trong 5 ngày, vượt xa mức 0.23 của con người sau 7 ngày. Toàn bộ chi phí chỉ ~$18,000, tương đương $22/giờ nghiên cứu AI. Phương pháp hay nhất tổng quát hóa sang toán học (PGR 0.94) nhưng chưa cải thiện có ý nghĩa thống kê khi thử nghiệm trên Claude Sonnet 4 ở quy mô production.

anthropicai-safetyalignment

7 phút đọc

#4872026-05-06

Dạy AI 'tại sao' trước khi dạy 'làm gì': Anthropic công bố Model Spec Midtraining

MSM giảm agentic misalignment từ 54% xuống 7% trên Qwen3-32B, vượt xa deliberative alignment baseline 14%. Kỹ thuật này cần ít dữ liệu hơn 40-60 lần so với fine-tuning thông thường. Mã nguồn và model đã mở trên GitHub và HuggingFace.

anthropicai-alignmentmodel-spec

6 phút đọc

#4802026-05-05

5 cấp độ dùng Claude: từ tab chat đến hạ tầng tự chạy

Boris Cherny chạy 5 session Claude Code local cộng 5-10 session cloud, ship 20-30 PR mỗi ngày. Cowork ra mắt 12/01/2026 đưa Claude Code đến người không code. Opus 4.7 nâng context lên 1M token ở giá tiêu chuẩn $5/$25 mỗi triệu token. Rào cản giữa cấp 4 và cấp 5 không phải kỹ thuật mà là niềm tin.

claude-codeanthropiccowork

8 phút đọc

#4772026-05-05

Claude Code /ultrareview: đội agent review code song song trên cloud, verify từng bug trước khi báo

Anthropic vừa ship /ultrareview — slash command gọi một đội agent chuyên biệt lên cloud sandbox, review PR từ nhiều góc (bug, edge case, security), rồi chạy một lớp agent riêng để verify từng phát hiện trước khi báo về. Kết quả: <1% false positive, nhưng tốn 5–20 phút và $5–25 mỗi lần chạy.

claude-codeultrareviewcode-review

7 phút đọc