Tất cả bài viết

// Posts#security

#7522026-05-31

Zero Trust cho AI Agent: Framework bảo mật toàn diện từ Anthropic

Prompt injection đạt 100% tỷ lệ thành công - guardrail tầng ngôn ngữ không đủ để bảo vệ AI agent trong doanh nghiệp. Anthropic phát hành framework Zero Trust 3 tầng với quy trình triển khai 8 bước: từ cryptographic identity đến behavioral monitoring. 250 malicious documents đủ để backdoor LLM 13 tỷ tham số; kỹ thuật Spotlighting giảm indirect injection từ trên 50% xuống dưới 2%.

securityai-agentszero-trust

5 phút đọc

#7292026-05-23

Khóa học 22 chương thiết kế AI Agent - P3: Production, Observability và Agency

Đưa AI agent từ prototype ra production là thách thức lớn nhất - Gartner dự báo 50% deployment failure đến từ thiếu governance. Khóa học agentic AI giải quyết vấn đề này qua 11 chương cuối: human-in-the-loop, MCP connectors, observability end-to-end, cost optimization, safety và proactive agents tự tiến hóa.

ai-agentagentic-aiobservability

6 phút đọc

#7192026-05-21

Lộ trình Vibe Coding 6 tháng - P4: Xây dựng sản phẩm thật và bảo mật

Tháng 4 là nơi lý thuyết gặp thực tế. 14 ý tưởng dự án từ beginner đến advanced, chu trình Plan-Review-Fix chuyên nghiệp, checklist bảo mật bắt buộc, 9 failure patterns của coding agents theo nghiên cứu Columbia University, và quy tắc 70/30 trong testing.

vibe-codingsecuritytesting

8 phút đọc

#6682026-05-18

5 Tool Trước Khi Build Bất Kỳ Agentic System Nào

direnv + secrets manager ngăn pattern vi phạm phổ biến nhất năm 2026 - API key commit nhầm vào git. LiteLLM proxy cắt 30-60% hoá đơn AI nhờ response caching theo prompt hash. uv nhanh hơn pip 10-100x và uv.lock đảm bảo mọi người dùng cùng dependency chính xác. mitmproxy là lớp giám sát duy nhất giúp bạn thực sự thấy agent đang làm gì trong production.

agentic-aideveloper-toolssecurity

7 phút đọc

#5942026-05-11

4 Trụ Cột Agent Bền Vững - Phần 2: Building và Memory

Tool contract là một chiều trừ khi bạn enforce ngược lại - bug Stripe thực tế: model pass email vào customer_id, agent thông báo khách đang trả tiền không tìm thấy tài khoản. State poisoning hiện diện trong 73% production AI deployments. Phần 2 của series về engineering deficit.

ai-agenttool-validationstate-poisoning

7 phút đọc

#5922026-05-10

6 Bệnh Thần Kinh của AI Agent - P2: Confabulation, Disinhibition và Anosognosia

Confabulation không phải hallucination: khi retrieval thất bại, agent bịa nguồn trông như thật thay vì thừa nhận không biết. Nghiên cứu HalluCitation 2026 tìm thấy gần 300 bài học thuật ACL/EMNLP có ít nhất 1 tài liệu tham khảo bịa đặt. Disinhibition là phanh control plane hỏng - agent đọc email phishing và thực sự gửi file đi. Anosognosia là bệnh nguy hiểm nhất: sai mà không biết mình sai.

ai-agentengineeringconfabulation

7 phút đọc

#5512026-05-07

Claude-OSINT: Biến Claude thành Recon Operator với 90+ Module và 5.500 Dòng Tradecraft

Claude-OSINT là bộ skill drop-in mã nguồn mở biến Claude Code thành external recon operator cho red-team và bug-bounty, đạt 96.9% pass rate trên 32-prompt self-evaluation. Bộ tool gồm 90+ recon module, 48 secret-regex pattern, 80+ dork và 27 attack-path template phủ 12 capability domain. Cài đặt trong 3 lệnh, không cần infrastructure, MIT license hoàn toàn miễn phí.

osintclaude-codesecurity

7 phút đọc

#5182026-05-06

AI đang đọc Gmail của bạn - và bạn đã cho phép điều đó từ rất lâu

64% ứng dụng bên thứ ba truy cập dữ liệu nhạy cảm mà không có lý do hợp lệ, theo nghiên cứu 2026 phân tích 4.700 website. OAuth refresh token không bao giờ tự hết hạn - app bạn cài từ năm ngoái có thể đang đọc inbox ngay lúc này. Bạn có thể thu hồi toàn bộ quyền trong dưới 2 phút tại myaccount.google.com/security.

gmailprivacyoauth

5 phút đọc

#4732026-05-04

deepsec: Công cụ mã nguồn mở của Vercel tìm lỗ hổng bảo mật bằng nghìn AI agent song song

deepsec là security harness mã nguồn mở từ Vercel Labs, dùng Claude Opus 4.7 và GPT 5.5 để rà soát codebase tìm lỗ hổng bảo mật. Công cụ scale lên 1.000+ Vercel Sandbox song song, cắt thời gian audit từ nhiều tháng xuống vài phút. Chi phí ~$25-60 cho 100 file, Apache 2.0 license, chạy hoàn toàn trên hạ tầng của bạn.

deepsecsecurityvercel

6 phút đọc

#4252026-04-27

hack-skills: 101 Kỹ Năng Pentesting Được Thiết Kế Riêng Cho AI Agent

hack-skills là knowledge base bảo mật mã nguồn mở với 101 skills thuộc 14 domain, được xây dựng để AI agents có thể tra cứu và áp dụng kỹ thuật pentesting theo cách có thể định tuyến và kiểm chứng. Install chỉ 1 lệnh: npx skills add yaklang/hack-skills. Repo đạt 771 stars, hỗ trợ offline qua AES-256 encrypted ZIP, và có web UI riêng tại skills.hackbenchmark.com.

securityai-agentpentesting

6 phút đọc