// Posts#ai-security
Morse code - công nghệ thế kỷ 19 đánh sập lớp phòng thủ của AI Grok, cuỗm 4 tỷ đồng
#5682026-05-07

Morse code - công nghệ thế kỷ 19 đánh sập lớp phòng thủ của AI Grok, cuỗm 4 tỷ đồng

Hacker gửi một NFT và một dòng Morse code lên X, khiến Grok tự động chuyển 3 tỷ token DRB trị giá ~$175,000 mà không cần hack bất kỳ dòng code nào. Giá DRB lao dốc gần 40% trong vài phút trước khi kẻ tấn công hoàn trả ~80% số tiền. Lỗ hổng nằm ở Bankrbot - hệ thống coi output text của LLM là lệnh tài chính hợp lệ, không có bước xác nhận của con người.

grok-aiprompt-injectionai-security
7 phút đọc
Khi AI bảo mật trở thành vũ khí: Lab mới của PortSwigger về Indirect Prompt Injection
#5382026-05-07

Khi AI bảo mật trở thành vũ khí: Lab mới của PortSwigger về Indirect Prompt Injection

PortSwigger ra lab Apprentice-level miễn phí về khai thác AI scanner thực hiện hành động phá hoại qua indirect prompt injection. Attacker nhúng lệnh vào blog comment, scanner đọc rồi tự tay xóa tài khoản người dùng - không cần exploit trực tiếp. CVE-2024-5184 xác nhận kỹ thuật này đã ra khỏi lý thuyết và được khai thác thực tế.

indirect-prompt-injectionai-securityportswigger
5 phút đọc
Tìm Zero-Day Với Bất Kỳ Model Nào: Bí Quyết Nằm Ở Orchestration
#5112026-05-06

Tìm Zero-Day Với Bất Kỳ Model Nào: Bí Quyết Nằm Ở Orchestration

Niels Provos chứng minh tìm zero-day không cần model frontier đắt tiền - framework IronCurtain open-source dùng Claude Opus 4.6 và GLM 5.1 đã tái hiện lỗi 27 năm tuổi trong OpenBSD. Chi phí audit toàn bộ codebase giờ chỉ $30-$150 với Sonnet và Opus 4.6. Bug 18 năm tuổi trong thư viện nền tảng bị tìm ra hoàn toàn tự động, không cần con người can thiệp.

ai-securityzero-dayvulnerability-research
7 phút đọc
Hack như AI: 3 kỹ thuật prompt biến LLM thành attacker thực sự
#5072026-05-06

Hack như AI: 3 kỹ thuật prompt biến LLM thành attacker thực sự

Valid AI vulnerability reports tăng 210% YoY trên HackerOne, với 560+ valid reports từ hackbot. Hỏi 'how would you break this?' thay vì 'is this code secure?' buộc LLM generate attack strategy thay vì auditor checklist. Nhồi context quá tải khiến bug trở thành kim trong đống rơm - feed đúng và đủ, không nhiều hơn. Assert 'function này có 3 lỗi, tìm đi' tăng tỷ lệ phát hiện bug thực sự.

ai-securitybug-bountyhackbot
5 phút đọc
Claude Code + MCP: Săn 0day tự động 24/7 - Khi AI trở thành pentester không ngủ
#4222026-04-27

Claude Code + MCP: Săn 0day tự động 24/7 - Khi AI trở thành pentester không ngủ

Researcher Andy Gill xây hệ thống tự động tìm 0day bằng Claude Code + 8 MCP server trên 5 VM, hơn 300 tool bảo mật. Mọi finding đều bắt đầu trong thư mục hallucinations/ và chỉ được promote sau khi vượt 4 validation gate. Claude Mythos (Anthropic, tháng 4/2026) tìm và validate hơn 500 lỗ hổng nghiêm trọng trong mã nguồn mở. Kali Linux tích hợp Claude qua MCP: 4.750 đường dẫn quét trong 25 giây, thay vì 2-3 giờ thủ công.

claude-codemcpvulnerability-research
7 phút đọc
AI Agent chiếm root shell trên Ubuntu 26.04 - ngay ngày đầu ra mắt
#4172026-04-26

AI Agent chiếm root shell trên Ubuntu 26.04 - ngay ngày đầu ra mắt

DarkNavy tuyên bố AI đa tác tử Argusee của họ chiếm root shell trên Ubuntu 26.04 LTS chỉ trong 24 giờ kể từ khi phát hành. Đây là một trong ba phát hiện tự động trong vòng một tuần tháng 4/2026, cùng với CVE-2026-4747 trên FreeBSD kernel do Claude tạo ra. Không có CVE, PoC hay chi tiết kỹ thuật nào được công bố - nhưng tín hiệu rõ ràng: thời gian khai thác đang co lại từ tuần xuống giờ. Các tổ chức cần chuyển sang quy trình phản ứng theo giờ thay vì theo tuần.

ai-securityubuntu-26-04darknavy
6 phút đọc
Agent Vault: Infisical vá lỗ hổng credential của AI agent bằng một proxy duy nhất
#3642026-04-22

Agent Vault: Infisical vá lỗ hổng credential của AI agent bằng một proxy duy nhất

Infisical vừa ra mắt Agent Vault — credential broker open-source cho AI agent. Thay vì đưa secret cho agent, nó chặn HTTPS và bơm credential ở lớp network. Claude Code, Cursor, Codex dùng được ngay với lệnh `agent-vault run -- claude`.

infisicalagent-vaultai-security
7 phút đọc
Mô hình AI nguy hiểm nhất của Anthropic vừa bị truy cập trái phép qua credentials của nhà thầu
#3512026-04-21

Mô hình AI nguy hiểm nhất của Anthropic vừa bị truy cập trái phép qua credentials của nhà thầu

Anthropic xác nhận một nhóm người dùng trái phép đã truy cập Claude Mythos — mô hình mạnh nhất công ty từng huấn luyện, có khả năng tự tìm và khai thác zero-day đến mức Anthropic từ chối phát hành công khai. Lỗ hổng đến từ credentials của một nhân viên nhà thầu bên thứ ba.

claude-mythosanthropicai-security
7 phút đọc
Dưới 20 phút, dưới $2: Dreadnode + Kimi K2.6 tìm ra lỗ TLS high-severity trong Azure Cosmos DB
#3332026-04-20

Dưới 20 phút, dưới $2: Dreadnode + Kimi K2.6 tìm ra lỗ TLS high-severity trong Azure Cosmos DB

Dreadnode chạy SAST trên binary Azure Cosmos DB lấy từ Microsoft Container Registry bằng .NET reversing agent dùng Kimi K2.6. 19 phút 26 giây, $1.97, ra 1 lỗ tautological trong TLS certificate validation — managed identity token có thể bị MITM.

dreadnodekimi-k2-6azure-cosmos-db
6 phút đọc
Calif.io: Từ nhóm hacker Việt Nam đến đối tác bảo mật chính thức của OpenAI và Microsoft
#3102026-04-17

Calif.io: Từ nhóm hacker Việt Nam đến đối tác bảo mật chính thức của OpenAI và Microsoft

Calif.io vừa được OpenAI công nhận là đối tác nghiên cứu lỗ hổng bảo mật chính thức, cùng Trail of Bits. Song song đó, Microsoft thừa nhận công trình nghiên cứu HTTP.sys kernel bug của Calif với Anthropic — một lỗ hổng mà founder Thai Duong gọi là bước ngoặt của công ty. Ba lần lên trang nhất Hacker News trong một tuần, MADBugs đang định nghĩa lại cách AI tìm zero-day.

calif-iocybersecurityopenai
7 phút đọc