devlog by a solofounder

// Popular Articles

#6512026-01-19

DeepSeek V4 giảm 10 lần KV cache ở 1M context — và giải luôn cơn khát HBM

V4-Pro vượt Opus 4.6 trên Terminal-Bench, gần bằng Gemini 3.1 Pro trên mọi benchmark, nhưng điểm đáng kể nhất là KV cache chỉ còn 10% so với V3.2 ở context 1M. Với GPU cố định, cùng một rack GB300 giờ có thể phục vụ gấp 10 lần số request concurrent. Đây là đóng góp nghiêm túc nhất cho kinh tế inference long-context năm 2026.

deepseek-v4kv-cachelong-context

8 phút đọc

#6462026-01-16

DeepSeek V4 Pro & V4 Flash lên Venice: model code open-source vượt Claude Opus 4.6 và GPT-5.4, rẻ hơn 7 lần

DeepSeek V4-Pro đạt 93.5% LiveCodeBench và 3,206 Codeforces — vượt GPT-5.4, Claude Opus 4.6, Gemini 3.1 Pro; tie SWE-bench Verified. 1M context, MIT license, giờ có mặt trên Venice với truy cập ẩn danh.

deepseek-v4venice-aiopen-source-llm

8 phút đọc

#6332026-01-10

Codex và Claude Code desktop đều chạy Oxlint + Oxfmt — Codex còn lên thẳng Vite 8

Evan You xác nhận hai agent coding đình đám nhất — OpenAI Codex và Anthropic Claude Code — đã âm thầm chuyển desktop app sang toolchain Rust Oxc (Oxlint + Oxfmt). Codex còn chạy Vite 8 với Rolldown. Đây là mốc validation lớn nhất mà VoidZero có thể mơ tới.

oxlintoxfmtvite-8

7 phút đọc

#6282026-01-07

Tencent open-sources Hy3 preview: 295B MoE that bets on agents, not parameter records

Tencent's Hunyuan team just shipped Hy3 preview — a 295B MoE with only 21B active per token, 256K context, SWE-bench Verified 74.4, and a 40% efficiency gain over HY 2.0. The pitch is cheap, fast, agent-ready inference, not a leaderboard crown.

tencent-hunyuanhy3-previewopen-source-llm

7 phút đọc

#6272026-01-07

DeepSeek V4 Preview: 1.6T MoE, 1M Context, MIT — Frontier Đã Open-Source

DeepSeek V4 vừa ra mắt 4 model open-weight MIT với native 1M context. V4-Pro đạt 3206 Codeforces (vượt GPT-5.4), 93.5 LiveCodeBench, 95.2 HMMT — giá chỉ bằng ~12% Claude Opus 4.6. Đây là dấu chấm hết cho khoảng cách open vs closed?

deepseek-v4open-source-llmmoe

7 phút đọc

#6262026-01-06

Biến Transformer thành Mamba thuần, không cần Attention: công thức distillation từ Apple, MILA, Flatiron

Nhóm nghiên cứu Apple – MILA – Flatiron vừa công bố HedgeMamba: công thức 2 bước distill Transformer thành Mamba thuần (không hybrid). Chỉ với 10B token (~2,7% ngân sách huấn luyện teacher), mô hình học trò đạt perplexity 14.11 so với 13.86 của Pythia-1B — gần như giữ nguyên hiệu năng mà vẫn thừa hưởng O(1) memory của SSM.

mambastate-space-modelscross-architecture-distillation

7 phút đọc

#6252026-01-06

Workspace Agent của OpenAI vừa ra mắt — và phiên bản mã nguồn mở đã có, chỉ từ €4/tháng

OpenAI vừa ra Workspace Agents (22/4/2026) để thay thế Custom GPT cho doanh nghiệp. Cùng lúc, một lựa chọn mã nguồn mở đang lan truyền trên X: tự host từ €4/tháng, dùng Claude/GPT/Gemini/Kimi/DeepSeek tuỳ ý, mỗi session chạy trong Docker sandbox riêng, sub-agent call hoàn toàn quan sát được — không còn black box.

workspace-agentsopenaiopen-source

7 phút đọc

#6242026-01-05

DeepSeek V4 Flash đốt 240M tokens để chạy benchmark — vẫn rẻ hơn Qwen 3.5 tới 3.7 lần

Flash (Max) đạt 47 điểm Artificial Analysis Intelligence Index, chi phí chạy full benchmark chỉ $113 — thấp hơn Qwen-3.5 397B ($418) và Gemini 3 Flash ($278) một cách gây sốc, bất chấp xài gấp 2.8–3.3 lần output tokens. Đây là câu chuyện về giá token rẻ nuốt chửng chi phí verbosity.

deepseek-v4artificial-analysisllm-benchmark

6 phút đọc

#6232026-01-05

DeepSeek V4 Pro: 1.6T MoE, 1M context, #1 open-weights model — at 7x less than Claude

DeepSeek dropped V4-Pro (1.6T/49B) and V4-Flash (284B/13B) on April 24, 2026. V4-Pro is now the largest open-weights model ever and #1 on the GDPval-AA agentic benchmark — while costing $3.48 per 1M output tokens vs Opus 4.6's $25. Here's what actually ships, why the efficiency story matters, and where it still trails the closed frontier.

deepseek-v4open-source-llmmoe

8 phút đọc

#6222026-01-04

DeepSeek V4 chạy mượt trên Huawei Ascend 950: Hào CUDA của Nvidia chính thức nứt

Ai cũng đang nhìn con số 1.6T tham số và giá $1.74/1M token của DeepSeek V4. Nhưng câu chuyện thật sự nằm ở phần cứng: đây là mô hình frontier đầu tiên không lệ thuộc Nvidia top-tier. Huawei Ascend 950 supernode đạt 20ms inference cho V4-Pro — hào compute địa chính trị đang co lại rất nhanh.

deepseek-v4huawei-ascendopen-source-llm

7 phút đọc