// Posts#local-ai
Hermes Desktop - AI Agent Nguyên Bản cho Windows Đã Tới
#7602026-06-02

Hermes Desktop - AI Agent Nguyên Bản cho Windows Đã Tới

Nous Research vừa công bố Hermes Desktop public preview - ứng dụng Windows native cho Hermes Agent với 94 skills, soul identity system, và bộ nhớ dài hạn. Được demo lần đầu tại GTC keynote của Jensen, công cụ này đánh dấu bước chuyển từ chatbot thụ động sang AI Agent chủ động chạy 24/7 trên máy cá nhân.

hermes-agentwindowsai-agent
8 phút đọc
llama.cpp, MLX, ExLlamaV2 và ExLlamaV3: Chọn engine nào cho Local AI 2026?
#7152026-05-21

llama.cpp, MLX, ExLlamaV2 và ExLlamaV3: Chọn engine nào cho Local AI 2026?

Bốn họ engine local chiếm ưu thế trong 2026, mỗi họ phục vụ một mục tiêu riêng. llama.cpp chạy được ở bất cứ đâu. MLX là vũ khí của Apple Silicon. ExLlamaV2 tối ưu cho một RTX đơn. ExLlamaV3 mở rộng sang 2-4 GPU consumer với EXL3 - fit model 70B vào 16GB VRAM.

llama-cppmlx-apple-siliconexllama
8 phút đọc
Inference Engine cho LLM: Kiến trúc và nền tảng bạn cần hiểu trước khi chọn
#7142026-05-21

Inference Engine cho LLM: Kiến trúc và nền tảng bạn cần hiểu trước khi chọn

Inference engine không phải là model - nó là lớp phần mềm quyết định latency, chi phí và khả năng mở rộng. Prefill là compute-bound, decode là memory bandwidth-bound, và 5 bottleneck thực sự không liên quan gì đến thông số GPU bạn thường xem. Bài đầu trong series 4 phần về Self-hosted LLM 2026.

inference-enginellmself-hosted-llm
7 phút đọc
Hermes Kanban Bridge v1.3.0: Biến Obsidian vault thành command center cho AI agent
#3852026-04-24

Hermes Kanban Bridge v1.3.0: Biến Obsidian vault thành command center cho AI agent

Plugin Obsidian + 13 REST endpoints, zero dependencies, ~45KB bundle. Hermes agent giờ có thể tự break-down dự án, di chuyển card, chạy standup hằng tuần — toàn bộ offline, trên máy của bạn.

hermes-agentobsidiankanban
6 phút đọc
AppFlowy - Workspace mã nguồn mở với Local AI miễn phí thay thế Notion
#0702025-04-25

AppFlowy - Workspace mã nguồn mở với Local AI miễn phí thay thế Notion

AppFlowy là workspace mã nguồn mở (AGPLv3) với 71.200 GitHub stars, định vị thay thế Notion với data ownership hoàn toàn. Local AI chạy qua Ollama miễn phí 100%, hỗ trợ Llama 3, Mistral 7B, Gemma 3 ngay trên máy - không gửi dữ liệu ra ngoài. Vault Workspace (v0.9.5) là môi trường offline hoàn toàn với RAG search và AI chat file cục bộ. Phiên bản mới nhất v0.11.9, hỗ trợ macOS, Windows, Linux, iOS, Android.

open-sourceproductivitylocal-ai
7 phút đọc