// Posts#llm-optimization
90% hóa đơn AI coding của bạn là tiền trả cho context bạn không cần gửi
#6102026-05-13

90% hóa đơn AI coding của bạn là tiền trả cho context bạn không cần gửi

70-87% tokens trong một coding agent session là waste - không phải code generation. Kỹ thuật context engineering đúng có thể giảm chi phí từ $6-8 xuống $1.50-2.70 mỗi session. Model routing 3 tầng tiết kiệm 51% so với chạy đồng nhất Opus 4.6. Kimi K2.6 vượt GPT-5.4 trên SWE-Bench Pro với chi phí input thấp hơn 8.3 lần.

context-engineeringai-codingllm-optimization
8 phút đọc