TL;DR

  • Single Grain đã build Company Brain với 500K+ tokens persistent memory và 90+ daily crons - sau 3 tuần đầu thất bại vì memory trở thành bottleneck

  • Chìa khóa: Memory là nguyên liệu thô. Retrieval là lớp vận hành.

  • Kiến trúc 5 lớp: Capture - Retrieval - Source Truth - Permissions - Feedback Loops

  • Báo cáo hàng tuần từ 25 phút + hàng giờ follow-up xuống còn dưới 60 giây

Company Brain 5 Layers - intelligence layer ngồi giữa context và công việc team cần làm

Kiến trúc 5 lớp của Company Brain: từ Capture đến Feedback Loops

Vấn đề: khi memory trở thành bottleneck

Công ty bạn đã có một bộ não. Chỉ là nó đang nằm rải rác trên Slack, Gong, HubSpot, và trong đầu người đang nghỉ phép hôm nay.

Khi Eric Siu và team Single Grain bắt đầu xây dựng internal agent fleet, giải pháp hiển nhiên là memory. Cho mỗi agent thêm context. Lưu các note hữu ích. Giữ lại call transcripts. Để hệ thống nhớ những gì con người hay quên.

Nó hoạt động được khoảng ba tuần. Rồi memory chính nó trở thành điểm nghẽn.

Các file persistent memory bắt đầu chiếm khoảng 40% context window. Các agent có nhiều thông tin hơn, nhưng chúng không phải lúc nào cũng kéo đúng thông tin vào đúng lúc. Hệ thống technically thông minh hơn, nhưng về mặt vận hành thì rối hơn nhiều.

Và vòng lặp cũ vẫn tồn tại:

Call transcript → Random notes → Human nhớ → Agent bắt đầu từ đầu → Human giải thích lại

Vòng lặp đó không scale được. Con người trở thành router - mọi output của agent đều phụ thuộc vào việc có ai đó nhớ đúng cuộc gọi, copy đúng note, paste đúng context, hay sửa cùng một lỗi lần thứ năm hay không.

Memory là nguyên liệu thô - Retrieval là lớp vận hành

Single Grain rebuild hệ thống xung quanh một ý tưởng khác: thay vì nhồi tất cả vào memory, hãy xây dựng một retrieval layer biết cần kéo gì cho từng task cụ thể.

So sánh cách cũ (human là router) vs cách mới (retrieval là operating layer)

Bên trái: vòng lặp cũ phụ thuộc vào human làm router. Bên phải: hệ thống mới với Retrieval hub xử lý context tự động.

Hệ thống hiện tại của Single Grain chạy trên toàn bộ workflows thực tế với 500K+ tokens persistent memory, hơn 90 daily crons, nhiều specialized agents, và hàng nghìn sales calls liên tục feed vào hệ thống.

Một ví dụ cụ thể: 2.862 Gong call transcripts được xử lý thành operational playbooks. Trong một ngày ingestion thông thường, 15 cuộc gọi tạo ra 390 insights, 470 facts, và 125 frameworks - không phải vì con số lớn, mà vì hệ thống có thể biến "company exhaust" rải rác thành operating intelligence có thể tái sử dụng.

Một cuộc gọi không còn chỉ là một cuộc gọi. Nó trở thành: thư viện objections, input cho sales training, tín hiệu positioning, nguồn ý tưởng content, cờ rủi ro CRM, và instruction cho các agent tương lai.

Kiến trúc 5 lớp của Company Brain

Lớp 1: Capture - Thu thập nguyên liệu thô

Đây là nơi hầu hết các team bắt đầu - và cũng là nơi họ dừng lại. Record meetings. Transcribe calls. Lưu Slack threads. Dump docs vào vector database. Rồi gọi nó là "brain".

Đó là một kho chứa, không phải brain.

Tại Single Grain, capture bao gồm: calls, CRM activity, content decisions, internal SOPs, agent outputs, daily logs, và corrections từ con người. Mục tiêu không phải tích lũy thêm thông tin - mà là làm cho work surface thông minh hơn mỗi tuần.

Lớp 2: Retrieval - Kéo đúng context vào đúng lúc

Một agent không cần toàn bộ lịch sử công ty. Nó chỉ cần 6 mảnh context quan trọng cho task đang xử lý.

  • Viết outbound email: ICP + offer + objections + prior campaign performance + brand voice + current campaign goal

  • Review pipeline: deal stage changes + stalled accounts + recent call notes + objections + next steps + CRM hiện tại

  • Viết content: actual POV + recent performance + approved claims + examples đã dùng + proof layer của bài đó

Đây là nơi nhiều AI systems thất bại âm thầm nhất. Chúng trông smart trong demo vì context được cấp sẵn. Rồi sụp đổ trong production vì không ai xây dựng retrieval layer.

Lớp 3: Source Truth - Xác định nguồn nào đáng tin

Một khi agents có thể retrieve context, vấn đề tiếp theo là trust. Nguồn nào thắng khi có conflict?

Sales call? CRM field? Slack correction? Old SOP? Báo cáo tuần mới nhất? Voice note mới nhất của founder?

Nếu không trả lời câu hỏi này, agents trở thành "confident liars with better formatting" - nói tự tin nhưng nói sai với format đẹp hơn.

Single Grain phải xử lý source hierarchy như một bài toán thiết kế vận hành: một số nguồn là live truth, một số là historical context, một số là inspiration, một số không bao giờ được dùng trong public content.

Lớp 4: Permissions - Đúng brain cho đúng workflow

Company intelligence trở nên nguy hiểm khi mọi agent đều thấy mọi thứ. Marketing agent không cần HR details. Content agent không cần client financials. Sales agent không cần mọi internal leadership note.

Một Company Brain thực sự cần workflow-level permissions - hệ thống phải biết task được phép dùng gì trước khi bắt đầu generate câu trả lời.

Điều này đặc biệt quan trọng với agencies và services companies: client context, internal context, prospect context, financial context, và strategy context nằm gần nhau. Không build permission boundaries sớm thì sẽ chỉ có hai lựa chọn - leak thông tin hoặc neuter hệ thống đến mức vô dụng.

Mục tiêu không phải một brain lớn không có tường. Mục tiêu là đúng brain cho đúng workflow.

Lớp 5: Feedback Loops - Lớp làm cho hệ thống compound

Đây là lớp khiến company brain trở thành company learning.

Mỗi lần human sửa lỗi của agent, correction đó phải trở thành hành vi tương lai:

  • Agent dùng câu cứng nhắc → voice rule update

  • Cite ví dụ không an toàn → source rule update

  • Bỏ sót CRM risk signal → pipeline scan update

  • Route công việc sai chỗ → workflow rule update

Không có feedback loops thì chỉ đang babysitting software. Với feedback loops, mỗi correction trở thành một lần training rep cho toàn bộ operating system.

Audit framework: 6 câu hỏi trước khi automate bất kỳ workflow nào

Chọn một workflow đang lãng phí thời gian: báo cáo tuần, pipeline review, content drafting, sales call follow-up, client onboarding, proposal creation. Sau đó hỏi 6 câu này:

  1. Workflow này phụ thuộc vào những nguồn nào?

  2. Khi các nguồn conflict, nguồn nào thắng?

  3. Agent cần context gì mỗi lần chạy?

  4. Context nào agent không được phép thấy?

  5. Human corrections nào lặp lại nhiều lần nhất?

  6. Một correction trở thành rule tương lai như thế nào?

Nếu chưa trả lời được 6 câu trên thì chưa sẵn sàng automate workflow đó. Chỉ đang làm cho sự lộn xộn chạy nhanh hơn.

Single Grain thấy điều này rõ nhất với reporting. Flow cũ: data pulling + manual interpretation + leadership follow-up + thêm clarification - tổng cộng khoảng 25 phút data pulling cộng thêm hàng giờ follow-up. Sau khi brain có đúng context: câu trả lời về trong dưới 60 giây.

Con số tiết kiệm thời gian là phụ. Thứ quan trọng hơn là decision latency: khi công ty có thể đặt câu hỏi tốt hơn với tốc độ nhanh hơn, nó bắt đầu vận hành theo cách khác hoàn toàn.

Kết: intelligence layer, không phải prompt library

Các công ty thắng với AI sẽ không phải là công ty có prompt library lớn nhất. Đó sẽ là công ty có intelligence layer sạch nhất.

Năm 2026, đây không còn là lý thuyết. YC Spring 2026 Requests for Startups gọi thẳng: "best AI-native companies đã làm cho toàn bộ công ty queryable". Bản thân Single Grain đang launch singlebrain.com - một managed service xây trên chính framework này cho các client bên ngoài.

Bốn động từ tóm tắt toàn bộ: Capture the work. Retrieve the right context. Know what to trust. Turn every correction into a rule.

Đó là cách brain compounds.- via singlebrain.com