MiroFish: Sinh viên 20 tuổi xây engine dự đoán tương lai bằng 60.000 AI Agent trong 10 ngày

TL;DR

Nếu ChatGPT trả lời câu hỏi bằng 1 đoạn văn, MiroFish trả lời bằng cả một xã hội thu nhỏ. Engine này không hỏi một LLM - nó tạo ra hàng nghìn AI agent, mỗi agent có nhân cách, ký ức dài hạn và logic hành vi riêng, rồi thả chúng vào một môi trường mô phỏng mạng xã hội để quan sát hành vi tập thể nổi lên. Kết quả là một báo cáo dự đoán được tổng hợp từ emergent dynamics - thứ mà không một model đơn lẻ nào có thể tự sinh ra.

60.900 stars, 9.500 forks trên GitHub (tính đến tháng 5/2026)
Xây dựng trong 10 ngày bởi sinh viên 20 tuổi tại Đại học Bưu chính Viễn thông Bắc Kinh
30 triệu RMB (~4,1 triệu USD) seed funding từ Shanda Group chỉ trong 24 giờ sau demo
Open-source, license AGPL-3.0, tự host được

MiroFish - giao diện nhập seed material và khởi động mô phỏng

Pipeline 5 bước - từ văn bản đến dự đoán

MiroFish biến một tài liệu bất kỳ thành một thế giới dự đoán qua 5 giai đoạn:

Xây knowledge graph (GraphRAG): Seed material - bài báo, báo cáo tài chính, bản thảo chính sách, thậm chí tiểu thuyết - được xử lý để trích xuất entities và relationships, tạo thành knowledge graph làm nền tảng mô phỏng.
Sinh agent: Từ knowledge graph, engine tạo ra hàng nghìn agent với nhân cách, lịch sử xã hội, quan điểm ban đầu và ký ức dài hạn riêng biệt (lưu trữ qua Zep Cloud).
Mô phỏng song song: Các agent tương tác trên hai platform đồng thời - một giống Twitter, một giống Reddit - được vận hành bởi OASIS framework của CAMEL-AI, có thể scale lên tới 1 triệu agent với 23 loại social action.
Sinh báo cáo: ReportAgent phân tích các opinion shift, coalition formation và behavioral pattern nổi lên, tổng hợp thành báo cáo dự đoán có cấu trúc.
Tương tác sâu: Sau khi mô phỏng xong, người dùng có thể chat trực tiếp với từng agent, hỏi lý do quyết định, hoặc inject biến số mới từ "God's-eye view" để chạy lại kịch bản khác.

MiroFish - knowledge graph của các agent và mối quan hệ xã hội

Con số đáng dừng lại

Một simulation đầy đủ với 1.000 agent qua 100 vòng sẽ tạo ra khoảng 50.000 LLM call. Chi phí thực tế:

Quick prototype (50 agent, 20 vòng, Qwen-plus): $0,50 - $2
Standard run (500 agent, 40 vòng): $8 - $25
Full simulation (1.000 agent, 100 vòng): $40 - $120
Enterprise run (2.000+ agent, 200+ vòng, GPT-4o): $200 - $800+
Budget option với DeepSeek/Gemini Flash: chỉ $5 - $20 cho 1.000 agent/100 vòng

Bộ nhớ dài hạn agent chạy qua Zep Cloud - free tier đủ để thử nghiệm nhỏ, paid plan từ $50 - $200/tháng tùy khối lượng. Đáng lưu ý: free tier giới hạn 5 API req/phút, dễ hit rate limit khi chạy report lớn.

Khác gì ChatGPT và các mô hình thống kê?

Sự khác biệt cốt lõi nằm ở nguồn gốc của câu trả lời:

ChatGPT/single LLM: 1 model → 1 câu trả lời → mang theo bias của chính model đó.
Mô hình thống kê: Dữ liệu lịch sử → ngoại suy → cho ra số liệu và xác suất, nhưng không mô hình hóa được dynamics xã hội (herd effect, opinion polarization, cascade effect).
MiroFish: Hàng nghìn agent tương tác → hành vi tập thể nổi lên → báo cáo narrative - không phải từ 1 model đoán, mà từ emergent result của cả một xã hội mô phỏng.

Điểm yếu cần thẳng thắn: MiroFish chưa có accuracy benchmark được công bố chính thức. Các demo trông "scarily accurate" là impression social media, chưa phải đánh giá khoa học nghiêm túc. Ngoài ra, agent có thể kế thừa RLHF bias từ LLM nền - dễ cho ra outcome "polite" hơn là messy như thực tế con người. Không phù hợp để dự đoán số liệu cứng như giá cổ phiếu chính xác hay vote share.

Ai nên thử ngay

MiroFish mạnh nhất ở các kịch bản định tính - stress-test kịch bản và phát hiện blind spot:

PR & Crisis Communication: Mô phỏng phản ứng của nhiều nhóm dư luận trước một tuyên bố/scandal trước khi phát hành. Demo thực tế: team đã chạy thành công mô phỏng dư luận về một vụ việc tại Đại học Vũ Hán, tạo ra full sentiment report từ document phân tích xã hội.
Tài chính: Mô phỏng phản ứng của các nhóm investor khác nhau (retail, institutional, media) với Fed rate hike hay earnings surprise - không phải đoán "giá về bao nhiêu" mà là "các nhóm sẽ react và ảnh hưởng nhau thế nào".
Chính sách công: Test bản thảo chính sách để phát hiện unexpected alliances hoặc messaging risk trước khi công bố chính thức.
Creative/Narrative: Team đã feed 80 chương đầu của Hồng Lâu Mộng để mô phỏng và dự đoán phần kết bị mất - hoàn toàn dựa trên tính cách nhân vật, không phải tác giả viết.

MiroFish demo - mô phỏng dư luận tại Đại học Vũ Hán

20 tuổi, 10 ngày, và câu hỏi tiếp theo

Câu chuyện đằng sau MiroFish không kém phần thú vị: Guo Hangjiang (aka "Baifu") bắt đầu với BettaFish - một tool phân tích sentiment đa agent ra mắt cuối 2024, đạt #1 GitHub Trending và 20.000 stars trong 1 tuần. Điều này thu hút sự chú ý của Chen Tianqiao, nhà sáng lập Shanda Group - người theo đuổi lý thuyết "super-individual": trong kỷ nguyên AI, một cá nhân có thể tạo ra thứ tương đương cả một công ty.

Chen mời Guo internship tại Shanda với toàn quyền sáng tạo. Kết quả: MiroFish được xây dựng trong 10 ngày bằng "vibe coding" - phương pháp phát triển nhanh dựa nặng vào AI coding assistants. Tối hôm đó Guo gửi video demo cho Chen. 24 giờ sau: 30 triệu RMB (~4,1 triệu USD) đầu tư seed, và một intern 20 tuổi trở thành CEO overnight.

Roadmap sắp tới bao gồm các example pre-built cho "Financial Prediction" và "Political News Prediction". Team đang tuyển dụng (contact: [email protected]). Milestone quan trọng nhất chưa đến: formal backtesting để chứng minh simulation output thực sự predictive - không chỉ plausible.

Một nhà phân tích nhận xét: "MiroFish đại diện cho Grounded Emergence - lần đầu tiên chúng ta thấy multi-agent simulation chuyển từ academic toy thành decision-support tool thực sự accessible cho cộng đồng open-source."

via GitHub - 666ghj/MiroFish · Emelia.io · Beitroot