- Gartner công nhận Semantic Layers là 'non-negotiable' budget item trong Top Trends Data & Analytics 2026.
- Liber AI ra mắt OntoEKG - pipeline LLM open-source xây ontology tự động từ text doanh nghiệp, đạt F1-score 0.724 ở miền Data nhưng chỉ 0.121 ở Finance.
- OntoBoom, Termboard, OntoView đang dân chủ hóa semantic modeling cho non-expert - gra.fo retiring.
- Neo4j ($200M ARR, 84% Fortune 100) đặt Ontologies là First-Class Citizen trong roadmap 2026.
TL;DR
Năm 2026 chính thức được gọi là "năm của ontology". Làn sóng công cụ mới - OntoBoom, Termboard, OntoView - đang cố gắng làm cho semantic modeling trở nên dễ tiếp cận hơn với người không phải chuyên gia, trong khi Liber AI ra mắt OntoEKG - pipeline LLM tự động hóa việc xây dựng ontology doanh nghiệp từ văn bản thô. Gartner đã đặt Semantic Layers vào danh sách top trends 2026, còn giới chuyên gia cảnh báo về nguy cơ "vibe ontology" - hệ quả của việc tin mù quáng vào LLM để viết ontology.

2026 - Năm của Ontology
Gartner công bố Data Management, Semantic Layers và GraphRAG là ba trong những xu hướng hàng đầu của Data & Analytics 2026. Theo Gartner, ngân sách cho semantic capabilities giờ là "non-negotiable" ở các doanh nghiệp lớn - không phải tùy chọn, mà là yêu cầu bắt buộc.
Nhìn lại, turning point xảy ra vào 2024: graph trở thành phân khúc tăng trưởng nhanh nhất trong AI research. Tại NeurIPS 2025, graph chiếm một phần đáng kể nội dung. Năm 2026 được cộng đồng gọi là "năm của ontology" vì AI agents đã phơi bày ra khoảng trống lớn mà industry đã tảng lờ nhiều năm: thiếu ngữ nghĩa cấu trúc.
Neo4j - doanh nghiệp graph database với $200M ARR và penetration đến 84% Fortune 100 - đã đặt "Ontologies as First-Class Citizen" vào roadmap 2026, bao gồm một công cụ modeling độc lập với thư viện mẫu theo use case và graph schema enforcement native.
'Figma Moment' cho Semantic Tooling
Anna Bergevin chỉ ra vấn đề cốt lõi: các công cụ semantic hiện tại được xây cho chuyên gia, không phải cho người mới bắt đầu. Tương tự như cách Figma dân chủ hóa thiết kế mà không làm mất giá trị của designer chuyên nghiệp, semantic tooling cần một bước nhảy tương tự.
Bức tranh công cụ đang thay đổi rõ rệt:
- Đang nổi lên: Termboard (sketch tool nhẹ hỗ trợ ChatGPT), OntoView (visualization), OntoBoom (visual canvas + AI Copilot + SHACL validation real-time)
- Đang lui về: gra.fo chính thức retiring
- Truyền thống: Protégé, TopBraid, PoolParty - vẫn mạnh với expert users nhưng learning curve dốc
OntoBoom là ví dụ nổi bật nhất. Được xây "cho kỷ nguyên agentic AI", nó cho phép thiết kế "semantic contracts" - bộ quy tắc ràng buộc AI agents phải tuân theo. Thay vì để agent đoán stat_cd = A là gì, ontology định nghĩa rõ: Customer hasStatus Active. Tính năng gồm drag-and-drop canvas, AI Copilot, real-time validation, import từ SQL/CSV/JSON/RDF, export sang OWL, Turtle, SHACL shapes và Cypher. Giá từ $0 (1 project, 5 AI credits) đến $49/tháng cho team. OntoBoom còn hỗ trợ MCP Protocol - kết nối trực tiếp Claude Desktop và AI assistants vào ontology của bạn.
Bẫy 'Vibe Ontology'
Khi LLM trở nên mạnh hơn, nhiều người bị cám dỗ để chúng tự viết ontology. Frédéric Verhelst và Joe Hoeller đặt tên cho kết quả này là "vibe ontologies" - và cảnh báo không nên tin mù quáng. Như Verhelst tổng kết: "Connectivity without semantics is just faster error."
Nghiên cứu từ OntoEKG (Liber AI, 2026) xác nhận ba giới hạn cụ thể của LLM trong ontology construction:
- Xác định scope: LLM khó tự mình định nghĩa ranh giới domain - cần human signaling rõ ràng về boundary của classes và properties
- Individuals vs classes: LLM hay nhầm entity cụ thể (cá nhân, địa điểm) với category trừu tượng do không có yêu cầu về level of abstraction
- Hierarchical reasoning: Trong giai đoạn entailment, LLM đôi khi đảo ngược chiều subsumption, phá vỡ tính nhất quán logic của RDF model
Kết luận của cộng đồng thực tế: knowledge engineers có thể dùng LLM như một công cụ hỗ trợ có chủ đích - tăng tốc workflow, gợi ý cấu trúc - nhưng không phải thay thế hoàn toàn quá trình modeling có chủ ý.
Con Số Đằng Sau
Liber AI ra mắt OntoEKG vào tháng 2/2026 (arXiv:2602.01276) - một pipeline LLM open-source gồm hai module: Extraction (Gemini 3 Flash) và Entailment (Claude 4.5 Opus). Pipeline tự động hóa việc tạo ontology từ văn bản doanh nghiệp thô và serialize sang chuẩn RDF.
Kết quả thực nghiệm trên ba domain doanh nghiệp:
| Domain | Fuzzy F1 | Exact F1 |
|---|---|---|
| Data | 0.724 | 0.102 |
| Finance | 0.121 | 0.000 |
| Logistics | - | 0.048 |
Miền Finance khó nhất - F1 chỉ đạt 0.121 do LLM bất đồng về việc term nào thuộc ontology. Fuzzy matching threshold được đặt ở 0.94 (Data & Finance) và 0.95 (Logistics). Khoảng cách giữa fuzzy và exact match cho thấy LLM-generated ontology vẫn còn xa so với gold standard khi đánh giá nghiêm ngặt.
Bên cạnh OntoEKG, cộng đồng đang phát triển nhiều benchmark đánh giá song song: LettrIA & EURECOM hợp tác ra một bộ, một nhóm nghiên cứu Đức - Anh phát triển bộ khác. Jesús Barrasa và Alexander Erdl của Neo4j cũng đang implement các metric đánh giá chất lượng ontology từ tổng hợp các paper học thuật trong series "Evaluating the Quality of Ontologies".
Tiếp Theo là Gì?
Hướng đi tiếp theo rất rõ ràng: từ RAG sang KAG - Knowledge Augmented Generation. Thay vì dùng graph chỉ để retrieval, mục tiêu là tích hợp knowledge graph như một "reasoning substrate" - backbone ngữ nghĩa giúp AI không chỉ lấy thông tin mà còn suy luận trên đó. Nghiên cứu từ Graphwise cho thấy ontology-based knowledge graph tăng đáng kể multi-hop Q&A accuracy của GraphRAG so với phiên bản schemaless.
OntoEKG sẽ tiếp tục phát triển với: end-to-end translation từ text sang RDF, xử lý named individuals và provenance, progressive construction (feed model cũ vào cùng input mới để duy trì nhất quán qua nhiều document), và xây dựng benchmark cộng đồng toàn diện.
Neo4j dự kiến ra mắt native modeling tool với sample library và schema enforcement trong năm 2026. Cộng đồng semantic web đang ở điểm bước ngoặt thực sự - không phải vì đột phá công nghệ đơn thuần, mà vì AI agents đã khiến câu hỏi "AI của chúng ta hiểu gì?" không còn là lý thuyết.
Nguồn: Year of the Graph Newsletter Vol.30, Spring 2026 - arXiv:2602.01276 (OntoEKG) - OntoBoom.
