#9672026-05-06
Gemini Embedding 2: Google dùng búp bê Matryoshka để cắt 75% chi phí vector
Gemini Embedding 2 là embedding model multimodal đầu tiên của Google, xử lý text, ảnh, video, audio và PDF trong cùng một embedding space. Kỹ thuật Matryoshka Representation Learning (MRL) cho phép cắt vector từ 3,072 xuống 768 chiều - tiết kiệm 4x lưu trữ với dưới 10% suy giảm chất lượng. Nuuly tăng Match@20 từ 60% lên 87%; Supermemory tăng Recall@1 thêm 40%. GA từ cuối tháng 4/2026, dùng được qua Gemini API và Vertex AI.