TL;DR

Ngày 22/04/2026, OpenAI công bố Privacy Filter — một model token-classification mã nguồn mở dùng để phát hiện và che thông tin cá nhân (PII) trong văn bản. Model có 1.5B tham số tổng, nhưng chỉ 50M active nhờ kiến trúc sparse mixture-of-experts, đủ nhỏ để chạy ngay trong trình duyệt qua WebGPU. OpenAI tuyên bố đạt 96% F1 trên benchmark PII-Masking-300k ngay khi dùng out-of-the-box, cửa sổ ngữ cảnh 128.000 token, và kèm một CLI tên opf. Tất cả phát hành dưới Apache 2.0 trên Hugging Face và GitHub.

What’s new

Đây là release đầu tay của Mihai Maruseac tại OpenAI, thông báo trực tiếp trên X. Ba thứ cùng ship trong một ngày:

Khác với các API cloud PII như AWS Comprehend hay Google DLP, Privacy Filter chạy hoàn toàn on-device — dữ liệu nhạy cảm không rời máy người dùng.

Why it matters

Trước đây, muốn che PII trước khi đẩy văn bản vào LLM, đội dev có ba lựa chọn: regex/pattern (dễ sai), Microsoft Presidio hay spaCy NER (chính xác vừa phải, chạy CPU ổn), hoặc gọi API cloud (tốt nhưng phải gửi dữ liệu nhạy cảm ra ngoài). Privacy Filter là lần đầu một model cấp frontier có thể chạy thẳng trong browser qua WebGPU mà chất lượng vẫn cạnh tranh. Với doanh nghiệp regulated (y tế, luật, tài chính), điều này mở ra workflow mới: sanitize ngay ở client trước khi gọi bất kỳ LLM nào — kể cả của OpenAI.

Technical facts

Thuộc tínhGiá trị
Tham số tổng / active1.5B / 50M
Kiến trúcBidirectional token classifier + span decoding
Transformer blocks8, lặp lại
AttentionGrouped-query (14 query / 2 KV, group size 7) + banded (band 128)
MoE128 experts, top-4 routing
d_model640
Context window128.000 tokens
Output classes33 (1 background + 8 PII × BIOES)
Benchmark96% F1 trên PII-Masking-300k
LicenseApache 2.0

Điểm đáng chú ý: model không autoregressive. Toàn bộ token trong cửa sổ 128K được label trong một forward pass, nghĩa là độ trễ tuyến tính theo độ dài văn bản chứ không bình phương, và không có phase generate. Đó là lý do 50M active params lại đủ nhanh cho browser inference real-time.

How to run

Chạy trong browser qua Transformers.js:

import { pipeline } from "@huggingface/transformers";

const classifier = await pipeline(
  "token-classification", "openai/privacy-filter",
  { device: "webgpu", dtype: "q4" },
);

const out = await classifier(
  "My name is Harry Potter and my email is harry.potter@hogwarts.edu.",
  { aggregation_strategy: "simple" },
);

Chạy qua CLI:

pip install -e .
opf "Alice was born on 1990-01-02."
opf -f /path/to/file
cat logs.txt | grep ERROR | opf

Comparison

  • vs Presidio / spaCy NER: Privacy Filter dùng ngữ cảnh hai chiều, phân biệt được "Apple" là công ty hay tên người; Presidio dựa nhiều vào pattern + rules.
  • vs cloud PII APIs (AWS Comprehend, Google DLP): chạy offline, không phát sinh cước, không có vendor lock-in, không để lại log bên thứ ba.
  • vs GLiNER: cửa sổ 128K token cho phép xử lý tài liệu dài trong một lần gọi, thay vì phải chunk.

Use cases

  • Luật sư chia sẻ ghi chú case với LLM mà không lộ danh tính khách hàng.
  • Bác sĩ soạn referral mà không rò rỉ thông tin bệnh nhân.
  • Doanh nghiệp SMB tóm tắt email khách hàng mà không đẩy tên thật sang bên thứ ba.
  • Data team sanitize dataset trước khi fine-tune hoặc eval.
  • Dev pipelines strip secrets, API keys, password khỏi log trước khi ship sang observability tool.

Limitations & pricing

Miễn phí (Apache 2.0). Nhưng OpenAI cảnh báo thẳng: “not an anonymization tool, a compliance certification, or a substitute for policy review.” Các giới hạn đã công bố:

  • Tối ưu cho tiếng Anh — chất lượng giảm với non-English và non-Latin scripts.
  • Chỉ có 8 span types cố định: private_person, private_address, private_email, private_phone, private_url, private_date, account_number, secret. Muốn thêm nhãn tuỳ chỉnh phải fine-tune.
  • Có thể bỏ sót identifier lạ hoặc over-redact với câu quá ngắn.
  • Không thay thế được privacy-by-design tổng thể — vẫn cần policy review, access control, audit log.

What’s next

Release đã ship kèm workflow fine-tuning ngay ngày đầu, gợi ý đội ngũ kỳ vọng cộng đồng sẽ đóng góp các label policy riêng (PII theo GDPR, HIPAA, PCI-DSS). Multilingual support và custom label schema là hai hướng tự nhiên tiếp theo, dù OpenAI chưa công bố roadmap cụ thể.

Nguồn: Hugging Face, GitHub, VentureBeat, Decrypt.