OpenAI ra mắt Privacy Filter: model mã nguồn mở chạy ngay trong trình duyệt để che PII

TL;DR

Ngày 22/04/2026, OpenAI công bố Privacy Filter — một model token-classification mã nguồn mở dùng để phát hiện và che thông tin cá nhân (PII) trong văn bản. Model có 1.5B tham số tổng, nhưng chỉ 50M active nhờ kiến trúc sparse mixture-of-experts, đủ nhỏ để chạy ngay trong trình duyệt qua WebGPU. OpenAI tuyên bố đạt 96% F1 trên benchmark PII-Masking-300k ngay khi dùng out-of-the-box, cửa sổ ngữ cảnh 128.000 token, và kèm một CLI tên opf. Tất cả phát hành dưới Apache 2.0 trên Hugging Face và GitHub.

What’s new

Đây là release đầu tay của Mihai Maruseac tại OpenAI, thông báo trực tiếp trên X. Ba thứ cùng ship trong một ngày:

Model weights tại huggingface.co/openai/privacy-filter ở định dạng Safetensors (F32/BF16).
CLI opf tại github.com/openai/privacy-filter — chạy one-shot, redact file, nhận piped input, eval trên labeled data, và fine-tune bằng opf train.
Demo Space tại huggingface.co/spaces/openai/privacy-filter để thử nhanh trên trình duyệt.

Khác với các API cloud PII như AWS Comprehend hay Google DLP, Privacy Filter chạy hoàn toàn on-device — dữ liệu nhạy cảm không rời máy người dùng.

Why it matters

Trước đây, muốn che PII trước khi đẩy văn bản vào LLM, đội dev có ba lựa chọn: regex/pattern (dễ sai), Microsoft Presidio hay spaCy NER (chính xác vừa phải, chạy CPU ổn), hoặc gọi API cloud (tốt nhưng phải gửi dữ liệu nhạy cảm ra ngoài). Privacy Filter là lần đầu một model cấp frontier có thể chạy thẳng trong browser qua WebGPU mà chất lượng vẫn cạnh tranh. Với doanh nghiệp regulated (y tế, luật, tài chính), điều này mở ra workflow mới: sanitize ngay ở client trước khi gọi bất kỳ LLM nào — kể cả của OpenAI.

Technical facts

Thuộc tính	Giá trị
Tham số tổng / active	1.5B / 50M
Kiến trúc	Bidirectional token classifier + span decoding
Transformer blocks	8, lặp lại
Attention	Grouped-query (14 query / 2 KV, group size 7) + banded (band 128)
MoE	128 experts, top-4 routing
d_model	640
Context window	128.000 tokens
Output classes	33 (1 background + 8 PII × BIOES)
Benchmark	96% F1 trên PII-Masking-300k
License	Apache 2.0

Điểm đáng chú ý: model không autoregressive. Toàn bộ token trong cửa sổ 128K được label trong một forward pass, nghĩa là độ trễ tuyến tính theo độ dài văn bản chứ không bình phương, và không có phase generate. Đó là lý do 50M active params lại đủ nhanh cho browser inference real-time.

How to run

Chạy trong browser qua Transformers.js:

import { pipeline } from "@huggingface/transformers";

const classifier = await pipeline(
  "token-classification", "openai/privacy-filter",
  { device: "webgpu", dtype: "q4" },
);

const out = await classifier(
  "My name is Harry Potter and my email is harry.potter@hogwarts.edu.",
  { aggregation_strategy: "simple" },
);

Chạy qua CLI:

pip install -e .
opf "Alice was born on 1990-01-02."
opf -f /path/to/file
cat logs.txt | grep ERROR | opf

Comparison

vs Presidio / spaCy NER: Privacy Filter dùng ngữ cảnh hai chiều, phân biệt được "Apple" là công ty hay tên người; Presidio dựa nhiều vào pattern + rules.
vs cloud PII APIs (AWS Comprehend, Google DLP): chạy offline, không phát sinh cước, không có vendor lock-in, không để lại log bên thứ ba.
vs GLiNER: cửa sổ 128K token cho phép xử lý tài liệu dài trong một lần gọi, thay vì phải chunk.

Use cases

Luật sư chia sẻ ghi chú case với LLM mà không lộ danh tính khách hàng.
Bác sĩ soạn referral mà không rò rỉ thông tin bệnh nhân.
Doanh nghiệp SMB tóm tắt email khách hàng mà không đẩy tên thật sang bên thứ ba.
Data team sanitize dataset trước khi fine-tune hoặc eval.
Dev pipelines strip secrets, API keys, password khỏi log trước khi ship sang observability tool.

Limitations & pricing

Miễn phí (Apache 2.0). Nhưng OpenAI cảnh báo thẳng: “not an anonymization tool, a compliance certification, or a substitute for policy review.” Các giới hạn đã công bố:

Tối ưu cho tiếng Anh — chất lượng giảm với non-English và non-Latin scripts.
Chỉ có 8 span types cố định: private_person, private_address, private_email, private_phone, private_url, private_date, account_number, secret. Muốn thêm nhãn tuỳ chỉnh phải fine-tune.
Có thể bỏ sót identifier lạ hoặc over-redact với câu quá ngắn.
Không thay thế được privacy-by-design tổng thể — vẫn cần policy review, access control, audit log.

What’s next

Release đã ship kèm workflow fine-tuning ngay ngày đầu, gợi ý đội ngũ kỳ vọng cộng đồng sẽ đóng góp các label policy riêng (PII theo GDPR, HIPAA, PCI-DSS). Multilingual support và custom label schema là hai hướng tự nhiên tiếp theo, dù OpenAI chưa công bố roadmap cụ thể.

Nguồn: Hugging Face, GitHub, VentureBeat, Decrypt.

OpenAI ra mắt Privacy Filter: model mã nguồn mở chạy ngay trong trình duyệt để che PII

TL;DR

What’s new

Why it matters

Technical facts

How to run

Comparison

Use cases

Limitations & pricing

What’s next

Tiếp tục lướt

Mind DeepResearch 30B của Li Auto vượt Gemini 3.1 trên benchmark deep research

Huihui4-8B-A4B: cắt 96 expert khỏi Gemma 4 mà perplexity vẫn đẹp hơn bản gốc

Carnice-V2-27b: a 27B open-source agent model built on Qwen3.6 lands on Hugging Face

Qwen3.6-27B chạy local trên MacBook Pro: model 27B đánh bại 397B trên benchmark coding

DeepSeek V4 Pro tự hack 3 challenge PortSwigger và 1 app Android — review bởi Claude Opus 4.7