TL;DR
- GPT-Rosalind là model AI đầu tiên của OpenAI trong series Life Sciences, công bố 16/04/2026.
- Fine-tuned cho biochemistry, genomics, protein engineering — không phải general-purpose.
- Đạt 0.751 pass rate trên BixBench, vượt GPT-5.4 ở 6/11 task LABBench2, xếp trên 95th percentile human expert ở RNA sequence-to-function prediction (Dyno Therapeutics eval).
- Mục tiêu: nén timeline 10–15 năm từ target discovery đến phê duyệt thuốc tại Mỹ.
- Launch partners: Amgen, Moderna, Allen Institute, Thermo Fisher Scientific, Novo Nordisk, Los Alamos National Laboratory.
- Truy cập gated — chỉ enterprise Mỹ được vetted qua trusted-access program.
What's new
Ngày 16/04/2026, OpenAI chính thức mở ra một hướng đi hoàn toàn mới: thay vì chạy theo quy mô mô hình general-purpose, công ty ra mắt GPT-Rosalind — model domain-specific đầu tiên, được fine-tune riêng cho nghiên cứu khoa học đời sống.
Tên gọi là lời tri ân dành cho Rosalind Franklin, nhà hóa học người Anh có những tấm ảnh nhiễu xạ tia X đặt nền móng cho việc phát hiện cấu trúc xoắn kép DNA — đóng góp mà bà không được ghi nhận trong giải Nobel 1962 trao cho Watson, Crick và Wilkins.
Không giống các GPT trước đó, Rosalind không được huấn luyện trải rộng mọi domain. Nó tập trung vào reasoning sâu về chuỗi gen, cấu trúc hóa học, protein và các giao thức thí nghiệm — những lĩnh vực mà GPT general-purpose thường chỉ xử lý bề mặt.
Why it matters
Tại Mỹ, trung bình cần 10 đến 15 năm để đưa một loại thuốc từ giai đoạn phát hiện mục tiêu (target discovery) đến lúc được cơ quan quản lý phê duyệt. Phần lớn khoảng thời gian đó không nằm ở những khoảnh khắc đột phá, mà ở các công việc phân tích lặp đi lặp lại: rà hàng trăm bài báo, thiết kế reagent, diễn giải dữ liệu sinh học phức tạp.
GPT-Rosalind tấn công chính khúc này. OpenAI không tuyên bố thay thế nhà khoa học — điều họ nhắm tới là giúp các team đi qua phần analytical nặng nhọc nhất nhanh hơn, để bản thân nhà khoa học tập trung cho hypothesis, thiết kế thí nghiệm, ra quyết định.
"AI is reshaping industries and in life sciences, it can help people live better, longer lives." — Sam Altman, CEO OpenAI
Technical facts
Các con số OpenAI công bố:
| Benchmark / Eval | Kết quả GPT-Rosalind | Ý nghĩa |
|---|---|---|
| BixBench (Edison Scientific) | 0.751 pass rate | Leading performance trên các task bioinformatics thực tế: xử lý sequencing, thống kê, diễn giải genomic |
| LABBench2 (vs GPT-5.4) | Thắng 6/11 task | Lợi thế lớn nhất ở CloningQA — thiết kế reagent end-to-end cho molecular cloning |
| Dyno Therapeutics RNA eval | >95th percentile (prediction), 84th percentile (generation) | Trên RNA sequences chưa từng publish — loại trừ memorization |
Kèm theo model, OpenAI còn tung Life Sciences research plugin cho Codex, kết nối tới hơn 50 công cụ khoa học và data pipeline: database sinh học, computational tool, thư viện phân tích. Các nhà nghiên cứu có thể query database, parse literature, chạy tool tính toán, và đề xuất experimental pathway — tất cả trong một interface.
Comparison
So với GPT-5.4 general-purpose, Rosalind thắng ở 6/11 task LABBench2, với cách biệt rõ nhất ở CloningQA. Điều này phản ánh industry trend mới: thay vì làm model càng to càng tốt, các lab AI đang đầu tư vào model chuyên biệt theo domain.
Về bối cảnh cạnh tranh, Bloomberg gọi đây là động thái OpenAI "takes on Google" — Google DeepMind với AlphaFold và spinoff Isomorphic Labs đang là người đi đầu trong AI cho phát triển thuốc. Sự khác biệt: AlphaFold là công cụ chuyên dự đoán cấu trúc protein 3D, còn GPT-Rosalind là agentic reasoning model bao quát cả workflow end-to-end — từ đọc paper đến thiết kế protocol.
Đáng chú ý, Novo Nordisk — đối tác enterprise của OpenAI (công bố 14/04/2026) — đồng thời cũng hợp tác với Nvidia dùng siêu máy tính sovereign AI Gefion. Novo đang đua với Eli Lilly ở thị trường thuốc giảm cân (Wegovy) và cần mọi lợi thế tốc độ có thể.
Use cases
Các launch partner và hướng ứng dụng:
- Amgen, Moderna, Thermo Fisher Scientific, Allen Institute — apply Rosalind vào research workflow. Theo CTO Allen Institute, Rosalind biến các bước thủ công (tìm và align data) thành quy trình "consistent và repeatable trong agentic workflow".
- Los Alamos National Laboratory — AI-guided design cho protein và catalyst.
- Novo Nordisk — phân tích dataset lớn chưa từng có, tìm pattern mới, test hypothesis nhanh hơn để rút ngắn hành trình thuốc obesity/diabetes từ research đến bệnh nhân.
Ví dụ cụ thể: một nhà nghiên cứu gene therapy có thể survey hàng trăm paper mới, nhận pattern trong protein structure, thiết kế cloning protocol, và dự đoán hành vi của một RNA sequence trong tế bào — tất cả trong cùng session Rosalind thay vì phải chạy qua nhiều tool và chuyên gia riêng biệt.
"Integrating AI in our everyday work gives us the ability to analyse datasets at a scale that was previously impossible, identify patterns we could not see, and test hypotheses faster than ever." — Mike Doustdar, CEO Novo Nordisk
Limitations & pricing
Dual-use risk là lý do access gated. Model huấn luyện trên dữ liệu sinh học có nguy cơ bị lạm dụng để thiết kế mầm bệnh nguy hiểm. OpenAI phản ứng bằng cách:
- Mở qua trusted-access program, chỉ enterprise Mỹ đã vetted.
- Yêu cầu tổ chức chứng minh đang làm việc cho mục tiêu cải thiện sức khỏe, có security và governance mạnh.
- Built-in technical safeguard: flag hoạt động nguy hiểm, giới hạn cách dùng.
Ngoài ra:
- Chưa có thuốc nào do AI khám phá hoặc thiết kế hoàn toàn vượt qua Phase 3 trials — bối cảnh toàn ngành, không riêng Rosalind.
- Chuyên gia từ Arthur D. Little nhận xét AI trong pharma vẫn chưa phải "end-to-end component" trong thiết kế và chạy clinical trial.
Pricing: trong giai đoạn research preview, sử dụng không tốn API credits hiện có. Chưa có tier pricing công bố. Khả dụng trên ChatGPT, Codex và OpenAI API — nhưng phải được approve mới dùng được.
What's next
GPT-Rosalind là model đầu tiên trong series Life Sciences — tín hiệu mạnh rằng OpenAI sẽ tiếp tục ra thêm domain-specific model cho các lĩnh vực chuyên sâu khác. Về mặt chiến lược, đây là canh bạc rằng chuyên biệt hóa sẽ thắng quy mô thuần tuý trong các ngành science và professional.
Ba điểm đáng theo dõi sắp tới:
- Partner results: Khi nào Amgen, Moderna, Novo Nordisk có case study cụ thể về việc Rosalind rút ngắn thời gian nghiên cứu?
- Access mở rộng: Liệu OpenAI có mở rộng ngoài enterprise Mỹ? Yêu cầu trusted-access có nới lỏng?
- Cuộc đua với DeepMind: Google DeepMind và Isomorphic Labs sẽ phản ứng thế nào? AlphaFold 3 và các đối thủ domain-specific sẽ đặt lại mức benchmark.
Nguồn: MarkTechPost, TheNextWeb, CNBC, Bloomberg, Axios.