OpenAI vừa chính thức ra mắt hai mô hình ngôn ngữ mới – GPT-4.1 và GPT-4.1 mini trên nền tảng ChatGPT. Đây là bước đi mang tính chiến lược, không chỉ mở rộng khả năng phục vụ người dùng mà còn hướng đến việc đưa trí tuệ nhân tạo vào vận hành thực tế trong doanh nghiệp một cách hiệu quả và tiết kiệm hơn.
GPT-4.1 hiện đã được cung cấp cho các khách hàng trả phí thuộc các gói ChatGPT Plus, Pro và Team. Các tài khoản thuộc khối Enterprise và Education sẽ sớm được cập nhật trong thời gian tới.
Song song, OpenAI cũng thay thế GPT-4o mini bằng GPT-4.1 mini làm mô hình mặc định cho toàn bộ người dùng ChatGPT, bao gồm cả người dùng miễn phí. Dù là phiên bản thu gọn với quy mô tham số nhỏ hơn, GPT-4.1 mini vẫn duy trì các tiêu chuẩn an toàn tương đương với bản đầy đủ.
Cả hai mô hình đều được tích hợp vào giao diện ChatGPT thông qua lựa chọn “more models” ở góc trên bên trái cửa sổ chat, cho phép người dùng linh hoạt chuyển đổi giữa các mô hình GPT-4.1, 4.1 mini và các mô hình suy luận như o3, o4-mini hay o4-mini-high.
Ban đầu, GPT-4.1 chỉ được thiết kế để cung cấp qua API – phục vụ cho các nhà phát triển ứng dụng và lập trình viên. Tuy nhiên, trước nhu cầu ngày càng tăng từ cộng đồng, OpenAI đã quyết định mở rộng khả năng truy cập mô hình này lên ChatGPT.
Michelle Pokrass, trưởng nhóm nghiên cứu hậu huấn luyện tại OpenAI, xác nhận trên mạng xã hội X rằng chính phản hồi tích cực từ người dùng đã khiến công ty thay đổi kế hoạch: “Chúng tôi định chỉ phát hành qua API, nhưng mọi người muốn nó có mặt trong ChatGPT – và đây rồi!”
Còn Kevin Weil, Giám đốc sản phẩm của OpenAI, cũng chia sẻ rằng GPT-4.1 được thiết kế đặc biệt cho lập trình viên, rất mạnh về khả năng viết mã và làm theo hướng dẫn.
GPT-4.1 không chỉ là bản nâng cấp thông thường, mà được thiết kế từ đầu với mục tiêu phục vụ các ứng dụng thực tế trong môi trường doanh nghiệp. Ra mắt vào tháng 4/2025 cùng với hai phiên bản mini và nano, GPT-4.1 nhắm đến những tình huống đòi hỏi hiệu suất cao và chi phí hợp lý.
Trong các bài kiểm tra tiêu chuẩn, GPT-4.1 cho thấy sự vượt trội rõ rệt: tăng 21,4 điểm so với GPT-4o trên bài đánh giá SWE-bench về kỹ năng lập trình phần mềm, và tăng 10,5 điểm trong khả năng thực hiện theo hướng dẫn (Scale’s MultiChallenge).
Ngoài ra, độ dài phản hồi của mô hình này được cắt giảm tới 50%, giúp cải thiện độ rõ ràng – một điểm cộng lớn đối với người dùng doanh nghiệp.
Trên API, GPT-4.1 có thể xử lý đến một triệu tokens – đủ để xử lý toàn bộ mã nguồn, hợp đồng pháp lý hoặc dữ liệu tài chính quy mô lớn. Dù OpenAI thừa nhận rằng hiệu suất có thể giảm khi xử lý dữ liệu khổng lồ, các thử nghiệm thực tế trong doanh nghiệp cho thấy GPT-4.1 vẫn hoạt động ổn định với vài trăm nghìn tokens.
Cùng với việc phát hành GPT-4.1, OpenAI cũng ra mắt trang “Safety Evaluations Hub” – nơi người dùng có thể theo dõi các chỉ số đánh giá hiệu năng và độ an toàn của mô hình. Theo đó, GPT-4.1 ghi nhận điểm số khá tốt: 0.40 điểm trong bài kiểm tra SimpleQA, 0.63 điểm ở PersonQA, và đạt 0.99 trong bài kiểm tra từ chối các yêu cầu nguy hiểm tiêu chuẩn.
Mặc dù điểm số chỉ đạt 0.23 trong bài kiểm tra StrongReject, một bài kiểm tra mang tính học thuật nhằm khai thác các lỗ hổng tiềm tàng; GPT-4.1 lại ghi điểm cao (0.96) khi xử lý các prompt gây nhiễu được tạo bởi người dùng thực, cho thấy mô hình có khả năng ứng phó tốt hơn trong tình huống sử dụng thực tế.
GPT-4.1 cũng tuân thủ hiệu quả cấu trúc ưu tiên hệ thống – nhà phát triển – người dùng mà OpenAI định nghĩa, đạt 0.71 điểm trong việc giải quyết xung đột giữa thông điệp hệ thống và người dùng. Mô hình này cũng bảo vệ tốt các cụm từ nhạy cảm và tránh đưa ra “đáp án sẵn”.
Về định vị GPT-4.1 so với các phiên bản trước, GPT-4.1 được giới thiệu sau GPT-4.5 – một mô hình nghiên cứu ra mắt tháng 2/2025. GPT-4.5 tập trung vào việc mở rộng kiến thức nền, cải thiện khả năng cảm xúc và giảm tình trạng “ảo giác thông tin” – giảm từ 61,8% ở GPT-4o xuống còn 37,1%. Tuy nhiên, nhiều người dùng đánh giá rằng các cải tiến này khá tinh tế và chưa thực sự nổi bật trong ứng dụng thực tế.
Đặc biệt, GPT-4.5 bị phàn nàn vì chi phí quá cao - tới 180 USD cho mỗi triệu tokens đầu ra thông qua API, và hiệu suất thấp hơn trong các bài kiểm tra toán học và lập trình, khi so với dòng mô hình o-series của OpenAI.
Ngược lại, GPT-4.1 tuy không đa năng và không mạnh về biểu đạt cảm xúc như GPT-4.5, nhưng lại hiệu quả hơn, nhanh hơn và phù hợp hơn với nhu cầu lập trình, triển khai sản phẩm, với khả năng tuân thủ hướng dẫn rất tốt.
Trên nền tảng API, GPT-4.1 có giá: 2 USD cho mỗi triệu tokens đầu vào; 0,50 USD với tokens đầu vào được cache; 8 USD cho mỗi triệu tokens đầu ra. Trong khi đó, phiên bản GPT-4.1 mini có chi phí thấp hơn đáng kể – chỉ 0,40 USD đầu vào và 1,60 USD đầu ra cho mỗi triệu tokens.
Đối thủ lớn nhất của OpenAI hiện nay là Google với các mô hình Gemini Flash và Flash-Lite, có giá chỉ từ 0,075–0,10 USD cho đầu vào và 0,30–0,40 USD cho đầu ra – rẻ hơn GPT-4.1 đến gần 10 lần. Tuy nhiên, GPT-4.1 được đánh giá cao hơn về độ chính xác trong kỹ thuật phần mềm và khả năng tuân thủ lệnh – yếu tố quan trọng trong môi trường doanh nghiệp.
Theo chuyên trang công nghệ Venture Beat, sự xuất hiện của GPT-4.1 mang lại giá trị thiết thực cho nhiều nhóm chức năng trong doanh nghiệp.
Đơn cử, với kỹ sư AI, GPT-4.1 giúp tăng tốc quá trình triển khai, thử nghiệm và tinh chỉnh mô hình – đặc biệt phù hợp với các nhóm nhỏ cần đưa sản phẩm ra thị trường nhanh chóng mà không hy sinh độ an toàn.
Đối với người quản lý hệ thống AI, mô hình này hoạt động ổn định trong các chu trình phức tạp, xử lý tốt các lỗi phát sinh từ người dùng, và dễ tích hợp vào hệ thống kiểm thử và điều phối mô hình.
Với kỹ sư dữ liệu, GPT-4.1 giúp giảm thiểu lỗi thông tin, tăng độ chính xác, từ đó xây dựng quy trình dữ liệu tin cậy hơn.
Chuyên viên an ninh mạng có thể yên tâm hơn khi GPT-4.1 kiểm soát tốt các đầu ra, hạn chế việc bị “jailbreak”, phù hợp với yêu cầu tích hợp vào hệ thống nội bộ có tính bảo mật cao.
Đáng chú ý, nếu GPT-4.5 đánh dấu bước tiến về khả năng mở rộng, thì GPT-4.1 là minh chứng cho sự chín muồi của một mô hình phục vụ thực tiễn. Không đắt đỏ, không “hào nhoáng” về đa phương tiện, nhưng GPT-4.1 mang đến sự chính xác, hiệu quả triển khai và chi phí hợp lý - những yếu tố quan trọng mà doanh nghiệp cần.
Đây cũng là xu hướng chung của ngành: thay vì chạy theo mô hình càng lớn càng tốt, các công ty công nghệ đang tập trung vào việc xây dựng những mô hình gọn nhẹ, dễ tích hợp và mang lại giá trị cụ thể. GPT-4.1 là đại diện tiêu biểu cho tư duy đó – một công cụ linh hoạt, sẵn sàng đưa AI vào chiều sâu hoạt động của doanh nghiệp hiện đại.
© thitruongbiz.vn