DeepSeek chuẩn bị tung ra mô hình R2, trong bối cảnh phải đối mặt với nguy cơ siết chặt hơn nữa các lệnh hạn chế chip từ Mỹ.
DeepSeek chuẩn bị tung ra mô hình R2. (Ảnh: Reuters)
Khi DeepSeek công bố mô hình R1 vào tháng 1 năm nay, đó không chỉ đơn thuần là một bản tin AI mới. Đây là cột mốc quan trọng khiến toàn ngành công nghệ phải chấn động và buộc nhiều ông lớn phải đánh giá lại cách tiếp cận cốt lõi trong phát triển AI. DeepSeek đang đẩy nhanh tiến độ ra mắt mô hình R2, kế nhiệm mô hình R1.
Điều khiến thành tựu của DeepSeek trở nên đặc biệt không nằm ở những khả năng hoàn toàn mới, mà ở cách họ đạt được kết quả tương đương với các “ông lớn” công nghệ phương Tây với chi phí chỉ bằng một phần nhỏ.
Điểm sáng của DeepSeek nằm ở lựa chọn những ưu tiên khác biệt. Kết quả là, ngành AI hiện đang phát triển song song trên hai hướng: hiệu suất tính toán và tối ưu hóa chi phí.
Khi DeepSeek chuẩn bị tung ra mô hình R2, trong bối cảnh phải đối mặt với nguy cơ siết chặt hơn nữa các lệnh hạn chế chip từ Mỹ, câu hỏi đặt ra là: vì sao công ty lại thu hút nhiều sự chú ý đến vậy?
Vượt qua hạn chế về tài nguyên
Sự xuất hiện đầy bất ngờ của DeepSeek đã cho thấy khả năng sáng tạo có thể bùng nổ ngay cả khi bị hạn chế lớn về tài nguyên. Trước các lệnh kiểm soát xuất khẩu của Mỹ, vốn hạn chế quyền tiếp cận những con chip AI tối tân nhất, DeepSeek buộc phải tìm ra những con đường thay thế để tiếp tục phát triển AI.
Trong khi các công ty Mỹ theo đuổi hiệu suất thông qua phần cứng mạnh hơn, mô hình lớn hơn và dữ liệu tốt hơn, DeepSeek lại tập trung vào việc tối ưu những gì sẵn có. Họ triển khai những ý tưởng quen thuộc nhưng với mức độ thực thi vượt trội — và chính sự hoàn thiện trong thực thi này lại trở thành điểm mới.
Cách tiếp cận ưu tiên hiệu quả này đã mang lại những kết quả đầy ấn tượng. Theo các báo cáo, mô hình R1 của DeepSeek có khả năng sánh ngang với OpenAI nhưng chỉ tiêu tốn 5-10% chi phí vận hành.
Chẳng hạn, đợt huấn luyện cuối cùng của mô hình V3 - tiền thân của R1, chỉ tiêu tốn 6 triệu USD, con số mà cựu kỹ sư AI Tesla, Andrej Karpathy, gọi là “một khoản ngân sách như trò đùa” so với hàng trăm triệu USD mà các đối thủ Mỹ bỏ ra.
Đáng chú ý hơn, trong khi OpenAI chi 500 triệu USD để huấn luyện mô hình Orion gần đây, DeepSeek đạt được kết quả thậm chí còn tốt hơn với chi phí chỉ 5,6 triệu USD - chưa đến 1,2% ngân sách của OpenAI.
Tuy nhiên, nếu nghĩ rằng DeepSeek đạt thành tích này hoàn toàn trong thế yếu do thiếu chip AI tiên tiến thì điều đó chưa hoàn toàn chính xác. Các lệnh kiểm soát ban đầu của Mỹ chủ yếu nhắm vào năng lực tính toán (compute), chứ không hạn chế về bộ nhớ và khả năng kết nối mạng - hai yếu tố then chốt giúp DeepSeek vận hành hệ thống hiệu quả.
Nhờ vậy, những con chip mà DeepSeek sử dụng tuy không tối tân nhất về compute nhưng vẫn có khả năng kết nối và bộ nhớ mạnh, cho phép họ song song hóa các tác vụ trên nhiều đơn vị tính toán - một chiến lược quan trọng để vận hành mô hình lớn với chi phí thấp.
Cộng hưởng với nỗ lực làm chủ toàn bộ chuỗi giá trị AI từ phía chính phủ Trung Quốc, DeepSeek đã thúc đẩy tốc độ đổi mới nhanh hơn dự kiến của giới quan sát phương Tây. Thành tựu của họ thực chất chỉ là sự tất yếu trong tiến trình phát triển AI, nhưng DeepSeek đã đẩy nhanh quá trình đó lên trước vài năm - điều mà khó ai có thể làm được.
Mô hình thực dụng hơn
Không chỉ dừng lại ở phần cứng, cách DeepSeek xử lý dữ liệu huấn luyện cũng khác biệt so với thông lệ phương Tây. Thay vì chỉ dựa vào dữ liệu thu thập từ internet, họ tận dụng mạnh mẽ dữ liệu tổng hợp (synthetic data) và đầu ra từ các mô hình độc quyền khác - một hình thức chưng cất mô hình (model distillation).
Cách tiếp cận này tuy mang lại hiệu quả cao về chi phí nhưng cũng đặt ra nhiều câu hỏi về quyền riêng tư dữ liệu, khiến doanh nghiệp phương Tây dè dặt.
Tuy nhiên, việc khai thác dữ liệu tổng hợp có thể tạo ra lợi thế lớn nếu được vận dụng đúng cách. Một số kiến trúc mô hình, như kiến trúc mixture-of-experts (MoE) mà DeepSeek đang sử dụng, có khả năng xử lý dữ liệu tổng hợp tốt hơn, trong khi các mô hình dày đặc truyền thống như Llama đời đầu có nguy cơ bị suy giảm hiệu suất hoặc thậm chí "sụp đổ" khi dùng quá nhiều dữ liệu nhân tạo.
Nguyên nhân nằm ở việc dữ liệu tổng hợp thường mang các mẫu phân phối khác với dữ liệu thực tế, khiến mô hình dễ học lệch hoặc đưa ra các giả định sai lệch nếu không được thiết kế phù hợp.
Tuy nhiên, đội ngũ kỹ sư DeepSeek đã từ đầu xây dựng kiến trúc của mình nhằm tích hợp tối ưu dữ liệu tổng hợp mà vẫn duy trì hiệu suất.
Tác động đến toàn ngành AI
Sự nổi lên của DeepSeek không chỉ là thành tích đơn lẻ mà đã tạo ra những chuyển động chiến lược trên toàn ngành.
Đơn cử, chỉ một tháng sau khi DeepSeek ra mắt, Sam Altman, CEO của OpenAI, thừa nhận OpenAI đã “chọn nhầm phía trong lịch sử” khi kiên trì theo đuổi AI nguồn đóng. Trong bối cảnh OpenAI phải chi tới 7-8 tỷ USD mỗi năm để vận hành, áp lực kinh tế từ những mô hình hiệu quả như DeepSeek ngày càng rõ rệt.
Điều này buộc OpenAI phải gọi vốn khổng lồ lên tới 40 tỷ USD, nâng định giá công ty lên mức chưa từng có: 300 tỷ USD. Thế nhưng, ngay cả khi có thêm tiền, bài toán cốt lõi vẫn còn đó: mô hình của OpenAI tiêu tốn tài nguyên gấp nhiều lần so với cách tiếp cận tiết kiệm của DeepSeek.
Bước tiến trong khả năng tự đánh giá
Một xu hướng quan trọng khác mà DeepSeek đẩy nhanh là “tính toán trong lúc suy luận” (test-time compute). Khi các phòng thí nghiệm AI lớn đã khai thác gần như toàn bộ dữ liệu công khai trên internet, sự khan hiếm dữ liệu làm chậm tốc độ cải thiện mô hình.
Để khắc phục điều đó, DeepSeek hợp tác với Đại học Thanh Hoa triển khai kỹ thuật "tự phê bình nguyên tắc" (Self-Principled Critique Tuning - SPCT), cho phép AI tự xây dựng bộ quy tắc đánh giá nội dung và tự đưa ra phê bình dựa trên những chuẩn mực đó.
Mô hình DeepSeek-GRM (generalist reward modeling) mà họ phát triển đại diện cho xu hướng AI tự đánh giá và tự cải thiện, nhưng cũng đi kèm nhiều rủi ro: các tiêu chuẩn mà AI tự đặt ra có thể lệch khỏi chuẩn mực đạo đức hay bối cảnh thực tế của con người. Nếu không có vòng kiểm soát từ con người, những sai lệch này có thể ngày càng lớn mà người dùng khó lý giải tại sao mô hình lại đưa ra kết quả như vậy.
Dù vậy, mô hình tự phê bình đang nhanh chóng trở thành xu hướng, khi DeepSeek kết hợp nhiều ý tưởng từ các nghiên cứu như "critique and revise" của OpenAI, "Constitutional AI" của Anthropic hay "self-rewarding agents".
Hướng đi mới của ngành AI
Sự trỗi dậy của DeepSeek đang mở ra xu thế phát triển song song trong ngành AI toàn cầu: trong khi một bên tiếp tục xây dựng siêu máy chủ mạnh hơn, bên kia tập trung tối ưu phần mềm và cấu trúc mô hình để giảm thiểu tiêu thụ điện năng - vốn đang vượt xa khả năng sản xuất điện toàn cầu.
Các tập đoàn lớn đã bắt đầu điều chỉnh. Microsoft đã tạm dừng kế hoạch xây thêm trung tâm dữ liệu tại nhiều khu vực, chuyển sang hạ tầng phân tán, hiệu quả hơn dù vẫn dự kiến chi khoảng 80 tỷ USD cho AI trong năm tài khóa này.
Meta cũng nhanh chóng phản ứng, khi đưa kiến trúc MoE lần đầu vào dòng Llama 4 và chủ động so sánh với DeepSeek trong các bảng thử nghiệm hiệu năng.
Chỉ trong thời gian ngắn, thật trớ trêu khi những lệnh cấm vận mà Mỹ ban hành để duy trì vị thế AI lại vô tình thúc đẩy những đổi mới mà họ muốn kìm hãm. Bằng việc hạn chế nguồn lực, DeepSeek buộc phải mở lối đi riêng.
Trong tương lai, khả năng thích ứng sẽ là yếu tố sống còn với tất cả các bên. Dù là dỡ bỏ hay siết chặt thêm các quy định kiểm soát AI, chính cách ngành công nghệ học hỏi và phản ứng lẫn nhau sẽ quyết định cục diện toàn cầu trong cuộc đua AI đang ngày càng nóng lên.
Google đang tiến hành một cuộc cải tổ lớn đối với nền tảng học tập nội bộ nổi tiếng của mình, với mục tiêu đào tạo nhân viên sử dụng các công cụ trí tuệ nhân tạo (AI) hiện đại trong công việc hàng ngày, theo CNBC.
Theo thông tin được công bố loạt doanh nghiệp gồm, Sữa Quốc tế Lof, Tập đoàn Gelex, FPT, ACB, NCB ... đã chốt lịch ĐHĐCĐ thường niên năm 2026, thời gian được các doanh nghiệp dự kiến từ tháng 2 đến tháng 4/2026. Trong đó có nhiều nội dung đáng chú ý như: tình hình tài chính, nhân sự cấp cao, kế hoạch kinh doanh năm 2026...
Cục Hàng không Việt Nam vừa có văn bản kiến nghị Bộ Xây dựng xem xét cấp lại Giấy phép kinh doanh hàng không chung cho Công ty TNHH Sun Air, trên cơ sở ghi nhận các thay đổi liên quan đến vốn điều lệ, chức danh người đại diện theo pháp luật...
Ngân hàng TMCP Quân đội (MB, Mã chứng khoán MBB : HoSE) vừa công bố Nghị quyết của Hội đồng quản trị về kế hoạch tổ chức Đại hội đồng cổ đông (ĐHĐCĐ) thường niên năm 2026.
Xét theo ngành nghề, bất động sản là một trong những lĩnh vực ghi nhận số doanh nghiệp thành lập mới tăng mạnh, với 625 doanh nghiệp trong tháng 1/2026, tăng 130% so với cùng kỳ. Tuy nhiên, trong tháng 1 đã có gần 54.300 doanh nghiệp đăng ký tạm ngừng kinh doanh có thời hạn, con số này gấp 11,8 lần so với tháng trước...
Toyota Motor đã bổ nhiệm ông Kenta Kon làm Tổng Giám đốc, thay thế ông Koji Sato, khi nhà sản xuất ô tô lớn nhất thế giới đang phải đương đầu với những biến động thương mại toàn cầu và áp lực cạnh tranh gia tăng từ xe điện Trung Quốc.
Theo UBND TP Đà Nẵng, chiều ngày 5/2, lãnh đạo UBND thành phố đã chủ trì buổi làm việc với Công ty Cổ phần Tập đoàn Trường Hải (THACO) để trao đổi, đánh giá và định hướng kế hoạch đầu tư phát triển Sâm Ngọc Linh cùng các loại dược liệu trên địa bàn thành phố.
CTCP Phát triển Trạm sạc Toàn cầu V-GREEN thông báo bổ nhiệm bà Phạm Thanh Thúy giữ chức Chủ tịch Hội đồng Quản trị kiêm Tổng Giám đốc công ty, thay cho ông Nguyễn Thành Dương xin thôi nhiệm vụ vì lý do cá nhân.
Không dừng lại ở việc cho thuê mặt bằng, Novaon Industry đang tái định nghĩa hạ tầng công nghiệp thông qua hệ sinh thái dịch vụ tích hợp xuyên suốt vòng đời dự án.
Theo báo cáo tài chính quý IV/2025 vừa được công bố, Công ty cổ phần Đồ hộp Hạ Long – Canfoco (mã chứng khoán CAN) ghi nhận khoản lỗ sau thuế quý 4/2025 lên tới 9,5 tỷ đồng, mức thua lỗ hàng quý cao nhất trong 22 năm trong quá trình hình thành và phát triển.
"Gã khổng lồ" công nghệ Hàn Quốc liên tiếp thiết lập các kỷ lục mới kể từ khi giá cổ phiếu vượt ngưỡng 100.000 won vào ngày 27/10/2025. Động lực tăng trưởng chủ yếu đến từ cuộc đua đầu tư cơ sở hạ tầng AI trên toàn cầu, khiến nhu cầu về chip bán dẫn tăng vọt.
Tập đoàn Xăng dầu Việt Nam (Petrolimex) vừa tổ chức Lễ giới thiệu Nhận diện thương hiệu mới Petrolimex, đánh dấu một cột mốc quan trọng của chiến lược phát triển và hành trình tái định vị thương hiệu Petrolimex trong giai đoạn mới.
Vượt qua Trung Nam và Tập đoàn PNE AG của Đức, CTCP Năng lượng VinEnergo, đơn vị thành viên thuộc Tập đoàn Vingroup, là nhà đầu tư trúng thầu dự án nhà máy điện gió hơn 48.000 tỷ
CTCP Hoàng Anh Gia Lai (HAGL, Mã: HAG) vừa công bố báo cáo tài chính hợp nhất quý IV/2025 với kết quả kinh doanh tăng trưởng mạnh, đặc biệt ở chỉ tiêu lợi nhuận, trong bối cảnh doanh nghiệp tiếp tục tái cơ cấu và tập trung vào mảng nông nghiệp.
Theo cập nhật từ Forbes, Việt Nam vừa có thêm 3 tỷ phú USD gồm bà Phạm Thu Hương (vợ tỷ phú Phạm Nhật Vượng), bà Phạm Thuý Hằng và ông Ngô Chí Dũng, với giá trị tài sản đều vượt mốc 1 tỷ USD.
lBecamex Group lãi ròng gần 1,239 tỷ đồng giảm 10% trong quý 4/2025. Doanh thu tài chính của Đất Xanh tăng khi các khoản tiền gửi và cho vay của công ty tăng mạnh. Tiền gửi có kỳ hạn hơn 3.800 tỷ đồng, tăng gần 2.500 tỷ đồng sau một năm; cho vay bên khác gần 1.160 tỷ đồng, tăng hơn 900 tỷ đồng.
CTCP Tập đoàn Hoá chất Đức Giang (Mã chứng khoán DGC) vừa công bố báo cáo tài chính hợp nhất quý IV/2025 với doanh thu thuần của doanh nghiệp đạt 2.740 tỷ đồng, tăng 13% so với cùng kỳ năm trước. Tính đến ngày 31/12/2025, tiền và các khoản tiền gửi ngân hàng đạt 13.105 tỷ đồng, chiếm khoảng 67% tổng tài sản và tăng trên 20% so với đầu kỳ.
ACV là viết tắt của Airports Corporation of Vietnam tên giao dịch quốc tế của Tổng công ty Cảng hàng không Việt Nam - CTCP trên cơ sở hợp nhất 3 tổng công ty. ACV được giao quản lý, điều phối hoạt động và đầu tư khai thác toàn bộ hệ thống 22 cảng hàng không trên toàn lãnh thổ Việt Nam bao gồm 9 sân bay quốc tế và 13 sân bay nội địa.
Công ty CP Vietcap đứng vị trí 196 trong danh sách 500 doanh nghiệp tư nhân lớn nhất Việt Nam. Chứng khoán Vietcap là gì? Công ty CP Vietcap uy tín không? Có nên mở tài khoản tại chứng khoán Bản Việt không?
Công ty TNHH Thương mại và Công nghiệp Mỹ Việt đứng ở vị trí số 195 trong danh sách 500 doanh nghiệp tư nhân lớn nhất Việt Nam. Công ty TNHH Thương mại và Công nghiệp Mỹ Việt kinh doanh gì? Tấm lợp Olympic có tốt không?
ACV là viết tắt của Airports Corporation of Vietnam tên giao dịch quốc tế của Tổng công ty Cảng hàng không Việt Nam - CTCP trên cơ sở hợp nhất 3 tổng công ty. ACV được giao quản lý, điều phối hoạt động và đầu tư khai thác toàn bộ hệ thống 22 cảng hàng không trên toàn lãnh thổ Việt Nam bao gồm 9 sân bay quốc tế và 13 sân bay nội địa.
Công ty CP Vietcap đứng vị trí 196 trong danh sách 500 doanh nghiệp tư nhân lớn nhất Việt Nam. Chứng khoán Vietcap là gì? Công ty CP Vietcap uy tín không? Có nên mở tài khoản tại chứng khoán Bản Việt không?
Công ty TNHH Thương mại và Công nghiệp Mỹ Việt đứng ở vị trí số 195 trong danh sách 500 doanh nghiệp tư nhân lớn nhất Việt Nam. Công ty TNHH Thương mại và Công nghiệp Mỹ Việt kinh doanh gì? Tấm lợp Olympic có tốt không?