Anthropic vượt mặt OpenAI: Claude Opus 4 có khả năng viết mã suốt 7 giờ, cạnh tranh công nghệ AI 'gắt' hơn

14:04 | 23/05/2025

Anthropic vừa mới chính thức ra mắt hai mô hình Claude Opus 4 và Claude Sonnet 4, nâng tiêu chuẩn mới cho khả năng làm việc độc lập của AI. Trong một thử nghiệm tại Rakuten, Claude Opus 4 đã duy trì tập trung vào một dự án refactor mã nguồn mở phức tạp suốt gần 7 giờ – đánh dấu bước nhảy vọt từ AI phản hồi nhanh sang AI cộng tác dài hạn thực thụ.

"Ngựa chiến mới" của Anthropic

Anthropic vừa ra mắt hai mô hình AI mới là Claude Opus 4 và Claude Sonnet 4, nâng tầm kỳ vọng về những gì AI có thể thực hiện mà không cần sự can thiệp của con người.

Công cụ AI mới của Anthropic có thể lập trình liên tục trong gần 7 giờ đồng hồ. (Ảnh: Venture Beat/Midjourney)

Đáng chú ý, mô hình chủ lực Opus 4 đã duy trì sự tập trung liên tục gần 7 giờ trong một bài thử nghiệm refactor dự án mã nguồn mở phức tạp tại Rakuten – một bước đột phá biến AI từ công cụ phản hồi nhanh thành cộng sự thực thụ, đủ sức đảm nhiệm các dự án kéo dài cả ngày.

Hiệu suất "marathon" này đánh dấu một bước nhảy vọt vượt xa giới hạn vài phút tập trung của các mô hình AI trước đây. Về mặt công nghệ, điều này mở ra khả năng để AI xử lý toàn bộ quy trình kỹ thuật phần mềm, từ lên ý tưởng đến hoàn thiện, với khả năng duy trì ngữ cảnh và độ tập trung suốt cả ngày làm việc.

Anthropic cho biết Claude Opus 4 đạt 72,5% điểm trên thang đo SWE-bench, một chuẩn đánh giá khắt khe trong kỹ thuật phần mềm, vượt xa GPT-4.1 của OpenAI (chỉ đạt 54,6% khi ra mắt tháng 4). Thành tích này củng cố vị thế của Anthropic như một đối thủ đáng gờm trong thị trường AI đang ngày càng cạnh tranh.

Khác biệt nổi bật của Claude 4 nằm ở khả năng kết hợp trực tiếp giữa tư duy lý luận và sử dụng công cụ. Thay vì chỉ thu thập dữ liệu rồi mới phân tích như các mô hình trước, Claude có thể tra cứu, phân tích và cập nhật thông tin đồng thời – mô phỏng quá trình suy nghĩ của con người một cách tự nhiên và hiệu quả hơn.

Sự chuyển dịch của ngành AI sang các mô hình lý luận rõ rệt trong năm 2025. Các hệ thống này xử lý vấn đề có trình tự, mô phỏng tư duy thay vì chỉ dò mẫu từ dữ liệu huấn luyện. OpenAI khởi đầu xu hướng này với dòng "o" từ tháng 12/2024, sau đó là Gemini 2.5 Pro của Google với năng lực "Deep Think", và R1 của DeepSeek bất ngờ chiếm thị phần nhờ khả năng giải quyết vấn đề mạnh mẽ với giá hợp lý.

Theo báo cáo Xu hướng Sử dụng Mô hình AI của Poe (mùa xuân 2025), tỷ lệ người dùng chuyển sang mô hình lý luận đã tăng gấp 5 lần trong 4 tháng, từ 2% lên 10%. Người dùng ngày càng coi AI là một đối tác tư duy, thay vì chỉ là công cụ trả lời câu hỏi.

Kiến trúc hai chế độ giúp cân bằng giữa tốc độ và chiều sâu

Anthropic đã giải quyết một điểm nghẽn kéo dài trong trải nghiệm người dùng công nghệ AI thông qua cách tiếp cận kết hợp. Cả hai mô hình Claude 4 đều có khả năng phản hồi gần như tức thì đối với các câu hỏi đơn giản và suy luận mở rộng với các vấn đề phức tạp – khắc phục tình trạng chậm trễ gây khó chịu mà các mô hình lý luận trước đây từng gặp phải, ngay cả với những yêu cầu cơ bản.

Tính năng hai chế độ này duy trì được sự nhanh nhạy trong tương tác mà người dùng mong đợi, đồng thời mở ra chiều sâu phân tích khi cần thiết. Hệ thống tự động phân bổ tài nguyên xử lý dựa trên độ phức tạp của nhiệm vụ, tạo nên sự cân bằng mà các mô hình trước chưa thể đạt được.

Một đột phá khác là khả năng duy trì bộ nhớ. Các mô hình Claude 4 có thể trích xuất thông tin chính từ tài liệu, tạo file tóm tắt và ghi nhớ xuyên suốt các phiên làm việc khi được cấp quyền – giải quyết triệt để "vấn đề mất trí nhớ" từng giới hạn hiệu quả của AI trong các dự án dài hạn.

Về mặt kỹ thuật, cơ chế này hoạt động tương tự như cách các chuyên gia xây dựng hệ thống quản lý tri thức: Claude tự động sắp xếp thông tin theo cấu trúc tối ưu, phục vụ việc truy xuất sau này. Nhờ đó, Claude có thể hiểu ngày càng sâu sắc hơn các lĩnh vực phức tạp thông qua quá trình tương tác kéo dài.

Cạnh tranh công nghệ AI ngày càng khốc liệt, các ông lớn chạy đua giành thị phần

Thời điểm Anthropic công bố loạt mô hình mới cho thấy rõ tốc độ cạnh tranh ngày càng tăng trong lĩnh vực AI tiên tiến. Chỉ 5 tuần sau khi OpenAI ra mắt dòng GPT-4.1, Anthropic đã đáp trả bằng các mô hình cạnh tranh hoặc vượt trội trên nhiều chỉ số quan trọng. Trong khi đó, Google đã cập nhật Gemini 2.5 hồi đầu tháng và Meta cũng vừa tung ra LLaMA 4 với khả năng đa phương thức cùng ngữ cảnh lên đến 10 triệu token.

Mỗi phòng thí nghiệm lớn hiện đang xây dựng thế mạnh riêng trong một thị trường ngày càng chuyên biệt. OpenAI dẫn đầu về tư duy tổng quát và khả năng tích hợp công cụ. Google vượt trội ở mảng xử lý đa phương thức. Anthropic hiện tuyên bố vị thế số 1 trong hiệu suất dài hạn và ứng dụng lập trình chuyên nghiệp.
Theo Venture Beat

Với khách hàng doanh nghiệp, cuộc cạnh tranh mang lại ý nghĩa chiến lược quan trọng. Các tổ chức đang phải đưa ra quyết định ngày càng phức tạp về việc lựa chọn hệ thống AI phù hợp cho từng tình huống sử dụng, khi không có mô hình nào chiếm ưu thế tuyệt đối.

Sự phân mảnh này có lợi cho những khách hàng am hiểu kỹ thuật, có thể tận dụng sức mạnh chuyên sâu của từng hệ thống, nhưng lại là thách thức cho các tổ chức muốn tìm một giải pháp AI thống nhất và đơn giản.

Tích hợp công cụ lập trình sâu hơn vào hoạt động doanh nghiệp

Anthropic cũng mở rộng khả năng tích hợp Claude vào quy trình phát triển phần mềm với phiên bản chính thức của Claude Code. Hệ thống này nay hỗ trợ các tác vụ chạy nền qua GitHub Actions, tích hợp trực tiếp với môi trường VS Code và JetBrains, cho phép hiển thị và chỉnh sửa mã ngay trong tệp của lập trình viên.

Việc GitHub lựa chọn Claude Sonnet 4 làm nền tảng cho một agent lập trình mới trong GitHub Copilot là minh chứng thị trường quan trọng. Hợp tác này với nền tảng phát triển của Microsoft cho thấy các tập đoàn công nghệ lớn đang đa dạng hóa đối tác AI, thay vì phụ thuộc vào một nhà cung cấp duy nhất.

Anthropic cũng giới thiệu thêm loạt API mới dành cho lập trình viên, điển hình là công cụ thực thi mã, trình kết nối MCP, API quản lý tệp và tính năng lưu cache lời gọi lệnh (prompt) lên đến 1 giờ. Những tính năng này giúp tạo ra các agent AI thông minh hơn, có thể duy trì trạng thái trong quy trình công việc phức tạp – một yêu cầu thiết yếu để AI có thể được doanh nghiệp ứng dụng thực sự.

hi các mô hình ngày càng có khả năng duy trì sự tập trung và ghi nhớ lâu dài, chúng dần trở thành cộng sự thực thụ, chứ không chỉ là công cụ hỗ trợ con người. (Ảnh: Thitruongbiz tạo bởi Meta AI)

Thách thức về minh bạch khi công nghệ AI ngày càng phức tạp

Báo cáo nghiên cứu của Anthropic công bố tháng 4 với tiêu đề "Các mô hình lý luận không phải lúc nào cũng nói ra điều chúng nghĩ" đã chỉ ra những mô hình đáng lo ngại trong cách các hệ thống AI diễn đạt quá trình suy luận của mình. Cụ thể, nghiên cứu phát hiện rằng Claude 3.7 Sonnet chỉ đề cập đến các manh mối quan trọng mà nó sử dụng để giải bài toán trong 25% số lần – làm dấy lên câu hỏi lớn về mức độ minh bạch trong tư duy của AI.

Nghiên cứu này phản ánh một nghịch lý ngày càng rõ: khi mô hình AI trở nên mạnh mẽ hơn, chúng cũng đồng thời trở nên khó hiểu hơn. Buổi làm việc tự động kéo dài 7 giờ của Claude Opus 4 – tuy ấn tượng – lại cho thấy con người gần như không thể theo dõi hay kiểm chứng toàn bộ chuỗi suy luận kéo dài như vậy.

Ngành công nghiệp công nghệ AI giờ đây đang đối mặt với một nghịch lý: năng lực càng cao thì minh bạch càng giảm. Để giải quyết căng thẳng này, cần có những cách tiếp cận giám sát mới, cân bằng giữa hiệu suất và khả năng giải thích – một thách thức mà chính Anthropic cũng thừa nhận nhưng chưa giải quyết triệt để.

Tương lai của hợp tác lâu dài giữa con người và AI

Buổi làm việc tự động kéo dài 7 giờ của Claude Opus 4 mở ra cái nhìn mới về vai trò tương lai của AI trong công việc trí tuệ. Khi các mô hình ngày càng có khả năng duy trì sự tập trung và ghi nhớ lâu dài, chúng dần trở thành cộng sự thực thụ, chứ không chỉ là công cụ hỗ trợ.

Sự chuyển dịch này cho thấy một thay đổi sâu sắc trong cách các tổ chức phân bổ và quản lý công việc tri thức. Những nhiệm vụ từng đòi hỏi con người giám sát liên tục giờ đây có thể ủy thác cho hệ thống AI – vốn có thể duy trì ngữ cảnh và tập trung trong nhiều giờ hoặc thậm chí nhiều ngày.

Điều này sẽ tạo ra tác động kinh tế và tổ chức lớn, đặc biệt ở những lĩnh vực như phát triển phần mềm, nơi thiếu hụt nhân lực và chi phí lao động vẫn là bài toán nan giải.

Khi Claude 4 làm mờ ranh giới giữa trí tuệ con người và máy móc, chúng ta bước vào một thực tại mới trong môi trường làm việc. Thách thức lớn nhất không còn là “AI có theo kịp con người không”, mà là chúng ta sẽ thích nghi thế nào khi đồng nghiệp hiệu quả nhất trong tương lai có thể không còn là con người.

Tung Lam

URL: https://thitruongbiz.vn/anthropic-vuot-mat-openai-claude-opus-4-co-kha-nang-viet-ma-suot-7-gio-canh-tranh-cong-nghe-ai-gat-hon-d28740.html

TPBank (TPB), lợi nhuận 6 tháng vượt 4.100 tỷ, tổng tài sản vượt mốc 428.600 tỷ đồng

Giá dầu phục hồi, tiến sát mốc 70 USD/thùng

Đề xuất tăng lương tối thiểu vùng 7,2% từ 1/1/2026

Hà Nội 'chốt' thời gian khởi công 2 tuyến metro

Nhiệt điện Quảng Ninh quý II/2025 báo lãi, lợi nhuận sau thuế 6 tháng đầu năm đi lùi

Bộ Chính trị kỷ luật Cảnh cáo Bộ trưởng Nông nghiệp và Môi trường Đỗ Đức Duy

Cư dân CT2C: Trưởng ban quản trị kiêm lãnh đạo đơn vị vận hành, quyền lợi cư dân có được đảm bảo?

Nguyên Bộ trưởng Bộ Y tế Nguyễn Thị Kim Tiến bị đề nghị kỷ luật

Giá xăng dầu đồng loạt giảm từ 15h00 chiều nay

Yêu cầu báo cáo Thủ tướng việc xử lý vướng mắc dự án cơ sở 2 Bệnh viện Bạch Mai, Việt Đức trước 20/7

Đề xuất 'rót vốn' gần 100.000 tỷ đồng làm 2 tuyến đường sắt đô thị trên cao

Thu hồi Sữa chống nắng DSK UV của Dược phẩm VShine

Bảo hiểm Quân đội (MIC) được chấp thuận tăng vốn điều lệ lên hơn 2.100 tỷ đồng

Đề xuất thí điểm cho thuê căn hộ dịch vụ ngắn ngày trong chung cư từ 1/9

Bộ VHTT&DL đề xuất nội dung quảng cáo: Không sử dụng hình ảnh, tên của các đơn vị, cá nhân y tế

Ông chủ Rượu Vodka Hà Nội, Rượu Nếp Mới thoát lỗ 6 tháng nhưng chưa 'tỉnh cơn say lỗ' quý II/2025

Lộ diện chủ đầu tư dự án khu công nghiệp Kim Bảng 4 tại Ninh Bình

Thủ tướng yêu cầu rà soát, chuẩn hóa lại các thủ tục hành chính về đất đai

Giá vàng trong nước đi ngang, thị trường vàng thế giới chao đảo

Từ hôm nay khách hàng mua vé tàu đi Trung Quốc tại tất cả các nhà ga, hướng dẫn quy trình mua vé