Thứ sáu 23/05/2025 15:30
Tin mới
  • 'Chặt chém' dịch vụ hoả táng Công ty Thanh Bình An Lạc Viên bị xử phạt, buộc phải trả lại gần 11 tỷ đồng cho 20.146 người bị thiệt hại

  • Thế hệ trẻ ngày nay đang đối mặt với hàng loạt mối đe dọa sức khỏe chưa từng có

  • Các ngân hàng lớn của Mỹ cân nhắc hợp tác phát hành stablecoin chung để tiến vào thế giới tiền mã hóa

  • Áp dụng biện pháp ngăn chặn hoạt động Telegram tại Việt Nam

  • Anthropic vượt mặt OpenAI: Claude Opus 4 có khả năng viết mã suốt 7 giờ, cạnh tranh công nghệ AI 'gắt' hơn

  • Giao công an điều tra, làm rõ sai phạm liên quan công ty của chồng Đoàn Di Băng, xử lý Nestlé Milo quảng cáo sữa Milo

  • Giá vàng miếng SJC ngày 23/5 quay đầu giảm nhẹ

  • Habeco chi hơn 266 tỷ đồng trả cổ tức năm 2023 bằng tiền 11,5%

  • Hà Nội điều chỉnh, bổ sung 115 công trình, dự án tại 5 quận, huyện

  • Chứng khoán Mỹ lình xình, nhà đầu tư lo ngại lợi suất trái phiếu kho bạc tăng

  • OPEC+ rục rịch tăng sản lượng, giá dầu giảm

  • 'Ông lớn' ngành dược Trung Quốc dự chi hơn 5.700 tỷ đồng thâu tóm gần 65% cổ phần Imexpharm

  • OCB sắp tăng vốn điều lệ lên 26.630 tỷ đồng

  • Kim loại quý quay đầu suy yếu, giá quặng chịu sức ép lớn từ Trung Quốc

  • TP HCM: Hơn 71.000 nhà đất ở được gỡ vướng để cấp sổ hồng

  • Tòa tháp đôi 37 tầng ở Đà Nẵng bị đình chỉ hoạt động

  • WB: Duy trì cải cách, đột phá cần thiết để Việt Nam bứt tốc bền vững

  • Thủ tướng yêu cầu 100% TTHC liên quan đến doanh nghiệp được thực hiện trực tuyến

  • Thị trường trái phiếu toàn cầu phát tín hiệu: Chính phủ phải trả giá cao hơn để vay dài hạn

  • Nhiều doanh nghiệp rơi vào 'vùng trũng vỡ mộng' với công nghệ AI - Big Tech đang làm gì?

  • Trang chủ
  • Tin tức
  • Thị trường
  • Doanh nghiệp
  • Bất động sản
  • Tài chính
  • Thương mại điện tử
  • Thuật ngữ
  • Multimedia
  • Multimedia
Tin tức
Thị trường
Doanh nghiệp
Bất động sản
Tài chính
Thương mại điện tử
Thuật ngữ

Anthropic vượt mặt OpenAI: Claude Opus 4 có khả năng viết mã suốt 7 giờ, cạnh tranh công nghệ AI 'gắt' hơn

14:04 |  23/05/2025

Anthropic vừa mới chính thức ra mắt hai mô hình Claude Opus 4 và Claude Sonnet 4, nâng tiêu chuẩn mới cho khả năng làm việc độc lập của AI. Trong một thử nghiệm tại Rakuten, Claude Opus 4 đã duy trì tập trung vào một dự án refactor mã nguồn mở phức tạp suốt gần 7 giờ – đánh dấu bước nhảy vọt từ AI phản hồi nhanh sang AI cộng tác dài hạn thực thụ.

"Ngựa chiến mới" của Anthropic

Anthropic vừa ra mắt hai mô hình AI mới là Claude Opus 4 và Claude Sonnet 4, nâng tầm kỳ vọng về những gì AI có thể thực hiện mà không cần sự can thiệp của con người.

Công cụ AI mới của Anthropic có thể lập trình liên tục trong gần 7 giờ đồng hồ. (Ảnh: Venture Beat/Midjourney)

Đáng chú ý, mô hình chủ lực Opus 4 đã duy trì sự tập trung liên tục gần 7 giờ trong một bài thử nghiệm refactor dự án mã nguồn mở phức tạp tại Rakuten – một bước đột phá biến AI từ công cụ phản hồi nhanh thành cộng sự thực thụ, đủ sức đảm nhiệm các dự án kéo dài cả ngày.

Hiệu suất "marathon" này đánh dấu một bước nhảy vọt vượt xa giới hạn vài phút tập trung của các mô hình AI trước đây. Về mặt công nghệ, điều này mở ra khả năng để AI xử lý toàn bộ quy trình kỹ thuật phần mềm, từ lên ý tưởng đến hoàn thiện, với khả năng duy trì ngữ cảnh và độ tập trung suốt cả ngày làm việc.

Anthropic cho biết Claude Opus 4 đạt 72,5% điểm trên thang đo SWE-bench, một chuẩn đánh giá khắt khe trong kỹ thuật phần mềm, vượt xa GPT-4.1 của OpenAI (chỉ đạt 54,6% khi ra mắt tháng 4). Thành tích này củng cố vị thế của Anthropic như một đối thủ đáng gờm trong thị trường AI đang ngày càng cạnh tranh.

Khác biệt nổi bật của Claude 4 nằm ở khả năng kết hợp trực tiếp giữa tư duy lý luận và sử dụng công cụ. Thay vì chỉ thu thập dữ liệu rồi mới phân tích như các mô hình trước, Claude có thể tra cứu, phân tích và cập nhật thông tin đồng thời – mô phỏng quá trình suy nghĩ của con người một cách tự nhiên và hiệu quả hơn.

Sự chuyển dịch của ngành AI sang các mô hình lý luận rõ rệt trong năm 2025. Các hệ thống này xử lý vấn đề có trình tự, mô phỏng tư duy thay vì chỉ dò mẫu từ dữ liệu huấn luyện. OpenAI khởi đầu xu hướng này với dòng "o" từ tháng 12/2024, sau đó là Gemini 2.5 Pro của Google với năng lực "Deep Think", và R1 của DeepSeek bất ngờ chiếm thị phần nhờ khả năng giải quyết vấn đề mạnh mẽ với giá hợp lý.

Theo báo cáo Xu hướng Sử dụng Mô hình AI của Poe (mùa xuân 2025), tỷ lệ người dùng chuyển sang mô hình lý luận đã tăng gấp 5 lần trong 4 tháng, từ 2% lên 10%. Người dùng ngày càng coi AI là một đối tác tư duy, thay vì chỉ là công cụ trả lời câu hỏi.

Kiến trúc hai chế độ giúp cân bằng giữa tốc độ và chiều sâu

Anthropic đã giải quyết một điểm nghẽn kéo dài trong trải nghiệm người dùng công nghệ AI thông qua cách tiếp cận kết hợp. Cả hai mô hình Claude 4 đều có khả năng phản hồi gần như tức thì đối với các câu hỏi đơn giản và suy luận mở rộng với các vấn đề phức tạp – khắc phục tình trạng chậm trễ gây khó chịu mà các mô hình lý luận trước đây từng gặp phải, ngay cả với những yêu cầu cơ bản.

Tính năng hai chế độ này duy trì được sự nhanh nhạy trong tương tác mà người dùng mong đợi, đồng thời mở ra chiều sâu phân tích khi cần thiết. Hệ thống tự động phân bổ tài nguyên xử lý dựa trên độ phức tạp của nhiệm vụ, tạo nên sự cân bằng mà các mô hình trước chưa thể đạt được.

Một đột phá khác là khả năng duy trì bộ nhớ. Các mô hình Claude 4 có thể trích xuất thông tin chính từ tài liệu, tạo file tóm tắt và ghi nhớ xuyên suốt các phiên làm việc khi được cấp quyền – giải quyết triệt để "vấn đề mất trí nhớ" từng giới hạn hiệu quả của AI trong các dự án dài hạn.

Về mặt kỹ thuật, cơ chế này hoạt động tương tự như cách các chuyên gia xây dựng hệ thống quản lý tri thức: Claude tự động sắp xếp thông tin theo cấu trúc tối ưu, phục vụ việc truy xuất sau này. Nhờ đó, Claude có thể hiểu ngày càng sâu sắc hơn các lĩnh vực phức tạp thông qua quá trình tương tác kéo dài.

Cạnh tranh công nghệ AI ngày càng khốc liệt, các ông lớn chạy đua giành thị phần

Thời điểm Anthropic công bố loạt mô hình mới cho thấy rõ tốc độ cạnh tranh ngày càng tăng trong lĩnh vực AI tiên tiến. Chỉ 5 tuần sau khi OpenAI ra mắt dòng GPT-4.1, Anthropic đã đáp trả bằng các mô hình cạnh tranh hoặc vượt trội trên nhiều chỉ số quan trọng. Trong khi đó, Google đã cập nhật Gemini 2.5 hồi đầu tháng và Meta cũng vừa tung ra LLaMA 4 với khả năng đa phương thức cùng ngữ cảnh lên đến 10 triệu token.

Mỗi phòng thí nghiệm lớn hiện đang xây dựng thế mạnh riêng trong một thị trường ngày càng chuyên biệt. OpenAI dẫn đầu về tư duy tổng quát và khả năng tích hợp công cụ. Google vượt trội ở mảng xử lý đa phương thức. Anthropic hiện tuyên bố vị thế số 1 trong hiệu suất dài hạn và ứng dụng lập trình chuyên nghiệp.

Theo Venture Beat

Với khách hàng doanh nghiệp, cuộc cạnh tranh mang lại ý nghĩa chiến lược quan trọng. Các tổ chức đang phải đưa ra quyết định ngày càng phức tạp về việc lựa chọn hệ thống AI phù hợp cho từng tình huống sử dụng, khi không có mô hình nào chiếm ưu thế tuyệt đối.

Sự phân mảnh này có lợi cho những khách hàng am hiểu kỹ thuật, có thể tận dụng sức mạnh chuyên sâu của từng hệ thống, nhưng lại là thách thức cho các tổ chức muốn tìm một giải pháp AI thống nhất và đơn giản.

Tích hợp công cụ lập trình sâu hơn vào hoạt động doanh nghiệp

Anthropic cũng mở rộng khả năng tích hợp Claude vào quy trình phát triển phần mềm với phiên bản chính thức của Claude Code. Hệ thống này nay hỗ trợ các tác vụ chạy nền qua GitHub Actions, tích hợp trực tiếp với môi trường VS Code và JetBrains, cho phép hiển thị và chỉnh sửa mã ngay trong tệp của lập trình viên.

Việc GitHub lựa chọn Claude Sonnet 4 làm nền tảng cho một agent lập trình mới trong GitHub Copilot là minh chứng thị trường quan trọng. Hợp tác này với nền tảng phát triển của Microsoft cho thấy các tập đoàn công nghệ lớn đang đa dạng hóa đối tác AI, thay vì phụ thuộc vào một nhà cung cấp duy nhất.

Anthropic cũng giới thiệu thêm loạt API mới dành cho lập trình viên, điển hình là công cụ thực thi mã, trình kết nối MCP, API quản lý tệp và tính năng lưu cache lời gọi lệnh (prompt) lên đến 1 giờ. Những tính năng này giúp tạo ra các agent AI thông minh hơn, có thể duy trì trạng thái trong quy trình công việc phức tạp – một yêu cầu thiết yếu để AI có thể được doanh nghiệp ứng dụng thực sự.

hi các mô hình ngày càng có khả năng duy trì sự tập trung và ghi nhớ lâu dài, chúng dần trở thành cộng sự thực thụ, chứ không chỉ là công cụ hỗ trợ con người. (Ảnh: Thitruongbiz tạo bởi Meta AI)

Thách thức về minh bạch khi công nghệ AI ngày càng phức tạp

Báo cáo nghiên cứu của Anthropic công bố tháng 4 với tiêu đề "Các mô hình lý luận không phải lúc nào cũng nói ra điều chúng nghĩ" đã chỉ ra những mô hình đáng lo ngại trong cách các hệ thống AI diễn đạt quá trình suy luận của mình. Cụ thể, nghiên cứu phát hiện rằng Claude 3.7 Sonnet chỉ đề cập đến các manh mối quan trọng mà nó sử dụng để giải bài toán trong 25% số lần – làm dấy lên câu hỏi lớn về mức độ minh bạch trong tư duy của AI.

Nghiên cứu này phản ánh một nghịch lý ngày càng rõ: khi mô hình AI trở nên mạnh mẽ hơn, chúng cũng đồng thời trở nên khó hiểu hơn. Buổi làm việc tự động kéo dài 7 giờ của Claude Opus 4 – tuy ấn tượng – lại cho thấy con người gần như không thể theo dõi hay kiểm chứng toàn bộ chuỗi suy luận kéo dài như vậy.

Ngành công nghiệp công nghệ AI giờ đây đang đối mặt với một nghịch lý: năng lực càng cao thì minh bạch càng giảm. Để giải quyết căng thẳng này, cần có những cách tiếp cận giám sát mới, cân bằng giữa hiệu suất và khả năng giải thích – một thách thức mà chính Anthropic cũng thừa nhận nhưng chưa giải quyết triệt để.

Tương lai của hợp tác lâu dài giữa con người và AI

Buổi làm việc tự động kéo dài 7 giờ của Claude Opus 4 mở ra cái nhìn mới về vai trò tương lai của AI trong công việc trí tuệ. Khi các mô hình ngày càng có khả năng duy trì sự tập trung và ghi nhớ lâu dài, chúng dần trở thành cộng sự thực thụ, chứ không chỉ là công cụ hỗ trợ.

Sự chuyển dịch này cho thấy một thay đổi sâu sắc trong cách các tổ chức phân bổ và quản lý công việc tri thức. Những nhiệm vụ từng đòi hỏi con người giám sát liên tục giờ đây có thể ủy thác cho hệ thống AI – vốn có thể duy trì ngữ cảnh và tập trung trong nhiều giờ hoặc thậm chí nhiều ngày.

Điều này sẽ tạo ra tác động kinh tế và tổ chức lớn, đặc biệt ở những lĩnh vực như phát triển phần mềm, nơi thiếu hụt nhân lực và chi phí lao động vẫn là bài toán nan giải.

Khi Claude 4 làm mờ ranh giới giữa trí tuệ con người và máy móc, chúng ta bước vào một thực tại mới trong môi trường làm việc. Thách thức lớn nhất không còn là “AI có theo kịp con người không”, mà là chúng ta sẽ thích nghi thế nào khi đồng nghiệp hiệu quả nhất trong tương lai có thể không còn là con người.

Tung Lam

URL: https://thitruongbiz.vn/anthropic-vuot-mat-openai-claude-opus-4-co-kha-nang-viet-ma-suot-7-gio-canh-tranh-cong-nghe-ai-gat-hon-d28740.html

© thitruongbiz.vn

  • Trang chủ
  • Tin tức
  • Thị trường
  • Doanh nghiệp
  • Bất động sản
  • Tài chính
  • Thương mại điện tử
  • Thuật ngữ
  • Multimedia

Giấy phép số 1906/GP-TTĐT do Sở TT&TT TP Hà Nội cấp ngày 23/06/2022.

Chịu trách nhiệm nội dung: Nguyễn Hương Ly

VPĐD: Số 1 ngõ 140 Giảng Võ, Ba Đình, Hà Nội.

Trụ sở: Số 22C ngách 119 ngõ 169 đường Hoàng Mai, Hoàng Văn Thụ, Hoàng Mai, Hà Nội.

Hotline: 0968.532.441

Email: [email protected]

Vận hành bởi: Công ty TNHH Thị Trường Biz.