Reddit vừa khởi kiện Anthropic - công ty đứng sau chatbot Claude AI - với cáo buộc thu thập trái phép hơn 100.000 bài đăng và bình luận của người dùng để huấn luyện mô hình ngôn ngữ lớn (LLM) của mình.
Reddit vừa khởi kiện Anthropic - công ty đứng sau chatbot Claude AI, vi phạm bản quyền. (Ảnh: Getty Images)
Anthropic bị tố vượt qua các biện pháp bảo vệ kỹ thuật của Reddit
Vụ kiện được đệ trình tại tòa án bang California, tập trung vào cáo buộc rằng Anthropic đã thực hiện hơn 100.000 yêu cầu trái phép tới máy chủ của Reddit để thu thập bài viết, bình luận và các nội dung khác mà không có sự cho phép.
Reddit cho biết điều này diễn ra bất chấp việc Anthropic trước đó từng công khai khẳng định đã chấm dứt các hành động thu thập dữ liệu như vậy.
Hiện Reddit đã ký kết các thỏa thuận cấp phép với nhiều tập đoàn công nghệ lớn, trong đó có OpenAI (cha đẻ của ChatGPT) và Alphabet (công ty mẹ của Google). Các thỏa thuận này đều có điều khoản quy định rõ về việc sử dụng nội dung, bảo vệ quyền riêng tư người dùng và quy trình xóa dữ liệu.
Tuy nhiên, theo Reuters, trong đơn kiện, Reddit cáo buộc Anthropic đã cố tình phớt lờ tệp robots.txt - một giao thức tiêu chuẩn giúp website chỉ định những khu vực mà các công cụ thu thập dữ liệu (web crawler, bot) không được phép truy cập.
Theo CEO Reddit, ông Steve Huffman, robots.txt hoạt động như một “tấm biển cấm xâm nhập” trên không gian số dành cho các phần mềm tự động.
Reddit cáo buộc Anthropic đã bỏ qua lệnh hạn chế này và vi phạm điều khoản dịch vụ bằng cách thu thập nội dung người dùng mà không có sự đồng ý. Đáng chú ý, đơn kiện cho rằng Anthropic thậm chí còn lấy cả các bài viết đã bị xóa, làm dấy lên lo ngại nghiêm trọng về quyền riêng tư cũng như cách công ty này lưu trữ dữ liệu người dùng.
Reddit cũng cho biết đã từng đề nghị Anthropic ký thỏa thuận cấp phép chính thức, nhưng Anthropic từ chối và chọn cách tự ý thu thập dữ liệu trực tiếp từ nền tảng. Cách làm này giúp Anthropic tránh phải trả phí cấp phép đồng thời né các biện pháp bảo vệ người dùng mà Reddit đã thiết lập.
Nguồn gốc tranh cãi: Reddit là “mỏ dữ liệu” huấn luyện AI
Trong đơn kiện, Reddit dẫn lại một nghiên cứu khoa học năm 2021 mà CEO Anthropic - ông Dario Amodei - đồng tác giả, trong đó nhấn mạnh Reddit là nguồn dữ liệu huấn luyện ngôn ngữ có giá trị cao.
Trước khi đồng sáng lập Anthropic, ông Dario Amodei từng giữ vị trí Phó Chủ tịch nghiên cứu tại OpenAI.
Reddit đưa ra bằng chứng cho thấy Claude đã tái tạo lại các bài đăng trên Reddit với độ chính xác gần như tuyệt đối.
Reddit đưa ra bằng chứng cho thấy Claude - chatbot của Anthropic, đã tái tạo lại các bài đăng trên Reddit với độ chính xác gần như tuyệt đối, bao gồm cả những nội dung mà người dùng sau đó đã xóa khỏi nền tảng.
Theo Reddit, điều này cho thấy Anthropic đã không thực hiện đầy đủ các biện pháp cần thiết nhằm bảo vệ quyền riêng tư người dùng cũng như xử lý các yêu cầu gỡ bỏ nội dung.
Reddit lập luận rằng hành động của Anthropic đã vi phạm nguyên tắc cạnh tranh lành mạnh khi thu thập dữ liệu từ nền tảng mà không bồi thường tài chính, trong khi các đối thủ khác đã phải trả phí cấp phép để có quyền truy cập tương tự.
Trái với những gì được quảng bá, Anthropic hoàn toàn phớt lờ các quy định và người dùng của Reddit. Họ tin rằng mình có quyền lấy bất cứ nội dung gì và sử dụng theo bất kỳ cách nào mà không phải chịu trách nhiệm.
Vì vậy, Reddit yêu cầu bồi thường thiệt hại tài chính và đề nghị tòa án ra lệnh cấm Anthropic tiếp tục sử dụng nội dung từ Reddit trong việc đào tạo hay phát triển các mô hình AI trong tương lai.
Các điểm chính: - Reddit kiện Anthropic vì cáo buộc thu thập hơn 100.000 bài viết và bình luận người dùng mà không được phép để huấn luyện AI. - Reddit cho rằng Anthropic đã vượt qua các biện pháp bảo vệ kỹ thuật, vi phạm điều khoản dịch vụ và từ chối ký thỏa thuận cấp phép chính thức. - Vụ kiện phản ánh những căng thẳng rộng hơn trong ngành AI về quyền dữ liệu, quyền riêng tư người dùng và phát triển AI có đạo đức. - Reddit lập luận rằng hành vi thu thập dữ liệu trái phép làm suy yếu mô hình kinh doanh của công ty và phá vỡ niềm tin của người dùng.
Tiền lệ tranh chấp bản quyền của Anthropic
Đây không phải là lần đầu tiên Anthropic vướng vào các tranh chấp liên quan đến việc thu thập dữ liệu. Hồi tháng 8/2024, một nhóm tác giả đã đệ đơn kiện tập thể cáo buộc Anthropic sử dụng sách có bản quyền mà không xin phép để đào tạo mô hình AI.
Nhóm tác giả yêu cầu được bồi thường cho việc sử dụng trái phép tác phẩm của họ.
Ngoài ra, vào tháng 10/2023, Universal Music Group cùng nhiều nhà xuất bản âm nhạc khác cũng kiện Anthropic với cáo buộc Claude tái tạo lời bài hát có bản quyền mà không được phép.
Các công ty âm nhạc cho rằng điều này xâm phạm quyền sở hữu trí tuệ của họ và yêu cầu tòa án cấm Anthropic tiếp tục sử dụng các nội dung đó.
Tuy nhiên, vụ kiện lần này của Reddit khác với các vụ kiện bản quyền trước đó ở chỗ tập trung vào hành vi vi phạm hợp đồng và cạnh tranh không công bằng, hơn là vi phạm quyền sở hữu trí tuệ.
Làn sóng khởi kiện các công ty AI đang gia tăng, phản ánh những căng thẳng rộng hơn trong ngành AI về quyền dữ liệu, quyền riêng tư người dùng và phát triển AI có đạo đức. (Ảnh minh họa)
Reddit lập luận rằng các nội dung do người dùng tạo ra trên nền tảng vẫn chịu sự điều chỉnh của điều khoản dịch vụ mà Anthropic đã cố tình vi phạm.
Về phía mình, người phát ngôn của Anthropic cho biết công ty không đồng tình với các cáo buộc của Reddit và sẽ kiên quyết tự bảo vệ trước pháp lý. Tuy nhiên, Anthropic chưa đưa ra phản hồi chi tiết về từng cáo buộc cụ thể.
Những hệ lụy lớn hơn trong ngành AI
Cuộc tranh chấp pháp lý này phản ánh những mâu thuẫn ngày càng gia tăng trong ngành AI liên quan đến việc thu thập dữ liệu huấn luyện.
Khi các công ty AI ngày càng cần những bộ dữ liệu khổng lồ để phát triển mô hình cạnh tranh, các tranh chấp về quyền dữ liệu và quyền sử dụng nội dung cũng ngày càng xuất hiện nhiều hơn.
Hoạt động web scraping - tức tự động trích xuất dữ liệu từ website, hiện vẫn nằm trong vùng xám pháp lý.
Mặc dù nhiều thông tin công khai có thể dễ dàng truy cập, nhưng các điều khoản dịch vụ và giới hạn kỹ thuật có thể đặt ra những ranh giới pháp lý rõ ràng cho việc thu thập dữ liệu.
Vụ kiện lần này làm nổi bật sự mâu thuẫn giữa các cam kết đạo đức mà Anthropic công bố và những gì Reddit cáo buộc là thực tế hoạt động thu thập dữ liệu không minh bạch.
Reddit cho rằng các tuyên bố này có thể gây hiểu lầm cho người dùng cũng như các đối thủ cạnh tranh về cách Anthropic thực sự thu thập dữ liệu.
Trước tình trạng tác động môi trường từ các trung tâm dữ liệu và máy chủ ngày càng gia tăng do tăng trưởng kinh tế và những tiến bộ công nghệ như trí tuệ nhân tạo (AI), Chương trình Môi trường Liên Hợp Quốc (UNEP) hôm nay đã công bố bộ Hướng dẫn mua sắm bền vững cho trung tâm dữ liệu và máy chủ, nhằm giúp chính phủ và các cơ quan chức năng cắt giảm mức tiêu thụ điện năng và nước tại các cơ sở này.
CTCP Chứng khoán Sài Gòn - Hà Nội (mã: SHS, sàn HNX) vừa công bố nghị quyết về việc phát hành trái phiếu riêng lẻ lần 2 năm 2025 với tổng giá trị phát hành theo mệnh giá tối đa 1.800 tỷ đồng.
Quý III/2025, GELEX Electric ghi nhận doanh thu thuần đạt hơn 6.444 tỷ đồng, tăng 14,7% so với cùng kỳ 2024. Lợi nhuận trước thuế đạt 2.202 tỷ đồng, tăng gấp hơn 3 lần cùng kỳ.
Ngân hàng TMCP Tiên Phong (TPBank, mã chứng khoán TPB) vừa được Ngân hàng Nhà nước (NHNN) chấp thuận tăng vốn điều lệ thêm gần 1.321 tỷ đồng thông qua phát hành cổ phiếu để trả cổ tức cho cổ đông hiện hữu.
Công ty Chứng khoán VIX vừa công bố báo cáo tài chính riêng quý III/2025 với kết quả tăng trưởng mạnh ở hầu hết các mảng hoạt động, đánh dấu giai đoạn bứt phá rõ nét sau khi thị trường chứng khoán phục hồi.
Công ty CP Nông nghiệp BAF Việt Nam (HOSE: BAF) vừa thông qua kế hoạch phát hành trái phiếu ra công chúng với tổng giá trị 1.000 tỷ đồng, nhằm bổ sung vốn cho hoạt động sản xuất kinh doanh và cơ cấu lại nợ vay. Chứng khoán JB Việt Nam sẽ là đơn vị tư vấn phát hành cho thương vụ này.
Theo tài liệu vừa công bố, DNP Holding đang lấy ý kiến cổ đông bằng văn bản từ ngày 05/10 đến 15/10/2025. Nội dung chính là đề xuất cổ đông chấp thuận cho Công ty TNHH Tasco Investment (công ty con 100% vốn của Tasco) không phải thực hiện thủ tục chào mua công khai.
Công ty CP Công nghệ Vi Mô (thuộc hệ sinh thái NextTech) vừa phát công văn chính thức gửi khách hàng, đối tác, liên quan đến thông tin Cơ quan Công an TP Hà Nội đang tiến hành điều tra và xác minh vụ việc liên quan đến ông Nguyễn Hòa Bình (Shark Bình) và dự án tiền số AntEx.
Bộ Xây dựng vừa chính thức phê duyệt Tổng công ty Hàng không Việt Nam (Vietnam Airlines) làm nhà đầu tư Dự án xây dựng và kinh doanh dịch vụ khai thác nhà ga hàng hóa số 2 tại Cảng hàng không quốc tế Long Thành.
Theo đăng ký doanh nghiệp thay đổi ngày 5/9/2025, Công ty Cổ phần Quản lý và Đầu tư Bất động sản VMI đã đổi tên thành Công ty Cổ phần Quản lý và Đầu tư Bất động sản Hưng Long.
CTCP Chứng khoán VPBank (VPBankS), ngày 8/10, đã công bố báo cáo tài chính quý III/2025. Trong kỳ, tổng doanh thu hoạt động của công ty đạt 3.572 tỷ đồng, gấp 6 lần cùng kỳ năm ngoái. Các mảng kinh doanh đều tăng trưởng mạnh.
Công ty cho biết, lượng cổ phiếu mà cổ đông hiện hữu không mua tiếp tục được chào bán cho 18 nhân viên công ty. Tuy nhiên, 1 nhà đầu tư từ chối mua và 1 nhà đầu tư không mua hết lượng cổ phiếu đã được phân phối,
Ngân hàng TMCP Việt Nam Thương Tín (Vietbank, UPCoM: VBB) đã được Ủy ban Chứng khoán Nhà nước chấp thuận phương án chào bán hơn 270,9 triệu cổ phiếu. Kế hoạch này sẽ nâng vốn điều lệ của ngân hàng vượt 10.900 tỷ đồng, diễn ra cùng với lộ trình chuyển niêm yết cổ phiếu VBB từ UPCoM sang HoSE.
Thủy sản Minh Phú vừa thông qua việc thành lập công ty con tại Canada với vốn điều lệ 100.000 USD, chỉ trong chưa đầy một tháng mở rộng tại thị trường Úc.
Thanh tra Ủy ban Chứng khoán Nhà nước vừa ban hành Quyết định xử phạt hành chính Công ty cổ phần Sữa Quốc tế Lof (mã chứng khoán IDP) do nhiều vi phạm trong lĩnh vực chứng khoán và công bố thông tin.
Theo dự phóng kết quả kinh doanh quý III/2025, Công ty Cổ phần Phát triển Bất động sản Phát Đạt (HoSE: PDR) ghi nhận tốc độ tăng trưởng tích cực, thể hiện hiệu quả trong chiến lược tái cơ cấu danh mục dự án và mở rộng nguồn thu.
Sở Giao dịch Chứng khoán TP HCM (HOSE) vừa công bố danh sách 10 công ty chứng khoán có thị phần môi giới cổ phiếu lớn nhất quý III/2025. Top 10 không thay đổi về danh sách so với quý trước, song thứ hạng và mức thị phần có sự dịch chuyển đáng chú ý.
Ngày 6/10, Tập đoàn Vingroup công bố thành lập CTCP Sản xuất và Kinh doanh VinMetal, chính thức gia nhập lĩnh vực công nghiệp luyện kim, mở rộng trụ cột công nghiệp - công nghệ hiện tại của tập đoàn.
Hội đồng Quản trị của CTCP Tập đoàn Hoa Sen (mã chứng khoán HSG: HoSE) đã thông qua nghị quyết giải thể Công ty Cổ phần Cảng Quốc tế Hoa Sen, có trụ sở chính tại TP HCM.
Mới đây, Ủy ban Chứng khoán Nhà nước (UBCKNN) ban hành Quyết định số 305/QĐ-XPHC về việc xử phạt vi phạm hành chính trong lĩnh vực chứng khoán và thị trường chứng khoán đối với CTCP Đầu tư Thành Thành Công (TTC). Địa chỉ trụ sở chính đặt tại số 253 Hoàng Văn Thụ, phường Tân Sơn Hòa, TP HCM.
Ngân hàng TMCP Quân Đội (MB – Mã chứng khoán MBB) vừa thông tin đã bán hơn 55,98 triệu cổ phiếu MBS của CTCP Chứng khoán MB (MBS) thông qua phương thức khớp lệnh trên sàn trong khoảng thời gian từ ngày 3/9/2025 đến ngày 2/10/2025.
ACV là viết tắt của Airports Corporation of Vietnam tên giao dịch quốc tế của Tổng công ty Cảng hàng không Việt Nam - CTCP trên cơ sở hợp nhất 3 tổng công ty. ACV được giao quản lý, điều phối hoạt động và đầu tư khai thác toàn bộ hệ thống 22 cảng hàng không trên toàn lãnh thổ Việt Nam bao gồm 9 sân bay quốc tế và 13 sân bay nội địa.
Công ty CP Vietcap đứng vị trí 196 trong danh sách 500 doanh nghiệp tư nhân lớn nhất Việt Nam. Chứng khoán Vietcap là gì? Công ty CP Vietcap uy tín không? Có nên mở tài khoản tại chứng khoán Bản Việt không?
Công ty TNHH Thương mại và Công nghiệp Mỹ Việt đứng ở vị trí số 195 trong danh sách 500 doanh nghiệp tư nhân lớn nhất Việt Nam. Công ty TNHH Thương mại và Công nghiệp Mỹ Việt kinh doanh gì? Tấm lợp Olympic có tốt không?
ACV là viết tắt của Airports Corporation of Vietnam tên giao dịch quốc tế của Tổng công ty Cảng hàng không Việt Nam - CTCP trên cơ sở hợp nhất 3 tổng công ty. ACV được giao quản lý, điều phối hoạt động và đầu tư khai thác toàn bộ hệ thống 22 cảng hàng không trên toàn lãnh thổ Việt Nam bao gồm 9 sân bay quốc tế và 13 sân bay nội địa.
Công ty CP Vietcap đứng vị trí 196 trong danh sách 500 doanh nghiệp tư nhân lớn nhất Việt Nam. Chứng khoán Vietcap là gì? Công ty CP Vietcap uy tín không? Có nên mở tài khoản tại chứng khoán Bản Việt không?
Công ty TNHH Thương mại và Công nghiệp Mỹ Việt đứng ở vị trí số 195 trong danh sách 500 doanh nghiệp tư nhân lớn nhất Việt Nam. Công ty TNHH Thương mại và Công nghiệp Mỹ Việt kinh doanh gì? Tấm lợp Olympic có tốt không?