Meta – Scale AI: Cuộc “cướp” dữ liệu trị giá 15 tỷ USD

Trong thế giới AI, dữ liệu không chỉ là nguyên liệu. Nó là quyền lực. Và Meta, với thương vụ đầu tư gần 15 tỷ USD vào Scale AI, đang đặt cược lớn để giành lấy quyền lực đó.

Bước đi chiến lược của Meta

Ngày 13/6/2025, giới công nghệ chấn động trước thông tin Meta đầu tư 14,8 tỷ USD để sở hữu 49% cổ phần của Scale AI, một trong những startup dữ liệu AI có giá trị nhất thế giới. Thương vụ này định giá Scale lên tới gần 30 tỷ USD, biến nó thành một “cánh tay dữ liệu” đầy uy lực cho Meta trong cuộc đua trí tuệ nhân tạo.

Scale AI, do Alexandr Wang sáng lập, là nhà cung cấp hàng đầu về dữ liệu được gắn nhãn chính xác – một yếu tố sống còn trong huấn luyện các mô hình ngôn ngữ lớn (LLM). Các khách hàng cũ của Scale từng bao gồm Google DeepMind, OpenAI, Anthropic và xAI của Elon Musk.

Từ đối tác trung lập thành “người của Meta”

Ngay sau thương vụ, Alex Wang được thông báo sẽ chuyển sang làm việc trực tiếp tại Meta, giữ vai trò lãnh đạo bộ phận “AI Foundation Models”. Sự chuyển đổi nhân sự này không chỉ mang tính biểu tượng – nó đánh dấu sự thay đổi vai trò của Scale: từ một nhà cung cấp dữ liệu độc lập, trung lập, trở thành cánh tay mở rộng về dữ liệu chiến lược của Meta.

Một số điều khoản hợp đồng bị rò rỉ cho thấy Meta sẽ có quyền ưu tiên sử dụng hạ tầng và dữ liệu gắn nhãn của Scale, điều mà các đối thủ khác như OpenAI và Google không thể chấp nhận. Ngay lập tức, các khách hàng lớn lần lượt rút khỏi nền tảng của Scale AI, khiến startup này rơi vào tình thế “độc quyền phục vụ một ông lớn”.

Tại sao Meta làm điều này?

Meta đang đối mặt với thách thức lớn: không thể tiếp cận được các kho dữ liệu độc quyền như Google Search, YouTube (Google), Reddit (OpenAI + Google), hay GitHub (Microsoft). Trong khi đó, các mô hình mã nguồn mở như LLaMA mà Meta phát triển cần hàng tỉ token gắn nhãn để đạt hiệu quả tương đương GPT-4 hay Claude.

Việc mua lại Scale AI là con đường ngắn nhất để Meta bù đắp khoảng trống dữ liệu chất lượng cao – điều mà không thể chỉ giải quyết bằng cách thu thập web công khai.

Đồng thời, nó cũng là một đòn giáng mạnh vào hệ sinh thái AI đang ngày càng phân cực, khi một nền tảng cung cấp dữ liệu dùng chung bỗng chốc trở thành “đất riêng”.

Hiệu ứng domino và phản ứng từ thị trường

Hệ quả của thương vụ Meta–Scale diễn ra gần như tức thì:

  • OpenAI, xAI, Anthropic và nhiều đối tác khác xác nhận đã dừng sử dụng dịch vụ của Scale.
  • Các startup AI như Mistral (Pháp), Cohere (Canada) bắt đầu tìm kiếm nhà cung cấp dữ liệu thay thế như Snorkel, Hugging Face hoặc tự xây dựng nền tảng nội bộ.
  • Google tỏ ra “thận trọng” khi tuyên bố đang “đánh giá lại quan hệ hợp tác với Scale”, đồng thời mở rộng hợp tác dữ liệu riêng với startup như Runway, ElevenLabs…

Nguy cơ độc quyền & vấn đề đạo đức dữ liệu

Thương vụ cũng làm dấy lên lo ngại về sự tập trung dữ liệu vào tay một vài tập đoàn công nghệ. Khi các nguồn dữ liệu được kiểm soát bởi chính đối thủ cạnh tranh, thị trường AI đứng trước nguy cơ mất tính minh bạch và cạnh tranh lành mạnh.

Ngoài ra, Meta từng nhiều lần vướng tranh cãi liên quan đến quyền riêng tư, sử dụng dữ liệu người dùng, và chất lượng dữ liệu huấn luyện mô hình. Việc tiếp cận hàng tỷ dòng dữ liệu được gắn nhãn bởi Scale đặt ra câu hỏi lớn: Liệu Meta có đủ đạo đức và trách nhiệm để sử dụng kho dữ liệu này một cách an toàn, công bằng?

Cân bằng lại thế trận AI toàn cầu

Với động thái này, Meta khẳng định vai trò là một thế lực dữ liệu hạng nặng bên cạnh Microsoft (GitHub + Bing), Google (Search + YouTube), OpenAI (Reddit, sách, văn bản mở). Dù chưa thể khẳng định thành công, nhưng Meta đang “chơi ván bài dữ liệu” một cách bài bản, quyết liệt và đầy tính toán.

Về phần Scale, nhiều chuyên gia đánh giá startup này đã đánh đổi vị trí “trụ cột trung lập” lấy sự hậu thuẫn tài chính khổng lồ – một quyết định chiến lược có thể tạo ra lợi nhuận nhưng đồng thời đặt dấu chấm hết cho vai trò cân bằng hệ sinh thái mà Scale từng đại diện.

Kết luận: Cuộc chiến AI đã đến thời kỳ dữ liệu là “đạn dược”

Khi mô hình AI ngày càng lớn, sở hữu dữ liệu trở thành vũ khí tối thượng. Thương vụ Meta – Scale AI không chỉ là một thương vụ đầu tư, mà là một bước chuyển dịch quyền lực giữa các siêu tập đoàn AI.

Nếu OpenAI có mô hình mạnh, Microsoft có hạ tầng, Google có tìm kiếm – thì giờ đây, Meta có dữ liệu. Cuộc chiến AI bước sang một chương mới: chiến tranh dữ liệu./.

Nguồn: Time, Reuters, Bloomberg, Axios, The Information – Tháng 6/2025