Vào ngày 28 tháng 5 năm 2025, DeepSeek đã phát hành DeepSeek-R1-0528. Cuộc đua trí tuệ nhân tạo (AI) toàn cầu đang chứng kiến những bước tiến chóng mặt, với sự cạnh tranh khốc liệt giữa các gã khổng lồ công nghệ và các công ty khởi nghiệp đầy tham vọng. Trong bối cảnh đó, DeepSeek, một startup AI đến từ Trung Quốc, đã âm thầm tung ra bản cập nhật mới cho mô hình suy luận R1, mang tên R1-0528, trên nền tảng Hugging Face. Động thái này không chỉ khẳng định vị thế của DeepSeek mà còn làm gia tăng áp lực lên các đối thủ nặng ký như OpenAI, Google, và xAI. Với khả năng lập trình ấn tượng và chi phí phát triển thấp, R1-0528 tiếp tục thách thức các quan niệm truyền thống về phát triển AI, đặt ra câu hỏi liệu sức mạnh tính toán khổng lồ và vốn đầu tư lớn có thực sự là yếu tố quyết định trong cuộc đua này. Bài viết này sẽ phân tích ý nghĩa của bản cập nhật R1-0528, vai trò của DeepSeek trong cuộc đua AI toàn cầu, và những thách thức mà các đối thủ phải đối mặt.
DeepSeek R1-0528, phiên bản mới nhất của mô hình suy luận R1, đã nhanh chóng thu hút sự chú ý của giới công nghệ dù không đi kèm thông báo chính thức. Theo bảng xếp hạng LiveCodeBench – một thước đo uy tín do các nhà nghiên cứu từ UC Berkeley, MIT, và Cornell phát triển – R1-0528 cho thấy khả năng tạo mã vượt trội, chỉ đứng sau các mô hình mini o4 và o3 của OpenAI, nhưng vượt qua Grok 3 mini của xAI và Qwen 3 của Alibaba. Một đại diện của DeepSeek đã gọi đây là “nâng cấp thử nghiệm nhỏ” trong một nhóm WeChat, khuyến khích người dùng trải nghiệm. Tuy nhiên, hiệu năng của R1-0528 cho thấy đây không chỉ là một bản cập nhật thông thường mà là minh chứng cho khả năng tối ưu hóa của DeepSeek trong việc phát triển AI với chi phí thấp.
R1-0528 kế thừa những đặc điểm nổi bật của R1, vốn đã gây sốc khi ra mắt vào tháng 1/2025 với hiệu năng ngang ngửa OpenAI o1 nhưng chỉ tiêu tốn khoảng 6 triệu USD để huấn luyện, thấp hơn đáng kể so với hàng trăm triệu USD của các đối thủ Mỹ. Mô hình này sử dụng phương pháp “chain-of-thought” (chuỗi suy nghĩ), cho phép giải quyết các vấn đề phức tạp bằng cách chia nhỏ và xử lý từng bước, tương tự cách suy nghĩ của con người. Ngoài ra, DeepSeek tiếp tục duy trì chiến lược mã nguồn mở, phát hành R1-0528 dưới giấy phép MIT, cho phép các nhà nghiên cứu toàn cầu truy cập, tùy chỉnh, và cải tiến mô hình. Điều này không chỉ thúc đẩy đổi mới mà còn tạo ra áp lực cạnh tranh lớn hơn cho các công ty giữ mô hình độc quyền như OpenAI.
Sự thành công của DeepSeek, đặc biệt với R1 và bản cập nhật R1-0528, đã đặt ra thách thức trực tiếp đối với các biện pháp kiểm soát xuất khẩu chip AI của Mỹ. Dù bị hạn chế tiếp cận các chip tiên tiến như Nvidia H100, DeepSeek đã sử dụng các chip H800 và A100 với hiệu suất thấp hơn, kết hợp với kỹ thuật “mixed precision” (kết hợp số dấu phẩy động 32-bit và 8-bit) để tối ưu hóa tính toán. Kết quả là các mô hình AI của DeepSeek đạt hiệu năng tương đương các đối thủ Mỹ nhưng với chi phí và tài nguyên thấp hơn đáng kể. Theo Nature, chính các chính sách hỗ trợ, nguồn tài trợ dồi dào, và lực lượng nhân sự AI chất lượng cao tại Trung Quốc đã giúp DeepSeek đạt được những bước tiến này.
Sự xuất hiện của R1-0528 và các mô hình trước đó của DeepSeek đã buộc các công ty Mỹ phải điều chỉnh chiến lược. OpenAI đã giảm giá dịch vụ và ra mắt o3 Mini, một mô hình tiết kiệm tài nguyên hơn, trong khi Google giới thiệu các gói truy cập Gemini giá rẻ. Những động thái này cho thấy áp lực cạnh tranh không chỉ đến từ hiệu năng mà còn từ chi phí vận hành, vốn là thế mạnh của DeepSeek. Tuy nhiên, một số chuyên gia Mỹ vẫn tỏ ra nghi ngờ về tính xác thực của chi phí huấn luyện thấp mà DeepSeek công bố, cho rằng con số thực tế có thể cao hơn.
Trong khi đó, tại Trung Quốc, các công ty như Alibaba và Tencent cũng không đứng ngoài cuộc chơi. Họ đã công bố các mô hình AI được cho là vượt trội hơn DeepSeek, làm gia tăng tính cạnh tranh nội bộ. Tuy nhiên, DeepSeek vẫn giữ lợi thế nhờ chiến lược mã nguồn mở và khả năng tối ưu hóa tài nguyên, khiến công ty trở thành tâm điểm chú ý không chỉ ở Trung Quốc mà còn trên toàn cầu.
Những đổi mới liên tục này hứa hẹn sẽ tiếp tục định hình cuộc đua AI, nơi hiệu quả tính toán và khả năng truy cập đang trở thành yếu tố then chốt. Tuy nhiên, DeepSeek cũng đối mặt với những thách thức, như hạn chế về dữ liệu do kiểm duyệt chính trị tại Trung Quốc, khiến mô hình của họ tránh né các chủ đề nhạy cảm như sự kiện Thiên An Môn. Ngoài ra, các biện pháp kiểm soát xuất khẩu chip ngày càng nghiêm ngặt của Mỹ có thể ảnh hưởng đến khả năng mở rộng của DeepSeek trong tương lai.
DeepSeek R1-0528 là minh chứng cho sự đổi mới và tham vọng của Trung Quốc trong cuộc đua AI toàn cầu. Với chi phí thấp, hiệu năng cao, và chiến lược mã nguồn mở, DeepSeek không chỉ thách thức các gã khổng lồ Mỹ như OpenAI và Google mà còn đặt ra những câu hỏi quan trọng về cách phát triển AI trong tương lai. Cuộc đua này không chỉ là về sức mạnh tính toán mà còn về sự sáng tạo và khả năng tối ưu hóa. Để duy trì lợi thế, các công ty trên toàn cầu cần học hỏi từ những bước đi của DeepSeek, đồng thời đầu tư vào nghiên cứu cơ bản và hợp tác mở. Trong bối cảnh cạnh tranh ngày càng khốc liệt, những đổi mới như R1-0528 hứa hẹn sẽ mang lại nhiều đột phá, định hình tương lai của trí tuệ nhân tạo.
cục TT,TK