Startup Trung Quốc đứng sau DeepSeek R1 - ‘quả bom’ AI giá rẻ làm chao đảo cổ phiếu Big tech Mỹ

Thực ra, DeepSeek không phải công ty Trung Quốc duy nhất đang cố gắng xây dựng mô hình AI có hiệu suất cao và chi phí thấp.

Nhưng khi họ cho ra mắt DeepSeek R1 với hiệu suất vượt trội so với bản o1 của OpenAI - được xác nhận của các bên thứ ba, đó thực sự là ‘bom tấn’ định nghĩa lại bản đồ công nghệ toàn cầu. Mà bản chất, là cuộc đua giữa hai siêu cường: Trung Quốc và Mỹ.

Sự xuất hiện của DeepSeek R1 đã thực sự tạo ra địa chấn, kéo sập thị trường chứng khoán Mỹ.

Trong phiên giao dịch ngày 27/1, chỉ số Nasdaq Composite giảm 612,47 điểm (-3,07%) xuống còn 19.341,43 điểm, khi nhiều cổ phiếu Big tech Mỹ lao dốc. Cụ thể, cổ phiếu Nvidia giảm gần 17%; cổ phiếu Tesla lao dốc 12%, Meta sụt gần 10%. Dư chấn cũng lan sang thị trường crypto, khi Bitcoin có lúc cắm đầu giảm tới 12%, để tuột mốc 100.000 USD.

DeepSeek R1 có gì?

*Dòng trạng thái về DeepSeek R1 của ông Shubham Saboo, Giám đốc sản phẩm của DeepSeek, nhận được nhiều tương tác trên mạng xã hội X*

“DeepSeek R1 là mã nguồn mở 100%, rẻ hơn 96,4% so với OpenAI o1 trong khi vẫn mang lại hiệu suất tương tự”, ông Shubham Saboo, Giám đốc sản phẩm của DeepSeek, viết trên X hôm 22/1, đồng thời cho biết: “OpenAI o1 mất 60 USD cho một triệu token đầu ra, còn DeepSeek R1 chỉ cần 2,19 USD”.

Hiệu suất của DeepSeek R1 cũng được xác nhận bởi các bên thứ ba. Trong nhiều bài kiểm tra, mô hình AI giá rẻ của Trung Quốc thậm chí vượt trội số với bản ChatGPT-o1 mới nhất của OpenAI.

CEO Microsoft Satya Nadella cũng đánh giá cao AI mới của startup Trung Quốc trong bài phát biểu tại Diễn đàn Kinh tế Thế giới ở Davos hôm 22/1.

″Mô hình DeepSeek mới thực sự ấn tượng. Họ đã biết cách thực hiện hiệu quả một mô hình nguồn mở có khả năng suy luận, đạt hiệu quả tính toán siêu việt. Chúng ta nên xem xét những diễn biến ở Trung Quốc một cách rất, rất nghiêm túc”, ông nói.

Theo các chuyên gia, DeepSeek sử dụng một quy trình đặc biệt goi là phương pháp “chưng cất”, qua đó giúp mô hình này trở nên thông minh thông qua việc “học” từ một mô hình lớn hơn. Điều này đảm bảo hiệu suất cao nhưng siêu tiết kiệm về mặt chi phí, qua đó tạo lợi thế cạnh tranh lớn về giá so với các công ty AI phương Tây.

Đặc biệt, DeepSeek R1 sử dụng mã nguồn mở, với tiềm năng lan tỏa mạnh mẽ trong cộng đồng công nghệ. Trong khi đó, OpenAI không mở mã nguồn - nhằm bảo vệ “ngưỡng an toàn” của các mô hình AI như CEO Sam Altman từng tuyên bố.

Hé mở DeepSeek

DeepSeek là một công ty khởi nghiệp (startup) về trí tuệ nhân tạo có trụ sở tại Hàng Châu, Trung Quốc. Startup này là “con đẻ” của Liang Wenfeng (Lương Văn Phong) - một doanh nhân và nhà nghiên cứu từng học tại Đại học Chiết Giang.

Sinh năm 1985, ông Phong là nhà đồng sáng lập High-Flyer Quant - công ty quản lý quỹ phòng hộ sử dụng AI để vận hành một trong những quỹ đầu cơ định lượng lớn nhất ở Trung Quốc. DeepSeek được tách ra từ High-Flyer Quant vào tháng 7/2023.

DeepSeek được xem như “ngựa ô” trong giới startup AI Trung Quốc: kín tiếng nhưng luôn biết cách gây ấn tượng. Trong khi nhiều startup AI đang mải 'đốt tiền', DeepSeek tự chủ tài chính và sớm có lãi.

Bí quyết đến từ cách tiếp cận của DeepSeek trong việc thiết kế mô hình AI, đặc biệt việc sáng tạo ra kiến trúc MLA (multi-head latent attention) mới giúp giảm mức sử dụng bộ nhớ xuống 5-13% so với kiến trúc MHA đang có trên các mô hình ngôn ngữ lớn (LLM) mạnh nhất trên thế giới.

Trước khi gây bão với DeepSeek R1, startup này từng cho ra mắt mô hình LLM mã nguồn mở mang tên DeepSeek V3. Dù được quảng bá là có thể xử lý khối lượng công việc và tác vụ thông qua văn bản bản đầu vào "theo cách thông minh nhất".

Tuy nhiên, trong thử nghiệm của TechCrunch và một số chia sẻ của người dùng trên mạng xã hội, DeepSeek V3 lại tự nhận nó là ChatGPT. Khi được yêu cầu giải thích, V3 khẳng định mình là phiên bản của GPT-4, được OpenAI phát hành năm 2023./.

Startup Trung Quốc kín tiếng đứng sau DeepSeek R1 - ‘quả bom’ AI giá rẻ làm chao đảo cổ phiếu Big tech Mỹ

DeepSeek R1 có gì?

Hé mở DeepSeek

Bình luận