Từ số 0 đến Top 10 Nature, hành trình đẳng cấp 'quái kiệt' DeepSeek

Liang Wenfeng (Lương Văn Phong), 40 tuổi, nhà sáng lập DeepSeek, được vinh danh 10 người có tầm ảnh hưởng nhất đến khoa học 2025 của tạp chí Nature.

Theo Nature, việc Lương Văn Phong cho ra mắt các mô hình ngôn ngữ lớn có hiệu suất mạnh mẽ nhưng chi phí thấp đã “gây chấn động thế giới”, đồng thời cho thấy Mỹ không còn đi trước trong lĩnh vực AI như nhiều chuyên gia từng nhận định.

luong-van-phong.png
Lương Văn Phong, người sáng lập DeepSeek. Ảnh: China Daily

Từ số 0 khởi nghiệp tới kẻ “ngáng đường” đế chế AI tỷ đô Google và OpenAI

Sinh năm 1985 tại Quảng Đông, Trung Quốc, Lương Văn Phong không lớn lên trong một môi trường công nghệ thuần túy. Xuất thân từ gia đình nhà giáo, ông sớm được rèn giũa tư duy học thuật bài bản.

Con đường học vấn của ông gắn liền với Đại học Chiết Giang, nơi ông hoàn thành chương trình kỹ sư điện tử và thạc sĩ kỹ thuật truyền thông. Luận văn về thuật toán theo dõi mục tiêu bằng camera giá rẻ cho thấy khả năng tiếp cận AI rất sớm, dù khi ấy trí tuệ nhân tạo vẫn còn là một khái niệm tương đối xa lạ với số đông.

Thế nhưng, thay vì tiếp tục con đường nghiên cứu thuần túy, Lương Văn Phong lại rẽ sang một hướng đi đầy bất ngờ: tài chính. Sau khi tốt nghiệp, ông chọn Thành Đô làm điểm khởi đầu, thử sức ở nhiều lĩnh vực khác nhau, trải qua không ít thất bại trước khi tìm được “mảnh đất” phù hợp.

Năm 2013, cùng một người bạn đồng môn, ông đồng sáng lập Công ty Quản lý Đầu tư Yakebi tại Hàng Châu, chính thức bước chân vào lĩnh vực giao dịch định lượng, nơi AI bắt đầu được ứng dụng để ra quyết định đầu tư. Hai năm sau, ông tiếp tục đồng sáng lập Công ty Công nghệ Huanfang Hàng Châu (nay là Công ty TNHH Quản lý Tài sản Jiuzhang Chiết Giang), từng bước xây dựng vị thế trong giới tài chính công nghệ cao.

Năm 2016 đánh dấu một cột mốc quan trọng khác, khi Lương Văn Phong cùng hai cộng sự đều là kỹ sư thành lập High-Flyer. Dựa trên nền tảng toán học, dữ liệu lớn và các mô hình AI, công ty nhanh chóng tạo tiếng vang trên thị trường đầu tư định lượng.

Đến năm 2019, High-Flyer đã quản lý khối tài sản vượt 10 tỷ nhân dân tệ, con số cho thấy khả năng kết hợp hiếm có giữa tư duy công nghệ và bản lĩnh tài chính của người đứng đầu. Cũng trong năm này, High-Flyer AI ra đời như một bộ phận nghiên cứu chuyên sâu, đặt nền móng cho những tham vọng vượt ra ngoài phạm vi tài chính.

Năm 2023, khi đường đua AI toàn cầu bước vào giai đoạn tăng tốc, sân chơi gần như thuộc về những “ông lớn” quen mặt như OpenAI, Google DeepMind hay các tập đoàn công nghệ hàng đầu Trung Quốc gồm Baidu, Tencent, thì DeepSeek xuất hiện khá lặng lẽ, hầu như không thu hút nhiều sự chú ý. Thế nhưng chỉ sau hơn một năm, startup non trẻ ấy đã bứt phá ngoạn mục, vươn mình thành một đối thủ đáng gờm trên bản đồ AI, buộc cả Google lẫn OpenAI cũng phải nhìn lại với sự thận trọng rõ rệt.

Sự chuẩn bị âm thầm đáng gờm đẳng cấp “quái kiệt”

Ít ai ngờ rằng, khi thế giới AI còn chưa bước vào cơn bùng nổ dữ dội, Lương Văn Phong đã âm thầm chuẩn bị cho một cuộc chơi dài hơi. Ngay từ năm 2021, ông lặng lẽ thu mua hàng nghìn GPU Nvidia, một quyết định khiến nhiều người trong giới tài chính khi đó không khỏi hoài nghi.

Với một người xuất thân từ tài chính, động thái “gom chip” tưởng chừng xa lạ ấy lại chính là nước cờ chiến lược mang tầm nhìn vượt thời điểm. Khi Mỹ áp đặt các biện pháp kiểm soát xuất khẩu chip đối với Trung Quốc, Lương Văn Phong đã sớm nắm trong tay nguồn lực then chốt để hiện thực hóa tham vọng AI.

Bước ngoặt thực sự diễn ra vào mùa xuân năm 2023. Tháng 4, High-Flyer, công ty do ông đồng sáng lập – bất ngờ tách riêng một phòng thí nghiệm AI, hoạt động độc lập với mảng tài chính truyền thống. Chỉ một tháng sau, DeepSeek chính thức ra đời. Sự kiện này đánh dấu cuộc chuyển mình đầy ngoạn mục của Lương Văn Phong từ sân chơi tài chính mạng lưới AI toàn cầu.

Trong bài phát biểu tại lễ trao giải Golden Bull Awards năm 2019, Lương Văn Phong đã chia sẻ tầm nhìn khác biệt về tương lai đầu tư định lượng tại Trung Quốc. Ông nhấn mạnh rằng, yếu tố tạo nên sự khác biệt cốt lõi chính là việc ứng dụng thuật toán và dữ liệu, thay vì phụ thuộc vào yếu tố con người. Đồng thời, ông khẳng định sứ mệnh của High-Flyer là nâng cao hiệu quả của thị trường tài chính Trung Quốc bằng sức mạnh của công nghệ.

Chiến lược “đi ngược số đông”: Thuật toán, chi phí thấp và cú bứt phá của DeepSeek

Không chọn con đường đầu tư ồ ạt vào siêu máy tính hay những hệ thống phần cứng đắt đỏ. Lương Văn Phong cho rằng sức mạnh cốt lõi của AI nằm ở thuật toán và khả năng tối ưu hóa mô hình. Từ triết lý đó, DeepSeek tập trung phát triển các mô hình ngôn ngữ lớn (LLM) với chi phí thấp nhưng hiệu quả cao – một hướng đi khiến giới công nghệ không khỏi bất ngờ.

Chỉ trong vòng một năm, DeepSeek liên tục công bố những bước tiến đáng chú ý. Tháng 11/2023, công ty trình làng DeepSeek Coder, mô hình AI hỗ trợ lập trình, qua đó chính thức bước vào cuộc cạnh tranh với OpenAI Codex và Google Gemini. Không lâu sau, đến tháng 12/2023, DeepSeek LLM ra mắt, cho thấy tham vọng của startup này không chỉ giới hạn ở lĩnh vực lập trình, mà còn hướng tới các ứng dụng AI mang tính tổng quát hơn.

Bước ngoặt thực sự xuất hiện vào giữa năm 2024, khi DeepSeek giới thiệu mô hình thế hệ thứ hai – DeepSeek-V2. Nhờ những cải tiến mạnh mẽ về hiệu suất cùng khả năng tối ưu chi phí, mô hình này nhanh chóng thu hút sự chú ý của cộng đồng AI toàn cầu. DeepSeek bắt đầu cạnh tranh trực tiếp với GPT-4, đồng thời tạo áp lực đáng kể lên các đối thủ bằng chiến lược giá hợp lý.

Đến cuối năm 2024, DeepSeek tiếp tục gây sửng sốt khi công bố DeepSeek-V3, với 671 tỷ tham số và khả năng xử lý ngữ cảnh lên tới 128.000 mã thông báo, một bước tiến vượt bậc so với nhiều sản phẩm mà OpenAI và Google đang sở hữu. Với phiên bản này, DeepSeek cho thấy một công ty khởi nghiệp hoàn toàn có thể đứng ngang hàng với các “gã khổng lồ” công nghệ, thậm chí vượt trội hơn ở một số khía cạnh.

Đặc biệt, sức hút của DeepSeek không chỉ đến từ công nghệ, mà còn nằm ở mô hình kinh doanh táo bạo. Thay vì khép kín công nghệ trong những hệ sinh thái đóng như OpenAI hay Google, DeepSeek lựa chọn hướng đi mã nguồn mở, cho phép cộng đồng các nhà phát triển trên toàn cầu cùng tham gia đóng góp và hoàn thiện mô hình. Chính chiến lược này đã giúp DeepSeek nhanh chóng mở rộng phạm vi ảnh hưởng, đồng thời thu hút sự quan tâm của nhiều tổ chức và cộng đồng công nghệ quốc tế.

"Cha đẻ" vaccine bại liệt tự uống liều đầu tiên, làm nên kỳ tích Việt Nam

Giáo sư Hoàng Thủy Nguyên cùng Bộ trưởng Y tế Phạm Ngọc Thạch đã tự nguyện uống những liều thử nghiệm vaccine bại liệt đầu tiên, mở đường cho kỳ tích.

GS.TSKH Hoàng Thủy Nguyên được biết đến là người đặt nền móng cho ngành sản xuất vaccine của Việt Nam với công trình vaccine phòng bại liệt. Với công trình này, ông đã đưa Việt Nam trở thành nước thứ hai thế giới tự chủ vaccine phòng bại liệt.

gs-hoang-thuy-nguyen-2.jpg
GS Hoàng Thủy Nguyên tham gia nghiên cứu sản xuất vaccine bại liệt uống Sabin ở Việt Nam. (Ảnh: Viện Vệ sinh dịch tễ Trung ương).

Chuyên gia cảnh báo mưa, gió chỉ 'giải cứu tạm thời ô nhiễm không khí Hà Nội

Ngày 14/12, chất lượng không khí Hà Nội cải thiện, nhưng chuyên gia cảnh báo Hà Nội chỉ được “giải cứu” tạm thời khi nguyên nhân gây ô nhiễm không khí còn đó.

Sau nhiều ngày chất lượng không khí ở mức kém, thậm chí có thời điểm chạm ngưỡng nguy hại cho sức khỏe, không khí tại Hà Nội đã ghi nhận sự cải thiện rõ rệt trong sáng 14/12. Các số liệu quan trắc trong nước và quốc tế cho thấy bầu không khí Thủ đô đã giảm ô nhiễm nhanh chóng, mang lại cảm giác dễ chịu hơn so với những ngày trước đó.

Băn khoăn Hà Nội “xanh” sau nhiều ngày ô nhiễm

Học sinh Việt Nam chế tạo AI xếp hạng khoa học, đột phá dữ liệu

METRIXA, sản phẩm của nhóm học sinh Trường THPT chuyên KHTN đã sử dụng AI để tự động phân tích hàng ngàn bài báo, cung cấp bảng xếp hạng nghiên cứu chuyên sâu.

Nhóm 8 học sinh Trường THPT chuyên Khoa học Tự nhiên (ĐH Khoa học Tự nhiên, ĐH Quốc gia Hà Nội) đã phát triển METRIXA, hệ thống AI đầu tiên ở Việt Nam có thể tự động thu thập, phân tích và trực quan hóa dữ liệu hàng chục nghìn bài báo khoa học, tạo nên bản đồ nghiên cứu 3D giúp đánh giá năng lực khoa học của các tổ chức một cách minh bạch và chính xác hơn.

dsc04980.jpg
Nhóm tác giả METRIXA. Ảnh: Hoài Hương.

Đọc nhiều nhất

Tin mới