Huang Ren Xun tuyên bố gây chấn động tại CES: Thời điểm ChatGPT của AI vật lý sắp đến

黃仁勳預告物理AI

Huang Ren-Jun công bố tại CES rằng “khoảnh khắc ChatGPT của Physical AI sắp tới”. NVIDIA phát hành nền tảng Vera Rubin với hiệu suất tăng 5 lần, mở nguồn Alpamayo tự lái, mô hình thế giới Cosmos và Robot Groot. Nhấn mạnh hai lần di chuyển nền tảng diễn ra đồng thời: AI làm lại ứng dụng, Physical AI làm lại thực tế.

Ba bước đột phá của cuộc cách mạng phần cứng Vera Rubin

Huang Ren-Jun bắt đầu bài phát biểu tại CES với câu nói, “Chúng tôi có 15 kg nội dung sẽ nhét vào bài phát biểu hôm nay, 3,000 người ngồi trong hội trường, 2,000 người ngoài sân xem, tầng bốn còn có người xem trực tuyến, hàng triệu người trên toàn cầu đang theo dõi.” Nhưng ông nhanh chóng quay lại chủ đề phần cứng, công bố Vera Rubin đã toàn bộ vào sản xuất.

Tên Vera Rubin bắt nguồn từ nhà thiên văn học thế kỷ 20, người quan sát thấy tốc độ quay tại mép thiên hà gần bằng tâm, điều này trái với vật lý Newton, trừ khi có vật chất không nhìn thấy tồn tại — vật chất tối. NVIDIA đặt tên nền tảng tính toán thế hệ tiếp theo là Vera Rubin vì “thứ không nhìn thấy” mà họ đối mặt cũng đang mở rộng: nhu cầu tính toán.

Huang Ren-Jun mô tả sự điên cuồng của nhu cầu hiệu suất. Quy mô mô hình tăng 10 lần mỗi năm, sau o1 suy luận trở thành “quá trình suy nghĩ”, đào tạo sau kỳ này đưa vào học tăng cường với khối lượng tính toán tăng vọt; test-time scaling làm cho lượng token suy luận mỗi lần tăng thêm 5 lần; và mỗi khi đạt tới tuyến đầu mới, chi phí token thế hệ trước sẽ giảm 10 lần mỗi năm. Điều này ngược lại cho thấy cạnh tranh cực kỳ khốc liệt, NVIDIA phải “thúc đẩy state-of-the-art tính toán mỗi năm một lần, không được rơi lại một năm nào”.

Kiến trúc lục nhân tố hợp tác của Vera Rubin

CPU tùy chỉnh Vera: Hiệu suất tăng gấp đôi, chia sẻ dữ liệu nhất quán hai chiều với Rubin GPU từ đầu

Rubin GPU: Một bảng tính toán có thể đạt 100 PFLOPS hiệu suất AI, gấp 5 lần thế hệ trước

Mạng và bảo mật: ConnectX-9 cung cấp 1.6 Tbps băng thông ngang, BlueField-4 DPU gỡ dỡ lưu trữ và bảo mật

Một bảng tính toán có 17,000 thành phần, khay tính toán được thiết kế lại thành hình dạng “không dây, không ống, không quạt”. Chuyển đổi NVLink thế hệ thứ sáu kết nối 18 nút thành một, sau đó mở rộng đến 200G, quang học đóng gói chung, tổ chức hàng ngàn tủ điện tử thành “nhà máy AI”. Trong tác vụ huấn luyện 10 triệu tham số, 100 triệu token, Rubin chỉ cần kích thước hệ thống của Blackwell một phần tư để hoàn thành trong cùng một cửa sổ một tháng.

Huang Ren-Jun cũng đề cập những vấn đề công nghiệp thực tế. Bên trong NVIDIA ban đầu có quy tắc, sản phẩm thế hệ mới tối đa thay đổi một hoặc hai chip, không gây rối chuỗi cung ứng. Nhưng sau khi Định luật Moore chậm lại, tăng trưởng transistor không theo kịp mô hình 10 lần, token 5 lần, chi phí giảm 10 lần, không làm “co-design (thiết kế hợp tác)” thì không thể theo kịp, vì vậy thế hệ này buộc phải thiết kế lại mỗi chip. Hiệu suất dấu phẩy động Rubin GPU gấp 5 lần Blackwell, nhưng transistor chỉ gấp 1.6 lần, điều này có nghĩa là chỉ nhờ quá trình xếp chồng transistor đã tới trần, phải dựa vào thiết kế kiến trúc và hợp tác hệ thống mới có thể tạo ra hiệu suất.

Chiến lược bước nhảy tập thể của mô hình mở nguồn

Năm qua, cái thực sự làm Huang Ren-Jun “phấn khích” không phải là tiến bộ của bất kỳ mô hình đóng nguồn nào, mà là bước nhảy tập thể của mô hình mở. Huang Ren-Jun nói, mô hình mở bây giờ khoảng “chậm hơn mô hình tuyến đầu sáu tháng”, nhưng mỗi sáu tháng lại có mô hình mới thông minh hơn xuất hiện, vì vậy lượt tải xuống bùng nổ, vì công ty khởi nghiệp muốn tham gia, công ty lớn muốn tham gia, nhà nghiên cứu muốn tham gia, sinh viên muốn tham gia, gần như mỗi quốc gia đều muốn tham gia.

Nhiều người hiểu lầm NVIDIA, nói nó chỉ là “bán GPU”, và Huang Ren-Jun trên sân khấu CES liên tục nhấn mạnh, NVIDIA đang trở thành nhà xây dựng mô hình mở nguồn tuyến đầu, và hoàn toàn mở. Ông liệt kê một loạt mô hình mở nguồn NVIDIA: từ Nemotron hỗn hợp Transformer-SSM, mô hình thế giới Cosmos, đến người máy hình người Groot. Thậm chí lĩnh vực tự lái Alpamayo, không chỉ mở nguồn mô hình, mà còn mở nguồn dữ liệu huấn luyện.

Huang Ren-Jun công bố Alpamayo là “AI tự lái suy nghĩ, suy luận toàn bộ thế giới đầu tiên”. Nó từ đầu đến cuối từ camera đến thực thi, vừa học “thể hiện con người” từ quãng đường thực tế lớn, cũng học quãng đường được Cosmos tạo ra, cộng thêm “hàng chục ngàn” mẫu ghi chú cực kỳ cẩn thận. Chìa khóa là nó không chỉ xuất ra vô lăng và phanh xăng, mà còn cho bạn biết nó sẽ thực hiện hành động gì, tại sao lại làm như vậy, quỹ đạo là gì.

Huang Ren-Jun nói, tám năm trước họ bắt đầu làm tự lái, vì sớm nhận định học sâu sẽ làm lại toàn bộ ngăn xếp tính toán. Alpamayo công bố “hôm nay mở nguồn”, quy mô kỹ thuật này rất lớn, Huang Ren-Jun nói nhóm AV của họ “hàng ngàn người”, và Mercedes-Benz hợp tác với họ năm năm trước. Ông dự báo tương lai có thể sẽ có 1 tỷ chiếc xe tự lái, “mỗi chiếc xe đều có khả năng suy nghĩ, mỗi chiếc xe đều được điều khiển bởi AI”.

Kiến trúc ba máy tính của Physical AI

Huang Ren-Jun dành thời gian dài nói về một việc: để AI hiểu được kiến thức thường thức của thế giới, khó hơn nhiều so với ngôn ngữ. Sự tồn tại của vật thể, quan hệ nhân quả, quán tính, ma sát, trọng lực, đối với trẻ em con người là trực giác, nhưng đối với AI hoàn toàn lạ. Và dữ liệu của thế giới thực luôn không đủ. Ông nói để làm physical AI, cần “ba máy tính”: để huấn luyện mô hình, để suy luận tại biên xe/robot/nhà máy, và để mô phỏng.

Omniverse là thế giới mô phỏng sinh đôi kỹ thuật số, Cosmos là mô hình nền tương của thế giới, mô hình robot có Groot và Alpamayo. Dữ liệu huấn luyện từ đâu? Mô hình ngôn ngữ có nhiều văn bản, video thực từ thế giới vật lý rất nhiều, nhưng chưa đủ để bao phủ tương tác đa dạng. Vì vậy họ sử dụng sinh dữ liệu tổng hợp tuân theo định luật vật lý, chọn lọc tạo mẫu huấn luyện.

Cosmos có thể tạo video chân thực từ một ảnh, tạo chuyển động liên tục từ mô tả cảnh 3D, tạo video toàn cảnh từ nhật ký cảm biến, tạo ra “trường hợp biên” từ gợi ý cảnh. Còn có thể mô phỏng có umpire, hành động được thực hiện, thế giới phản ứng, Cosmos lại suy luận bước tiếp. Huang Ren-Jun định nghĩa tự lái là “thị trường chính truyền thống quy mô lớn” đầu tiên của physical AI, và khác biệt “điểm uốn chính là lúc này”, trong mười năm tới, một tỷ lệ lớn những chiếc xe trên thế giới sẽ tự động hóa cao độ.

Huang Ren-Jun cho rằng, tương lai của AI không chỉ là đa phương thức, mà là “đa mô hình”. Hệ thống thông minh nhất nên gọi mô hình phù hợp nhất trong các tác vụ khác nhau, hệ thống thực tế nhất tự nhiên là đa đám mây, đám mây hỗn hợp, tính toán biên. Điều này có nghĩa là bản chất ứng dụng AI, thực ra là một bộ kiến trúc điều khiển và suy luận, một trí tuệ có thể phán đoán ý định, chọn mô hình, gọi công cụ, kết hợp kết quả. Huang Ren-Jun cho rằng, trí tuệ này đang trở thành “giao diện người dùng” mới, không còn là Excel, không còn là form, không còn là dòng lệnh.

Công ty NVIDIA đang trải qua khoảnh khắc mâu thuẫn. Nó trông giống như cái nguy hiểm nhất trong tất cả tự sự bong bóng, giá trị thị trường đã vot lên độ cao chưa từng thấy. Nhưng nó đồng thời giống như cái mạnh nhất trong tất cả cổ phiếu khái niệm AI, một quý doanh thu, lợi nhuận ròng hàng trăm tỷ đô la Mỹ, tỷ suất lợi nhuận gộp có thể đạt 70%. Khi một công ty đồng thời nắm giữ tự sự công nghệ, vị trí quan trọng trong chuỗi công nghiệp, và sự chú ý của thị trường tài chính, nó sẽ trở thành biểu tượng. Lợi ích của biểu tượng là niềm tin mang lại phí bảo hiểm, nhược điểm là phí bảo hiểm có nghĩa là bạn không thể sai lầm.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim