Pengumuman Mengejutkan Jensen Huang di CES: Momen ChatGPT untuk Physical AI Hampir Tiba

MarketWhisper

黃仁勳預告物理AI

Huang Ren-yun mengumumkan di CES bahwa “saat ChatGPT untuk Physical AI sudah dekat”. Nvidia meluncurkan platform Vera Rubin dengan peningkatan daya komputasi 5 kali lipat, membuka sumber Alpamayo untuk self-driving, model dunia Cosmos, dan robot Groot. Menekankan dua migrasi platform terjadi secara bersamaan: AI mengerjakan ulang aplikasi, Physical AI mengerjakan ulang realitas.

Tiga Terobosan Revolusi Hardware Vera Rubin

Huang Ren-yun membuka presentasi CES-nya dengan mengatakan, “Kami memiliki 15 kilogram konten untuk dimasukkan ke dalam presentasi hari ini, dengan 3.000 orang duduk di ruangan, 2.000 orang lagi di halaman luar menonton, orang-orang menonton di lantai empat secara online, dan jutaan orang di seluruh dunia menonton.” Namun dia dengan cepat kembali ke topik hardware, mengumumkan bahwa Vera Rubin telah dalam produksi penuh.

Nama Vera Rubin berasal dari astronom abad ke-20, yang mengamati bahwa kecepatan rotasi di tepi galaksi hampir sama dengan di pusat, yang tidak masuk akal menurut fisika Newton, kecuali jika ada materi tak terlihat—materi gelap. Nvidia menamai platform komputasi generasi berikutnya Vera Rubin karena “hal-hal tak terlihat” yang mereka hadapi juga berkembang: permintaan komputasi.

Huang Ren-yun menggambarkan permintaan daya komputasi yang gila-gilaan. Ukuran model tumbuh 10 kali lipat setiap tahun, setelah o1 penalaran menjadi “proses pemikiran”, pelatihan pasca-latihan memperkenalkan pembelajaran penguatan dengan lonjakan komputasi; scaling waktu-uji membuat jumlah token per inferensi meningkat 5 kali lipat lagi; dan setiap kali mencapai frontier baru, biaya token generasi sebelumnya turun 10 kali lipat setiap tahun. Ini sebaliknya menunjukkan persaingan sangat ketat, Nvidia harus “memajukan state-of-the-art komputasi setiap tahun, tidak boleh tertinggal satu tahun pun”.

Arsitektur Enam-Inti Kolaboratif Vera Rubin

CPU Kustom Vera: Performa berlipat ganda, berbagi data konsistensi dua arah dengan Rubin GPU sejak awal

Rubin GPU: Satu papan komputasi dapat mencapai 100 PFLOPS daya AI, 5 kali lipat dari generasi sebelumnya

Jaringan dan Keamanan: ConnectX-9 menyediakan bandwidth lateral 1.6 Tbps, BlueField-4 DPU melepas penyimpanan dan keamanan

Satu papan komputasi memiliki 17.000 komponen, nampan komputasi dirancang ulang menjadi bentuk “tanpa kabel, tanpa pipa, tanpa kipas angin”. Pertukaran NVLink generasi keenam menghubungkan 18 node menjadi satu kesatuan, kemudian diperluas hingga 200G, optik kemasan bersama, mengorganisir ribuan rak untuk membentuk “pabrik AI”. Dalam tugas pelatihan 10 kuadriliun parameter, 100 kuadriliun token, Rubin hanya memerlukan seperempat ukuran sistem Blackwell untuk menyelesaikan dalam jendela bulan yang sama.

Huang Ren-yun juga menyebutkan tantangan industri yang nyata. Awalnya Nvidia memiliki aturan internal bahwa produk generasi baru paling banyak mengganti satu atau dua chip, jangan buat rantai pasokan menderita. Namun setelah Hukum Moore melambat, pertumbuhan transistor tidak dapat mengejar 10 kali lipat model, 5 kali lipat token, dan penurunan biaya 10 kali lipat, tanpa “co-design” tidak mungkin tertajar, jadi generasi ini terpaksa merancang ulang setiap chip. Rubin GPU memiliki efisiensi floating-point 5 kali lipat Blackwell, namun transistor hanya 1,6 kali lipat, ini berarti mengandalkan proses untuk menumpuk transistor sudah mencapai batas, harus mengandalkan desain kolaboratif arsitektur dan tingkat sistem untuk menciptakan performa.

Strategi Lompatan Kolektif Model Sumber Terbuka

Selama setahun terakhir, apa yang benar-benar membuat Huang Ren-yun merasa “bersemangat” bukanlah kemajuan satu model closed-source tertentu, melainkan lompatan kolektif mode open-source. Huang Ren-yun mengatakan, model terbuka sekarang tertinggal model frontier sekitar “enam bulan”, namun setiap enam bulan muncul model baru yang lebih cerdas, jadi unduhan meledak, karena startup ingin berpartisipasi, perusahaan besar ingin berpartisipasi, peneliti ingin berpartisipasi, siswa ingin berpartisipasi, hampir setiap negara ingin berpartisipasi.

Banyak orang salah memahami Nvidia, mengatakan itu hanya “menjual GPU”, dan Huang Ren-yun berulang kali menekankan di panggung CES, Nvidia menjadi pembuat model open-source frontier, dan itu yang sepenuhnya terbuka. Dia melaporkan serangkaian model open-source Nvidia: dari Nemotron yang mencampur Transformer-SSM, model dunia Cosmos, hingga robot humanoid Groot. Bahkan di bidang self-driving Alpamayo, tidak hanya membuka model, tetapi juga membuka data pelatihan.

Huang Ren-yun mengumumkan Alpamayo adalah “AI self-driving pertama di dunia yang dapat berpikir dan bernalar”. Ini end-to-end dari kamera ke aktuator, belajar dari sejumlah besar “demonstrasi manusia” dari jarak tempuh nyata, juga belajar dari jarak tempuh yang dihasilkan Cosmos, ditambah “puluhan ribu” sampel anotasi yang sangat teliti. Kuncinya adalah tidak hanya menghasilkan kemudi dan rem akselerator, tetapi juga memberi tahu Anda tindakan apa yang akan diambil, mengapa melakukannya, dan apa lintasannya.

Huang Ren-yun mengatakan, mereka mulai melakukan self-driving delapan tahun yang lalu, karena awal-awal mereka menilai pembelajaran mendalam akan mengerjakan ulang seluruh tumpukan komputasi. Alpamayo mengumumkan “buka sumber hari ini”, rangkaian teknik ini sangat besar, Huang Ren-yun mengatakan tim AV mereka “ribuan orang”, dan Mercedes-Benz berkolaborasi dengan mereka lima tahun lalu. Dia memprediksi di masa depan mungkin akan ada 1 miliar kendaraan self-driving, “setiap kendaraan akan memiliki kemampuan berpikir, setiap kendaraan akan didorong oleh AI”.

Arsitektur Tiga Komputer Physical AI

Huang Ren-yun menghabiskan waktu yang sangat lama untuk berbicara tentang satu hal: membuat AI memahami akal sehat dunia jauh lebih sulit daripada bahasa. Persistensi objek, hubungan kausal, inersia, gesekan, gravitasi, bagi bayi manusia adalah intuitif, bagi AI sepenuhnya asing. Dan data dari dunia nyata tidak akan pernah cukup. Dia mengatakan untuk melakukan physical AI, diperlukan “tiga komputer”: untuk melatih model, untuk inferensi tepi di mobil/robot/pabrik, dan untuk simulasi.

Omniverse adalah dunia simulasi bayang digital, Cosmos adalah model fondasi dunia, model robot memiliki Groot dan Alpamayo. Data pelatihan dari mana? Model bahasa memiliki banyak teks, video nyata dunia fisik banyak, tetapi jauh tidak cukup untuk mencakup interaksi beragam. Jadi mereka menggunakan data sintetis yang sesuai hukum fisika untuk menghasilkan, secara selektif membuat sampel pelatihan.

Cosmos dapat membuat video realistis dari gambar tunggal, membuat gerakan koheren dari deskripsi adegan 3D, menghasilkan video panorama dari log sensor, membuat “kasus tepi” dari isyarat adegan. Juga dapat simulasi loop tertutup, tindakan dilakukan, dunia merespons, Cosmos bernalar langkah berikutnya. Huang Ren-yun mendefinisikan self-driving sebagai “pasar arus utama skala besar” pertama physical AI, dan menyatakan “titik balik ada di waktu ini”, dekade depan proporsi besar kendaraan di dunia akan otomasi tinggi.

Huang Ren-yun percaya di masa depan, AI bukan hanya multimodal, tetapi “multi-model”. Sistem paling cerdas harus memanggil model paling sesuai dalam tugas berbeda, sistem paling nyata secara alami multi-cloud, cloud hybrid, edge computing. Ini berarti esensi aplikasi AI sesungguhnya adalah satu set arsitektur penjadwalan dan inferensi, satu agen yang dapat menilai niat, memilih model, memanggil alat, menggabungkan hasil. Huang Ren-yun percaya, agen seperti ini sedang menjadi “antarmuka pengguna” baru, bukan lagi Excel, bukan lagi formulir, bukan lagi command line.

Nvidia mengalami saat yang paradoks. Terlihat seperti narasi gelembung paling berbahaya dari semuanya, valuasi sudah mencapai ketinggian yang belum pernah terjadi sebelumnya. Namun pada saat yang sama seperti saham konsep AI paling kuat dari semuanya, pendapatan triwulanan, laba bersih ratusan miliar dolar Amerika, margin kotor dapat mencapai 70%. Ketika satu perusahaan secara bersamaan menguasai narasi teknologi, posisi penting rantai industri, dan perhatian pasar keuangan, itu menjadi totem. Keuntungan totem adalah kepercayaan membawa premium, kerugiannya adalah premium berarti Anda tidak dapat membuat kesalahan.

Lihat Asli
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.
Komentar
0/400
Tidak ada komentar