OpenAI dan Broadcom mengumumkan Jalapeño pada 24 Juni 2026, sebuah chip akselerator AI yang dirancang khusus untuk inferensi model bahasa besar. Chip ini merupakan Prosesor Kecerdasan pertama OpenAI dan komponen awal dari platform komputasi multi-generasi yang direncanakan, yang dikembangkan bersama oleh kedua perusahaan, dengan tujuan meningkatkan kecepatan, efisiensi, dan aksesibilitas sistem AI canggih. Tonggak sejarah ini mencerminkan arah strategis yang lebih luas di mana OpenAI semakin bekerja menuju kontrol atas seluruh infrastruktur yang mendasari model dan aplikasinya, daripada hanya mengandalkan platform komputasi eksternal.
Jalapeño dirancang dari awal berdasarkan penelitian internal tentang kebutuhan inferensi LLM modern. Arsitekturnya mencerminkan wawasan yang diperoleh dari peta jalan pengembangan model OpenAI, termasuk pertimbangan seputar optimasi kernel, penanganan memori, jaringan, dan sistem penyajian. Chip ini dikembangkan dalam kemitraan dengan Broadcom dan Celestia, yang berkontribusi pada proses manufaktur, integrasi papan dan rak, sistem jaringan, dan infrastruktur penerapan skala besar. Menurut perusahaan, desain ini dimaksudkan untuk tetap fleksibel di berbagai model bahasa besar, tidak terbatas pada satu arsitektur atau lini produk tertentu.
Sampel teknik awal sudah menjalankan beban kerja pembelajaran mesin di lingkungan laboratorium pada frekuensi operasi dan tingkat daya yang ditargetkan, termasuk beban kerja yang terkait dengan model canggih seperti GPT-5.3-Codex-Spark. Evaluasi internal awal menunjukkan bahwa Jalapeño dapat mencapai peningkatan kinerja per watt dibandingkan dengan akselerator AI terkemuka yang ada. Arsitektur ini dikatakan menekankan pengurangan perpindahan data dan distribusi sumber daya komputasi, memori, dan jaringan yang lebih seimbang, yang bertujuan untuk mendekatkan pemanfaatan dunia nyata ke batas teoretis perangkat keras. Teknologi silikon Broadcom, termasuk komponen jaringannya Tomahawk, diposisikan sebagai pendukung utama penerapan skala besar.
Chip ini dikembangkan dalam kemitraan dengan Broadcom dan Celestia. Broadcom berkontribusi pada teknologi silikon dan komponen jaringan, termasuk sistem jaringan Tomahawk. Celestia berkontribusi pada proses manufaktur, integrasi papan dan rak, sistem jaringan, dan infrastruktur penerapan skala besar. Desain ini didasari oleh sistem produksi yang digunakan dalam produk seperti ChatGPT, Codex, dan layanan berbasis API, serta persyaratan yang diantisipasi untuk aplikasi berbasis agen di masa depan.
Perusahaan telah membingkai pengembangan ini sebagai bagian dari pergeseran yang lebih luas menuju model ekonomi yang digerakkan oleh komputasi. Dalam konteks ini, chip ini disajikan sebagai upaya untuk meningkatkan ketersediaan sumber daya komputasi, mengurangi biaya operasional, dan meningkatkan daya tanggap sistem AI di seluruh aplikasi konsumen dan perusahaan. Strategi yang mendasarinya melibatkan integrasi yang lebih erat antara pengembangan model, desain perangkat keras, dan penerapan infrastruktur, yang memungkinkan optimasi di seluruh sistem daripada hanya dalam komponen yang terisolasi.
Pendekatan teknik di balik Jalapeño sangat khusus untuk inferensi LLM, bukan beban kerja komputasi umum. Hal ini didasari oleh sistem produksi yang digunakan dalam produk seperti ChatGPT, Codex, dan layanan berbasis API, serta persyaratan yang diantisipasi untuk aplikasi berbasis agen di masa depan. Tujuan desain adalah menggabungkan throughput tinggi dengan latensi rendah, memungkinkan kinerja yang lebih responsif untuk kasus penggunaan AI interaktif dalam skala besar.
Aspek kunci dari program ini adalah desain bersama sistem perangkat lunak dan perangkat keras, di mana model dan infrastruktur berkembang bersama. Ini termasuk arsitektur chip, sistem memori, lapisan jaringan, mekanisme penjadwalan, dan kerangka penerapan. Dengan menyelaraskan komponen-komponen ini, sistem dimaksudkan untuk meningkatkan efisiensi dan mengurangi biaya per unit kecerdasan yang diberikan.
Strategi platform yang lebih luas memposisikan Jalapeño sebagai langkah pertama dalam peta jalan infrastruktur jangka panjang yang dijadwalkan untuk penerapan bertahap dimulai pada tahun 2026, dengan menggabungkan kontribusi dari Broadcom dalam silikon dan jaringan, serta Celestia dalam integrasi sistem.
Apa yang diumumkan OpenAI dan Broadcom pada 24 Juni 2026?
OpenAI dan Broadcom mengumumkan Jalapeño, sebuah chip akselerator AI yang dirancang khusus untuk inferensi model bahasa besar. Chip ini merupakan Prosesor Kecerdasan pertama OpenAI dan komponen awal dari platform komputasi multi-generasi yang direncanakan, yang dikembangkan bersama oleh kedua perusahaan.
Beban kerja apa yang dijalankan oleh sampel teknik awal Jalapeño?
Sampel teknik awal sudah menjalankan beban kerja pembelajaran mesin di lingkungan laboratorium pada frekuensi operasi dan tingkat daya yang ditargetkan, termasuk beban kerja yang terkait dengan model canggih seperti GPT-5.3-Codex-Spark.
Kapan penerapan bertahap Jalapeño dijadwalkan untuk dimulai?
Strategi platform yang lebih luas memposisikan Jalapeño sebagai langkah pertama dalam peta jalan infrastruktur jangka panjang yang dijadwalkan untuk penerapan bertahap dimulai pada tahun 2026.
Berita Terkait
OpenAI meluncurkan chip AI pertama mereka, Jalapeño, dengan performa yang sebanding dengan Nvidia Blackwell.
OpenAI dan Broadcom Meluncurkan Jalapeño, Chip AI Khusus Pertama untuk Inferensi LLM
Qualcomm Meluncurkan CPU Pusat Data Dragonfly C1000, Meta Jadi Pelanggan Pertama
OpenAI dan Broadcom Meluncurkan Chip AI Kustom Jalapeño untuk Inferensi
Model GLM-5.2 z.AI Mendapat Perhatian AS dengan Biaya Rendah dan Kinerja Tinggi