ChatGPT Images 2.0 Hadir! Akurasi pembuatan teks meningkat pesat, dengan mudah menghasilkan poster pemasaran

ChainNewsAbmedia

OpenAI secara resmi meluncurkan ChatGPT Images 2.0 pada hari Selasa, tidak hanya sangat meningkatkan akurasi dalam pembuatan teks, serta keindahan desain pada poster dan foto potret. Model ini juga untuk pertama kalinya memperkenalkan “mode berpikir”, sehingga pembuatan gambar memiliki kemampuan pencarian di web dan output batch multi-gambar, mendekati sepenuhnya skenario penerapan untuk keperluan komersial.

(Canva mengumumkan integrasi mendalam Claude, mewujudkan konversi draf AI menjadi produk desain jadi)

Dari mengarang dari nol hingga menu sempurna: AI akhirnya belajar mengeja

Menilik dua tahun lalu, kelemahan model generasi gambar AI dalam pembuatan teks hampir sudah diketahui semua orang. Selama prompt menyertakan kebutuhan akan teks, hasil keluaran sering kali dipenuhi dengan kesalahan ejaan yang absurd, bahkan mengarang tanpa dasar. Hal ini bahkan lebih parah pada bahasa non-Inggris seperti bahasa Tionghoa, Jepang, dan Korea.

Ilustrasi poster berbahasa Korea dari pengumuman resmi

Kini, ChatGPT Images 2.0 sudah mampu menghasilkan satu poster promosi yang dapat langsung digunakan oleh penyedia, dengan teks yang jelas dan akurat. Peneliti dalam beberapa tahun terakhir secara aktif mengeksplorasi arsitektur-arsitektur baru seperti (Autoregressive Models) dan sejenisnya untuk kembali ke model, sehingga logika operasional, pemahaman terhadap teks, kemampuan generasi, serta verifikasi mengalami peningkatan yang signifikan.

Mode berpikir diluncurkan: pencarian online, konsistensi komposisi semuanya pas

Peningkatan paling inti pada ChatGPT Images 2.0 adalah “Mode Berpikir (Thinking Capabilities)”; saat ini dibuka untuk pengguna berbayar ChatGPT Plus, Pro, versi komersial, dan versi perusahaan. Setelah diaktifkan, model dapat langsung melakukan pencarian informasi di web untuk membantu pembuatan gambar, juga dapat membuat penjelasan visual yang sesuai berdasarkan file yang diunggah pengguna, serta melakukan pemeriksaan diri dan optimasi atas konten gambar sebelum keluaran resmi.

Untuk pembuatan batch, dalam mode berpikir, satu prompt dapat menghasilkan hingga delapan gambar sekaligus, dan setiap gambar dapat mempertahankan konsistensi citra karakter, gaya objek, serta gaya keseluruhan. Ini cocok untuk storyboard komik, rangkaian gambar dan teks untuk media sosial, bahkan hingga gambar perencanaan berbagai ruang untuk desain interior.

Ilustrasi storyboard komik dari pengumuman resmi

Dari sisi resolusi, model baru mendukung keluaran hingga 2K, dan menambahkan opsi berbagai rasio aspek dari 3:1 hingga 1:3, sehingga makin memenuhi kebutuhan bisnis yang beragam.

Bahasa Asia dioptimalkan secara besar-besaran, pengguna Jepang, Tiongkok, dan Korea mendapat kabar baik!

Selain bahasa Inggris, OpenAI secara khusus menyoroti peningkatan besar pada tulisan berbahasa Asia di Images 2.0; bahasa Jepang, Korea, dan Tionghoa semuanya mengalami perbaikan yang jelas.

Artikel uji yang beberapa hari lalu beredar luas di komunitas teknologi Tiongkok juga membuktikan kabar tersebut. Beberapa kreator di Zhihu saat itu melakukan perbandingan uji coba antara GPT-Image-2 dan pesaing Google Nano Banana Pro, mencakup berbagai skenario seperti desain poster berbahasa Tionghoa, gambar sampul e-commerce, antarmuka media sosial, serta bagan visual berbasis data.

Uji GPT-Image 2.0 di artikel Zhihu

Hasil pengujian menunjukkan bahwa GPT-Image-2 secara nyata unggul dalam rasa estetika font Tionghoa, hierarki tata letak, dan nuansa desain secara keseluruhan. Gaya poster yang dihasilkan lebih mendekati materi komersial yang nyata, bukan keluaran model yang tampak jelas “bernuansa AI”. Artikel tersebut juga menyebutkan bahwa pada replikasi antarmuka (seperti tampilan layar permainan atau tangkapan layar aplikasi komunikasi) dan pencocokan adegan orang asli, GPT-Image-2 juga menunjukkan ketepatan detail yang lebih tinggi.

ChatGPT Images 2.0 dibuka sepenuhnya, API juga diluncurkan

Saat ini, ChatGPT Images 2.0 sejak hari Selasa di minggu ini sudah tersedia gratis untuk semua pengguna ChatGPT dan Codex untuk fitur dasar; sementara pengguna berbayar dapat membuka efek keluaran yang lebih lanjut. Bersamaan dengan itu, OpenAI juga membuka akses GPT-Image-2 API, dengan penetapan harga dihitung berdasarkan kualitas output dan pengelompokan resolusi, untuk memberi fleksibilitas integrasi bagi tim perusahaan dan pengembang.

Perlu dicatat bahwa tanggal berakhirnya pengetahuan model baru adalah Desember 2025; untuk prompt pembuatan gambar yang melibatkan peristiwa terkini, akurasi mungkin mengalami batasan tertentu. Selain itu, kecepatan pembuatan komposisi yang rumit juga tidak dapat secepat tanya-jawab teks biasa secara instan, namun tetap hanya membutuhkan beberapa menit.

Artikel ini, ChatGPT Images 2.0 hadir! Akurasi pembuatan teks meningkat pesat, dengan mudah menghasilkan poster pemasaran, pertama kali muncul di Rantai Berita ABMedia.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

IREN Mengakuisisi Mirantis untuk $625M dalam Kesepakatan Saham Seluruhnya untuk Memperluas Platform Cloud AI

Menurut BlockBeats, IREN Limited menyetujui untuk mengakuisisi perusahaan perangkat lunak infrastruktur cloud Mirantis dengan nilai sekitar $625 juta dalam transaksi seluruhnya berbasis saham pada 5 Mei. Akuisisi ini bertujuan untuk meningkatkan kapabilitas cloud AI IREN dengan menghadirkan kemampuan perangkat lunak dan orkestrasi untuk

GateNews4jam yang lalu

CEO Anthropic: AS Mempertimbangkan Proses Rilis Model AI yang Disederhanakan, Pesaing Tertinggal 1-3 Bulan

Menurut 金十, CEO Anthropic mengungkapkan pada 5 Mei bahwa pemerintah AS tampaknya sedang mempertimbangkan penyederhanaan proses untuk merilis model kecerdasan buatan. CEO tersebut mencatat bahwa kemampuan lab-lab AI besar lainnya mungkin tertinggal dari Anthropic sekitar satu hingga tiga

GateNews4jam yang lalu

Tim SGLang Menyelesaikan Putaran Pendanaan Benih $100M Senilai $400M , Accel Memimpin

Menurut Beating, tim di balik mesin inferensi open-source SGLang telah secara resmi membentuk RadixArk dan menyelesaikan putaran pendanaan seed senilai 100 juta dolar AS dengan valuasi post-money 400 juta dolar AS. Accel memimpin putaran tersebut, dengan Spark Capital sebagai investor co-lead. Pesaing semikonduktor Nvidia (melalui

GateNews4jam yang lalu

OpenAI Memberi Hibah kepada 8.000 Pengembang untuk Meningkatkan Batas Kecepatan Codex hingga 10x sampai 5 Juni

Menurut Beating, OpenAI mengirim email kepada lebih dari 8.000 pengembang yang mendaftar untuk acara offline GPT-5.5 di San Francisco, memberi mereka peningkatan 10x pada batas laju Codex yang berlaku segera hingga 5 Juni. Semua pelamar menerima hadiah apa pun terlepas dari apakah mereka mendapat undangan acara.

GateNews4jam yang lalu

Patungan OpenAI dengan Anthropic dalam pembicaraan untuk mengakuisisi tiga perusahaan layanan AI pada 5 Mei

Menurut Jin 10, usaha patungan OpenAI dengan Anthropic sedang dalam pembicaraan untuk mengakuisisi tiga perusahaan layanan AI pada 5 Mei. Perusahaan yang ditargetkan dilaporkan mencakup perusahaan yang berfokus pada rekayasa dalam layanan AI

GateNews4jam yang lalu

Anthropic Meluncurkan Sepuluh Agen AI untuk Layanan Keuangan pada Hari Selasa

Anthropic meluncurkan sepuluh agen AI baru pada Selasa yang dirancang untuk menangani tugas layanan keuangan, termasuk menyusun presentasi rapat klien, meninjau laporan keuangan, dan mengeskalasi kasus untuk ditinjau kepatuhan. Alat tersebut menargetkan para profesional di perbankan, asuransi, manajemen aset, dan fintech

GateNews4jam yang lalu
Komentar
0/400
Tidak ada komentar