Banyak orang ketika menghadapi performa model AI yang tidak memuaskan, reaksi pertama mereka adalah mengeluhkan algoritma itu sendiri. Tapi jika dipikir-pikir lagi, model sebenarnya hanya menjalankan "instruksi" dari data — apa yang dipelajari, itulah yang akan dikeluarkan.



Jika hasil akhirnya terlihat sangat tidak masuk akal? Maka harus mencari ke belakang. Mulai dari memeriksa sumber data terlebih dahulu. Apakah kualitas data pelatihan bermasalah, atau apakah fitur input sendiri sudah memiliki bias? Perubahan pola pikir ini akan langsung mempengaruhi cara Anda membangun seluruh sistem. Daripada terus-menerus melakukan tuning parameter, lebih baik fokuskan lebih banyak energi pada tahap pembersihan dan persiapan data. Perubahan kecil, perbedaan besar.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 7
  • Posting ulang
  • Bagikan
Komentar
0/400
BoredRiceBallvip
· 20jam yang lalu
Data sampah masuk, sampah juga keluar, ini benar-benar dipahami setelah pernah tertipu. Sudah bertahun-tahun algoritma disalahkan, saatnya mencari keadilan. Jika data pelatihan buruk, model sekuat apapun juga sia-sia, sekarang sudah mengerti. Daripada mengutak-atik parameter, lebih baik bersihkan data terlebih dahulu, agar tidak buang-buang waktu. Seharusnya sudah ada yang menjelaskan hal ini secara terang-terangan, model adalah cermin.
Lihat AsliBalas0
TokenUnlockervip
· 01-15 00:02
Pada akhirnya, tetap harus mengelola data sendiri dengan baik, model hanyalah kambing hitam saja Data yang buruk masuk, keluaran juga buruk, mengkritik algoritma memang agak tidak adil Prinsip ini juga berlaku di dunia kripto, input yang salah pasti outputnya tidak masuk akal Daripada setiap hari menyalahkan rantai atau kontrak, lebih baik cek dulu data operasi di rantai sendiri Setuju, mengatur parameter ini memang benar-benar mengobati gejala, tidak menyelesaikan akar masalah, memakan waktu dan tidak memuaskan Kualitas data adalah produktivitas, kalimat ini tidak salah Menghabiskan waktu di awal untuk membersihkan data, di kemudian hari sedikit lembur untuk memperbaiki bug, paham tidak Model seperti cermin, mencerminkan apa yang kamu berikan padanya, jangan salahkan cermin yang jelek Banyak orang memang tidak mau mengakui bahwa input mereka bermasalah, sudahlah Orang yang memahami logika ini seharusnya akan mengalami kerugian lebih sedikit
Lihat AsliBalas0
ForkYouPayMevip
· 01-14 01:57
Data sampah masuk, model sampah keluar, sesederhana itu, banyak orang masih menyalahkan algoritma Algoritma disalahkan selama bertahun-tahun juga cukup tidak adil, pada akhirnya harus dari sumbernya dimulai Ini adalah pelajaran dari Web3, garbage in garbage out, data tidak dibersihkan sebelumnya semuanya sia-sia Benar, daripada bermain dengan parameter lebih baik fokus pada data, hasilnya akan lebih efisien, bro Salahkan model daripada salahkan dataset sendiri, pernah terpikir bahwa tidak sebanyak ini orang Saya sangat setuju, banyak proyek yang gagal karena kualitas data Ini adalah jalan yang benar, 80% masalah sebenarnya terletak pada pra-pemrosesan
Lihat AsliBalas0
TokenCreatorOPvip
· 01-14 01:55
Data sampah masuk, model sampah keluar, bukankah ini pengetahuan umum, haha --- Sekali lagi banyak orang menyalahkan algoritma, benar-benar membuat pusing, mereka sama sekali tidak melihat data apa yang mereka berikan --- Like, akhirnya ada yang mengatakan ini, para pengatur parameter benar-benar harus merenung --- Inilah mengapa saya bilang insinyur data lebih berharga daripada insinyur algoritma, tidak ada yang mau dengar --- Membersihkan data memang bisa menyelesaikan delapan puluh persen masalah, tapi tidak ada yang mau melakukan pekerjaan "membosankan" ini --- Tertawa terbahak-bahak, sekumpulan orang copy paste dataset lalu mulai menyalahkan model, pantas saja --- Jadi kuncinya adalah menemukan sumber data yang bersih, yang lain hanyalah awan-awan --- Benar, benar, benar, data sampah masuk, data sampah keluar, selalu kebenaran abadi
Lihat AsliBalas0
SchrödingersNodevip
· 01-14 01:50
Data masuk sampah, model keluar monster, bukankah ini pengetahuan umum haha Memang harus dari sumbernya untuk mengontrol kualitasnya, para ahli tuning parameter harus sadar Sangat setuju, banyak orang suka menyalahkan algoritma, padahal bahan yang mereka berikan sudah rusak sejak awal Apakah kalian pernah mengalami dataset yang berantakan hasilnya malah menyalahkan model Rasanya sebagian besar orang belum menyadari betapa pentingnya kualitas data Benar, daripada sibuk tuning parameter, lebih baik memperbaiki data terlebih dahulu Inilah sebabnya mengapa insinyur yang baik selalu fokus pada proses pembersihan data
Lihat AsliBalas0
GamefiGreenievip
· 01-14 01:50
Benar sekali, data sampah masuk sampah keluar, tidak ada yang bisa menyelamatkan garbage in garbage out, sesederhana itu Beberapa hari yang lalu proyek kami mengalami kegagalan seperti itu, selalu menyalahkan model, kemudian menyadari bahwa dataset itu sendiri sudah bermasalah Pembersihan data adalah bagian terpenting, sayangnya banyak orang enggan menghabiskan waktu untuk ini Ini sama seperti interaksi di blockchain, jika alamat yang dimasukkan salah, kontrak yang sekuat apapun juga akan sia-sia
Lihat AsliBalas0
SchrodingersFOMOvip
· 01-14 01:48
Benar sekali, saya juga pernah mengalami lubang ini sebelumnya, hanya mengutak-atik parameter sampai crash, baru menyadari bahwa masalahnya adalah data. Kalimat "garbage in, garbage out" benar-benar pelajaran yang menyakitkan, harus direnungkan dengan baik. Model hanyalah cermin, jika tampak jelek itu karena sumbernya memang kotor, memperbaiki cermin tidak ada gunanya. Inilah mengapa ilmuwan data lebih berharga daripada insinyur pengaturan parameter, inti dari semuanya adalah memperkuat dasar. Ya Tuhan, jika saya melihat artikel ini lebih awal, saya tidak akan membuang begitu banyak daya komputasi, sangat menyayangkan dompet.
Lihat AsliBalas0
  • Sematkan

Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)