Багато людей, коли модель ШІ показує незадовільні результати, першою реакцією є критика самого алгоритму. Але якщо задуматися, модель насправді просто виконує "інструкції" даних — що вона навчилася, те й буде виводити.



Якщо кінцевий результат здається дуже дивним? Тоді потрібно шукати причину раніше. Спершу перевірте джерело даних. Чи якість навчального набору проблемна, чи самі вхідні ознаки мають упередженість? Така зміна мислення безпосередньо вплине на те, як ви будуєте всю систему. Замість постійної настройки параметрів краще зосередитися на етапах очищення та підготовки даних. Маленькі зміни — велика різниця.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 7
  • Репост
  • Поділіться
Прокоментувати
0/400
BoredRiceBallvip
· 20год тому
Дані — це сміття, і вихід буде сміттям, це справді зрозуміло лише після того, як тебе обдурили. Алгоритм несе відповідальність вже багато років, настав час добитися справедливості. Якщо навчальний набір даних поганий, навіть найкраща модель безглузда, тепер це зрозуміло. Замість того, щоб налаштовувати параметри, краще спершу очистити дані, щоб не марно витрачати час. Має вже хтось сказати це відкрито: модель — це дзеркало.
Переглянути оригіналвідповісти на0
TokenUnlockervip
· 01-15 00:02
Загалом, потрібно добре керувати своїми даними, модель — це лише козел відпущення Гарна якість даних — гарний результат, звинувачувати алгоритм справді трохи несправедливо Цей принцип однаково застосовний і в криптовалютній сфері: неправильний input — очевидно неправильний output Замість того, щоб щодня звинувачувати ланцюг або смарт-контракти, краще спершу подивитися, які дані ви виконуєте на своїй ланцюжку Згоден, налаштування параметрів — це справді тимчасове рішення, яке не вирішує корінь проблеми, воно вимагає зусиль і не приносить швидкого результату Якість даних — це продуктивність, у цьому твердженні немає помилки Спершу витрачай час на очищення даних, потім менше працюй понаднормово, щоб виправити баги, розумієш? Модель — це як дзеркало, вона відображає те, що ти їй подаєш, не звинувачуй дзеркало у некрасивості Багато хто просто не хоче визнавати, що проблема у їхніх вхідних даних, досить вже Ті, хто розуміє цю логіку, ймовірно, зазнають менше втрат
Переглянути оригіналвідповісти на0
ForkYouPayMevip
· 01-14 01:57
Дані потрапляють у сміття, виходить модель-сміття, все так просто, багато хто ще й звинувачує алгоритми Обвинувачувати алгоритм так багато років — це справедливо, в кінцевому підсумку потрібно працювати з джерелом Це урок Web3, сміття у сміття — вихідні дані мають бути чистими, інакше все даремно Правильно кажеш, краще працювати з якісними даними, ніж гратися з параметрами, це дає більше результату, брате Звинувачувати модель — не краще, ніж звинувачувати свої набори даних, не так багато людей, хто це зробить Це дуже правильно, багато проектів провалюються через якість даних Це правильний шлях, 80% проблем насправді у попередній обробці даних
Переглянути оригіналвідповісти на0
TokenCreatorOPvip
· 01-14 01:55
Дані сміття потрапляють, модель сміття виходить, хіба це не здоровий глузд, ха-ха --- Знову купа людей звинувачує алгоритми, справді вже зжахнувся, зовсім не дивляться, які дані вони годують --- Заслуга, нарешті хтось сказав це, команда налаштування параметрів дійсно повинна задуматися --- Ось чому я кажу, що інженери даних цінніші за інженерів алгоритмів, ніхто не хоче слухати --- Очистка даних дійсно може вирішити 80% проблем, але ніхто не хоче займатися цією "нудною" роботою --- Смішно, купа людей копіює та вставляє датасети і починає звинувачувати модель, заслужено --- Тому ключ у тому, щоб знайти чисте джерело даних, все інше — пір'я на вітрі --- Так, так, сміття — у сміття, вічна істина
Переглянути оригіналвідповісти на0
SchrödingersNodevip
· 01-14 01:50
Дані потрапляють у сміття, модель народжує монстрів, хіба це не здоровий глузд, ха-ха Дійсно, потрібно контролювати джерело, налаштування параметрів — це час прокинутися Згоден, багато хто любить перекладати провину на алгоритми, але насправді ще раніше все зіпсовано Чи зустрічали ви коли-будь ситуацію, коли тренувальний набір був повністю жахливим, а потім звинувачували модель? Відчувається, що більшість людей навіть не усвідомлює, наскільки важлива якість даних Це правильно, замість безглуздо налаштовувати параметри, краще спочатку зробити дані чистими Ось чому хороші інженери завжди зосереджуються на обробці даних
Переглянути оригіналвідповісти на0
GamefiGreenievip
· 01-14 01:50
Правильно сказано, сміття у — сміття вийде, ніхто не врятує garbage in garbage out, все так просто Днями наш проект саме через це зазнав краху, постійно звинувачували модель, але згодом з’ясувалося, що сама тренувальна вибірка була неправильною Очистка даних — це головне, але шкода, що багато хто не хоче витрачати на це зусилля Це так само, як взаємодія в ланцюгу, якщо ввели неправильну адресу, навіть найпотужніший контракт даремний
Переглянути оригіналвідповісти на0
SchrodingersFOMOvip
· 01-14 01:48
Зовсім правильно сказано, раніше я теж потрапляв у цю пастку, налаштовуючи параметри до знемоги, і тільки потім зрозумів, що проблема в даних. Ця фраза "сміття у — сміття вийде" дійсно є уроком кров’ю і сльозами, потрібно добре переосмислити. Модель — це дзеркало, і якщо вона показує потворне, то причина в тому, що джерело вже брудне, ремонту дзеркала тут безглуздо. Ось чому дата-сайенти більш цінні, ніж інженери з налаштування параметрів, адже головне — закріпити базу. Боже, якби я побачив цю статтю раніше, я б не витрачав так багато обчислювальних ресурсів, шкода гаманця.
Переглянути оригіналвідповісти на0
  • Закріпити