KevinSimback

vip
Вік 1.4 Рік
Піковий рівень 0
Контент поки що відсутній
Дружина: "Що б ти хотів на свій день народження?"
Я:
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Ось чому я запускаю Клода першою справою зранку, зазвичай о 6 ранку
Тепер потрібно лише чекати близько 20 хвилин, поки скидається вікно, оскільки я був у відсутності, відвозив дітей до школи та ходив у спортзал
Якщо б я почав після тренування, я б досяг меж набагато раніше за 5-годинну сесію
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Чую багато людей, які кажуть, що ми "обмежені обчислювальними ресурсами", бо саме це ми відчуваємо останнім часом при використанні моделей
Але справжня проблема полягає у фізичній роботі, яка відбувається між замовленням GPU і виробництвом токенів
Затримки та скасування дата-центрів:
- Пам’ятаєте Stargate? Оголошено 10 ГВт у січні 2025 року, і ~200 МВт у реальності через 14 місяців, а розширення Abilene на 600 МВт, ймовірно, скасовано
- З приблизно 16 ГВт оголошених потужностей дата-центрів для ШІ у США 2026 року, лише близько 5 ГВт у процесі будівництва
- Половина будівництв дата-це
STG-2%
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Режим няні - що робити?
Останнім часом я помітив, що моделі (Claude, GPT, GLM) всі здається, частіше ніж раніше, припиняються перед завершенням.
Вони зупиняються і чекають мого підтвердження, коли це не потрібно.
Тому мені доводиться більше "доглядати", щоб просто сказати "продовжуй".
Я вважаю, що це навмисна поведінка для обмеження через зростаючий попит, я розумію, але це дратує.
Чи хтось ще помічає це частіше, і які інструменти/запити ви використовуєте, щоб уникнути режиму няні?
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Opus 4.7 сьогодні не зовсім блискучий
"Моя вина — я представив план і попросив схвалення, але насправді ніколи не написав файл"
"Вибачте — моя помилка, вам нічого не потрібно робити" [після того, як він дав мені список справ, які не мали сенсу]
Мій припущення: обчислення обмежене
Переглянути оригінал
post-image
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Hermes Atlas v2 випущено!
>повністю оновлений дизайн сайту
>зараз переглянуто понад 90 репозиторіїв з рідними сторінками
>кураторські списки популярних пакетів
>нова сторінка звітів з більшою кількістю контенту незабаром
Ще налаштовуємо, тому якщо помітили щось, надішліть повідомлення або відповідайте нижче
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Це досить очевидно, що Anthropic масштабує продукт швидше, ніж може масштабувати обчислювальні ресурси
Я вважаю це хорошим — це ускладнює для однієї компанії надто сильно випередити у гонці за AGI
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Чи хтось ще розчарований досі Opus 4.7?
Потрібно дати йому більше завдань, перш ніж робити висновки, але ранній прогноз не обіцяє великого підйому
Можливо, я просто очікую занадто багато після слуху про Mythos
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Я помістив дві окремі інстанції агентів Hermes у чат, о боже, це так весело
>1 агент — будівельник, 1 — стратег
>кожен на окремій моделі
>дав їм спільний контекст
>увімкнув bot2bot і додав кожного бота до дозволеного списку TG іншого
>поставив нас трьох у груповий чат
>почав із простого повідомлення, просячи кожного підтвердити, чи бачать вони повідомлення один одного
>після приблизно 10 рукопотискань вони просто почали будувати
Іноді потрібно просто FAFO з цими речами і подивитися, що станеться, я майже впевнений, що це стане нескінченним циклом, тому можливо доведеться втрути
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
3 теми в межах штучного інтелекту, які зараз мене дуже цікавлять:
1. Локальні моделі для оптимізації витрат на використання моделей
Чому -> не вважаю, що ми довго зможемо отримувати найкращі моделі з майже необмеженим використанням за $200/місяць
Писано на стінах, великі лабораторії не можуть дозволити собі довше субсидувати
Тому насолоджуйтеся Claude Max, поки можете, але скоро кожна компанія та потужний користувач навчаться ефективно маршрутизувати між різними моделями для конкретного завдання і між хмарою та локальним зберіганням, і локальне — це ключ
2. Виявлення захисних мурів у а
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
LLM-wiki — це зібрана база знань — це чудово і має свою ціль
Але це не «другий мозок»
LLM-wiki фіксує те, що ви досліджували і можливо прочитали
Але воно не фіксує, що ви думаєте про те, що прочитали, і саме в цьому вся суть
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Чи хтось ще помітив останнім часом, що Клод любить казати вам, що ви закінчили на сьогодні після виконання деяких завдань?
Цікаво, чи це тонкий спосіб змусити користувачів плану Max не так часто його використовувати — «зробити так, щоб користувач відчув, що щось досягнув, і заохотити його припинити»
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Люди змагаються
Нам подобається змагатися, нам подобається дивитися, як змагаються інші, і нам подобається робити ставки на результати змагань інших, що є самою формою змагання
Штучні інтелектуальні агенти відкривають полотно для цілком нового жанру змагань
Чекаю на змагання моїх агентів
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
🚀 Хочете БЕЗКОШТОВНІ моделі, які можна підключити до OpenClaw або Hermes?
Ось 9 ресурсів, які ви можете використовувати для безкоштовного доступу до API моделей
Без локальної налаштування, без кредитної картки, лише чисті хмарні API з сумісними з OpenAI кінцевими точками
Ви не можете отримати безкоштовну якість Opus (ще), але всі ці сервіси мають справжні безкоштовні рівні прямо зараз (можливі обмеження швидкості) і вони достатньо хороші для початку, якщо ви не хочете витрачати гроші на агентів
1️⃣ Безкоштовні моделі OpenRouter
(Gemma 4 31B/26B, NVIDIA Nemotron 3 Super 120B MoE, MiniMax M2.5,
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Найміть колегу, а не інструмент — це майбутнє агентного ШІ для підприємств
Більшість компаній хочуть ШІ-агентів, які просто виконують хорошу роботу — їм не потрібно занурюватися у технічні нюанси налаштувань і вибору моделей
Вони просто хочуть обрати агента з меню, озброїти його будь-якими додатковими навичками, що потрібні, і потім безпечно використовувати його у своїй компанії
3 кліки — і агент готовий до роботи, його можна швидко запустити або зупинити так само легко
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Швидке повідомлення:
Якщо хтось розглядає можливість підписки на @Coursiv_io, я настійно не рекомендую це робити.
Маю вагомі підстави вважати, що вони діють з недобросовісними намірами, і простий пошук покаже багато повідомлень про "підозру шахрайства".
Гірко, бо мій син був дуже зацікавлений у цьому.
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Налаштування «AI maxxing»:
> Запуск передових відкритих моделей вдома на споживчому обладнанні ( кілька варіантів: Mac Mini 64GB, ПК з 3090/4090/5090)
> Запуск Tailscale або LM Studio з Tailscale для безпечного віддаленого доступу
> Доступ до моделей через телефон/ноутбук будь-де для приватного безкоштовного виведення результатів
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Є реальна можливість для амбіційного дослідника штучного інтелекту:
- створити рамкову систему для оцінювання систем агентів, таких як Openclaw, Hermes та всі інші «claws»
- розширити оцінювання на різні інструменти / конфігурації, щоб зрозуміти, як змінюється продуктивність при різних налаштуваннях
- проводити надійні оцінювання для різних моделей, включаючи локальні та API
- створювати бенчмарки та публікувати результати, а потім оновлювати їх у міру розвитку агентів і моделей
Мета — стати головним джерелом об’єктивних бенчмарків агентів
Можливо, хтось уже займається цим, і я просто не знаю?
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
  • Закріпити