jolestar

vip
Возраст 8.4 год
Максимальный уровень 5
Пока нет содержимого
Модель часто ошибается при использовании rg, уровень ошибок составляет около 10%. Проблема в том, что обработка -rn в rg отличается от grep, а модель больше знакома с grep, поэтому постоянно ошибается. В эпоху ИИ новые инструменты заменяют старые, и они должны бесшовно принимать все входные данные старых инструментов, особенно тех, с которыми знакомы LLM.
Посмотреть Оригинал
post-image
  • Награда
  • комментарий
  • Репост
  • Поделиться
Подписка GPT была непонятным образом отменена Google Play, и теперь в версии GPT для Android, похоже, нет доступа к подписке? Кто-нибудь сталкивался с подобной проблемой?
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
holon v0.19.0 发布了
这个版本 内置了一套 web UI,同时也把底层存储系统重构了一遍,api 和 event 系统重构了一遍,填了许多 AI 挖的坑。
原来用的是 JSONL,数据量大了后就很难维护。叠加上 AI 编程习惯是 grep 然后发现没有就加,导致有很多 api 和 event 冗余。
于是全弄到 sqlite 数据库中了,结果没想到积累到数据已经很大了,数据库超过了 4G,遇到了性能问题,于是继续优化,现在这个版本算稳定了。
欢迎大家尝试,Web UI 略微简陋,但 holon 的模式是同一套接口,支持 tui 和 web ui,看到的 agent 的视图是一致的。
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
codex устройство токен входа внезапно требует верификацию номера телефона? И при этом обнаружил, что номер телефона openai в настройках аккаунта найти нельзя? Кажется, нигде нельзя изменить.
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
Агенту нужны какие базовые инструменты
Вижу, что все обсуждают вопрос набора инструментов для агента — достаточно ли просто предоставить shell, чтобы всё работало? После работы с holon понял, что всё не так просто.
Читаю: почему отказались от Read/Glob и полностью перешли на shell
Набор инструментов holon менялся несколько раз, в итоге отказались от таких специализированных инструментов, как Read (чтение файла), Glob (поиск по шаблону), предоставляемых Claude Code, и все операции чтения и поиска выполняются через shell. Это совпадает с подходом Codex — ExecCommand — команда `cat` для чтения фа
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
Назначьте плану Codex контрольную точку, а затем постоянно добавляйте задачи, и он будет продолжать работать. Жаль, что моя скорость добавления не поспевает за его скоростью реализации😅
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
После долгого общения с GPT я привык использовать слово «собирать» (или «подытоживать»). После выполнения некоторых задач, но оставшихся мелких дел, я говорю ему «собрать оставшиеся дела», и это кажется очень естественным. Я уже забыл, как раньше выражался, не используя слово «собирать» 😅.
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
Как такие слова попадают туда? Хотя GPT 5.5 уже достаточно мощный, появление таких проблем всегда вызывает у людей сомнения в его надежности😅
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
Лимит на неделю Codex Plus скоро исчерпан, из-за того что многооконное использование долгое время не закрывалось, iTerm занял десятки ГБ памяти, а диск тоже был заполнен из-за worktree, созданного агентом, постоянно всплывало окно очистки. Поэтому пришлось перезагрузить компьютер, запустил Codex, чтобы освободить место и очистить диск, решил немного отдохнуть. В итоге обнаружил, что Codex сбросил лимит!!😅
Посмотреть Оригинал
post-image
  • Награда
  • комментарий
  • Репост
  • Поделиться
В эпоху AI-кодирования хорошие привычки программирования по-прежнему важны
Недавно я делал бенчмарк для агента и обнаружил, что нельзя просто оценивать сложность задачи программирования для ИИ с точки зрения разработчика.
Например, задача рефакторинга: разбить большой файл в несколько тысяч строк на более чем десять небольших модулей по функциям.
Эта задача для разработчика на самом деле не считается сложной, основная работа — перемещение кода, организация импортов, проверка сборки, — с этим справится даже новичок.
Поэтому я решил использовать простую задачу для бенчмарка, и результат
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
Увидел взаимодействие двух агентств по PR, довольно интересно.
Агент разработчик завершил оптимизацию задачи CI и создал PR.
Агент рецензент заметил изменение значения тайм-аута по умолчанию, посчитал, что оно не входит в рамки задачи, и отклонил.
Агент разработчик убрал этот тайм-аут по умолчанию, в результате CI не прошел, одна тестовая проверка выдала ошибку. Он немного изменил длительность sleep в тесте, чтобы тест прошел.
Агент рецензент посчитал, что этот тест проверяет сценарий отмены асинхронной задачи по тайм-ауту, после изменения он фактически не проверяет ничего, и снова отк
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
Обнаружив, что при проектировании продуктов типа Agent с помощью ИИ, ИИ часто недооценивает возможности агента, поэтому создаются ограничения в виде кода или подсказок, что приводит к недостаточной свободе агента и делает его очень жестким. Позже подумал, что, возможно, это связано с тем, что текущие материалы для обучения ИИ основаны на опыте использования предыдущего поколения ИИ?
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
Давайте организуем сотрудничество двух агентов: разработчик提交ит PR, архитектор отвечает за ревью и слияние PR. Пусть они реагируют на события GitHub через подписку на события. Но поскольку оба используют мой аккаунт, часто система считает, что это их собственные действия, и фильтрует их. Нужно зарегистрировать отдельный аккаунт GitHub для каждого агента. В будущем все интернет-сервисы должны предоставлять быстрый способ создания аккаунтов для агентов. А как сейчас обычно организуют совместную работу нескольких агентов?
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
Сделайте инструмент с помощью Codex, чтобы отправлять сообщения в iterm, в котором работает Codex. Инструмент создан, но отправка сообщений возможна только в поле ввода, отправить их нельзя. Пробовал соединять строки с помощью "\r" и других комбинаций — не получилось.
Затем я посмотрел исходный код iterm и поискал в интернете, в итоге пришёл к выводу, что это невозможно.
Интерфейс, предоставляемый iterm, позволяет только отправлять текст, но не напрямую симулировать нажатия клавиш, поэтому реализовать отправку невозможно. Мне посоветовали поддерживать только tmux и отказаться от iterm.
Я
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
UXC v0.13.1 выпущен в релиз
В этом релизе собраны обновления двух версий v0.13.x, что сделало опыт стабильной работы UXC в режиме выполнения (Runtime) еще лучше.
Основные функции:
1. Поддержка прямого генерации TypeScript-клиентского кода для удаленных возможностей, протестированных через командную строку, что позволяет напрямую интегрировать типизированный код в локальные приложения без необходимости переписывать слой клиента. ИИ нуждается не только в CLI, но и в возможностях вызова кода.
2. Автоматическое обнаружение и импорт существующих конфигураций MCP. Разработчики MCP могут бесшовно п
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
Worktree лучше подходит в качестве однократного каталога для выполнения
Недавно распространённым способом было подготовить один worktree, а затем открыть в этом каталоге Codex / Claude Code. Поскольку ранние модели имели ограниченную контекстную память и запоминание, если сразу в основном рабочем пространстве позволить им самостоятельно создавать worktree, легко запутать текущий каталог с каталогом созданного worktree после сжатия контекста, что в итоге приводит к путанице.
Однако у такого подхода есть побочный эффект — со временем worktree превращается в долгосрочное рабочее пространство.
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
Перенёс блог на mdorigin. После появления AI я почувствовал, что мой блог снова может зажечься.
Я сказал Codex: «На основе моего контента порекомендуй мне стиль блога».
Codex предложил мне две версии, запустил два порта для предварительного просмотра и подробно объяснил причины.
В результате я удалил встроенную систему шаблонов mdorigin. Шаблоны — это продукт эпохи Agent, созданный в основном для снижения порога изменения стиля.
Теперь с появлением Agent достаточно предоставить расширяемость. Стиль сайта пусть настраивает Agent, а mdorigin занимается только структурой HTML / Markdown, маршрути
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
После замены модели OpenClaw на GPT-5.4, возможности действительно улучшились, но она стала немного многословной, любит длинные объяснения, и это немного утомляет😅.
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
Google выпустила workspace cli, поддерживающий Drive, Gmail, Calendar и все API workspace.
Посмотрел, идея реализации похожа на uxc — через schema файл для вывода команд во время выполнения.
npm install -g @googleworkspace/cli
А Apple не выпустит ли CLI для своей экосистемы?
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
  • Закреплено