Модель часто ошибается при использовании rg, уровень ошибок составляет около 10%. Проблема в том, что обработка -rn в rg отличается от grep, а модель больше знакома с grep, поэтому постоянно ошибается. В эпоху ИИ новые инструменты заменяют старые, и они должны бесшовно принимать все входные данные старых инструментов, особенно тех, с которыми знакомы LLM.

Посмотреть Оригинал

Награда
лайк
комментарий
Репост
Поделиться

jolestar

06-25 00:19

Подписка GPT была непонятным образом отменена Google Play, и теперь в версии GPT для Android, похоже, нет доступа к подписке? Кто-нибудь сталкивался с подобной проблемой?

Посмотреть Оригинал

Награда
лайк
комментарий
Репост
Поделиться

jolestar

06-19 06:46

holon v0.19.0 发布了
这个版本内置了一套 web UI，同时也把底层存储系统重构了一遍，api 和 event 系统重构了一遍，填了许多 AI 挖的坑。
原来用的是 JSONL，数据量大了后就很难维护。叠加上 AI 编程习惯是 grep 然后发现没有就加，导致有很多 api 和 event 冗余。
于是全弄到 sqlite 数据库中了，结果没想到积累到数据已经很大了，数据库超过了 4G，遇到了性能问题，于是继续优化，现在这个版本算稳定了。
欢迎大家尝试，Web UI 略微简陋，但 holon 的模式是同一套接口，支持 tui 和 web ui，看到的 agent 的视图是一致的。

Посмотреть Оригинал

Награда
лайк
комментарий
Репост
Поделиться

jolestar

06-03 01:06

codex устройство токен входа внезапно требует верификацию номера телефона? И при этом обнаружил, что номер телефона openai в настройках аккаунта найти нельзя? Кажется, нигде нельзя изменить.

Посмотреть Оригинал

Награда
лайк
комментарий
Репост
Поделиться

jolestar

05-27 00:53

Агенту нужны какие базовые инструменты
Вижу, что все обсуждают вопрос набора инструментов для агента — достаточно ли просто предоставить shell, чтобы всё работало? После работы с holon понял, что всё не так просто.
Читаю: почему отказались от Read/Glob и полностью перешли на shell
Набор инструментов holon менялся несколько раз, в итоге отказались от таких специализированных инструментов, как Read (чтение файла), Glob (поиск по шаблону), предоставляемых Claude Code, и все операции чтения и поиска выполняются через shell. Это совпадает с подходом Codex — ExecCommand — команда `cat` для чтения фа

Посмотреть Оригинал

Награда
лайк
комментарий
Репост
Поделиться

jolestar

05-08 15:29

Назначьте плану Codex контрольную точку, а затем постоянно добавляйте задачи, и он будет продолжать работать. Жаль, что моя скорость добавления не поспевает за его скоростью реализации😅

Посмотреть Оригинал

Награда
лайк
комментарий
Репост
Поделиться

jolestar

05-03 07:24

После долгого общения с GPT я привык использовать слово «собирать» (или «подытоживать»). После выполнения некоторых задач, но оставшихся мелких дел, я говорю ему «собрать оставшиеся дела», и это кажется очень естественным. Я уже забыл, как раньше выражался, не используя слово «собирать» 😅.

Посмотреть Оригинал

Награда
лайк
комментарий
Репост
Поделиться

jolestar

05-01 01:53

Как такие слова попадают туда? Хотя GPT 5.5 уже достаточно мощный, появление таких проблем всегда вызывает у людей сомнения в его надежности😅

Посмотреть Оригинал

Награда
лайк
комментарий
Репост
Поделиться

jolestar

04-28 06:24

Лимит на неделю Codex Plus скоро исчерпан, из-за того что многооконное использование долгое время не закрывалось, iTerm занял десятки ГБ памяти, а диск тоже был заполнен из-за worktree, созданного агентом, постоянно всплывало окно очистки. Поэтому пришлось перезагрузить компьютер, запустил Codex, чтобы освободить место и очистить диск, решил немного отдохнуть. В итоге обнаружил, что Codex сбросил лимит!!😅

Посмотреть Оригинал

Награда
лайк
комментарий
Репост
Поделиться

jolestar

04-27 14:54

В эпоху AI-кодирования хорошие привычки программирования по-прежнему важны
Недавно я делал бенчмарк для агента и обнаружил, что нельзя просто оценивать сложность задачи программирования для ИИ с точки зрения разработчика.
Например, задача рефакторинга: разбить большой файл в несколько тысяч строк на более чем десять небольших модулей по функциям.
Эта задача для разработчика на самом деле не считается сложной, основная работа — перемещение кода, организация импортов, проверка сборки, — с этим справится даже новичок.
Поэтому я решил использовать простую задачу для бенчмарка, и результат

Посмотреть Оригинал

Награда
лайк
комментарий
Репост
Поделиться

jolestar

04-24 03:26

Увидел взаимодействие двух агентств по PR, довольно интересно.
Агент разработчик завершил оптимизацию задачи CI и создал PR.
Агент рецензент заметил изменение значения тайм-аута по умолчанию, посчитал, что оно не входит в рамки задачи, и отклонил.
Агент разработчик убрал этот тайм-аут по умолчанию, в результате CI не прошел, одна тестовая проверка выдала ошибку. Он немного изменил длительность sleep в тесте, чтобы тест прошел.
Агент рецензент посчитал, что этот тест проверяет сценарий отмены асинхронной задачи по тайм-ауту, после изменения он фактически не проверяет ничего, и снова отк

Посмотреть Оригинал

Награда
лайк
комментарий
Репост
Поделиться

jolestar

04-21 14:47

Обнаружив, что при проектировании продуктов типа Agent с помощью ИИ, ИИ часто недооценивает возможности агента, поэтому создаются ограничения в виде кода или подсказок, что приводит к недостаточной свободе агента и делает его очень жестким. Позже подумал, что, возможно, это связано с тем, что текущие материалы для обучения ИИ основаны на опыте использования предыдущего поколения ИИ?

Посмотреть Оригинал

Награда
лайк
комментарий
Репост
Поделиться

jolestar

04-09 15:28

Давайте организуем сотрудничество двух агентов: разработчик提交ит PR, архитектор отвечает за ревью и слияние PR. Пусть они реагируют на события GitHub через подписку на события. Но поскольку оба используют мой аккаунт, часто система считает, что это их собственные действия, и фильтрует их. Нужно зарегистрировать отдельный аккаунт GitHub для каждого агента. В будущем все интернет-сервисы должны предоставлять быстрый способ создания аккаунтов для агентов. А как сейчас обычно организуют совместную работу нескольких агентов?

Посмотреть Оригинал

Награда
лайк
комментарий
Репост
Поделиться

jolestar

04-08 13:04

Сделайте инструмент с помощью Codex, чтобы отправлять сообщения в iterm, в котором работает Codex. Инструмент создан, но отправка сообщений возможна только в поле ввода, отправить их нельзя. Пробовал соединять строки с помощью "\r" и других комбинаций — не получилось.
Затем я посмотрел исходный код iterm и поискал в интернете, в итоге пришёл к выводу, что это невозможно.
Интерфейс, предоставляемый iterm, позволяет только отправлять текст, но не напрямую симулировать нажатия клавиш, поэтому реализовать отправку невозможно. Мне посоветовали поддерживать только tmux и отказаться от iterm.
Я

Посмотреть Оригинал

1 Лайков

Награда
1
комментарий
Репост
Поделиться

jolestar

04-05 04:27

UXC v0.13.1 выпущен в релиз
В этом релизе собраны обновления двух версий v0.13.x, что сделало опыт стабильной работы UXC в режиме выполнения (Runtime) еще лучше.
Основные функции:
1. Поддержка прямого генерации TypeScript-клиентского кода для удаленных возможностей, протестированных через командную строку, что позволяет напрямую интегрировать типизированный код в локальные приложения без необходимости переписывать слой клиента. ИИ нуждается не только в CLI, но и в возможностях вызова кода.
2. Автоматическое обнаружение и импорт существующих конфигураций MCP. Разработчики MCP могут бесшовно п

Посмотреть Оригинал

1 Лайков

Награда
1
комментарий
Репост
Поделиться

jolestar

04-03 02:55

Worktree лучше подходит в качестве однократного каталога для выполнения
Недавно распространённым способом было подготовить один worktree, а затем открыть в этом каталоге Codex / Claude Code. Поскольку ранние модели имели ограниченную контекстную память и запоминание, если сразу в основном рабочем пространстве позволить им самостоятельно создавать worktree, легко запутать текущий каталог с каталогом созданного worktree после сжатия контекста, что в итоге приводит к путанице.
Однако у такого подхода есть побочный эффект — со временем worktree превращается в долгосрочное рабочее пространство.

Посмотреть Оригинал

Награда
лайк
комментарий
Репост
Поделиться

jolestar

04-01 08:33

Перенёс блог на mdorigin. После появления AI я почувствовал, что мой блог снова может зажечься.
Я сказал Codex: «На основе моего контента порекомендуй мне стиль блога».
Codex предложил мне две версии, запустил два порта для предварительного просмотра и подробно объяснил причины.
В результате я удалил встроенную систему шаблонов mdorigin. Шаблоны — это продукт эпохи Agent, созданный в основном для снижения порога изменения стиля.
Теперь с появлением Agent достаточно предоставить расширяемость. Стиль сайта пусть настраивает Agent, а mdorigin занимается только структурой HTML / Markdown, маршрути

Посмотреть Оригинал

1 Лайков

Награда
1
комментарий
Репост
Поделиться

jolestar

03-11 03:26

После замены модели OpenClaw на GPT-5.4, возможности действительно улучшились, но она стала немного многословной, любит длинные объяснения, и это немного утомляет😅.

Посмотреть Оригинал

2 Лайков

Награда
2
комментарий
Репост
Поделиться

jolestar

03-05 00:33

Google выпустила workspace cli, поддерживающий Drive, Gmail, Calendar и все API workspace.
Посмотрел, идея реализации похожа на uxc — через schema файл для вывода команд во время выполнения.
npm install -g @googleworkspace/cli
А Apple не выпустит ли CLI для своей экосистемы?

Посмотреть Оригинал

Награда
лайк
комментарий
Репост
Поделиться

Популярные темы
Подробнее
#
GateCompletesDividendDistribution
140,13K Популярность
#
StrategyBuybackSurges12%
1,27M Популярность
#
IsraelStrikesIranBTCPlunges
67,29K Популярность
#
PredictWorldCupShare20000U
564,82K Популярность
#
TrumpDisclosesOver100MBTCETH
3,83M Популярность

Закреплено

Карта сайта

jolestar

Популярные темы

GateCompletesDividendDistribution

StrategyBuybackSurges12%

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

TrumpDisclosesOver100MBTCETH

Закреплено