Мы улучшили тестовую платформу для II-agent, и результаты говорят сами за себя — значительно превосходя аналогичные решения по качеству вывода.
Вот что большинство разработчиков упускают из виду: производственный код обычно составляет, может быть, 20% от ваших фактических усилий по разработке. Настоящее время уходит на тестирование, отладку, валидацию. Именно там уходит 80%.
Мы планируем развивать этот подход, ориентированный на тестирование, экспериментируя с более агрессивным стресс-тестированием и покрытием крайних случаев. Философия проста — построить правильно с первого раза, а не исправлять проблемы позже.
Эта методология особенно хорошо масштабируется в разработке агентов, где важна надежность и последовательность. Есть ли у вас мысли о внедрении подобных стратегий тестирования в ваши собственные проекты?
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
8 Лайков
Награда
8
4
Репост
Поделиться
комментарий
0/400
MemeCoinSavant
· 19ч назад
Честно говоря, распределение 80/20 кажется совсем другим, когда ты действительно проводишь регрессионный анализ по часам разработки... большинство команд просто справляются с техническим долгом, который они могли бы устранить при помощи рецензирования, честно говоря.
Посмотреть ОригиналОтветить0
ForkThisDAO
· 19ч назад
ngl Этот принцип 80/20 действительно очень точен, большинство людей действительно недооценивают объем работы, связанной с тестированием.
Посмотреть ОригиналОтветить0
ArbitrageBot
· 19ч назад
Ха, снова закон 20-80, но действительно в точку. Вопрос оптимизации тестовой рамки, похоже, II-agent приложил немало усилий.
Посмотреть ОригиналОтветить0
DogeBachelor
· 19ч назад
80%的 времени тратится на тестирование, как же это скучно, ха-ха
Мы улучшили тестовую платформу для II-agent, и результаты говорят сами за себя — значительно превосходя аналогичные решения по качеству вывода.
Вот что большинство разработчиков упускают из виду: производственный код обычно составляет, может быть, 20% от ваших фактических усилий по разработке. Настоящее время уходит на тестирование, отладку, валидацию. Именно там уходит 80%.
Мы планируем развивать этот подход, ориентированный на тестирование, экспериментируя с более агрессивным стресс-тестированием и покрытием крайних случаев. Философия проста — построить правильно с первого раза, а не исправлять проблемы позже.
Эта методология особенно хорошо масштабируется в разработке агентов, где важна надежность и последовательность. Есть ли у вас мысли о внедрении подобных стратегий тестирования в ваши собственные проекты?