V4-Pro демонстрирует 67% процент успешного прохождения кода во внутреннем тесте догфудинга, приближаясь к производительности Opus 4.5

Сообщение Gate News, 24 апреля — V4 публично раскрыла внутренние данные догфудинга для своей модели V4-Pro. Компания собрала примерно 200 реальных инженерных задач от более чем 50 инженеров, охватив разработку функций, исправление ошибок, рефакторинг и диагностику в различных технологических стеках, включая PyTorch, CUDA, Rust и C++. После тщательной фильтрации для оценки бенчмарка было сохранено 30 задач.

V4-Pro-Max достиг 67% процента успешного прохождения кода, существенно превзойдя Sonnet 4.5 с 47% и приблизившись к Opus 4.5 с 70%. Однако он уступает Opus 4.5 Thinking (73%) и Opus 4.6 Thinking (80%), при этом значительно опережая Haiku 4.5 на 13%.

Во внутреннем опросе с 85 респондентами все участники сообщили, что используют V4-Pro для агентного кодинга в ежедневных рабочих процессах. 52% поддержали V4-Pro как свою модель первичного кодинга по умолчанию, 39% склонялись к одобрению, и менее 9% выразили неодобрение. Сообщенные проблемы включали низкоуровневые ошибки, неверное толкование неоднозначных запросов и иногда чрезмерное обдумывание поведения.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Samsung Electro-Mechanics растёт на спросе со стороны ИИ: KB Securities повышает целевую цену на 4 мая

По данным KB Securities от 4 мая, Samsung Electro-Mechanics сохранила рекомендацию «покупать» и повысила целевую цену, сославшись на сильный спрос на многослойные керамические конденсаторы и подложки FC-BGA, используемые в серверах для ИИ. Компания сообщила о выручке за первый квартал в размере 3,2 триллиона вон ($2,18 миллиарда) и

GateNews12м назад

Meta AI Увеличивает вовлечённость в Facebook и Instagram в 1 квартале финансового года 2026; время в Reels выросло на 10%

Согласно The Economic Times, результаты Meta за 1-й квартал финансового года 2026 показали, что обновления ИИ повысили вовлечённость в видео на Facebook и Instagram. Время, проведённое в Instagram Reels, выросло на 10%, а время просмотра видео на Facebook увеличилось более чем на 8% по всему миру. Средняя цена за рекламу выросла на 12% в годовом выражении, а более чем на 8%

GateNews13м назад

Новое исследование Гарвардской медицинской школы: ИИ в отделении неотложной помощи принимает диагностические решения лучше, чем врачи-люди

Исследование, опубликованное Гарвардской медицинской школой в журнале «Science», с помощью двойных слепых тестов и клинического рассуждения объективно сравнило различия между AI-системами и человеческими врачами при интерпретации медицинских карт. Результаты показали, что AI на ранних этапах принятия решений в отделении неотложной помощи может быть наравне с лечащими врачами или даже превосходить их — и это только на основе доступной в тот момент информации из электронных медицинских карт. В исследовании также подчеркивается, что AI пока не способен самостоятельно лечить пациентов, а врачи по-прежнему необходимы; при широком внедрении AI может снижать число диагностических ошибок и стоимость обращения за медицинской помощью.

ChainNewsAbmedia28м назад

Крупнейшие 10 конгломератов Южной Кореи прибавили 65% до $2,6 триллиона на фоне ралли акций чипов для ИИ

По данным The Korea Herald, южнокорейские крупнейшие 10 конгломератов увеличили свою совокупную рыночную стоимость на 65% до 3 832,7 триллиона вон (2,6 триллиона долларов США) на фоне ралли акций чипов, связанных с ИИ. SK Group показала самый большой рост — на 89,6% до 1 139,8 триллиона вон (775 млрд долларов США), в первую очередь благодаря

GateNews31м назад

Инвестиции в ИИ обеспечили 75% роста ВВП США в 1-м квартале, заявил советник Белого дома

По словам Дэвида Сакса, советника Белого дома по вопросам ИИ и криптовалют, который прокомментировал данные Morgan Stanley, опубликованные в начале мая, инвестиции в ИИ внесли примерно 75% прироста ВВП США в первом квартале 2026 года. Сакс отметил, что инвестиции в ИИ обеспечат около 2,5% прироста ВВП в этом году и

GateNews37м назад

ИИ-специалисты зарабатывают до 25% больше в Сингапуре — отчёт NodeFlair показывает

Согласно опубликованному 4 мая отчёту NodeFlair о зарплатах в технологической сфере за 2026 год, разработчики ПО в Сингапуре с навыками в AI зарабатывали на 13%–25% больше, чем коллеги без такой экспертизы. Выводы были сделаны на основе более чем 230 000 проверенных данных о зарплатах. Рост зарплат различался в зависимости от уровня карьеры, при этом

GateNews1ч назад
комментарий
0/400
Нет комментариев