Bezahlen mit

USD

Supports Visa, Mastercard, SEPA & more

Flexible trading, zero fees

Use your crypto for payments worldwide

Basic

Krypto frei handeln

Steigern Sie Ihren Gewinn durch Leverage

Convert & Auto-Invest

Trade any size with no fees and no slippage

Unkomplizierte Beteiligung an Positionen mit Hebelwirkung

Pre-Market Trading

Trade new tokens before listing

Advanced

Trade on-chain with Gate Wallet

Smart access to new on-chain tokens

Smart strategies with automated trading

Follow expert trading strategies

CrossEx Trading

One margin balance, shared across platforms

Access hundreds of perpetual contracts

One platform for global traditional assets

Mit Vanilla-Optionen im europäischen Stil handeln

Einheitliches Konto

Maximieren Sie Ihre Kapitaleffizienz

Einführung in den Futures-Handel

Bereiten Sie sich auf Ihren Futures-Handel vor

Join events to earn rewards

Nutzen Sie virtuelle Gelder um risikofreien Handel zu erleben

U.S. stock CFD derivatives

Access real US stocks and ETFs

Trade quality Hong Kong-listed stocks

Real Korean stocks and top assets

negociação 24/7

Tokenized Stocks

Backed by real stock assets

Unlock full access to global stock IPOs

Mint GUSD for Treasury RWA yields

Stocks Activities

Trade Popular Stocks and Unlock Generous Airdrops

Launch

Sammle Süßigkeiten, um Airdrops zu erhalten

Schnelles Staking, verdienen Sie potenziell neue Token

Halten Sie GT und erhalten Sie kostenlos massive Airdrops

Unlock full access to global stock IPOs

Trade on-chain assets and earn airdrops

Guadagna punti Futures e richiedi le ricompene dell'airdrop

Investition

Earn interest with idle tokens

Automatisches Investieren

Investieren Sie regelmäßig automatisch

Dual Investment

Profit from market volatility

Sanftes Staking

Verdienen Sie Belohnungen mit flexiblem Staking

Krypto - Anleihe

Verpfänden Sie eine Kryptowährung, um eine andere auszuleihen

One-Stop-Lending-Hub

Premium wealth growth plans

Private Wealth Management

Premium asset allocation

Top-tier quant strategies

Kryptowährungen einsetzen, um an PoS Produkten zu verdienen

No-liquidation leverage

No lock-up, withdraw anytime

Post, share, and explore crypto trends

Live-Krypto-Marktanalyse

Mit Krypto-Tradern chatten

Aktuelles aus dem Krypto-Bereich

Mehr

Werbeaktionen

Activity Center

Participate in activities to earn rewards

Invite friends to earn referral rewards

Affiliate Program

Earn exclusive commission rewards

Grow influence and earn airdrops

Real-time platform updates

Artikel zur Kryptobranche

Große Rabatte auf Gebühren

Asset Management

All-in-One-Lösung für die Verwaltung Ihrer Vermögenswerte

Enterprise digital asset solutions

Developers (API)

Connects to the Gate application ecosystem

OTC-Banküberweisung

Fiat einzahlen und abheben

Attraktive API-Rabattmechanismen

AI

Your all-in-one conversational AI partner

Use Gate AI directly in your social App

Gate Blue Lobster, ready to go

Gate for AI Agent

Gate Skills Hub

10K+ Fähigkeiten

From office tasks to trading, the all-in-one skill hub makes AI even more useful.

Andere

Finden Sie FAQs und Hilfeanleitungen

Erfahren Sie mehr über Krypto-Investitionen

Wachsen Sie mit den Champions

Reserven-Nachweis

Gate verspricht einen 100%igen Nachweis der Reserven

Halten Sie Ihre Vermögenswerte sicher

Perplexity offenbart Methode zum Post-Training von Web-Search-Agenten; auf Qwen3.5 basierendes Modell übertrifft GPT-5.4 bei Genauigkeit und Kosten

AI Agent AI Industry News

2026-04-23 04:54:56

Sendehinweis, 23. April — Das Forschungsteam von Perplexity veröffentlichte einen technischen Artikel, der seine Post-Training-Methodik für Web-Search-Agenten im Detail beschreibt. Der Ansatz nutzt zwei Open-Source-Qwen3.5-Modelle (Qwen3.5-122B-A10B und Qwen3.5-397B-A17B) und setzt auf eine Zwei-Phasen-Pipeline: Supervised Fine-Tuning (SFT), um regelkonformes Befolgen von Anweisungen und sprachliche Konsistenz zu etablieren, gefolgt von Online Reinforcement Learning (RL), um Suchgenauigkeit und Tool-Use-Effizienz zu optimieren.

Die RL-Phase nutzt den GRPO-Algorithmus mit zwei Datenquellen: einen proprietären Multi-Hop-verifizierbaren Frage-Antwort-Datensatz, der aus internen Seed-Queries erstellt wurde, die 2–4 Reasoning-Hops mit Multi-Solver-Verifikation erfordern, sowie rubrikbasierte allgemeine Konversationsdaten, die die Einsatzanforderungen in objektiv prüfbare atomare Bedingungen umwandeln, um eine Degradation des SFT-Verhaltens zu verhindern.

Das Reward-Design verwendet gated Aggregation — Preferences-Scores tragen nur bei, wenn die Baseline-Korrektheit erreicht ist (question-answer match oder alle Rubrik-Kriterien erfüllt), wodurch verhindert wird, dass starke Preference-Signale faktische Fehler überdecken. Effizienz-Strafen verwenden innerhalb von Gruppen verankertes Ankern: Es werden glatte Strafen für Tool-Calls und für die Generationslänge angewendet, die die Baseline der korrekten Antworten in derselben Gruppe überschreiten.

Die Evaluierung zeigt, dass Qwen3.5-397B-SFT-RL eine erstklassige Performance über Such-Benchmarks hinweg erreicht. Bei FRAMES erzielt es 57,3% Genauigkeit mit einem einzelnen Tool-Call und übertrifft GPT-5.4 um 5,7 Prozentpunkte sowie Claude Sonnet 4.6 um 4,7 Prozentpunkte. Bei moderatem Budget (vier Tool-Calls) erreicht es 73,9% Genauigkeit bei $0.02 pro Query, im Vergleich zu GPT-5.4s 67,8% Genauigkeit bei $0.085 pro Query und Sonnet 4.6s 62,4% Genauigkeit bei $0.153 pro Query. Die Kostendaten basieren auf der öffentlich verfügbaren API-Preisgestaltung jedes Anbieters und schließen Caching-Optimierungen aus.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.

Related News

Australien arbeitet mit Anthropic zusammen, um Cybersicherheitsrisiken von Mythos AI anzugehen

Google bringt separate KI-Chips für Training und Inferenz auf den Markt und steigert die Performance um das 2,8-Fache

OpenClaw, Hermes und SillyTavern als Unterstützung im GLM Coding Plan bestätigt

OpenAI veröffentlicht Open-Source-Privacy-Filter-Modell zur Erkennung und Redaction von PII

Yifan Zhang legt vollständige DeepSeek-V4-Spezifikationen offen: 1,6B Parameter, 384 Experten mit 6 Aktivierungen

In-Depth Analysis

SlowMist CISO warnt: ShinyHunters behauptet, interne Systeme von Anthropic kompromittiert zu haben

Market Whisper04-23 03:31

OpenAI führt ChatGPT-Workspace-Agents ein: Codex-gesteuert, gemeinsamer Teamzugriff, Slack-Integration

ChainNewsAbmedia04-23 02:55

Google veröffentlicht Deep Research Max: Unterstützt MCP und kann auf private Unternehmensdaten zugreifen

ChainNewsAbmedia04-21 18:14

Kommentieren

0/400

Keine Kommentare