Karpathy unterstützt HTML-Ausgaben für große Sprachmodelle und sagt interaktives neuronales Video als ultimative Form voraus

Laut Andrej Karpathy, OpenAI-Gründungsmitglied und Schöpfer des Konzepts „vibe coding“, hat er heute den Ansatz des Claude Code-Teams unterstützt, für Ausgaben großer Sprachmodelle HTML statt Markdown zu verwenden. Karpathy skizzierte eine Roadmap zur Entwicklung von KI-Interaktionsschnittstellen: von Klartext zu Markdown zu HTML, gefolgt von mehreren Zwischenformen, bis hin zur finalen Stufe interaktiver neuronaler Videos, die direkt von Diffusionsmodellen erzeugt werden.

Karpathy führte diese Entwicklung auf die Bandbreite des menschlichen Gehirns zurück und merkte an, dass etwa ein Drittel des menschlichen Gehirns visuelle Signale parallel verarbeitet – eine „Zehn-Spur-Autobahn“ für die Eingabe von Informationen. Er argumentierte, dass die optimale Mensch-KI-Interaktion eine effiziente Spracheingabe für den Menschen und eine Ausgabe mit hoher Bandbreite (Bilder, Animationen oder Video) von der KI kombiniert. Er empfahl Nutzern, umgehend „strukturierte Antworten als HTML“ den Prompts hinzuzufügen, als kurzfristige Verbesserung.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare