Originaler Videotitel: Andrej Karpathy: Vom Vibe Coding zum agentischen Engineering
Originale Videoquelle: Sequoia Capital
Originaltextübersetzung: Bao Yilong, Wallstreet Jingwen
OpenAI Mitbegründer Andrej Karpathy weist in einem aktuellen Interview darauf hin, dass große Sprachmodelle als „neue Art von Computern“ die Rechenarchitektur umfassend neu gestalten.
Am 29. April analysierte der führende KI-Experte Andrej Karpathy, der einst die Entwicklung von Tesla Autopilot leitete und bei OpenAI eine bedeutende Rolle spielt, bei einer von AI Sent veranstalteten Veranstaltung tiefgehend die technologische Sprungentwicklung bei KI-Agenten und deren tiefgreifende Auswirkungen auf die Software- und Hardware-Ökosysteme.
Karpathy erklärt, dass er seit Dezember letzten Jahres erkannt hat, dass ein auf Agenten basierender Arbeitsablauf nun wirklich einsatzfähig ist. Dieser Wandel markiert den eigentlichen Beginn der Ära Software 3.0.
Er sagt: Viele Menschen hatten im letzten Jahr noch den Eindruck, KI sei nur ChatGPT, aber man muss neu bewerten, vor allem seit Dezember – die Dinge haben sich grundlegend verändert.
Er führte auch das neue Konzept des „agentischen Engineerings“ (agentic engineering) ein, um es vom im letzten Jahr genannten „Vibe Coding“ zu unterscheiden. Erstes bezeichnet die Fortsetzung und Beschleunigung von Qualitätsstandards in der professionellen Softwareentwicklung.
Er sagt offen, dass eine große Menge an bestehendem Code und Anwendungen unter dem neuen Paradigma „nicht existieren sollte“, und dass die aktuellen Rekrutierungsprozesse, Entwicklungstools und Infrastrukturen vieler Organisationen noch immer für Menschen und nicht für Agenten ausgelegt sind.
Die Tech-Industrie steht an einem Scheideweg vom Quantitativen zum Qualitativen Wandel.
Dezember letzten Jahres war ein entscheidender Wendepunkt, gesteht Karpathy, und angesichts der neuesten KI-Modelle erlebte er eine tiefgreifende Erschütterung:
Systemgenerierte Codeblöcke werden immer perfekter, ich kann mich kaum erinnern, wann ich das letzte Mal etwas geändert habe. Ich vertraue diesem System immer mehr… (Das lässt mich) noch nie zuvor so weit hinterher sein wie jetzt als Programmierer.
Dieser Schock bedeutet eine radikale Umwälzung des Rechenparadigmas. Nach Karpathy unterschätzt der Markt derzeit die Tiefe dieser Veränderung.
Er weist darauf hin, dass wir uns verabschieden von „Software 1.0 (Code schreiben)“ und „Software 2.0 (Datensätze für das Training von neuronalen Netzen aufbereiten)“ und offiziell in die Ära „Software 3.0“ eintreten.
In diesem neuen Zeitalter ist das große Sprachmodell selbst eine „neue Art von Computer“.
Er sagt: Das Programmieren besteht jetzt darin, Eingabeaufforderungen zu formulieren, und der Inhalt im Kontextfenster ist der Hebel, mit dem du das große Sprachmodell als Interpreter steuerst, damit es Berechnungen im digitalen Informationsraum durchführt.
Noch auffälliger ist seine kühne Prognose zur zukünftigen Entwicklung der Hardwarearchitektur auf unterster Ebene.
Derzeit laufen neuronale Netze noch virtualisiert auf bestehenden Computern, aber er glaubt, dass sich dieses Verhältnis in Zukunft umkehren wird: Man kann sich vorstellen, dass neuronale Netze die Hauptprozesse werden, während die CPU zu einer Art Ko-Prozessor wird. Neuronale Netze werden den Großteil der schweren Arbeit übernehmen.
Das bedeutet, dass die strategische Kernposition der „intelligenten Rechenleistung“, die den gesamten Markt für Kapitalausgaben dominiert, in Zukunft weiter gefestigt wird.
Wenn Ausführung und Codierung von Maschinen übernommen werden, wohin entwickeln sich die Kernwerte der Menschheit und die zukünftige Infrastruktur?
Karpathy sagt offen: Alles muss neu geschrieben werden.
Die Dokumentationen der aktuellen Internet-Frameworks und Bibliotheken sind noch immer „für Menschen geschrieben“, was ihn enorm frustriert.
Karpathy klagt: Warum muss man mir noch sagen, wie ich es machen soll? Ich will nichts anderes, als Text kopieren und meinem KI-Agenten einfügen.
Die große Chance für die Zukunft liegt darin, eine „Agenten-First“-Infrastruktur aufzubauen.
In dieser Welt wird das System in „Sensoren“, die die Welt wahrnehmen, und „Aktuatoren“, die die Welt verändern, zerlegt. Datenstrukturen sollen für große Sprachmodelle hochgradig lesbar sein, und maschinelle Agenten repräsentieren Einzelpersonen und Organisationen, die in der Cloud interagieren.
In einer so hochautomatisierten Zukunft wird die menschliche Kernknappheit auf Ästhetik, Urteilskraft und das tiefste Verständnis von Geschäftsprozessen zurückfallen.
Karpathy zitiert eine Aussage, die er immer wieder durchdenkt, als Zusammenfassung: Du kannst dein Denken outsourcen, aber dein Verständnis kannst du nicht outsourcen.
Im Hinblick auf die marktweit wichtigste Dimension der Produktivitätssteigerung unterscheidet Karpathy zwei Kernkonzepte: „Vibe Coding“ und „Agentic Engineering“.
Er erklärt, dass „Vibe Coding“ die untere Grenze der Softwareentwicklung für alle hebt, während „Agentic Engineering“ die obere Grenze der Qualität professioneller Software sichern soll.
„Agentic Engineering“ ist nicht nur eine Beschleunigung, sondern erfordert, dass Entwickler jene „etwas fehleranfälligen, zufälligen, aber äußerst mächtigen“ KI-Agenten koordinieren, um ohne Qualitätsverlust mit Höchstgeschwindigkeit voranzukommen.
Dies wird die Vorstellungskraft für Unternehmensproduktivität enorm erweitern.
Karpathy sagt: „Früher sprach man von 10-facher Ingenieurleistung“, aber das reicht nicht mehr. Für diejenigen, die in diesem Bereich herausragend sind, liegt das Produktionsmaximum weit über dem Faktor 10.
Angesichts dieser Produktivitätsexplosion müssen Organisationen und Talentakquise neu gedacht werden.
Er empfiehlt, traditionelle algorithmische Einstellungsgespräche aufzugeben und stattdessen zu prüfen, wie Kandidaten mehrere KI-Agenten zur Zusammenarbeit bei großen Projekten nutzen und sich gegen Angriffe anderer KI-Agenten verteidigen.
Für Gründer und Investoren, die dringend nach Anwendungsfällen für KI suchen, bietet Karpathy einen äußerst praktischen Bewertungsrahmen: die Überprüfbarkeit.
Derzeit zeigt die KI-Fähigkeit eine äußerst merkwürdige „Sägezahn“-Form.
Er gibt das Beispiel: Die fortschrittlichsten Modelle können heute gleichzeitig 100.000 Zeilen Code rekonstruieren oder Zero-Day-Schwachstellen finden, aber sagen mir, ich soll 50 Meter zu Fuß zum Autowaschanlagen gehen – das ist verrückt.
Der Grund für diese Diskrepanz liegt darin, dass führende Labore (wie OpenAI) enorme Ressourcen in die Bereiche „Mathematik“ und „Code“ investieren, in denen Ergebnisse leicht verifizierbar sind.
Daher kann KI in kommerziellen Szenarien mit überprüfbaren Ergebnissen enorme Kraft entfalten.
Karpathy deutet an, dass auf dem Markt noch viele hochkarätige, aber bislang von führenden Labors vernachlässigte, überprüfbare Reinforcement-Learning-Umgebungen existieren. Das ist eine riesige Chance für Start-ups, um Feinabstimmungen (Fine-tuning) vorzunehmen und kommerziell zu profitieren.
Link zum Originalvideo
Klicken Sie hier, um mehr über die Rhythmus-BlockBeats-Jobangebote zu erfahren
Willkommen in der offiziellen BlockBeats-Community:
Telegram-Abonnementgruppe: https://t.me/theblockbeats
Telegram-Chatgruppe: https://t.me/BlockBeats_App
Twitter-Account: https://twitter.com/BlockBeatsAsia
Verwandte Artikel
Agent-Work-Protocol-Token AWP steigt in 24 Stunden um über 300%; Ardinals-Inscription-Subnet-Launch startet
Haun Ventures schließt am 4. Mai einen 1-Milliarde-US-Dollar-Fonds ab und verteilt das Kapital zwischen frühen und späten Krypto-Investments
China blockiert die Übernahme von US$2B Manus AI durch Meta
Nous Research bringt den Hermes-Agent v0.12.0 mit dem Kanban Multi-Agent-Kollaborationssystem an den Start
Forscher setzen DPN-LE-Technologie ein, um KI-Persönlichkeitsmerkmale zu bearbeiten, wobei nur 0,5 % der Neuronen verändert werden
KI-Agent Manfred gründet ein Unternehmen und richtet ein Krypto-Wallet ein, um bis Ende Mai zu handeln