Speechify-CEO: KI-Token-Kosten werden bald die Gehälter von Mitarbeitern übersteigen

CryptoFrontier

Cliff Weitzman, Gründer und CEO von Speechify AI, argumentiert in einer Folge der Videoreihe von 20VC, dass moderne Softwareunternehmen ihre Abläufe grundlegend umstrukturieren müssen, um steigende AI-Compute-Kosten stemmen zu können. Weitzman ist der Ansicht, dass traditionelle Management-Praktiken diesen Wandel nicht überleben werden und dass Unternehmen jedes Projekt streichen müssen, das nicht direkt zahlende Kunden anzieht, um die Ausgaben für Machine Intelligence zu finanzieren.

Vertriebs-zuerst-Strategie als Kernprinzip

Weitzman setzt auf einen vertriebsorientierten Ansatz für alle Unternehmensentscheidungen. Er sieht Marketing als Konvertierungs-Gleichung statt als Markenaufbau und sagt: „Wachstum ist nur ein Arbitrage-Spiel. Du konkurrierst mit jeder einzelnen anderen Person auf der Welt, die ihr Produkt den Nutzern vor Augen bringen will.“

Nach dieser Philosophie testet Speechify fast tausend täglich von KI erzeugte Anzeigen, um zu ermitteln, was Nutzer tatsächlich in zahlende Kunden verwandelt. Weitzman betont: „Mache nur Dinge, die zu einer Conversion führen. Wenn du keine Leute bekommst, die auf deinem Produkt tatsächlich konvertieren, dann gibt es keinen Sinn, die Arbeit zu machen, die du gerade machst.“

KI-gestützte Werbung und datenbasierte Zielgruppenansprache

Während Unternehmen verstärkt auf KI-Chat-Tools setzen, die persönliche Nutzerdaten erfassen, entstehen neue Werbemöglichkeiten – zugleich mit Datenschutzrisiken. Weitzman hebt das Potenzial dieser Daten hervor: „Massiv. Denn es weiß so viel über dich… OpenAI weiß alles über deine Vergangenheit und woran du in deiner Psyche interessiert bist.“

Er argumentiert, dass hohe Werbekosten irrelevant werden, sobald die Rendite durch korrektes Tracking nachgewiesen ist. „Es ist in Ordnung, einen hohen CPM zu zahlen, solange Leute konvertieren und solange du Attribution hast“, erklärt Weitzman und verweist darauf, dass das neu gestartete SDK von OpenAI fürs Tracking „wirklich wichtig“ für diesen Ansatz ist.

Token-Ausgaben als Standard-Betriebsausgabe

Weitzman sagt eine grundlegende Verschiebung in den Unternehmensbudgets voraus: „Nächstes Jahr erwarte ich, dass wir mehr in Tokens ausgeben werden, als wir für Gehälter ausgeben. Das ist derzeit untypisch, aber ich glaube nicht, dass es langfristig untypisch sein wird.“

Damit KI-Tools auch wirklich genutzt werden, verlangt er von Mitarbeitenden, Screenshots oder Videoaufnahmen einzureichen, die ihren täglichen Umgang mit der Technologie zeigen. Führungskräfte in der Technik müssen Teams unter Druck setzen, jeden Tag Tausende an Compute-Credits zu verbrauchen.

Operative Geschwindigkeit durch Wegfall von Meetings

Weitzman setzt strikte operative Regeln durch, um die Produktentwicklung zu beschleunigen:

  • Mitarbeitende senden täglich Ziele an ihre Vorgesetzten
  • Telefonanrufe ersetzen lange Nachrichtenthreads
  • Reviews werden für projektübergreifende Arbeit beschleunigt
  • Für interne Nachrichten wird eine Reaktionszeit von 60 Sekunden erzwungen
  • Traditionelle Status-Meetings sind verboten

Er argumentiert, dass Meetings, bei denen „eine Person spricht und die anderen passiv zuhören“, Unternehmen unnötig ausbremsen.

Produktion als einziges Leistungs-Kriterium

In Weitzmans Management-System ersetzen ausgelieferter Code traditionelle Leistungsbeurteilungen. „Wenn du etwas unglaublich Gutes gebaut hast, es aber nicht in Produktion ist, ist es Zeitverschwendung… du bekommst keinen Credit, wenn es nicht in Produktion ist… du brauchst keine Performance Review.“

Infrastruktur-Optimierung und Unit Economics

Weitzman räumt ein, dass die anfänglichen Compute-Ausgaben so hoch waren, dass Speechify „sich eher wie der Betrieb einer Wohltätigkeitsorganisation als wie ein Unternehmen angefühlt hat“. Das Unternehmen optimierte die Infrastruktur, bis die Verarbeitung einer Million Zeichen nur noch ein paar Dollar kostete.

Er verfolgt Unit Economics eng und prüft, ob jede Nutzerinteraktion Gewinn erzeugt, sowie die Erwartung, dass Pläne zur Senkung der Compute-Kosten im Zeitverlauf umgesetzt werden. Zwar glaubt er, dass vorübergehende Verluste, die durch Venture Capital finanziert werden, das an Anbieter von KI-Infrastruktur fließt, eine gültige frühe Strategie sind, doch er betont: Die Lösung der Compute-Kosten ist entscheidend für die spätere Profitabilität.

Weiterreichende Implikationen für Ungleichheit

Weitzman argumentiert, dass teure Rechenleistung großen Tech-Unternehmen Vorteile verschafft und traditionelle Karrierewege aufbricht. Er rät Einzelnen, sich in dieser Landschaft selbst zu vertreten, und wendet das Prinzip auf regulierte Branchen wie das Gesundheitswesen an: „Das Problem sind nicht die Ärzte, das Problem ist das System.“

Er ist der Ansicht, dass der Zugang zu Technologie zunehmend für das wirtschaftliche Überleben unverzichtbar wird, und sagt: „Kein Telefon zu haben ist verrückt“, da Smartphones mittlerweile zu einer Grundnotwendigkeit geworden sind.

Konterpunkt: Externe Forschung und alternative Perspektiven

Während Weitzmans Ansatz auf aggressive KI-Einführung und hohe Ausgaben setzt, zeigen externe Forschungen Nuancen:

Zur KI-generierten Werbung: Eine 2026 von MarTech behandelte Studie fand, dass 57% der Konsumenten Marken eher vertrauen, wenn sie KI nutzen, aber 34% machen sich Sorgen um die Privatsphäre der Daten und 24% mögen zu stark personalisierte Erlebnisse nicht. Das deutet darauf hin, dass aggressives KI-Anzeigentesten die Conversion verbessern kann, aber das Risiko birgt, in das überzugehen, was Weitzman die „gruselige Zone“ nennt, wenn Personalisierung über das hinausgeht, womit Nutzer sich wohlfühlen.

Zu Token-Ausgaben und Output: Der DORA-Report von Google aus 2025 argumentiert, dass KI vor allem die bestehenden Stärken und Schwächen einer Organisation verstärkt. Die größten Renditen kämen durch die Verbesserung der zugrunde liegenden organisatorischen Systeme, nicht nur durch das Hinzufügen von Tools. Das legt nahe, dass das Pushen, damit Mitarbeitende mehr Compute-Credits verbrauchen, die Aktivität steigern kann, ohne bessere Produkte zu garantieren, sofern Workflows, Review-Prozesse und die Engineering-Kultur nicht stark sind.

Zu den Dynamiken der Compute-Kosten: Nvidia berichtete 2025, dass die Inferenzkosten fallen, weil Modelle optimiert und Infrastrukturen verbessert werden. ARKs Analyse zur KI-Infrastruktur aus 2026 erwartet jedoch weiterhin, dass die Ausgaben für KI-Infrastruktur nahezu verdreifachen: von 500 Milliarden US-Dollar im Jahr 2025 auf fast 1,5 Billionen US-Dollar bis 2030. Das deutet darauf hin, dass die Gewinner Unternehmen sein werden, die fallende Unit-Kosten und steigende Nachfrage in dauerhafte Margen verwandeln – nicht einfach jene, die am meisten für Compute ausgeben.


Diese Zusammenfassung basiert auf einer Folge der 20VC-Videoreihe mit Cliff Weitzman und wurde mit KI-Unterstützung sowie redaktioneller Prüfung erstellt.

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.
Kommentieren
0/400
Keine Kommentare