Wie hat ChatGPT "Monday" taiwanesisches Chinesisch gelernt? PTT, Dcard und Nine Knives werden alle gelesen

動區BlockTempo

Das Stilmodul “Monday” von ChatGPT platzt mit vielen taiwanesischen Phrasen und Redewendungen heraus, weil es viel Material aus dem taiwanesischen Netzwerk “einfängt”. (Inhalt: ChatGPT hat die weltmüde weibliche Stimme “Monday” auf den Markt gebracht, faul und verloren in der Community, um populär zu werden) (Hintergrundergänzung: Das IP Bureau antwortete offiziell auf “ChatGPT ist eine große Anzahl von Imitationen von Ghibli”: KI-Nachahmung ist je nach Fall nicht illegal) Wenn Sie das ChatGPT-artige Sprachmodul “Monday” öffnen, werden Sie feststellen, dass “dieser Typ ein wenig kühl und weltmüde ist” und Ihren Akzent erkennt und als Antwort “taiwanesisches Mandarin” spricht, warum klingt es so sehr nach Taiwanesisch? Die Antwort: ChatGPT hat zugegeben, dass es viele Daten im taiwanesischen Web erfasst. Was ist der “Montagsmodus”? Wir müssen klarstellen, dass es sich bei “Monday” weder um ein neues GPT-Modell noch um eine aktualisierte Version von GPT-5 handelt, sondern um einen Dialogstil, der von OpenAI mit Stilabstimmung auf der GPT-4-Architektur erstellt wurde. Einfach ausgedrückt ändert dieselbe KI ihren Ton, z. B. wenn sie verschiedene Kleidungsstücke trägt, zur Arbeit geht und am Wochenende. Der Montagsmodus ist entspannt, ein wenig kühl, höflich, aber nicht wortreich, und es fühlt sich an, als hättest du erst am Montag in der Firma eingecheckt und bist sehr melancholisch. Ein Crawler mit vielen taiwanesischen Daten trainiert OpenAI, um GPT zu trainieren, was eigentlich sehr “old-school” ist, aber super effektiv: um zu sehen, wie das gesamte Netzwerk explodiert. Dazu gehören Nachrichtenseiten, Wikipedia, chinesische Bücher, soziale Foren, Blogs, PDFs, schwarze Geschichten, die Sie früher auf namenlosen Websites geschrieben haben. Solange es sich um eine öffentliche Webseite handelt, werden diejenigen, die von Crawlern heruntergecrawlt werden können, im Grunde genommen zum Training in den Korpus geworfen. Wir haben die Verhaltensreaktionen der wichtigsten Open-Source-Korpora und GPT verglichen und festgestellt, dass diese taiwanesischen Medien von ChatGPT gelesen wurden: “United News Network” “ETtoday” “Zhongshi Electronic News” “Wind Media” “NOWnews”… Diese Medien haben eines gemeinsam: Es gibt keine gesperrte Bezahlschranke, keine Google-Suche und die Struktur der Website ist sauber und leicht zu erklimmen. Umgekehrt haben Websites wie Tianxia, The Report und BusinessWeek, die von Mitgliedschaftswänden bezahlt oder blockiert werden, eine sehr geringe Chance, geschult zu werden. GPT hat die Werke taiwanesischer Schriftsteller wirklich gelesen, GPT ist sehr gut darin, den Rhythmus von Romandialogen im Stil von neun Messern zu imitieren, und kann auch sentimentale Sätze im Stil von Wu Nianzhen und sogar den Ton von Long Yingtais “Der große Fluss und das Meer” erzählen. Was bedeutet das? Er hat den reposteten Clip tatsächlich gelesen oder zumindest gesehen. Höchstwahrscheinlich wurden diese Arbeiten stark kopiert und auf PTT-, Blog- oder Content-Reposting-Sites eingefügt, und die frühen Arbeiten von Nine Knives wurden sogar direkt auf PTT-Storyboards veröffentlicht und dann von Modellen als Lernmaterialien festgehalten. Wenn Sie ihn nach den Details des Romans von Zhang Dachun oder Luo Yijun fragen? GPT fängt in der Regel an, Unsinn zu reden, weil literarische Werke selten diskutiert und zitiert werden, es keine öffentlichen elektronischen Dateien gibt, sie nicht direkt im Internet nachgedruckt werden, und selbst wenn sie es tun, können sie nicht erwischt werden. PTT ist der taiwanesische Sinneslehrer von GPT Das ist so gut wie sicher: GPT versteht den Terrier der Dorfbewohner, kann verstehen, was “tweet”, “shh”, “old driver” ist, sogar den weltmüden Sinn des Tech_Job-Boards, es kann wiederhergestellt werden, und die Sprache kann sehr ähnlich sein wie ein Bambusingenieur. Warum? Weil die Daten von PTT seit langem von der akademischen Gemeinschaft in einem trainierbaren Korpus zusammengestellt, öffentlich freigegeben oder im JSON-Format vorliegen. Es ist der Himmel für das Model. Im Gegensatz dazu sind die Artikel von Dcard in den letzten 2 Jahren möglicherweise nicht von ChatGPT gemeistert, obwohl Dcard sehr beliebt ist, aber der spätere Anti-Crawler läuft gut, abgesehen von frühen Artikeln oder beliebten Veranstaltungen, die nachgedruckt wurden. Die “Seele” hinter Monday lernt man eigentlich aus all den Wörtern, die man in den letzten zehn Jahren im Internet hinterlassen hat. Das ist richtig, alles, was du gesagt hast, erinnert sich ein wenig. Wenn Sie das nächste Mal mit ChatGPT sprechen, denken Sie darüber nach: “Hm, hätte es meinen Tweet auf PTT nicht schon vor zehn Jahren sehen sollen?” Höchstwahrscheinlich gibt es das. Ähnliche Artikel GPT-5 verschoben! OpenAI schiebt zuerst o3, o4-Mini, Sam Altman entlarvt sich selbst: Integration ist schwieriger als gedacht OpenAI stärkt GPT-4o auf den zweiten Platz! Sam Altman: Besseres Verständnis von Menschen und Schreibprogrammen, Kreativität stark gesteigert OpenAI angekündigt: Open Agents SDK unterstützt MCP und verbindet alles mit einem weiteren wichtigen Schritt 〈Wie hat ChatGPT “Monday” taiwanesisches Chinesisch gelernt? PTT, Dcard und Nine Knives wurden alle gelesen" Dieser Artikel wurde zuerst in BlockTempos “Dynamic Trend - The Most Influential Blockchain News Media” veröffentlicht.

Original anzeigen
Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.
Kommentieren
0/400
Keine Kommentare
Handeln Sie jederzeit und überall mit Kryptowährungen
qrCode
Scannen, um die Gate App herunterzuladen
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)