6 KI-Tools zur Verbesserung deines Workflows
04/02/2023Texte verbessern – Ein ChatGPT Trick
08/02/2023Kann ChatGPT Live-Daten von URLs crawlen? Also Online sein?
Nein, aber das ist oft auch nicht nötig.
Kann ChatGPT Live-Daten von URLs crawlen?
Einige Nutzer/innen möchten, dass das bekannte ChatGPT von OpenAI bei der Eingabe von URLs Daten live von der Webseite crawlt und in das Ergebnis einbezieht. Aber das ist leider (noch) Utopie.
Wie schon im Namen “GPT” für General Pretrained Transformer steckt, ist es ein statisches, im Voraus trainiertes Sprachmodell. Das “im Voraus gelernte” steht genau dort und schließt daher ein individuelles Durchkriechen des Modells aus.
Außerdem wurde in unzähligen Berichten über das innovative KI-Chat-Tool sowie in der Dokumentation von OpenAI selbst mehr als ausführlich dargelegt, dass die Daten, auf denen GPT3.5 (die Basis von ChatGPT) trainiert wurde, eine Version des Internets bis Ende 2021 enthalten.
Vom Anwendungsfall her ist also weder das große Sprachmodell oder ChatGPT noch die Weboberfläche geeignet, um ein SEO-Tool wie die Google Search Console zu ersetzen, wo eine aktuelle Version in wenigen Sekunden auf Knopfdruck abgerufen werden kann.
Aber das ist auch nicht nötig.
Warum sollte ChatGPT live crawlen?
Natürlich wollen Suchmaschinenoptimierer (SEOs) möglichst aktuelle Daten verwenden, wenn sie ihre Inhalte oder die ihrer Konkurrenten analysieren. Aber ChatGPT ist kein SEO-Crawling-Tool und hat auch nie behauptet, eines zu sein.
Es geht darum, die aktuellsten Inhalte einer URL zu nutzen und darauf basierend eigene Inhalte zu erstellen. Verschiedene Content-Tools bieten Messmethoden wie die Keyword-Dichte oder das fortschrittlichere TF*IDF (ein bekanntes Konzept aus den 70er Jahren, das in vielen Textsuchmaschinen verwendet wird), um Texter/innen Inspirationen für die Erstellung umfassenderer Artikel zu geben, die dann auch in Suchmaschinen besser ranken sollten. Manchmal wird auch von holistischen Inhalten gesprochen.
Nun ist es so, dass in großen Sprachmodellen wie GPT3.5, das in ChatGPT verwendet wird, bereits besonders holistische Inhalte vorhanden sind. Schließlich basierte das Training des Modells (vereinfacht ausgedrückt) auf einem relativ vollständigen Internet-Crawl. Ein TF*IDF-Tool zur Textoptimierung ist es deshalb aber trotzdem nicht.
“Fine Tuning” ist der Fachbegriff für das “Neulernen” von Inhalten und ist bei anderen OpenAI-Angeboten möglich, aber (noch) nicht bei ChatGPT. Die Feinabstimmung des Sprachmodells auf neue Inhalte kann dazu beitragen, die Qualität des Sprachmodells und den Output der KI zu verbessern. Der damit verbundene Aufwand, das Sprachmodell zu trainieren, muss jedoch durch noch viel höhere Gebühren bezahlt werden. ChatGPT bietet diese Option im Moment nicht als kostenloses Tool an, sondern reagiert nur bis Ende 2021 auf Daten.
Warum die URL in ChatGPT eingeben?
Bei vielen Aspekten verstehen wir oft nicht, warum ein Sprachmodell so reagiert, wie es reagiert. Das gilt auch für die Ersteller und Betreiber von KI wie ChatGPT selbst.
Wenn man eine bestehende, etablierte URL in die Prompts einbezieht, werden relevante Aspekte aus dem Modell für diesen Zweck “abgeleitet” (vom englischen “inference”), d.h. statistisch wahrscheinlich generiert, so wie alle Textausgaben nur statistisch wahrscheinlich generiert werden.
Wenn man also die URL in das Sprachmodell eingibt, kann man bestimmte Ankerpunkte setzen, die vielleicht auf eine alte Version des Inhalts unter dieser URL verweisen. Oder vielleicht werden nur relevante Wörter aus der URL extrahiert. Das hängt natürlich stark davon ab, wie “sprechend” die URL ist.
URLs mit sprechenden Namen wie https://www.my-camping-store.de/gas-ovens funktionieren in Prompts natürlich besser als kryptische URLs wie https://www.coolstuff.com/c12/p422.
Aber sprechende URLs haben schon vor 20 Jahren in der Google-Suchmaschine besser funktioniert, warum sollten also nicht mehr Besonderheiten bei einem modernen Sprachmodell wie ChatGPT helfen?
Für die Erstellung ziemlich guter Artikel mit der “Outrank Article”-Eingabeaufforderung von AIPRM für SEO funktioniert die Angabe von URLs jedoch erstaunlich gut. Wie so oft kann das Ergebnis dann durch nachfolgende Prompts stark verbessert werden.
Wird ChatGPT die Google-Suche ersetzen?
Es stellt sich heraus, dass du mit cleveren Eingabeaufforderungen erstaunlich gute Inhalte generieren kannst, die mit dem übereinstimmen, was es in der Vergangenheit gegeben hat. Für die meisten Themen, wie z. B. Faltmatratzen, gibt es eine begrenzte Anzahl von Themen und nur wenig Aktualität.
Wenn ich ChatGPT nach dem Waschmaschinen-Testsieger vom Januar 2023 frage, bin ich im falschen Tool.
Der Wunsch nach Crawling und Aktualität kommt vielleicht daher, dass die Leute seit Wochen ganz aufgeregt darüber nachdenken, ob ChatGPT der Google-Killer sein könnte. Aber wenn du verstehst, wie ein solches Sprachmodell aufgebaut ist und wie inaktuell die Inhalte darin sind, dann macht das auch keinen Sinn.
Ein Sprachmodell ist keine Suchmaschine, kein SEO-Tool und schon gar nicht – in seiner jetzigen Form – ein Ersatz für Google, um aktuelle Inhalte zu finden.
Allerdings ist ein Sprachmodell ab Ende 2021 sehr praktisch, um eine konkrete und sehr umfassende (“ganzheitliche”) Antwort zu geben, wenn der Inhalt nicht aktuell sein muss. Für die Grundlagen der Softwareentwicklung, das Basteln von kleinen Anwendungen sowie in Programmier-Tutorials ist es sehr gut geeignet. Für die neueste Version der Konfigurationsdateien für den Caddy-Webserver ist es ungeeignet.
Wenn man so überlegt, dann erscheinen viele Berichte über die mögliche Ablösung von Google, auch aus renommierten Quellen, aus heutiger Sicht doch sehr uninformiert, aber vor allem reißerisch. Dem interessierten Leser empfehle ich, sich auf jeden Fall über das PalM-Modell zu informieren, ein Google-Sprachmodell, das auf über 500 Milliarden Parametern basiert, statt auf 175 Milliarden.
Google PalM ist GPT3/GPT3.5 offenbar weit überlegen – aber leider ist es nicht frei verfügbar. Google als sprachbasiertes Geschäftsmodell beschäftigt sich schon seit einem Jahrzehnt mit “künstlicher Intelligenz” und Sprachmodellen wie GPT3.
Kann ChatGPT mir trotzdem helfen, gute Inhalte zu erstellen?
Die Ausgabe von ChatGPT wird allein durch die Prompts, also den Eingabebefehl, gesteuert. Je besser der Prompt, desto besser die Ausgabe. Je mehr Kontext das Sprachmodell erhält, desto besser.
Die Eingabe von URLs in den Prompt löst kein Crawling der URL aus, aber das ist auch nicht nötig, um gute Inhalte zu produzieren. Wenn nach fast zwei Monaten “enthüllt” wird, dass das eben nicht so ist, bin ich ein bisschen überrascht.
Einige Nutzer schwören immer noch auf das Crawling, weil die Schlussfolgerungsergebnisse genauso gut sind. Aber dann musst du dich natürlich fragen – für welche Aufforderung? Für das Thema “Faltmatratzen” ist gerade im Jahr 2022 nicht so viel passiert, dass ein Neulernen des Sprachmodells nötig gewesen wäre.
Aber der Versuch, aktuelle Inhalte wie die letzten Sportergebnisse aus dem statischen Sprachmodell zu erhalten, muss scheitern.