Doppelter Content durch ChatGPT oder Gemini?

Aktualisiert am 12. Juni 2024

Kaum geschrieben, schon veraltet: mein Artikel – zumindest, was die Bezeichnung der AI von Google betrifft – Bard ist jetzt Gemini, der Link unten führt direkt zu Bard im neuen Namenskleid https://GEMINI.google.com/app

Wie ihr wisst, sind die meistgenutzten KI zum Texte generieren  Bard ↑ und ChatGPT ↑. Bei beiden solltest du dich anmelden, damit dir der Umfang der App zur Verfügung steht.

Beide KI schaffen einen Inhalt, der immerhin zu mehr als 80% Unique Content ist.

ChatGPT & Bard: einzigartiger Content?

Duplicate Content durch ChatGPT & Bard

Dieser Frage geht ein Artikel von Ubersuggest ↑ nach, hier wurde Bard und ChatGPT getestet. Beide Apps sollten 1000 Artikel schreiben. Diese Artikel behandelten unterschiedliche Themen und wurden nach Erstellung durch Copyscape geprüft.

Was entsteht doppelter Content und warum solltest du ihn vermeiden?

Doppelter Content ist gleicher Inhalt, der auf mehreren Webseiten oder in mehreren Versionen einer Webseite zu finden ist. Oft entsteht Duplicate Content durch

  • Kopieren von Inhalten aus dem Netz
  • Verwendung derselben Texte für verschiedene Unterseiten
  • Falsche technische Einstellungen, siehe hierzu den Artikel über Relaunch oder Umzug einer Website →

 

Auf den Screenshots siehst du das Ergebnis meiner Prüfung bei Siteliner – du kannst dir mit einem Klick eine Liste der Dateien ansehen, die als Duplicate Content angesehen werden. Bei mir sind es zum Teil Archive, die WordPress automatisch bildet. Hier muss ich mich also damit beschäftigen, wie ich mit diesen seltsamen Seiten /page/4 etc. umgehe: Weiterleiten? Gibt es eine Möglichkeit, die Erstellung solcher Archive zu verhindern?

Wenn dir hier etwas dazu einfällt, dann schreib mir bitte im Kommentarfeld deine Erfahrungen dazu.

Warum solltest du doppelten Content vermeiden?

Suchmaschinen wie Google oder Bing versuchen, den besten Inhalt für eine bestimmte Suchanfrage zu finden. Wenn es mehrere Webseiten mit dem gleichen Inhalt gibt, ist es für die Suchmaschine schwierig einzuschätzen, welcher Inhalt der beste ist. Websites mit zu viel Duplicate Content verlieren im Ranking.

Als Faustregel gilt, dass der Anteil des doppelten Content an einer Seite nicht mehr als 25 % betragen sollte. Wenn der Anteil des doppelten Content höher ist, kann dies zu Problemen mit der SEO und der Nutzererfahrung führen.

Tipps zum Vermeiden von doppeltem Content:

  • Kopiere keine Inhalte von anderen Webseiten, ohne die Zustimmung des Urhebers einzuholen.
  • Verwende für verschiedene Webseiten unterschiedliche Inhalte.
  • Überprüfe die technischen Einstellungen

Mit Siteliner ↑ kannst du Duplicate Content auf deiner Website erkennen. Bis zu 200 Seiten deiner Website können kostenlos analysiert werden.

Plagiat-Programme → Urheberrecht und Prüfung, ob der Text von einer KI stammt

Beachte bitte, dass diese Programme aus Amerika stammen und deshalb bei der Einschätzung ob KI oder nicht, einen Text auf Deutsch immer als 100% von Menschen geschrieben einstufen (bis jetzt).

Mein Tipp wäre hier: schreibe deinen Content auf Englisch (oder lass ihn erstellen) , prüfe ihn und dann übersetze ihn ins Deutsche. Dann sollte Urheberrecht kein Thema mehr sein

Deutsche Texte prüfen

Doppelter Content: ChatGPT vs. Bard

Von den 1000 Artikeln, die das Team von Neil Patel testete, waren bei ChatGPT 18,6% Duplicate Content und bei Bard 14,9%. Manchmal war es ein ganzer Absatz, oft nur ein oder zwei Sätze.

Wie entsteht doppelter Content bei Bard?

Das sagt Bard dazu:

Doppelter Content bei Bard entsteht aus zwei Hauptgründen:

  • Ähnliche Eingaben führen zu ähnlichen Ausgaben. Wenn ein Benutzer eine Anfrage stellt, die dem Modell bereits bekannt ist, wird es wahrscheinlich einen ähnlichen Text generieren wie bei früheren Anfragen.
  • Das Modell lernt aus den Daten, auf denen es trainiert wurde. Wenn ein Text in den Trainingsdaten doppelt vorkommt, ist es wahrscheinlich, dass das Modell ihn auch doppelt generiert.

Wie entsteht doppelter Content bei ChatGPT?

Das sagt ChatGPT dazu:

Doppelter Content, auch als Redundanz bezeichnet, kann in ChatGPT auf verschiedene Weisen entstehen. Hier sind einige mögliche Gründe:

  • Fragen mit unterschiedlichen Formulierungen:
    Wenn Benutzer ähnliche Fragen mit unterschiedlichen Worten stellen, kann die Antwort von ChatGPT trotzdem ähnlich sein. Das Programm kann aufgrund der verschiedenen Formulierungen die gleichen Informationen wiederholen.
  • Wiederholung von Informationen:
    ChatGPT hat eine begrenzte Speicherkapazität und liest den Text in Blöcken. Es kann dazu neigen, Informationen zu wiederholen, um sicherzustellen, dass der Kontext erhalten bleibt, besonders wenn die Informationen in verschiedenen Abschnitten des Gesprächs präsentiert werden.
  • Vorgeschlagene Antworten:
    Wenn ein Benutzer eine Frage stellt und mehrere mögliche Formulierungen gibt, kann ChatGPT ähnliche Antworten generieren, die auf den vorgeschlagenen Formulierungen basieren.
  • Trainingsdaten:
    Das Programm wurde mit einer Vielzahl von Texten aus dem Internet trainiert. Wenn im Trainingskorpus doppelter oder ähnlicher Inhalt vorhanden ist, kann dies zu redundanter Ausgabe führen.

Es ist wichtig zu beachten, dass ChatGPT nicht bewusst Inhalte dupliziert und dass die Modellantworten von den Eingaben und dem Kontext abhängen. Doppelten Content bei Bard oder ChatGPT vermeiden

Das sagt Bard dazu

  • Die Eingaben des Benutzers diversifizieren. Dies kann erreicht werden, indem dem Benutzer offenere oder komplexere Fragen gestellt werden.
  • Das Modell mit unterschiedlichen Datensätzen zu trainieren. Dies kann dazu beitragen, dass das Modell lernt, unterschiedliche Textformate zu generieren.
  • Das Modell auf doppelten Content zu untersuchen. Dies kann dazu beitragen, dass das Modell lernt, doppelten Content zu vermeiden.

In der Studie von Neil Patel wurden ChatGPT und Bard hinsichtlich ihrer Fähigkeit, doppelten Content zu generieren, miteinander verglichen. ChatGPT erzeugte im Durchschnitt mehr doppelten Content als Bard. Dies ist wahrscheinlich darauf zurückzuführen, dass ChatGPT auf einem kleineren Datensatz trainiert wurde als Bard.

Das sagt ChatGPT dazu

  • Klare Formulierung: Um präzise Antworten zu bekommen, formulier deine Fragen einfach und deutlich. Eine klare Formulierung erhöht die Chance, dass du spezifische und nicht wiederholte Informationen bekommst.
  • Berücksichtigung von Kontextinformationen: Füge deinen Fragen zusätzliche Kontextinformationen hinzu. Das hilft ChatGPT, den Kontext besser zu verstehen und ermöglicht genauere und zielgerichtete Antworten.
  • Anpassung von Fragen: Wenn du eine allgemeine Antwort bekommst und mehr Details brauchst, passt deine Frage an oder füge weitere Informationen hinzu. Das fördert die Erhaltung der gewünschten Informationen.
  • Manuelle Überprüfung und Anpassung: Lies die generierten Antworten aufmerksam durch. Bei wiederholten oder unklaren Informationen passe die Frage an und stell sie erneut, um das Modell in die gewünschte Richtung zu lenken.
  • Experimentieren: Probiere verschiedene Formulierungen und Fragen aus, um zu sehen, ob du unterschiedliche, aber relevante Antworten erhältst.

Es ist wichtig zu beachten, dass ChatGPT auf vorherigen Eingaben basiert und nicht notwendigerweise ein Bewusstsein für vorherige Antworten hat. Daher liegt es an dir, die Interaktion zu steuern und sicherzustellen, dass du die gewünschten Informationen bekommst.

Fazit Duplicate Content bei diesen beiden KI

Ich habe gelernt, dass Bard auf einen größeren Datensatz trainiert wurde und dass ich in der Kommunikation mit der KI genauer und kreativer sein sollte.

Bei der nächsten Contenterstellung werde ich beide mal ausprobieren und die Ergebnisse vergleichen – zur Zeit nutze ich diese Programme kostenfrei, weil ich hauptsächlich für mich und meine Studenten schreibe 🙂

Versuche also, einzigartige Inhalte zu erschaffen und vergiss dabei E-E-A-T – hilfreicher Content  nicht.

 

Schreibe einen Kommentar