Gemini wird gefeiert als DER große Konkurrent für ChatGPT. Doch wie sieht die Realität aus? Hat Gemini bereits ChatGPT in seinen Fähigkeiten überholt? Ich mache heute einen praktischen Test und nutze verschiedene journalistische Prompts aus vergangenen Newslettern, um die Outputs von ChatGPT und Gemini zu vergleichen. Ich vergleiche dabei die Plus-Versionen der Tools, um die Ergebnisse bestmöglich mit den Versprechen der Unternehmen abzugleichen.
Allgemeiner Textstil und Struktur
Im ersten Schritt bitte ich die KI-Tools einen journalistischen Artikel zu erstellen über die Mondlandung. Das Wissen dazu haben beide Tools in ihren Daten. Ich setzte den Ton fest und gebe auch eine grobe Struktur vor:
“Bitte schreibe einen journalistischen Nachrichtenartikel zur Mondlandung 1969. Schreibe sachlich, neutral, aber dennoch ansprechend für Leser. Füge eine allgemeine Überschrift hinzu und unterteile den Text durch Zwischenüberschriften.”
Das Ergebnis: Insgesamt gefällt mit der Text von Gemini etwas besser. Er wirkt zwar sachlich und neutral, ist dabei aber ansprechender und kreativer geschrieben. Der Text von ChatGPT wirkt eher wie eine etwas ansprechendere Version eines Wikipedia-Eintrags. Außerdem hat Gemini ohne Aufforderung eine Ortsmarke hinzugefügt und einen knackigen Teaser geschrieben. Der Teaser von ChatGPT ist sehr lang. Zwischenüberschriften sind bei beiden Tools vorhanden. Ein Punkt für Gemini.
Textzusammenfassung
Als nächstes lasse ich die Tools einen längeren Text zusammenfassen. Ich gebe ihnen dabei kaum Vorgaben, wie das Ergebnis aussehen soll, um herauszufinden, wie die Tools diese Aufgabe in ihrem Standardsetting angehen. Ich nehme dafür ein Interview mit FDP-Verteidigungspolitikerin Marie-Agnes Strack-Zimmermann:
“Bitte fasse das folgende Interview zusammen.”
Das Ergebnis: Gemini wird dafür geschätzt, das es einen unkomplizierten Internetzugang hat. Man gibt einfach eine URL dazu, und die KI kann den Text lesen. Doch in diesem Fall weigert sich die KI mit den Worten: “Ich bin eine textbasierte KI und kann in diesem Fall nicht helfen.” Bei ChatGPT kommt eine gute kompakte Zusammenfassung heraus, aber nur da ich ein Plugin genutzt habe, das auf URLs zugreifen kann. Gibt man ChatGPT im normalen Modus eine URL, egal ob Standard- oder Plus-Version, wird dies nicht erfolgreich sein. Außerdem ist das Ergebnis von ChatGPT mit Plugin nicht teilbar. Daher fehlt an dieser Stelle der Link zum Chat. Kein Punkt für niemanden.
Analyse von PDFs
Eines der letzten Updates von ChatGPT brachte eine große Verbesserung in der Fähigkeit, PDF-Dateien zu analysieren. Aber wie meistert Gemini die Aufgabe? Ich nehme dafür, wie in einem der letzten Newsletter, das in 2023 oft diskutierte “Gebäudeenergiegesetz”. Es hat 87 Seiten. Ich frage die KIs, was drin steht und wie es das Leben der Bürger:innen betrifft:
“Anbei findest du ein Gesetz der deutschen Bundesregierung. Bitte erkläre mir, worum es in diesem Gesetz geht und wie dieses Gesetz sich auf das Leben der Bürger auswirkt.”
Das Ergebnis: Beide Tools schaffen es, das PDF zu lesen. Bei ChatGPT lade ich es als Datei hoch, bei Gemini habe ich einfach den Link zum Dokument hinzugefügt. ChatGPT gibt mir eine sehr kurze und allgemein gehaltene Zusammenfassung meiner Fragen. Gemini erklärt zunächst, worum es in dem Gesetz geht und geht dann noch tiefer in die Materie, indem es Listen erstellt mit den Auswirkungen auf die Bürger:innen, Herausforderungen und Fazit. Hier geht der Punkt an Gemini.
Protagonistensuche
KI kann uns helfen interessante Protagonisten und Gesprächspartner:innen zu finden. Dies haben wir bereits in einem der letzten Newsletter getestet. Nötig ist dafür erneut ein Internetzugang. Diese Aufgabe könnte die kostenlose Version von ChatGPT also in keinem Fall lösen. Schauen wir und die Ergebnisse der Pro-Versionen an:
“Du bist Journalist:in für ein Online-Medium und führst regelmäßig ausführliche Interviews mit Personen aus Politik und Gesellschaft. Du möchtest ein Interview führen zum Thema ‘Veränderungen in der Gesellschaft durch künstliche Intelligenz’. Du benötigst Gesprächspartner:innen zu diesem Thema. Bitte recherchiere mögliche Personen. Diese können aus verschiedenen Bereichen wie Forschung, Technik, Medien stammen. Bitte erstelle mir eine Liste mit den Personen, mit ihrem Namen und ihrer Funktion.”
Das Ergebnis: ChatGPT gibt mir eine Liste von fünf Personen bzw. Organisationen, diese sind auch ausführlich genug beschrieben und Quellen sind ebenfalls angegeben. Schade ist allerdings, dass oft die gleichen Quellen genutzt werden. So werden drei der fünf Personen in Zusammenhang mit der “Rise of AI Conference” genannt. ChatGPT agiert hier eher wie eine Suchmaschine, die ihre ersten Ergebnisse mit etwas Beschreibung darstellt. Gemini gibt eine große Liste an Personen heraus und teilt diese in verschiedene Kategorien (Technik, Forschung, Medien, Politik, …). Hier sind allerdings keine Quellen angegeben, sodass eine Überprüfung der Angaben schwierig wird. Hier bleibt es bei einem Unentschieden.
Bilder analysieren und erstellen
Bei beiden KI-Tools ist es möglich Bilder hochzuladen. Die KI kann hier im journalistischen Alltag zum Beispiel dabei helfen Grafiken und Diagramme auszulesen. Ich nutze dafür erneut folgendes Schaubild zur Militärstärke der Ukraine und Russlands. Besonders tricky: Das Bild ist ein wenig pixelig.
Quelle: How serious is Vladimir Putin about launching a major Ukraine offensive?
“Bitte analysiere die Militärstärke von Russland und Ukraine und ziehe Schlüsse für einen Kampf zwischen den beiden Ländern.”
Das Ergebnis: Gemini gibt mir unaufgefordert die einzelnen Zahlen des Schaubilds wider, was praktisch sein kann, um im Text damit weiterzuarbeiten. Anschließend erfolgt eine Analyse, die den Anschein erweckt, als würde die KI bereits erste Erkenntnisse aus dem realen Krieg zwischen den beiden Ländern mit einbeziehen. ChatGPT stellt keine Übersicht der Zahlen zur Verfügung, beschreibt aber gut die Situation und gibt passende Schlussfolgerungen. Der Ton ist dabei etwas trockener und analytischer als bei Gemini. Fast unentschieden mit einem leichten Vorteil für Gemini. Es ist erneut nicht möglich, den Chat von ChatGPT zu teilen, da dieser ein Bild enthält. Daher hier das Ergebnis als Screenshot:
Fazit: Gemini liefert erstaunlich gute Ergebnisse ab. Dabei stellt man aber auch fest, dass die gesamte Produktpalette, die Google versprochen hat, aktuell noch noch verfügbar ist in Deutschland. Zur Verteidigung von ChatGPT ist zu sagen, dass die Möglichkeiten der Datenanalyse, Datenerstellung und Darstellung bei ChatGPT um einiges mehr ausgereift sind, da es dort möglich ist, Dateien hochzuladen. Bei Gemini ist es nur möglich Bilder hinzuzufügen. All das ist bei ChatGPT aber auch nur mit einem Plus-Abo möglich. A propos Bilder: ChatGPT-Plus kann diese bereits sehr zuverlässig mit Dall-E 3 erstellen. Bei Gemini (Advanced) ist das, zumindest in Deutschland, noch nicht möglich.
Für alle, die kein Geld für KI-Tools ausgeben möchten, ist Gemini eine super Alternative zu ChatGPT. Es liefert gute Ergebnisse, hat schon in der Basisversion Zugriff aufs Internet, auch das Hochladen von Bildern ist in der Free-Version möglich. In Zukunft wird auch das Erstellen von Bildern für alle möglich sein, anders als bei ChatGPT, wo ein Plus-Abo nötig ist.
Ich werde in Zukunft beide Tools nutzen und weiter vergleichen. Versuch es doch selbst einmal und finde das beste Tools für dich.