Blog Layout

Prompt-Tipp: ChatGPT vs. Gemini: Ein journalistischer Vergleich

Feb. 28, 2024

Gemini wird gefeiert als DER große Konkurrent für ChatGPT. Doch wie sieht die Realität aus? Hat Gemini bereits ChatGPT in seinen Fähigkeiten überholt? Ich mache heute einen praktischen Test und nutze verschiedene journalistische Prompts aus vergangenen Newslettern, um die Outputs von ChatGPT und Gemini zu vergleichen. Ich vergleiche dabei die Plus-Versionen der Tools, um die Ergebnisse bestmöglich mit den Versprechen der Unternehmen abzugleichen.


Allgemeiner Textstil und Struktur

Im ersten Schritt bitte ich die KI-Tools einen journalistischen Artikel zu erstellen über die Mondlandung. Das Wissen dazu haben beide Tools in ihren Daten. Ich setzte den Ton fest und gebe auch eine grobe Struktur vor:


“Bitte schreibe einen journalistischen Nachrichtenartikel zur Mondlandung 1969. Schreibe sachlich, neutral, aber dennoch ansprechend für Leser. Füge eine allgemeine Überschrift hinzu und unterteile den Text durch Zwischenüberschriften.”


Das Ergebnis: Insgesamt gefällt mit der Text von Gemini etwas besser. Er wirkt zwar sachlich und neutral, ist dabei aber ansprechender und kreativer geschrieben. Der Text von ChatGPT wirkt eher wie eine etwas ansprechendere Version eines Wikipedia-Eintrags. Außerdem hat Gemini ohne Aufforderung eine Ortsmarke hinzugefügt und einen knackigen Teaser geschrieben. Der Teaser von ChatGPT ist sehr lang. Zwischenüberschriften sind bei beiden Tools vorhanden. Ein Punkt für Gemini.

New Button New Button

Textzusammenfassung

Als nächstes lasse ich die Tools einen längeren Text zusammenfassen. Ich gebe ihnen dabei kaum Vorgaben, wie das Ergebnis aussehen soll, um herauszufinden, wie die Tools diese Aufgabe in ihrem Standardsetting angehen. Ich nehme dafür ein Interview mit FDP-Verteidigungspolitikerin Marie-Agnes Strack-Zimmermann:


“Bitte fasse das folgende Interview zusammen.”


Das Ergebnis: Gemini wird dafür geschätzt, das es einen unkomplizierten Internetzugang hat. Man gibt einfach eine URL dazu, und die KI kann den Text lesen. Doch in diesem Fall weigert sich die KI mit den Worten: “Ich bin eine textbasierte KI und kann in diesem Fall nicht helfen.” Bei ChatGPT kommt eine gute kompakte Zusammenfassung heraus, aber nur da ich ein Plugin genutzt habe, das auf URLs zugreifen kann. Gibt man ChatGPT im normalen Modus eine URL, egal ob Standard- oder Plus-Version, wird dies nicht erfolgreich sein. Außerdem ist das Ergebnis von ChatGPT mit Plugin nicht teilbar. Daher fehlt an dieser Stelle der Link zum Chat. Kein Punkt für niemanden.

Ergebnis von Gemini

Analyse von PDFs

Eines der letzten Updates von ChatGPT brachte eine große Verbesserung in der Fähigkeit, PDF-Dateien zu analysieren. Aber wie meistert Gemini die Aufgabe? Ich nehme dafür, wie in einem der letzten Newsletter, das in 2023 oft diskutierte “Gebäudeenergiegesetz”. Es hat 87 Seiten. Ich frage die KIs, was drin steht und wie es das Leben der Bürger:innen betrifft:


“Anbei findest du ein Gesetz der deutschen Bundesregierung. Bitte erkläre mir, worum es in diesem Gesetz geht und wie dieses Gesetz sich auf das Leben der Bürger auswirkt.”


Das Ergebnis: Beide Tools schaffen es, das PDF zu lesen. Bei ChatGPT lade ich es als Datei hoch, bei Gemini habe ich einfach den Link zum Dokument hinzugefügt. ChatGPT gibt mir eine sehr kurze und allgemein gehaltene Zusammenfassung meiner Fragen. Gemini erklärt zunächst, worum es in dem Gesetz geht und geht dann noch tiefer in die Materie, indem es Listen erstellt mit den Auswirkungen auf die Bürger:innen, Herausforderungen und Fazit. Hier geht der Punkt an Gemini.

Ergebnis von ChatGPT New Button

Protagonistensuche

KI kann uns helfen interessante Protagonisten und Gesprächspartner:innen zu finden. Dies haben wir bereits in einem der letzten Newsletter getestet. Nötig ist dafür erneut ein Internetzugang. Diese Aufgabe könnte die kostenlose Version von ChatGPT also in keinem Fall lösen. Schauen wir und die Ergebnisse der Pro-Versionen an:


“Du bist Journalist:in für ein Online-Medium und führst regelmäßig ausführliche Interviews mit Personen aus Politik und Gesellschaft. Du möchtest ein Interview führen zum Thema ‘Veränderungen in der Gesellschaft durch künstliche Intelligenz’. Du benötigst Gesprächspartner:innen zu diesem Thema. Bitte recherchiere mögliche Personen. Diese können aus verschiedenen Bereichen wie Forschung, Technik, Medien stammen. Bitte erstelle mir eine Liste mit den Personen, mit ihrem Namen und ihrer Funktion.”


Das Ergebnis: ChatGPT gibt mir eine Liste von fünf Personen bzw. Organisationen, diese sind auch ausführlich genug beschrieben und Quellen sind ebenfalls angegeben. Schade ist allerdings, dass oft die gleichen Quellen genutzt werden. So werden drei der fünf Personen in Zusammenhang mit der “Rise of AI Conference” genannt. ChatGPT agiert hier eher wie eine Suchmaschine, die ihre ersten Ergebnisse mit etwas Beschreibung darstellt. Gemini gibt eine große Liste an Personen heraus und teilt diese in verschiedene Kategorien (Technik, Forschung, Medien, Politik, …). Hier sind allerdings keine Quellen angegeben, sodass eine Überprüfung der Angaben schwierig wird. Hier bleibt es bei einem Unentschieden.

New Button Ergebnis von Gemini

Bilder analysieren und erstellen

Bei beiden KI-Tools ist es möglich Bilder hochzuladen. Die KI kann hier im journalistischen Alltag zum Beispiel dabei helfen Grafiken und Diagramme auszulesen.  Ich nutze dafür erneut folgendes Schaubild zur Militärstärke der Ukraine und Russlands. Besonders tricky: Das Bild ist ein wenig pixelig.

Quelle: How serious is Vladimir Putin about launching a major Ukraine offensive?


“Bitte analysiere die Militärstärke von Russland und Ukraine und ziehe Schlüsse für einen Kampf zwischen den beiden Ländern.”


Das Ergebnis: Gemini gibt mir unaufgefordert die einzelnen Zahlen des Schaubilds wider, was praktisch sein kann, um im Text damit weiterzuarbeiten. Anschließend erfolgt eine Analyse, die den Anschein erweckt, als würde die KI bereits erste Erkenntnisse aus dem realen Krieg zwischen den beiden Ländern mit einbeziehen. ChatGPT stellt keine Übersicht der Zahlen zur Verfügung, beschreibt aber gut die Situation und gibt passende Schlussfolgerungen. Der Ton ist dabei etwas trockener und analytischer als bei Gemini. Fast unentschieden mit einem leichten Vorteil für Gemini. Es ist erneut nicht möglich, den Chat von ChatGPT zu teilen, da dieser ein Bild enthält. Daher hier das Ergebnis als Screenshot:

New Button

Fazit: Gemini liefert erstaunlich gute Ergebnisse ab. Dabei stellt man aber auch fest, dass die gesamte Produktpalette, die Google versprochen hat, aktuell noch noch verfügbar ist in Deutschland. Zur Verteidigung von ChatGPT ist zu sagen, dass die Möglichkeiten der Datenanalyse, Datenerstellung und Darstellung bei ChatGPT um einiges mehr ausgereift sind, da es dort möglich ist, Dateien hochzuladen. Bei Gemini ist es nur möglich Bilder hinzuzufügen. All das ist bei ChatGPT aber auch nur mit einem Plus-Abo möglich. A propos Bilder: ChatGPT-Plus kann diese bereits sehr zuverlässig mit Dall-E 3 erstellen. Bei Gemini (Advanced) ist das, zumindest in Deutschland, noch nicht möglich.


Für alle, die kein Geld für KI-Tools ausgeben möchten, ist Gemini eine super Alternative zu ChatGPT. Es liefert gute Ergebnisse, hat schon in der Basisversion Zugriff aufs Internet, auch das Hochladen von Bildern ist in der Free-Version möglich. In Zukunft wird auch das Erstellen von Bildern für alle möglich sein, anders als bei ChatGPT, wo ein Plus-Abo nötig ist.


Ich werde in Zukunft beide Tools nutzen und weiter vergleichen. Versuch es doch selbst einmal und finde das beste Tools für dich.

von Patrick Große 09 Juni, 2024
In einer gemeinsamen Mitteilung haben OpenAI und News Corp eine mehrjährige globale Partnerschaft bekannt gegeben. Durch die Partnerschaft erhält OpenAI die Erlaubnis, Inhalte von News Corp in seinen Antworten auf Nutzerfragen anzuzeigen und seine Produkte zu verbessern. Das Ziel dieser Zusammenarbeit sei es, den Nutzer:innen fundierte Entscheidungen auf Basis zuverlässiger Informationen und Nachrichtenquellen zu ermöglichen. OpenAI wird Zugang zu aktuellen und archivierten Inhalten von News Corp's bedeutenden Publikationen wie The Wall Street Journal, Barron’s, MarketWatch, Investor’s Business Daily, The Times, The Sun, The Australian und vielen weiteren erhalten. Inhalte aus anderen Geschäftsfeldern von News Corp sind von der Vereinbarung ausgenommen. Neben der Bereitstellung von Inhalten wird News Corp auch seine journalistische Expertise einbringen, um sicherzustellen, dass die höchsten journalistischen Standards in den Angeboten von OpenAI präsent sind. Robert Thomson, CEO von News Corp, bezeichnete die Vereinbarung als historisch und betonte ihre Bedeutung für Wahrhaftigkeit, Tugend und Wert im digitalen Zeitalter. „Wir sind erfreut, in Sam Altman und seinem talentierten Team prinzipientreue Partner gefunden zu haben, die die kommerzielle und soziale Bedeutung von Journalist:innen und Journalismus verstehen. Diese wegweisende Übereinkunft markiert nicht das Ende, sondern den Beginn einer vielversprechenden Partnerschaft.“ Sam Altman, CEO von OpenAI, erklärte, dass die Partnerschaft ein stolzer Moment für Journalismus und Technologie sei. „Wir schätzen die führende Berichterstattung von News Corp und sind begeistert, unseren Nutzer:innen Zugang zu hochwertigem Journalismus zu verschaffen. Gemeinsam legen wir das Fundament für eine Zukunft, in der KI die Standards des Weltklasse-Journalismus respektiert, verbessert und aufrechterhält.“
von Patrick Große 09 Juni, 2024
Prompt Engineers für KI-Systeme waren im vergangenen Jahr stark nachgefragt. Teilweise wurden Gehälter bis über 300.000 Dollar im Jahr aufgerufen, um die Besten der Besten zu bekommen. Doch meine Message ist: Jeder kann Prompt Engineer sein. Wer schon länger meinem Newsletter folgt, kennt die Grundlagen des Prompting. Doch manchmal kann es dennoch passieren, dass man sich unsicher ist, wie ein Prompt am besten aussehen sollte. Nicht zu kurz, nicht zu lang. Nicht zu wenige Infos, nicht zu viele. Wie detailliert muss der Prompt also sein? Das ist eine Frage der Übung und des Ausprobierens. Doch auch die KI selbst kann uns helfen, die Anweisungen an sie bestmöglich zu formulieren. Zum Beispiel mit diesem Prompt: “Ich werde dir einen Prompt geben und dein Ziel wird es sein, diesen zu verbessern, indem du mir Fragen stellst. Sobald ich die Fragen beantwortet habe, schreibe den neuen Prompt und stelle mir neue Fragen. Okay?” Schritt für Schritt wollen wir uns den perfekten Prompt bzw. die Informationen, die die KI benötigt, erarbeiten. Ich starte mir diesem kurzen Prompt: “Fasse mir die unterschiedlichen Standpunkte beim Verbot von Verbrennermotoren in Europa zusammen.” Von der KI erhalte ich folgende Nachfragen: “Okay, um den Prompt detaillierter und spezifischer zu gestalten, habe ich einige Fragen: Möchtest du, dass der Fokus auf bestimmten Ländern in Europa liegt? Wenn ja, welche Länder interessieren dich besonders? Soll der Prompt die Standpunkte von politischen Parteien, Umweltorganisationen, Industrievertretern und der Bevölkerung beinhalten? Möchtest du historische Kontexte oder aktuelle Entwicklungen berücksichtigt haben? Gibt es bestimmte Quellen oder Arten von Quellen, die du bevorzugst, wie z. B. wissenschaftliche Studien, Nachrichtenartikel oder offizielle Stellungnahmen? Soll der Prompt auch mögliche Auswirkungen eines Verbots von Verbrennermotoren auf Wirtschaft, Umwelt und Gesellschaft ansprechen? Wie ausführlich soll die Zusammenfassung sein? Möchtest du eine kurze Übersicht oder eine detaillierte Analyse? Sobald ich deine Antworten habe, kann ich den Prompt verbessern.” Ich beantworte die Fragen so gut es geht: “1. Es soll ein grober Überblick über Europa sein, mit einem Fokus auf Deutschland. 2. Ja, das sind bereits gute Gruppen. 3. Ich möchte die aktuellen Situationen und Standpunkte kennen, historische Hintergründe können als Erklärung nützlich sein. 4. Ich bevorzuge seriöse Quellen, wie Studien, journalistische Texte und Stellungsnahmen. 5. Ja. 6. Ich möchte eine möglichst ausführliche Zusammenfassung.” Nun erhalte ich einen neuen Prompt von der KI: “Bitte fasse die unterschiedlichen Standpunkte zum Verbot von Verbrennermotoren in Europa zusammen, mit einem speziellen Fokus auf Deutschland. Berücksichtige dabei die Meinungen von politischen Parteien, Umweltorganisationen, Industrievertretern und der allgemeinen Bevölkerung. Achte besonders auf aktuelle Situationen und Standpunkte, und ziehe historische Hintergründe zur Erklärung hinzu, wo sie relevant sind. Nutze seriöse Quellen wie wissenschaftliche Studien, journalistische Artikel und offizielle Stellungnahmen. Diskutiere auch die möglichen Auswirkungen eines Verbots von Verbrennermotoren auf die Wirtschaft, Umwelt und Gesellschaft. Die Zusammenfassung sollte möglichst ausführlich sein.” Außerdem stellt die KI mir weitere Fragen, um den Prompt weiter zu verbessern: ”Gibt es spezifische politische Parteien oder Umweltorganisationen, deren Standpunkte besonders wichtig sind? Soll der Einfluss internationaler Akteure, wie der EU oder globaler Umweltabkommen, ebenfalls berücksichtigt werden? Gibt es besondere wirtschaftliche Sektoren oder gesellschaftliche Gruppen, deren Standpunkte du detaillierter beleuchtet haben möchtest? Möchtest du, dass spezifische Fallstudien oder Beispiele in die Analyse einfließen?” So geht das nun weiter, bis entweder die KI keine Verbesserungsmöglichkeiten mehr sieht, oder du zufrieden mit dem Prompt bist. 
von Patrick Große 21 Mai, 2024
OpenAI hat am Montag sein neues Flaggschiff-Modell vorgestellt, das sie GPT-4o nennen – das „o“ steht für „omni“, was auf die Fähigkeit des Modells hinweist, Text, Sprache und Video zu verarbeiten. GPT-4o wird in den nächsten Wochen schrittweise in den Produkten des Unternehmens eingeführt. Laut OpenAI-CTO Mira Murati bietet GPT-4o eine Intelligenz auf dem Niveau des aktuellen Modells GPT-4, verbessert jedoch die Fähigkeiten von GPT-4 in mehreren Modalitäten und Medien. „GPT-4o kann in Sprache, Text und Bild logisch schlussfolgern“, sagte Murati während einer Live-Präsentation in den Büros von OpenAI in San Francisco. „Und das ist unglaublich wichtig, weil wir die Zukunft der Interaktion zwischen uns und Maschinen gestalten.“ Die Neuerungen von GPT-4o im Überblick GPT-4o verbessert das Erlebnis im KI-gestützten Chatbot ChatGPT erheblich. Die Plattform bot schon lange einen Sprachmodus, der die Antworten des Chatbots mittels eines Text-zu-Sprache-Modells transkribierte. GPT-4o verstärkt dies jedoch, indem es den Nutzer:innen ermöglicht, mit ChatGPT mehr wie mit einem Assistenten zu interagieren. Nutzer:innen können ChatGPT beispielsweise eine Frage stellen und ChatGPT während der Antwort unterbrechen. Das Modell liefert laut OpenAI „in Echtzeit“ Reaktionsfähigkeit und kann sogar auf Nuancen in der Stimme einer/s Nutzer:in reagieren, indem es Stimmen in „einer Reihe verschiedener emotionaler Stile“ (einschließlich Gesang) generiert. GPT-4o verbessert auch die visuellen Fähigkeiten von ChatGPT. Angesichts eines Live-Videos oder eines Desktop-Bildschirms kann ChatGPT jetzt schnell dazugehörige Fragen beantworten, von Themen wie „Was passiert in diesem Softwarecode?“ bis hin zu „Welche Marke zeigt das Hemd dieser Person?“. Diese Funktionen werden sich in Zukunft weiterentwickeln. Während GPT-4o heute ein Bild eines Menüs in einer anderen Sprache betrachten und übersetzen kann, könnte das Modell in Zukunft ChatGPT ermöglichen, beispielsweise ein Live-Sportspiel „anzusehen“ und die Regeln zu erklären. Auch das Übersetzen von rund 50 Sprachen ist in Echtzeit möglich. Ankündigungen bei Google Auf der Google I/O 2024 wurden zahlreiche neue KI-Produkte und -Dienste vorgestellt, die sich auf verschiedene Anwendungen und Bereiche erstrecken. Hier sind die Hauptneuerungen: Video-KI Veo: Diese KI kann Full-HD-Videos (1080p) generieren, die länger als eine Minute sind. Veo versteht Kameraeinstellungen und erzeugt konsistente und kohärente Videos. Erste Künstler können Veo über VideoFX testen. Project Astra: Google bündelt hier seine Arbeit an KI-Agenten, die die Welt verstehen, sich Dinge merken und handeln können. Diese Agenten basieren auf Gemini und sind für verschiedene Aufgaben spezialisiert. Sie sollen zukünftig über Smartphones oder Brillen zugänglich sein. Sie können sehen und hören und in Echzeit Fragen zur Umgebung beantworten, ähnlich wie der neue Sprachassistent von OpenAI. AI Overview: AI kommt noch stärker in die Google-Suche. Diese Funktion bietet automatisch generierte Zusammenfassungen oberhalb der Google Suchergebnisse an. Die Funktion kombiniert die Fähigkeiten des Gemini-Modells mit Googles Suchsystemen und soll bis Ende des Jahres aus der Testphase in den normalen Betrieb übergehen. Lyria: Eine generative Musik-KI, die künftig alle Musikdienste in der Music AI Sandbox zusammenführen wird. SynthID: Ein digitales Wasserzeichen, das in Bilder, Audio, Text und Video eingebettet werden kann. Visuelle Suche: Eine Erweiterung von Google Lens, bei der man Fragen zu einem Video stellen kann, indem man ein Element umkreist. Diese Funktion ist vergleichbar mit neuen Funktionen von OpenAIs ChatGPT, bei denen man über die Kamera und per Sprache interagieren kann. Insgesamt zeigt Google auf der I/O 2024 einen starken Fokus auf die Integration von KI in verschiedene Produkte und Dienste, um Nutzern effizientere und vielseitigere Werkzeuge zur Verfügung zu stellen. Verfügbarkeit und Zugänglichkeit GPT-4o ist ab sofort in der kostenlosen Stufe von ChatGPT und für Abonnent:innen der Premium-ChatGPT Plus- und Team-Pläne mit „5-fach höheren“ Nachrichtenlimits verfügbar. (OpenAI merkt an, dass ChatGPT automatisch auf GPT-3.5, ein älteres und weniger leistungsfähiges Modell, umschaltet, wenn Nutzer:innen das Nachrichtenlimit erreichen.) Das verbesserte ChatGPT-Spracherlebnis, das von GPT-4o unterstützt wird, wird in etwa einem Monat in der Alpha-Version für Plus-Nutzer:innen verfügbar sein. Viele Expert:innen argumentieren, dass OpenAI in dieser Woche das KI-Rennen gewonnen hat, denn die meisten vorgestellten Produkte von Google sollen erst im Laufe des Jahres verfügbar sein, während die neuen ChatGPT-Features bereits heute oder in den kommenden Wochen veröffentlicht werden. Relevanz für den Journalismus Für Journalist:innen bietet GPT-4o eine Reihe spannender Möglichkeiten. Die Fähigkeit, Sprach-, Text- und Bildinhalte nahtlos zu verarbeiten, kann die Recherchearbeit erheblich beschleunigen. Reporter:innen könnten beispielsweise Sprachaufnahmen direkt transkribieren und analysieren lassen, während sie gleichzeitig relevante Bilder interpretieren und beschreiben lassen. Die Multimodalität ermöglicht es auch, komplexe Geschichten, die verschiedene Medienformate umfassen, effizienter zu erstellen und zu überprüfen. Die verbesserte Sprachfunktion könnte zudem die Interaktion mit digitalen Assistenten revolutionieren, indem sie eine natürlichere und flüssigere Kommunikation ermöglicht. Dies kann besonders nützlich sein, um schnell Informationen zu sammeln, Fakten zu überprüfen oder Inhalte zu redigieren, während man unterwegs ist. Schließlich eröffnet die Multilingualität von GPT-4o neue Perspektiven für den internationalen Journalismus. Mit der Fähigkeit, in etwa 50 Sprachen effizient zu arbeiten, können Journalist:innen Inhalte in verschiedenen Sprachen schneller übersetzen und analysieren, was die Berichterstattung über globale Ereignisse erleichtert. Bemerkenswert ist, das OpenAI viele nützliche Funktionen bald allen Nutzer:innen zugänglich machen wird, also auch den Personen ohne Plus-Abonnement. Dann wird es für alle möglich sein, auf das Internet zuzugreifen, Daten zu analysieren und Grafiken zu erstellen oder Fotos und Dateien hochzuladen und zu analysieren. Außerdem wird OpenAI GPTs und den dazugehörigen Store für alle zugänglich machen. Sobald alle Funktionen zugänglich sind, werde ich hier einen Praxistext veröffentlichen. Mit dem Zugang zu GPTs für alle werde ich mich in Zukunft außerdem stärker mit GPTs für Journalist:innen beschäftigen. 
Mehr anzeigen
Share by: