GPT-4o («o» für «omni») ermöglicht eine natürliche Mensch-Computer-Interaktion durch die Verarbeitung und Ausgabe von Text, Audio und Bildern. Es reagiert auf Audioeingaben in durchschnittlich 320 Millisekunden, vergleichbar mit menschlicher Reaktionszeit.

Was kann GPT 4o?

ChatGPT 4o bringt eine Reihe neuer, bahnbrechender Funktionen mit sich. Besonders hervorzuheben ist die Fähigkeit zur natürlichen Interaktion, die zwischenmenschliche Kommunikation nachahmt. Während KI-Systeme immer komplexer werden, legt OpenAI grossen Wert darauf, die Benutzeroberflächen (UI) zu vereinfachen und die Integration von ChatGPT-Anwendungen nahtlos in unser tägliches Leben zu gestalten.

Ein Beispiel dafür ist eine Desktop-Anwendung, die bei Aufgaben am Computer unterstützt. Diese Anwendung ermöglicht es, durch Gespräche mit den Benutzenden, Bildschirmfreigabe und direkte Eingaben Unterstützung zu bieten, etwa um Code zu verstehen oder zu verbessern.

Das Ziel ist eine möglichst barrierefreie Nutzung von ChatGPT und eine natürliche Interaktion mit dem Sprachmodell. Anders als bisher kann das Sprachmodell nun während des Gesprächs unterbrochen werden, sodass sofort auf es reagiert werden kann, ohne auf das Ende seiner Antwort warten zu müssen.

Im OpenAI Spring Update vom 13. Mai 2024 wurden die neuesten Entwicklungen demonstriert. Die weiterentwickelte Version ChatGPT 4o wird kostenlos für alle zur Verfügung stehen, damit möglichst viele Menschen Zugang zu dieser Innovation haben und die neuen Möglichkeiten der Sprachmodell-Versionen verstehen können.

Die Demo zeigt

  1. wie ChatGPT-4o nach einer entsprechenden Aufforderung eine Gutenachtgeschichte erzählt
  2. wie ChatGPT-4o beim Lösen einer einfachen linearen Gleichung hilft, indem es konkrete Tipps im Lösungsprozess gibt, ohne das Ergebnis direkt zu verraten
  3. wie ChatGPT-4o ein Liniendiagramm zerlegt und erklärt
  4. wie ChatGPT-4o Sprache übersetzt und Kommunikation ermöglicht
  5. wie ChatGPT-4o menschliche Emotionen anhand einer Videoaufnahme erkennen und beschreiben kann
Die neueste Version kann bereits getestet werden, sei es in der Desktop-Anwendung oder als App auf dem Smartphone. In ersten Tests begeistert das Update vor allem durch die Schnelligkeit und Natürlichkeit der Interaktion.

GPT-4o in der Schule: Anwendungsmöglichkeiten

Das neue Sprachmodell ChatGPT 4o bietet enorme Chancen für den Schulunterricht, insbesondere durch die Unterstützung beim Lösen einfacher linearer Gleichungen. Anstelle der Lehrperson können Schülerinnen beim Lösen mathematischer Probleme auch auf die Hilfe des Sprachmodells zurückgreifen. Dies eröffnet erhebliche Möglichkeiten, da Schülerinnen ihre Lernzeit optimal nutzen können und bei entsprechender Ausstattung der Geräte eine 1:1 Betreuung ermöglicht wird. Gleichzeitig wird die Lehrkraft entlastet.

Bereits lassen sich viele Kommentare und Einschätzungen zum neusten Update aus dem Hause OpenAI finden. Michael Lutz stellt vor, inwiefern GPT-4o im Schulbereich Einsatz finden könnte:

Update aus dem Hause Google: Google I/O

Die Konkurrenz schläft nicht: Schon heute Abend, am Dienstag, den 14. Mai 2024, wird um 19:00 Uhr das nächste Highlight bei der Google I/O 2024 Keynote erwartet. In dieser mit Spannung erwarteten Präsentation wird Google seine neuesten Innovationen und Technologien vorstellen. Branchenexperten und Technologiebegeisterte sind gespannt, welche neuen Entwicklungen und Fortschritte Google enthüllen wird, um im Wettbewerb mit anderen Technologiegiganten wie OpenAI weiterhin an der Spitze zu bleiben.

Quellen:

OpenAI (2024). Introducing GPT-4o. [14.5.24]

OpenAI (2024). Spring Update. [14.5.24]

Lutz Education (2024). Digitale Transformation & Change-Management. [14.5.24]

 

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Adresse

PHBern
Netzwerk Digitale Transformation
Think Tank Medien und Informatik
CH-3012 Bern

Kontakt

ttim@phbern.ch
+41 31 309 28 95