ChatGPT: Grundlagen und Funktionen

ChatGPT hat seit seiner Einführung Ende 2022 die Art und Weise revolutioniert, wie wir mit Künstlicher Intelligenz interagieren. Als leicht zugänglicher und vielseitiger KI-Assistent ermöglicht er es auch Menschen ohne technischen Hintergrund, die Potenziale der Generativen KI im Berufsalltag zu nutzen.

Dieses Werkzeug versteht und beantwortet Fragen in natürlicher Sprache, unterstützt bei der Textarbeit, löst mathematische Probleme, erklärt komplexe Sachverhalte und kann sogar bei der Analyse von Bildern helfen. Dabei passt sich ChatGPT dem Wissensniveau des Nutzers an und kann Erklärungen bei Bedarf vereinfachen oder vertiefen.

Im beruflichen Kontext bietet ChatGPT vielfältige Einsatzmöglichkeiten: Von der Unterstützung bei Recherchen über die Optimierung von Texten bis hin zur Analyse von Daten und dem Erstellen von Dokumentationen. In den folgenden Abschnitten werden die wichtigsten Funktionen und deren praktische Anwendung vermittelt.

Grundlagen zu ChatGPT

ChatGPT ist ein KI-Sprachmodell der Firma OpenAI, das auf der GPT-Architektur (Generative Pre-trained Transformer) basiert. Im Gegensatz zu klassischen Computerprogrammen, die nach fest programmierten Regeln arbeiten, nutzt ChatGPT Machine Learning-Technologien, um Sprache zu verstehen und zu generieren.

Das Modell wurde mit einer enormen Menge an Textdaten trainiert und kann dadurch Zusammenhänge erkennen, Fragen beantworten und neue Texte generieren. Es versteht den Kontext einer Konversation und kann sich an vorherige Nachrichten im Dialog erinnern.

Verfügbare Versionen

OpenAI entwickelt ChatGPT kontinuierlich weiter und bietet verschiedene Versionen für unterschiedliche Anforderungen an.
Die Basisversion nutzt das GPT-4o Modell und steht kostenlos zur Verfügung. Sie eignet sich hervorragend für viele Alltagsaufgaben und den ersten Einstieg.
Für anspruchsvollere Aufgaben bietet ChatGPT weitere Funktionalitäten (zum Beispiel individuell erstellbare GPTs („Apps“) und eine erweiterte Websuche) sowie erweiterte Modelle (zum Beispiel GPT-o1).
OpenAI stellt für ChatGPT neue und erweiterte Funktionalitäten typischerweise in Zyklen von drei bis sechs Monaten bereit. Sie werden in der Regel zunächst für bezahlte Abos verfügbar gemacht, und später auch in der kostenlosen Version.

Wichtige Eigenschaften

Eine der bemerkenswertesten Eigenschaften von ChatGPT ist die Fähigkeit, natürliche Sprache zu verstehen und kontextbezogen zu antworten. Das System lernt während der Konversation dazu und kann sich an vorherige Teile des Gesprächs erinnern. Dies ermöglicht einen natürlichen Dialogfluss, bei dem ChatGPT auch Rückfragen stellt, wenn etwas unklar ist. Bemerkenswert ist auch die Fähigkeit, eigene Grenzen zu erkennen und transparent zu kommunizieren, wenn eine Frage nicht beantwortet werden kann.

Zu den weiteren wichtigen Funktionen gehören:

  • Die Verarbeitung und Generierung verschiedener Textformate
  • Die Unterstützung multipler Sprachen mit hoher Qualität
  • Das Verstehen und Generieren von Programmcode
  • Die Fähigkeit zur Strukturierung und Analyse von Informationen

Zugänglichkeit

Der Zugang zu ChatGPT gestaltet sich bewusst niedrigschwellig und flexibel. Die primäre Nutzung erfolgt über den Webbrowser unter chat.openai.com.
Es gibt eine kostenlose Basisversion und eine kostenpflichtige Plus-Version, die per Abonnement genutzt werden kann.
Für Unternehmen und Organisation gibt es weiterhin die kostenpflichtigen Abo-Versionen ChatGPT „Team“ für Unternehmen bis ca. 150 Mitarbeitende und ChatGPT „Enterprise“ für größere Unternehmen. Sie bieten zusätzlich Möglichkeiten zur Zusammenarbeit und bessere Grundeinstellungen für den Datenschutz.

Für die mobile Nutzung bietet OpenAI mobile Apps für iOS und Android sowie Desktop Apps für Apple MacOS und Microsoft Windows an. Diese ermöglichen den Zugriff auf ChatGPT von unterwegs und bieten die gleiche Funktionalität wie die Webversion.

Für Entwickler und Unternehmen steht zusätzlich ein API zur Verfügung, über das ChatGPT in eigene Anwendungen integriert werden kann.

Erste Schritte

Der Einstieg in die Nutzung von ChatGPT ist bewusst einfach gestaltet. Die Nutzung ist sofort und ohne Registrierung über die Website chat.openai.com möglich. Für erweiterte Funktionen wie das Speichern der Chat-Historie ist ein (kostenloser) Account erforderlich.

Registrierung und Login

Die optionale Registrierung bei ChatGPT erfordert eine E-Mail-Adresse sowie ein Passwort. Nach der initialen Anmeldung und Bestätigung der E-Mail-Adresse stehen alle Basisfunktionen zur Verfügung. OpenAI bietet verschiedene Login-Optionen an:

  • Anmeldung mit E-Mail und Passwort
  • Login über Microsoft-Konto
  • Login über Google-Konto
  • Anmeldung über Apple ID

Für die geschäftliche Nutzung wird die Aktivierung der Zwei-Faktor-Authentifizierung empfohlen.

Benutzeroberfläche

Die Benutzeroberfläche von ChatGPT ist minimalistisch und intuitiv gestaltet. Der Hauptbereich wird vom Chat-Fenster dominiert, in dem die Konversation stattfindet. Am unteren Rand befindet sich das Eingabefeld für Nachrichten (sogenannte „Prompts“). Bei registrierten Nutzern finden sich links die Konversationshistorie und wichtige Einstellungsoptionen. Die übersichtliche Gestaltung ermöglicht auch Neueinsteigern eine schnelle Orientierung.

Grundlegende Navigation

Die Navigation in ChatGPT orientiert sich an bekannten Chat-Anwendungen. Neue Konversationen werden über den „Neu“-Button gestartet. Registrierte Nutzer sehen frühere Gespräche chronologisch in der linken Seitenleiste und können diese wieder aufrufen. Wichtige Funktionen wie das Löschen von Konversationen, das Exportieren von Chats oder das Anpassen von Einstellungen sind über eindeutige Symbole oder Menüs erreichbar.

Konversationsverlauf und -management

Die Verwaltung des Konversationsverlaufs steht nur registrierten Nutzern zur Verfügung. ChatGPT speichert dann standardmäßig alle Gespräche in der Seitenleiste. Dies ermöglicht es, frühere Konversationen nachzuverfolgen oder fortzusetzen. Zur Verwaltung stehen verschiedene Funktionen zur Verfügung:

  • Umbenennen von Konversationen für bessere Übersicht
  • Archivieren wichtiger Gespräche
  • Exportieren von Konversationen
  • Selektives oder vollständiges Löschen des Verlaufs
  • Deaktivieren der Gesprächsaufzeichnung

Nicht registrierte Nutzer können die Basisversion von ChatGPT zwar vollumfänglich nutzen, müssen aber beachten, dass ihre Konversation nach dem Schließen des Browsers bzw. beim Start eines neuen Chats verloren geht.

Kernfunktionen

ChatGPT verfügt über ein breites Spektrum an Grundfunktionen, die in nahezu allen Arbeitsbereichen nutzbringend eingesetzt werden können. Das System verarbeitet Eingaben in natürlicher Sprache und passt seine Antworten automatisch an den Kontext und das erkennbare Wissensniveau des Nutzers an.

Textgenerierung und -analyse

Die Kernkompetenz von ChatGPT liegt in der Verarbeitung von Text. Das System kann Texte verschiedenster Art erstellen, überarbeiten und analysieren. Dabei passt es sich flexibel an unterschiedliche Anforderungen an:

  • Stil (formell, informell, technisch, kreativ)
  • Länge (von Kurznachrichten bis zu längeren Dokumenten)
  • Zielgruppe (Experten, Laien, Kunden, Mitarbeitende)
  • Format (Fließtext, Stichpunkte, Tabellen, Gliederungen)

Frage-Antwort-Dialog

Eine besondere Stärke von ChatGPT ist die Fähigkeit, kontextbezogen auf Fragen zu antworten. Das System versteht Rückfragen, bittet bei Unklarheiten um Präzisierung und kann komplexe Sachverhalte schrittweise erklären. Die Antworten basieren dabei auf dem Trainingswissen und werden bei Bedarf mit Beispielen oder Analogien verdeutlicht.

Code-Erstellung und -Erklärung

Im technischen Bereich unterstützt ChatGPT sowohl bei der Programmierung als auch beim Verständnis von Code. Das System kann:

  • Code in verschiedenen Programmiersprachen generieren
  • Bestehenden Code analysieren und erklären
  • (Bestehenden) Code kommentieren
  • Fehler in Code identifizieren und beheben
  • Best Practices vorschlagen
  • Code-Beispiele zur Veranschaulichung bereitstellen
  • Testroutinen für bestehenden Code generieren

Strukturierte Ausgaben

ChatGPT kann Informationen in verschiedenen strukturierten Formaten aufbereiten. Dies ist besonders nützlich für die Organisation und Präsentation von Daten. Beispiele für Ausgabeformate sind:

  • Tabellen für Vergleiche und Übersichten
  • Listen für Aufzählungen und Schrittfolgen
  • Hierarchische Gliederungen
  • Formatierte Textblöcke
  • Markdown-formatierte Ausgaben

Mathematische Berechnungen

Neben der Textverarbeitung beherrscht ChatGPT auch grundlegende bis fortgeschrittene mathematische Operationen. Das System kann:

  • Arithmetische Berechnungen durchführen
  • Formeln erklären und anwenden
  • Mathematische Probleme schrittweise lösen
  • Statistikaufgaben bearbeiten
  • Bei der Analyse von Zahlenreihen und Datensätzen unterstützen

Es ist zu beachten, dass Chatbots und LLMs nicht völlig zuverlässig sind bei solchen Berechnungen. Dies hat sich im Laufe der Versionsentwicklung über die Zeit verbessert, ist aber nach wie vor noch nicht perfekt.
Beim Einsatz von ChatGPT kann für genauere Ergebnisse und komplexe(re) Berechnungen das GPT „Wolfram“ eingesetzt werden. Es basiert auf Wolfram Alpha, unterstützt (komplexe) mathematische Formeln und Berechnungen, und bietet eine sehr gute Genauigkeit und Qualität bei den Ergebnissen.

Spezifische Funktionen

In diesem Kapitel werden besondere Funktionalitäten beschrieben, die ChatGPT über die reine Konversation hinaus bietet. Diese Funktionen erweitern die Einsatzmöglichkeiten erheblich und machen das System zu einem vielseitigen Assistenten.

Chat-Historie

ChatGPT speichert automatisch alle Konversationen und macht diese über das Hauptmenü zugänglich. Dies ermöglicht:

  • Schnelles Wiederfinden früherer Gespräche
  • Fortsetzung unterbrochener Dialoge
  • Organisation durch Benennung und Ordnerstruktur
  • Export wichtiger Konversationen
  • Selektives Löschen nicht mehr benötigter Gespräche

Websuche

Mit der integrierten Websuche kann ChatGPT auf aktuelle Online-Informationen zugreifen:

  • Integration von Echtzeit-Informationen aus dem Internet
  • Verifizierung von Fakten durch multiple Quellen
  • Bereitstellung von Links zu weiterführenden Informationen
  • Analyse aktueller Ereignisse und Entwicklungen

Derzeit gibt es eine Standard-Websuche und eine neue erweiterte Websuche. Letztere ist aktuell nur in bezahlten Versionen von ChatGPT verfügbar und soll laut OpenAI zukünftig auch in der kostenfreien Version bereitgestellt werden.

Bildanalyse

ChatGPT kann hochgeladene Bilder analysieren und interpretieren:

  • Detaillierte Beschreibung des Bildinhalts
  • Erkennung von Text in Bildern
  • Identifikation von Objekten, Personen und Szenen
  • Technische Analyse von Diagrammen und Grafiken
  • Unterstützung bei der Fehlersuche in Screenshots

Mit den Inhalten eines Bildes kann weitergearbeitet werden, indem zum Beispiel darauf basierend Konzepte oder weitere Inhalte ausgearbeitet werden.

Bildgenerierung

Mit DALL-E Integration können Bilder durch Textbeschreibungen generiert werden:

  • Erstellung von Illustrationen und Grafiken
  • Generierung von Konzeptbildern
  • Anpassung bestehender Bilder
  • Verschiedene Stile und künstlerische Ansätze
  • Variation von Perspektiven und Ausführungen

Bilder können auch auf Basis des aktuellen Chat-Kontext oder des bisherigen Chat-Verlaufs erstellt werden – zum Beispiel mit dem Prompt „Bitte visualisiere das diskutierte Konzept als abstraktes Bild.“.

Die hier beschriebene Bildgenerierung ist nicht zu verwechseln mit der weiter unten beschriebenen Datenvisualisierung. Bei der Bildgenerierung können Bilder unterschiedlichster Art generiert werden, bei der Datenvisualisierung werden Diagramme auf Basis von hochgeladenen oder anderweitig bereitgestellten Daten erzeugt.

Die Erzeugung von strukturierten Bildern wie Workflows und Ablaufdiagrammen ist über die Funktion der Bilderzeugung nicht möglich. Hierzu können – je nach Anwendungszweck – spezialisierte Tools wie Napkin AI oder das Mermaid-Format verwendet werden, das ChatGPT erzeugen kann.

Spracheingabe und -ausgabe

Die Sprach-Funktionen ermöglichen eine natürliche Interaktion:

  • Diktat von Nachrichten statt Texteingabe
  • Vorlesen von ChatGPT-Antworten
  • Mehrsprachige Spracheingabe und -ausgabe
  • Anpassung der Sprechgeschwindigkeit
  • Auswahl verschiedener Stimmen

Seit Kurzem ist der sogenannte „Fortgeschrittene Sprachmodus“ verfügbar. Er ermöglicht (quasi) Echtzeit-Dialoge in unterschiedlichen Sprachen, wobei auch Ad-Hoc Übersetzungen im Dialog möglich sind.
Bisher sind noch nicht alle Funktionen der Text-basierten Kommunikation verfügbar – zum Beispiel kann bei diesem Sprachmodus keine Websuche verwendet werden. Dies wird sich aber im Laufe der Zeit ändern.

Hochladen von Dateien

ChatGPT kann verschiedene Dateiformate verarbeiten:

  • Textdokumente (PDF, DOC(X), TXT)
  • Tabellen (CSV, XLSX)
  • Bilder (JPG, PNG, GIF)
  • Programmcode-Dateien
  • Präsentationen

Entsprechende Dateien können in ChatGPT geladen werden. Es gibt – je nach ChatGPT Version – unterschiedliche Limits bzgl. der Anzahl und Größe hochladbarer Dateien.

Das System analysiert den Inhalt und kann darauf basierend:

  • Zusammenfassungen erstellen
  • Fragen beantworten
  • Änderungen vorschlagen
  • Daten extrahieren und verarbeiten

Erzeugen von Download-Dateien

ChatGPT kann Inhalte in verschiedenen Formaten zum Download bereitstellen:

  • Textdokumente in verschiedenen Formaten (einschließlich Microsoft Word)
  • Strukturierte Daten im CSV- oder Excel-Format
  • Programmcode-Dateien
  • Konfigurationsdateien
  • Markdown-Dokumente

Datenanalyse und -visualisierung

Für die Arbeit mit Daten bietet ChatGPT:

  • Statistische Auswertungen
  • Trendanalysen
  • Erstellung von Diagrammen und Grafiken
  • Datenbereinigung und -transformation
  • Interpretationshilfe für komplexe Datensätze

Diese Funktionalitäten sind alle – zum Beispiel im Gegensatz zu Excel oder anderen Applikationen – über natürliche Sprache verfügbar, so dass keine spezifischen Formeln oder Benutzerschnittstellen verwendet werden müssen.

Memory-Funktion

Die Memory-Funktion ermöglicht das Speichern von Informationen über einzelne Chats hinweg:

  • Benutzerpräferenzen
  • Häufig verwendete Einstellungen
  • Kontextinformationen
  • Personalisierte Anweisungen
  • Projektspezifische Details

Die Memory-Funktion ist standardmäßig aktiv und ChatGPT „merkt“ sich Dinge nach eigenem Gusto. Sie kann über die ChatGPT-Einstellungen an- und abgeschaltet werden. Falls sie verwendet wird, sollten – ebenfalls über die ChatGPT-Einstellungen – die automatisch generierten Einträge regelmäßig geprüft und ggfls. gelöscht werden, um zu vermeiden, dass sich ChatGPT Informationen „merkt“, die in späteren Chat-Dialogen nicht (mehr) verwendet werden sollen.

Konfigurierbare Vorgaben

Nutzer können verschiedene Aspekte der Interaktion anpassen:

  • Bevorzugte Antwortlänge und -stil
  • Fachlicher Detailgrad
  • Ton der Kommunikation
  • Standardformate für Ausgaben
  • Spezifische Rollen oder Perspektiven

Diese Vorgaben können in den ChatGPT-Einstellungen eingetragen und dann für sämtliche Chats genutzt werden. Daher sollten hier nur „allgemeingültige“ Informationen hinterlegt werden, die für alle Chats gelten sollen.

Teilen von Chat-Dialogen

Gespräche können mit anderen geteilt werden:

  • Generierung von teilbaren Links
  • Export kompletter Konversationen
  • Ausgewählte Abschnitte teilen
  • Einbettung in andere Plattformen
  • Kollaborationsmöglichkeiten

Die Möglichkeiten sind unterschiedlich, je nachdem, ob eine persönliche Version von ChatGPT genutzt wird oder eine Unternehmens-Version. Bei den Unternehmensversionen „Team“ und „Enterprise“ gibt es erweiterte Funktionen zur Zusammenarbeit.

Nutzung und Erstellung individueller GPTs

GPTs sind spezialisierte Ausprägungen von ChatGPT. Sie bieten folgende Möglichkeiten:

  • Nutzung vorgefertigter GPTs für spezifische Aufgaben
  • Erstellung eigener GPTs mit definierten Fähigkeiten
  • Anpassung von Verhalten und Wissen
  • Integration externer Ressourcen
  • Teilen und Veröffentlichen eigener GPTs

GPTs sind individuell erstellbare „Apps“ innerhalb von ChatGPT, die Spezialfunktionen bieten und gleichzeitig die gesamten Basisfunktionen von ChatGPT integrieren. Sie können komplett mit Sprache – ohne Coding – erstellt werden. Die Nutzung von GPTs ist mit allen ChatGPT-Versionen möglich, die Erstellung nur mit kostenpflichtigen Versionen. GPTs können in unterschiedlicher Weise verfügbar gemacht werden:

  • Nur für die eigene Nutzung
  • Für spezifische Personen (über einen geteilten Link)
  • Für alle ChatGPT Anwender (über den ChatGPT „GPT Store“)
  • Für Mitarbeitende eines Unternehmens oder einer Organisation (nur bei ChatGPT „Team“ und „Enterprise“ Lizenzen)

Bei der Nutzung von GPTs aus dem GPT Store sollte beachtet werden, dass GPTs Code ausführen können, und dass es – zum Beispiel im Gegensatz zum Apple App Store – keine Qualitätssicherung oder Zertifizierung von GPTs gibt. Dies ist ähnlich wie bei der Nutzung von Add-Ins für Microsoft Office Produkte.
Es sollte also im Hinblick auf Schadsoftware und unerwünschte Seiteneffekte vorsichtig gehandelt werden. Es empfiehlt sich, nur bekannte bzw. von solider Seite empfohlene GPTs zu nutzen.
Ein weiterer Indikator für Qualität, Sicherheit und Zuverlässigkeit kann die Anzahl der Nutzungen/Downloads sein, die bei jedem GPT angegeben sind. Bei niedrigen Werten ist eine gewisse Skepsis angebracht.

ChatGPT Canvas

Canvas ist ein spezieller Modus, der über die Auswahl des Basismodells aufgerufen wird. Er bietet eine interaktive Umgebung für:

  • Parallele Bearbeitung mehrerer Texte
  • Live-Coding mit Ausführungsmöglichkeit
  • Drag-and-Drop Organisation von Inhalten
  • Kollaboratives Arbeiten
  • Versionierung und Historie

Es wird der Bildschirm geteilt und neben dem Chat-Dialog ein zweites Fenster geöffnet. In diesem Fenster ist dann eine Bearbeitung von Text bzw. Programmcode möglich. Die Prompts im Chat werden direkt auf den Inhalt des zweiten Fensters angewendet, so dass eine interaktive Bearbeitung möglich wird.

API-Zugang

Für Entwickler und Unternehmen bietet ChatGPT API-Schnittstellen:

  • Integration in eigene Anwendungen
  • Automatisierung von Prozessen
  • Maßgeschneiderte Lösungen
  • Skalierbare Implementierungen
  • Anpassbare Parameter und Modelle

Von OpenAI (dem Unternehmen hinter ChatGPT) werden unterschiedliche APIs bereitgestellt. Sie umfassen die Basismodelle (z.B. GPT-4o) und auch ChatGPT selbst.
Diese APIs werden auch von vielen Tool-Herstellern verwendet.
Die Abrechnung bei der Nutzung von APIs erfolgt – im Gegensatz zur monatlichen Pauschale von ChatGPT – immer volumenbasiert („Pay-per-Use“-Modell). Daher ist eine Kostenkontrolle angezeigt.

Mehrbenutzer-Funktionen

Für Teams und Organisationen gibt es spezielle Kollaborations-Features:

  • Gemeinsame Workspaces
  • Teambasierte GPT-Verwaltung
  • Geteilte Ressourcen und Vorlagen
  • Administrations-Dashboard
  • Nutzungsstatistiken und -analysen

Jede der oben beschriebenen Funktionen erweitert die Einsatzmöglichkeiten von ChatGPT erheblich. Die Verfügbarkeit einzelner Funktionen kann je nach Version und Abonnement variieren. Es empfiehlt sich, die aktuelle Dokumentation zu konsultieren, um die spezifischen Verfügbarkeiten zu prüfen.

Fazit

ChatGPT hat sich seit seiner Einführung Ende 2022 als transformative Kraft in der Unternehmenslandschaft etabliert. Die Vielseitigkeit und intuitive Nutzbarkeit des Systems – von der Textgenerierung über Code-Erstellung bis hin zur Datenanalyse – eröffnet Unternehmen jeder Größe neue Möglichkeiten, ihre Prozesse zu optimieren und Innovationen voranzutreiben. Besonders wertvoll ist dabei die Fähigkeit des Systems, sich durch natürlichsprachliche Interaktion an unterschiedliche Anforderungen und Wissensniveaus anzupassen. Die Integration von Websuche, Bildanalyse und -generierung sowie die Möglichkeit zur Erstellung individueller GPTs erweitern das Potenzial zusätzlich.

Weiterführende Informationen