Mit „GPT.UP“ hat die Universität Potsdam zum Wintersemester 2024/25 einen neuen Dienst gestartet, der allen Universitätsangehörigen die Arbeit mit einem KI-gestützten Chat-Assistenten ermöglicht. Was kann er?
GPT.UP ist ein webbasierter Chatbot, der Textanfragen entgegennimmt und in Echtzeit ohne menschliche Hilfe beantwortet. Im Hintergrund arbeiten verschiedene, von den Nutzenden auswählbare KI-Sprachmodelle (Large Language Models). Man kann sich den Dienst daher als eine Art Vermittler vorstellen, der zwischen den anfragenden Personen und der KI steht. Das Besondere an GPT.UP ist, dass der Datenschutz eingehalten wird. Personenbezogene Daten der Nutzenden werden im Gegensatz zu ähnlichen KI-Diensten, die frei im Internet verfügbar sind, nicht an die Hersteller der Sprachmodelle weitergeleitet.
Wofür ist der Dienst gedacht?
GPT.UP kann Hochschulangehörige beim Erkunden von KI und auch bei unterschiedlichen Aufgaben unterstützen – zum Beispiel als Impulsgeber, Reflexionspartner und bei der Erledigung von Routinetätigkeiten. Lehrende können den Chatbot in ihren Veranstaltungen einsetzen, um Studierende Aufgaben mithilfe der KI bearbeiten zu lassen sowie die Korrektheit des Outputs überprüfen und kritisch bewerten zu lassen.
Wofür nicht?
Es ist nicht erlaubt, eindeutige personenbezogene Daten in GPT.UP einzugeben, z. B. Namen oder Eigenschaften von realen Personen. Der Dienst ist daher nicht dazu gedacht, die Auswahl von Personal oder eine anderweitige Auswahl von Personen zu unterstützen. Auch eine Verwendung zur Korrektur oder Bewertung studentischer Arbeiten oder generell zur Beurteilung der Fähigkeiten von Personen sind ausgeschlossen.
Bei der Arbeit mit GPT.UP lässt sich aus einer ganzen Liste von verschiedenen Sprachmodellen wählen. Worin unterscheiden sie sich?
Vor allem in der Größe, Ausprägung und Aktualität der Trainingsdaten, in der Eingabetextmenge (Context Window in Tokens), die gleichzeitig verarbeitet werden kann, und in der Lizenzierung. So sind beispielsweise die als Marktführer geltenden Sprachmodelle von OpenAI (ChatGPT) nicht frei verfügbar. Die Schnittstellenzugriffe auf die hinter dem kommerziellen ChatGPT liegenden Large Language Models „GPT-4o“ und „GPT-4o Mini“ erfolgen datenschutzsicher über die kommerzielle Cloud-Computing-Plattform von Microsoft in Europa. Die Lizenzkosten werden dabei derzeit über MWFK-Fördermittel zentral finanziert. Alle anderen Sprachmodelle in GPT.UP sind Open-Source-Modelle, die von der GWDG, der Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen, gehostet werden. Die Modelle haben ganz unterschiedliche Stärken. „Llama 3.1 SauerkrautLM 70B Instruct“ ist beispielsweise besonders stark in der englischen und deutschen Sprache, wohingegen das Modell „Codestral 22B“ spezialisiert ist auf Aufgaben aus dem Bereich der Softwareentwicklung. Eine gute Übersicht findet sich hier: https://docs.hpc.gwdg.de/services/chat-ai/models/index.html
Als Letztes kam im Februar 2025 das Modell „DeepSeek“ hinzu. Wodurch zeichnet es sich aus?
Das chinesische Sprachmodell basiert auf einem anderen Trainingsverfahren, welches vergleichsweise wenig Rechenleistung erfordert und eine sehr schnelle und zielgenaue Beantwortung ermöglicht. DeepSeek ist ein Open-Source-Modell, es kann somit über das chinesische DeepSeek-Portal genutzt oder alternativ heruntergeladen und in der eigenen Infrastruktur betrieben werden.
Gegenüber DeepSeek bestehen erhebliche Bedenken. Wie geht die UP damit um?
Die Bedenken beziehen sich einerseits auf das im Internet frei zugängliche DeepSeek-Portal und die dazugehörige App für Smartphones, andererseits aber auch auf das dahinter liegende Sprachmodell.
Gegen das im Internet frei zugängliche DeepSeek-Portal gibt es Datenschutz- und Zensurbedenken. Der chinesische Betreiber sammelt laut eigenem Bekunden über diesen Weg persönliche Informationen über die Benutzer*innen und ihre Netzwerkaktivitäten. Inwieweit dem chinesischen Staat Zugang zu diesen Daten gewährt wird, ist dabei unklar. Darüber hinaus werden sensible und in China als politisch heikel eingestufte Themen bei der Ein- und Ausgabe vom Interface zensiert. Das bedeutet, dass bestimmte Fragen, die über das frei im Internet zugängliche Interface eingegeben werden, nicht beantwortet werden. Aus diesen Gründen hat die GWDG sich entschieden, das DeepSeek-Sprachmodell in Göttingen zu hosten. GPT.UP greift auf das von der GWDG bereitgestellte Sprachmodell zu und nicht auf das in China gehostete. Die Ein- und Ausgaben werden somit datenschutzkonform verarbeitet. Eine Zensur bei der Ein- oder Ausgabe findet im GPT.UP-Interface nicht statt.
Bedenken richten sich aber auch gegen das zugrundeliegende Sprachmodell von DeepSeek selbst. Ein- und Ausgaben von Sprachmodellen können nämlich nicht nur über das Interface beeinflusst werden, sondern auch indem die Lernbasis während der technischen Entwicklungsphase des Sprachmodells eingeschränkt wird (z. B. durch Manipulation bzw. Selektion von Trainingsdaten). Eine systematische Selektion von Trainingsdaten wirkt sich daher auch auf die Ausgaben des Sprachmodells aus. Bezogen auf DeepSeek bedeutet dies, dass Ausgaben von DeepSeek eine höhere politische Voreingenommenheit (engl. „Bias“) aufweisen. Auf diesen sog. „political bias“ weist die GWDG selbst in der Übersicht der bereitgestellten Modelle hin (https://docs.hpc.gwdg.de/services/chat-ai/models/index.html).
Da diese politische Voreingenommenheit in DeepSeek gewissermaßen eingebrannt ist, sollte dies bei der Nutzung über GPT.UP beachtet werden bzw. für eine kritischen Reflexion über die generierten Ausgaben genutzt werden.
Das ZIM stellt den Dienst nicht nur für die UP, sondern auch die FH Potsdam und die Filmuni bereit. Wie kam es dazu?
Im Förderprogramm „Künstliche Intelligenz – Smarte Systeme in der Brandenburger Hochschulbildung“ des MWFK gab es für Kooperationsprojekte einen Bonus. Es ist darüber hinaus geplant, dass die UP als einer von zwei technischen Knoten für den Betrieb von hochschulübergreifenden IT-Diensten im Land Brandenburg fungiert. Ob die notwendigen Personalstellen und Sachmittel dafür bereitstehen werden, wird sich allerdings erst nach der Verabschiedung des Landeshaushalts zeigen.
GPT.UP – ein KI-Chat-Assistent für die Universität Potsdam: https://www.uni-potsdam.de/de/gptup/index