1. Hinführung
Die traditionelle schulische Prüfungskultur konzentriert sich oft auf den reproduktiven Abruf von Wissen und spiegelt damit kaum die Lebenswelt unter Bedingungen von Digitalität und künstlicher Intelligenz wider. Gleichzeitig stellt sich die Frage, wie Lern- und Prüfungssituationen zeitgemäß gestaltet werden können, um Schüler*innen nicht nur fachlich, sondern auch in ihren digitalen Kompetenzen zu fördern.
Vor diesem Hintergrund skizziert der folgende Beitrag eine konkrete Prüfungssituation und deren unterrichtliche Anbahnung, in der die Bedingungen und Möglichkeiten der digitalen/KI-Wirklichkeit genutzt werden.
Juristische Legitimation bot die aktuelle „Handlungsempfehlung für die Bildungsverwaltung zum Umgang mit Künstlicher Intelligenz in schulischen Bildungsprozessen“ der KMK (KMK Handlungsempfehlung 2024), die ausdrücklich die Berücksichtigung KI-bezogener Kompetenzen in Prüfungsformaten empfiehlt und Schulleitungen nahelegt, Lehrkräften "die notwendigen Ressourcen und Freiräume zur Verfügung zu stellen" (ebd.)
2. Also los geht´s! – Die unterrichtliche Anbahnung
In einem EF-Deutschkurs sollte die Fähigkeit zur „versierten [KI-]Ko-Aktivität und zur Reflexion“ (ebd.) angebahnt werden, indem die Lernenden im Unterricht zunächst den Umgang mit und die Möglichkeiten von Sprachmodellen für die Textproduktion kennenlernen und erproben. Die Unterrichtsreihe schließt mit einer Klausur ab, die die fachlichen (Lese-, Schreib- und insbesondere literarische Kompetenzen) und überfachlichen (Reflexions- und KI-spezifische) Kompetenzen in einer Prüfungssituation zur Anwendung bringt, welche unter Punkt 3 genauer beschrieben wird.
In der konkreten unterrichtlichen Anbahnung setzten sich Kleingruppen selbstreguliert mithilfe eines Lernpfads auf der Plattform Padlet intensiv mit Parabeln und deren Untersuchung für eine kohärente Sinnkonstruktion auseinander.
Dort übten sie auch die Möglichkeiten der gezielten Interaktion mit Sprachmodell (strategisches Prompting von der Ideenfindung bis zu selbstgesteuerten Feedbackprozessen) und einen generell kritischen Umgang mit diesen (Validierung des Outputs durch nachgeschaltete Internetrecherchen, kritische Abwägung der Ergebnisse in Kleingruppengesprächen).
Durch dieses Vorgehen (Untersuchung und Sinnkonstruktion literarischer Texte -> individuelle Textproduktion -> Überprüfung bzw. Überarbeitung der Ergebnisse mit KI -> kritische Beurteilung des KI-Outputs) werden neben den fachspezifischen auch überfachliche KI-spezifische Fähigkeiten und Fertigkeiten erworben. Zudem ermöglicht die kooperative reflexive Umwälzung nach der KI-Nutzung eine Vertiefung des Gelernten.
3. Anlage und Aufbau der Klausur in KI-Ko-Konstruktion
Die unterrichtliche Vorbereitung befähigte die Lernenden dazu, die in der Klausur (90+30 Minuten Bearbeitungszeit, an iPads mit externen Tastaturen) geforderten Arbeitsschritte zu bewältigen.
Grundsätzlich sollten die Schüler*innen in der Klausur Franz Kafkas Parabel "Vor dem Gesetz" zunächst hinsichtlich Inhalt sowie Bild- und Sachebene untersuchen und einen schlüssigen Deutungsansatz entwickeln. Die Dichte und Offenheit der Erzählung erschwert deren inhaltliche Erfassung und kann zu Unsicherheiten führen: Das Spannungsverhältnis zwischen scheinbar einfacher Handlung und abstrakter Aussageebene verlangt eine präzise Analyse von Motiven, Symbolen und sprachlichen Hinweisen.
Anschließend überarbeiteten die Lernenden ihre Analyse mithilfe textgenerativer KI, um individuelle Unsicherheiten auszuräumen und reflektierten dieses Vorgehen kritisch.
3.1 Teil 1 - Basiskompetenzen
Im ersten Teil der Prüfung (ohne Internetzugang) stand die eigenständige, "hilfsmittelfreie" Textarbeit im Fokus, um die Basiskompetenzen des analytischen Schreibprozesses zu überprüfen, die individuelle Textverstehens-, Planungs- und Schreibkompetenz.
Gerade wenn Sprachmodelle als Hilfsmittel zur Ko-Konstruktion herangezogen werden sollen, bleibt das tiefe Textverständnis unentbehrlich, um spätere KI-Outputs sinnvoll einordnen zu können. Zudem wurde so auf juristischer Ebene die Gewährleistung eines (eher) reproduktiven Anforderungsbereiches (AFB 1), in dieser ansonsten auf Reorganisation und Reflexion (AFB 2 und 3) angelegten Prüfung gewährleistet.
3.2 Teil 2 - KI-Ko-Konstruktion
Im Anschluss erhielten die Schüler*innen Zugriff auf einen DSGV-konformen Chatbot, um ihren Ausgangstext zu überarbeiten. Im weitesten Sinne also ein "anderes Hilfsmittel" – ein Vorgehen, das im Fach Mathematik in höheren Jahrgangsstufen standardmäßig durchgeführt wird.
Ziel war es, textgenerierende KI gezielt in den Schreibprozess einzubeziehen, um den eigenen (Prä-) Text sprachlich und inhaltlich zu optimieren.
Je nach Prompt konnte das Sprachmodell sowohl auf Ebene der Rezeption, etwa beim literarischen Textverständnis (z. B. Deutung von Leerstellen) als auch bei der konkreten Textproduktion (Aufbau, Orthografie, Kohärenz) helfen.
Hierdurch wurde ein vertiefter Kompetenzerwerb hinsichtlich des literarischen Lernens und Schreibens angebahnt.
Entscheidend war dabei, den KI-Output kritisch zu reflektieren und nur begründet zu übernehmen – so wurde die inhaltliche Hoheit über den eigenen Text bewahrt.
Alle Änderungen mussten als Zitate gekennzeichnet werden und ein anzufügendes „Prompt-Protokoll“ dokumentierte Eingabeaufforderungen und KI-Output. Bewertungsgrundlage bildeten sowohl der ursprüngliche als auch der mit KI-Einsatz überarbeitete Text, ergänzt durch eine Reflexion des Vorgehens, auf die im Folgenden eingegangen werden soll.
3.3 Teil 3 - Dokumentation und Reflexion
Abschließend sollten die Lernenden zunächst ihre KI-Interaktion detailliert und nachvollziehbar darlegen, indem sie beispielhaft die Gestaltung und Formulierung eines Prompts begründeten. Anschließend folgte eine vertiefte Reflexion, in der sie anhand eines konkreten Beispiels erläuterten, an welchen Stellen und aus welchen Gründen sie den KI-Output übernahmen oder verwarfen, um die Ko-Aktivität bewusst zu beschreiben. Abschließend galt es, die Arbeitsweise selbst kritisch zu erörtern und einzuordnen.
Dies sind nur einige der zahlreichen Möglichkeiten, KI-Einsatz zu reflektieren und bewerten, wie zuletzt Joscha Falck in seinem Beitrag (Falck 2024) deutlich herausgearbeitet hat.

Um diese ungewohnte Meta-Ebene einzuüben, gab es schon während der Unterrichtsreihe regelmäßig Aufgaben, bei denen die Schüler*innen einerseits Prompts formulieren und andererseits diesen KI-Einsatz kritisch bewerten sollten. Zur sprachlichen Unterstützung standen Formulierungshilfen und vorformulierte Feedback-Prompts zur Verfügung, die sich auf ein 4-stufiges Kompetenzraster aus Joscha Falcks oben erwähnten Beitrag beziehen.
3.4 Schweiß und Tastaturanschläge – Die Durchführung
Im Vorfeld äußerten die Lernenden Bedenken hinsichtlich Technik (Internetverbindung, Tastaturladungen), die sich als unbegründet erwiesen. Als größte Herausforderung erwies sich laut den Ergebnissen einer in der Folgestunde durchgeführten Evaluation tatsächlich die Bearbeitungszeit: Zwar wurden die Anforderungen durch die Aufgabenstellung weitestgehend vorentlastet, aber die hilfsmittelfreie Untersuchung von Inhalt und Parabelstruktur (ungewohnt kurze 45 Minuten) und die anschließende KI-Interaktion erforderten mehr Zeit und kognitive Ressourcen als erwartet.
Diese subjektiv wahrgenommene Herausforderung lässt sich durch aktuelle fachwissenschaftliche Beiträge stützen, wie im Abschnitt 4.2 dargestellt wird.
3.5 Chainprompting für Feedback - Die Korrektur
Während der Bewertung der Klausur nutzte ich selbst relativ spontan einen komplexen „Chain-Prompt“ (in dem unter anderem der Erwartungshorizont integriert war), um den Lernenden - mir folgerichtig erscheinend – in KI-Ko-Konstruktion erstelltes individuelles Feedback bereitzustellen. Der Prompt wurde mitsamt dem vollständigen Output im Sinne der Transparenz den Lernenden in Form eines Prompt-Protokolls gemeinsam mit dem Feedback (und dem Erwartungshorizont) ausgegeben - genau, wie sie selbst ihre Klausuren abgegeben haben.
Die Korrektur dauerte pro Klausur vergleichbar lang wie bei herkömmlichen Korrekturen, lieferte jedoch passgenaue und deutlich umfangreichere Rückmeldungen.
Alternativ wäre es möglich gewesen, speziell hierfür ausgelegte KI-Feedback-Plattformen (wie FelloFish) zu nutzen. Eine selbstständige Anforderung einer individuellen Rückmeldung zum eigenen Klausurergebnis (etwa in selbstgewählter Schwerpunktsetzung auf Grundlage des Erwartungshorizontes) würde bei diesem Vorgehen die Autonomie der Lernenden fördern und das ohnehin selbstregulierend angelegte Unterrichtsvorhaben stimmig mit einer selbstgesteuerten Phase abschließen.
4. Veränderungen, Herausforderungen und Potentiale
Mit den beschriebenen Praxiserfahrungen und Erkenntnissen aus der Klausur sowie des hinführenden Unterrichts wird deutlich, wie KI-gestützte Prüfungen in der Praxis aussehen könnten und welche unmittelbaren Fragen und Herausforderungen bei einer solch veränderten Schreib-, Aufgaben- und Prüfungskultur auftreten.
4.1 Veränderung des Schreibprozesses unter Bedingungen von Digitalität und KI
Der klassische Schreibprozess (Planen – Schreiben – Überarbeiten) wird durch die Verwendung von Sprachmodellen zu einem zunehmend interaktiven, iterativen Verfahren. So werden die verfügbaren sprachlichen und fachlichen Ressourcen erweitert (vgl. Wampfler 2023), wobei Lernende zunehmend Steuerungs- (Prompting) und Bewertungsfunktionen (kritische Evaluation) übernehmen und damit essenzielle „KI-Literacy“ entwickeln (Long & Magerko 2020).
Der Schreibprozess verändert sich durch den eingeforderten Einsatz von KI-Tools grundlegend. Neben individuellen kognitiven (Planen, Formulieren und Überarbeiten, vgl. Hayes & Flower) und sozialen Aspekten (vgl. z. B. Böttcher & Becker-Mrotzek) kommt eine technologische Ebene hinzu. Auch frühere Modelle, die den Schreibprozess und seine Teilprozesse darstellen, berücksichtigten zwar technologische Einflüsse wie Textverarbeitungsprogramme als Hilfsmittel, aber Sprachmodelle verändern den Schreibprozess auf einer tieferen Ebene: Sprachmodelle bilden neben menschlichen Fähigkeiten (s.o.) eine KI-basierte Ressource für Inhalt, Sprache und Stil und können den Aufbau von Schreibkompetenzen fördern, wenn sie bewusst für einen Teilschritt eingesetzt werden. Technologie ist somit nicht mehr nur ein Werkzeug zur Erleichterung des linearen Schreibprozesses sondern wird zum Bestandteil dieses.
In KI-gestützten Schreibprozessen agieren Schreibende in einem komplexen Zusammenspiel aus menschlichen und KI-basierten Ressourcen. Nach der Erstellung eines eigenen Textentwurfs werden wichtige aber anspruchsvolle Steuerungs- und Bewertungskompetenzen zentral: mit zielführenden Prompts (hinsichtlich selbst gewählter Beurteilungskategorien wie etwa „Sprachrichtigkeit“, „inhaltliche Relevanz“ und „funktionale Angemessenheit“ = Steuerungsfunktion) wird das Sprachmodell gezielt dirigiert. Der KI-generierte Output muss anschließend kritisch beurteilt und validiert werden (Beurteilungsfunktion), bevor die Ergebnisse (ggf. modifizierend) in die eigenen Texte integriert werden können.
Diese essenziellen Kompetenzen und das Wissen über die Funktionsweise und Grenzen von KI, werden von Long & Magerko (2020) zusammenfassend als KI-Literacy verstanden und sind unbedingt zu erwerben.
Diese Veränderungen des Schreibprozesses führt zu veränderten Anforderungen an Lernende und erfordert einen zeitgemäßen Erwerb von Schreib- und Textkompetenz.

4.2 Herausforderungen an textproduzierende Schüler*innen
Durch die Verbindung verschiedener Anforderungen auf unterschiedlichen Ebenen werden hohe metakognitive Anstrengungen benötigt:
Zum Einen auf Ebene der literarischer Textanalyse - Konkret in dem Beispiel der Klausur die Dekodierung semantischer und syntaktischer Strukturen, Identifikation interpretatorischer Leerstellen und Entwicklung eigener Deutungshypothesen, anschließende Formulierung des Analyse-Prä-Textes mit seinen spezifischen Textprozeduren.
Weiterhin eine zentrale KI-Anwendungskompetenz - So sind für eine zielführende Nutzung u.a. (in Zeiten von Reasoning-Modellen muss man sagen: noch) differenzierte Kompetenzen hinsichtlich der (Follow-up-)Prompt-Formulierung nötig.
Abschließend werden Reflexions-, Überarbeitungs- und vertiefte Schreibkompetenzen gefordert, da die Verarbeitung und kritische Evaluation generierter Deutungsvorschläge einen fortwährenden Abgleich zwischen eigenem Textverständnis und KI-Output erfordert, wobei die Veränderungen aus dem KI-Text gelöst, beurteilt und aktiv zutreffende und notwendige Hinweise ausgewählt und stimmig, semantisch und syntaktisch in den eigenen Text integriert werden müssen, um die inhaltliche Relevanz und funktionale Angemessenheit zu sichern (vgl. Brommer & Rezat)
Es ist offensichtlich, dass bei diesem (für die Lernenden noch ungewohnten) KI-gestützten Schreibprozess, hohe Anforderungen an die Schreibenden gestellt werden, die leicht zu metakognitiver Erschöpfung führen können. Wie bereits in Abschnitt 3.4 dargestellt, spiegelte sich diese hohe kognitive Belastung in der als zu knapp empfundenen Bearbeitungszeit wider.
Aktuelle Fachbeiträge, Studien sowie die Ergebnisse der Klausur zeigen, dass die Interaktion mit Sprachmodellen neue Formulierungs- und Ausdrucksvarianten erschließt, was jedoch besonders Lernende mit hoher fachlicher und sprachlicher Kompetenz profitieren lässt (vgl. u.a. Wurst 2024). Weniger geübte Schüler*innen hingegen neigen eher zu unreflektierter Übernahme und bedingt sinnvoller Einbindung in den eigenen Text, was den Aufbau von Schreibkompetenz behindern kann (vgl. Wampfler 2023). Dieses Phänomen bestätigt auch eine Meta-Studie von Deng et al. (2024), die negative Effekte wie Deskilling bzw. Automation- und Confirmation-Bias beschreibt
4.3 Das Potential von Sprachmodellen im Kontext von Schule
Gleichzeitig zeigen aktuelle Metaanalysen (u.a. ebd. & Melisa et al. (2025)), dass der zielführende und unbedingt didaktisch vorbereitete und begleitete Einsatz von Sprachmodellen Denkprozesse stimulieren und den Lernerfolg und Kompetenzerwerb fördern kann. So unterstützt das Zusammenspiel des mehrfach dargestellten kritischen Lesens, fachlicher Deutung und differenzierter KI-Nutzung dabei sowohl die Lesekompetenz – insbesondere durch eine vertiefte Textauseinandersetzung – als auch die Schreibkompetenz, da Lernende lernen, KI-generierte Vorschläge stilistisch und inhaltlich zu bewerten, anzupassen und weiterzuentwickeln.
Zudem kann der Einsatz von Sprachmodellen bei komplexen Aufgaben die mentale Belastung der Lernenden senken kann, ohne ihre Selbstwirksamkeit spürbar zu beeinträchtigen (vgl. ebd.). Dies wiederum fördert ein effizienteres Lernen und steigert sowohl die emotionale Beteiligung als auch die intrinsische Lernmotivation (vgl. Deng et al. 2024).
Diese Beobachtung bestätigte sich in der abschließenden Evaluation meines Kurses: Die Lernenden bewerteten die Klausurform und die gesammelten Erfahrungen durchweg positiv. Sie betonten hier vor allem die Steigerung des wahrgenommenen Lernerfolgs durch unmittelbares Feedback zum Textprodukt, das dadurch entstehende Sicherheitsgefühl und das Gefühl der Relevanz der Vorgehensweise („KI verstehen und damit arbeiten lernen“)
5. Fazit
Prüfungsformate, die sich rein auf Wissensreproduktion stützen, werden einer digitalisierten Lebenswelt nicht mehr gerecht. Der Einfluss von Sprachmodellen auf den Schreibprozess wurde ebenso dargestellt, wie die Möglichkeiten und curriculare, lebensweltliche und überfachliche Legitimation, KI in Lehr- und Lernprozessen einzusetzen. Die beschriebene Klausur in KI-Ko-Konstruktion und das hinführende Unterrichtsvorhaben demonstriert, wie sich textgenerierende Sprachmodelle in den Schreibprozess integrieren lassen, ohne eigenständiges Denken zu ersetzen, da Lernende komplexe Steuerungs- und Bewertungsaufgaben übernehmen.
Aufgeführte Studien und Fachbeiträge belegen zugleich das Potenzial, Motivation und Lernerfolg zu steigern, sofern Lehrkräfte passende didaktische Zugänge und Lernsituation entwickeln.
Letztlich besteht die Herausforderung für die Lehrenden darin, KI-gestützte Lern- und Prüfungssituation zu gestalten, sodass sie Fähigkeiten für die Zukunft vermitteln und zugleich die Eigenleistung der Schüler*innen im Mittelpunkt belassen. Werden diese Bedingungen erfüllt, kann KI als Sparringspartner einen zeitgemäßen Schreibprozess nachhaltig bereichern, die Lernenden technisch auf die Zukunft vorbereiten und dabei ihr eigenes Schreiben und Denken weiterentwickeln.
6. Literatur
Brommer, Sarah / Rezat, Sara (2024): Ein Modell zur Mensch-KI-Interaktion im Schreibprozess
https://www.vkkiwa.de/blog/ein-modell-zur-mensch-ki-interaktion-im-schreibprozess/
Deng, Ruiqi/Jiang, Maoli/Yu, Xinlu/Lu, Yuyan/Liu, Shasha (2024): "Does ChatGPT enhance student learning? A systematic review and meta-analysis of experimental studies." https://www.sciencedirect.com/science/article/pii/S0360131524002380
Duri Long, Brian Magerko (2020): "What is AI Literacy? Competencies and Design Considerations" https://dl.acm.org/doi/10.1145/3313831.3376727
Falck, Joscha (2024): "KI-Einsatz im Unterricht reflektieren und bewerten" https://joschafalck.de/ki-bewertung/
Hayes, John R./Linda S. Flower (1980): Identifying the organization of writing processes. In: Lee W. Gregg/Erwin Steinberg (Hg.): Cognitive processes in writing. Hillsdale, 3–30.
Rahyuni Melisa , Ashadi Ashadi , Anita Triastuti , Sari Hidayati , Achmad Salido , Priska Efriani Luansi Ero , Cut Marlini , Zefrin Zefrin , Zaki Al Fuad (2025): "Critical Thinking in the Age of AI: A Systematic Review of AI's Effects on Higher Education" https://www.edupij.com/index/arsiv/74/396/critical-thinking-in-the-age-of-ai-a-systematic-review-of-ais-effects-on-higher-education
Wampfler, Philipp (2024): "KI im Schreibunterricht: Creative Writing Prompts" https://schulesocialmedia.com/2023/09/27/ki-im-schreibunterricht-creative-writing-prompts/
Wurst, Alexander (2024): Gemeinsam zum eigenen Text: Ein Phasenmodell zum KI-unterstützten Schreiben ab Jahrgangsstufe 9. In: Der Deutschunterricht 5/2024: KI im Deutschunterricht . Friedrich.
Kultusministerkonferenz (2024): „Handlungsempfehlungen zur Nutzung Künstlicher Intelligenz in Schule und Unterricht“
Über den Autor

Timm Wiegmann unterrichtet Deutsch und Kunst am Nicolaus Cusanus Gymnasium in Bergisch Gladbach. Seit seinem Berufseinstieg beschäftigt er sich intensiv mit Lehren und Lernen unter den Bedingungen der Digitalität. Zudem beschäftigt er sich mit der Frage nach zukunftsfähigen Prüfungsformaten und einer zeitgemäßen Gestaltung von Leistungsbewertung. Wenige Tage nach dem Public Release von ChatGPT hat er begonnen, die vielfältigen Einsatzmöglichkeiten von Künstlichen Intelligenz im Kontext Schule zu untersuchen und erproben. In diesem Bereich hat er bereits mehrere Fortbildungen durchgeführt und setzt sich für eine sinnvolle Integration von KI in Unterricht und Schulentwicklung ein.