von Ulrich Wackerbarth
Ende letzter Woche berichtete die FAZ über eine empirische Studie von Towfigh/Traxler/Glöckner mit dem Titel „Geschlechts- und Herkunftseffekte bei der Benotung juristischer Staatsprüfungen“, an der u.a. mein Kollege an der Fernuniversität Andreas Glöckner beteiligt war. Die Studie, die in der ZDRW 2018, 111 veröffentlicht ist, wurde mit Mitteln des Landes NRW und mit Informationen des Justizministeriums über die Einzelbenotung unterstützt. Den Wissenschaftlern waren in einer Vorgängerstudie (ZDRW 2014, 8) über Lernfortschritt bereits im Jahr 2013 bzw. 2014 Notenunterschiede „aufgefallen“, die sie nach eigenem Bekunden zu einer intensiveren Untersuchung veranlassten. Ich selbst habe von der Studie am letzten Donnerstag aus der Zeitung erfahren.
Von den vielen Punkten, in denen die Untersuchung angreifbar ist, greife ich mir hier – ganz willkürlich – einige heraus, die nur die Geschlechtseffekte betreffen.
1. Voreingenommenheit der Prüfer wegen der Vornoten?
Großen Wert legen die Autoren auf die von ihnen beobachtete „Diskontinuität der Notenverteilung“ rund um die entscheidenden Notenstufen, also auf die Tatsache, dass die Gesamtnote fast nie eine 8,9 (ab 9,0 ist das vollbefriedigend erreicht) oder 6,4 (ab 6,5 ist befriedigend) ist. Die Prüfungskommission lässt einen Kandidaten(***) vielmehr entweder klar scheitern oder hebt ihn auf die nächste Notenstufe; im Nichterreichen der Notenschwelle liegt also ein eigenständiges Signal. Die Autoren tun so, als sei das Willkür der Prüfungskommission (ZDRW 2018, 140).
„Dieses Signal ist indessen nicht frei von Willkür, es hängt in hohem Maße von der konkreten Zusammensetzung der Prüfungskommission ab und enthält ein starkes dezisionistisches Element:“
Zunächst: jede Beurteilung durch Prüfer enthält naturgemäß ein starkes dezisionistisches Element, jede Beurteilung hängt von der Zusammensetzung der Prüfungskommission ab. Vor allem aber: Willkür liegt schon deshalb nicht vor, weil das Vorgehen der Prüfer gesetzlich geboten ist, was die Autoren vergessen zu erwähnen. § 18 Abs. 4 JAG NRW lautet nämlich:
„Der Prüfungsausschuss kann bei der Entscheidung über das Ergebnis der staatlichen Pflichtfachprüfung von dem rechnerisch ermittelten Wert für die Gesamtnote um bis zu einem Punkt abweichen, wenn dies auf Grund des Gesamteindrucks den Leistungsstand des Prüflings besser kennzeichnet und die Abweichung auf das Bestehen keinen Einfluss hat.“
Nur damit das nicht mißverstanden wird: „kann … abweichen“ heißt nicht, die Prüfer könnten machen, was sie wollen. Vielmehr müssen sie in jedem Einzelfall ihr Ermessen ausüben und sich Gedanken darüber machen, ob die in aller Regel bessere mündliche Leistung des Kandidaten (selbst diese Tatsache ist übrigens erklärlich, da Mißverständnisse – anders als bei den Klausuren – durch Nachfrage aufgeklärt werden können) seinen Leistungsstand besser kennzeichnet. Dies und nicht eine „strategische Generosität“ erklärt die Häufung der Noten oberhalb der Schwellenwerte.
Ob man das anders machen sollte, wie Towfigh/Traxler/Glöckner wünschen, oder überhaupt kann, bleibt zweifelhaft. Denn an einem persönlichen Eindruck und einer damit stets verbundenen Subjektivität der Bewertung kommt man nie vorbei, wenn man nicht die mündlichen Prüfung ganz abschafft. In jedem Fall aber gilt: Was hat eine angebliche Voreingenommenheit gegenüber dem Kandidaten wegen seiner Vornote mit der Diskriminierung von Frauen und Ausländern zu tun? Richtig: Nichts!
2. Hinweise, die gegen Diskriminierung von Frauen sprechen
a) Kontrolle nach dem Abischnitt?
Die Autoren versuchen, eine gefundene durchschnittliche Besserstellung von Frauen zu einer Schlechterbehandlung zu machen, indem sie den Abiturnotendurchschnitt als Ausgangspunkt nehmen. Siehe ZDRW 2018, 122 f.: im universitären Teil der Ersten Prüfung schneiden Frauen marginal besser ab als Männer, nicht aber wenn man nur diejenigen mit gleichem Abiturdurchschnitt betrachtet. Nach der Abinote zu kontrollieren, erscheint jedoch nicht naheliegend. Das Abitur misst nämlich selbst keine spezifisch juristischen Fähigkeiten.
b) Prädikatswahrscheinlichkeit bei gleicher Note im ersten Examen
Für die spätere berufliche Entwicklung hat es besondere Bedeutung, ein Prädikatsexamen zu erzielen. Das betonen auch die Autoren der Studie gleich am Anfang (ZDRW 2018, 115). Für Frauen, die unter gleichen Voraussetzungen wie Männer starten (die also die gleiche Note im ersten Staatsexamen erzielt haben), ergibt sich insoweit lediglich eine um 1% geringere Wahrscheinlichkeit, ein solches „vollbefriedigend“ im zweiten Examen zu erreichen und diese geringe Abweichung ist zudem nicht signifikant (ZDRW 2018, 135 f. mit Tabelle 11 Modell 3). Im Text der Studie wird diese Tatsache freilich eher verdeckt als hervorgehoben. Lieber wird der Geschlechtsunterschied auf das Erste Examen geschoben, während es doch eher naheliegt, dass jedenfalls im zweiten Examen Frauen, die mit gleichen Voraussetzungen gestartet sind, keine Nachteile erleiden.
c) Weniger Frauen als Männer fallen nach der mündlichen Prüfung im ersten Examen durch
Wenn man im Rahmen einer empirischen Studie gezielt u.a. die Frage der Diskriminierung wegen des Geschlechts untersucht, so sollte man wenigstens auch einen Blick auf die amtlichen Statistiken werfen.
Dabei hätte z.B. auffallen können, dass in der mündlichen Prüfung im ersten Examen statistisch im Schnitt weniger Frauen als Männer so schlecht benotet werden, dass sie die Prüfung insgesamt nicht bestehen. M.a.W.: es findet statistisch betrachtet in der mündlichen Prüfung eher eine Besserstellung der weiblichen Prüflinge statt und nicht eine Schlechterbehandlung, jedenfalls was das Bestehen angeht! Fakten, die in der Untersuchung aber nicht auftauchen.
3. Weitere Fakten und alternative Erklärungsansätze
Es ist außerdem auffällig, und auch darüber erfährt man nichts in der Studie, dass in NRW mittlerweile 58% Frauen und 42 % Männer sich zur staatlichen Pflichtfachprüfung melden (2016), das ist seit Jahren relativ konstant (überprüft bis 2012). Ebenfalls seit Jahren fallen nur aufgrund der diskriminierungsunverdächtigen Klausuren 8% mehr Frauen endgültig durch die Pflichtfachprüfung (im Schnitt haben 34 % der Frauen vs. nur 26 % der Männer nach den Klausuren einen sog. Block). Beides, die hohe Zahl der weiblichen Prüflinge und die hohe Blockquote nach den Klausuren verlangt nach Erklärungen, die die Verfasser der Studie nicht anbieten.
Ganz anders haben hingegen Hinz und Röhl bereits im Jahr 2016 (JZ 2016, 874, 879) hier verschiedene Erklärungsangebote gemacht, die Towfigh, Traxler und Glöckner pauschal als „strukturelle Diskriminierung“ abtun (ZDRW 2018, 117 vor Fn. 6). Mir hingegen erscheinen die von Hinz/Röhl dargestellten Ansätze sehr wohl relevant und sie haben m.E. überhaupt nichts mit Diskriminierung zu tun:
Ein solcher Erklärungsansatz könnte etwa ein nach Geschlecht unterschiedliches Abbruchverhalten der Studenten sein. Wenn Frauen bei gleicher Leistung eine geringere Rate des Studienabbruchs als Männer hätten, wäre die Analyse der Abschlussprüfungen durch Selektivität beeinflusst. Dazu passt etwa die eben erwähnte Tatsache, dass in NRW im Ersten Examen weit mehr Frauen an den Prüfungen beteiligt sind als Männer.
Ganz ohne diskriminiert zu werden, könnten mehr Frauen als Männer in den Rechtswissenschaften das für sie passende Studium erblicken. Vielleicht entscheiden sich demzufolge angesichts der heute zweifelhaften Berufsaussichten nur noch solche Männer für das Studium, die dieses dann besonders zielstrebig verfolgen. Dann wäre es kein Wunder, wenn sie hinterher auch (durchschnittlich) besser abschneiden, vgl. zu ähnlichen Ansätzen auch Hinz/Röhl, aaO S. 879.
Hinz und Röhl haben weiter gezeigt, dass Frauen unterdurchschnittlich oft einen wirtschaftsrechtlichen Schwerpunktbereich für den universitären Teil des ersten Examens wählen (Vgl. aaO S. 878). Ich weiß aus eigener Erfahrung, dass gerade im zivilrechtlichen Teil der mündlichen Prüfung besonderer Wert auf gesunden Menschenverstand und Mitdenken gelegt wird. Dort hilft ein wirtschaftliches Grundverständnis bzw. -interesse bei der Lösung der Fragen und davon profitieren vermutlich diejenigen, die hier ohnehin für sich einen Schwerpunkt gesetzt haben. Auch dies hat weder mit struktureller noch mit individueller Diskriminierung etwas zu tun.
4. Eine Studie mit Vorverständnis?
a) Handschrifterkennung durch die Korrektoren?
Nicht nachvollziehbar ist es für mich, wenn die Autoren unterstellen, dass ggf. die Handschrift für schlechtere Klausurbenotung verantwortlich ist (ZDRW 2018, 117 mit Fn. 6). Die Autoren legen nahe (ohne es freilich ausdrücklich zu behaupten), dass (manche) Korrektoren anhand der Handschrift erraten, dass die anonyme Klausur von einer Frau geschrieben wurde, um sodann (bewusst oder unbewusst) weniger Punkte zu vergeben. Mit einer solchen Annahme ist es dann aber nachgerade unvereinbar, dass die Klausuren von Frauen, die zum zweiten Staatsexamen mit gleicher Vornote aus der Ersten Prüfung wie die Männer starten, gerade nicht signifikant schlechter sind als die der zum Vergleich herangezogenen Männer (siehe ZDRW 2018, 124). Ich persönlich halte die Korrektur anonymisierter Klausuren mit Hinz und Röhl (JZ 2016, 879) für diskriminierungsunverdächtig.
b) Das segensreiche Wirken von Frauen in der Kommission
Sinnvoll ist es freilich, die Ergebnisse der mündlichen Prüfung nach den schriftlichen Vornoten zu kontrollieren. Da auch danach ein Unterschied in den erreichten mündlichen Noten verbleibt, spricht das zunächst einmal dafür, dass tatsächlich Frauen in der mündlichen Prüfung — statistisch betrachtet –schlechter abschneiden als Männer. Hier finden Towfigh, Traxler und Glöckner im Gegensatz zu Hinz und Röhl durchaus statistisch signifikant schlechtere Ergebnisse für Frauen, und zwar sowohl im ersten wie auch im zweiten Examen. Obwohl sie jedoch über Gründe dafür nur spekulieren können, wie sie selbst zugeben (Korrelationen, nicht Kausalitäten, ZDRW 2018, 139, s.a. 117), freuen sie sich, dass bereits eine Frau in der Kommission derartige Unterschiede zum Wegfall bringt.
„Dieser Geschlechterunterschied verschwindet jedoch, wenn mindestens eine Frau Teil der Prüfungskommission in der mündlichen Prüfung ist. Die Zusammensetzung der Kommission hat damit einen ausgleichenden Effekt auf das Erreichen der nächsten Noten-Stufe. Der Effekt ist jedoch lokal, d.h. auf die mündliche Note rund um die jeweiligen Schwellenwerte begrenzt; auf die Geschlechtsunterschiede in der durchschnittlichen Gesamtnote hat die Zusammensetzung der Kommission der mündlichen Prüfung keinen statistisch signifikanten Effekt.“
Es mag ja sein, dass die Anwesenheit einer Frau für den Wegfall des schlechteren Ergebnisses sorgt. Aber woher wollen Towfigh/Traxler/Glöckner wissen, dass hier nicht die beiden Männer in der Prüfung aus Angst, als Chauvinisten zu gelten, die ungerechtfertigte positive Diskriminierung durch die Prüferin einfach mitmachen? Dass sie einfach nicht widersprechen, wenn diese aus falsch verstandener Rücksichtnahme ihre Geschlechtsgenossin bevorzugt, und zwar genau dann, wenn es um die Wurst geht?
Auf S. 118 f. sagen Towfigh/Traxler/Glöckner selbst, dass – wie eine frz. Studie ergeben hat – Prüfer manchmal
„unbewusst und wohl vor allem bei der Benotung in mündlichen Prüfungen — von ihnen wahrgenommene Nachteile auszugleichen versuchen“.
Eine solche Erklärung kommt den Verf. der Studie dann aber nicht mehr in den Sinn, wenn es darum geht, die angeblich ausgleichende Wirkung einer Frau in der Prüfungskommission zu bewerten. Diese wird einfach vorbehaltlos begrüßt (ZDRW 2018, 141).
„So sollten die positiven Auswirkungen von Prüferinnen in Prüfungskommissionen zum Anlass genommen werden, ihren Einsatz in verstärktem Maße anzustreben“
5. Fazit.
Ich will gar nicht ausschließen, dass es Prüfer mit Vorurteilen gegenüber Frauen oder Personen mit Migrationshintergrund gibt oder manchmal auch eine unbewusste Diskriminierung stattfindet. Aber welchen Sinn eine solche Studie hat, die Fakten verschweigt und keinerlei Erklärungsansätze liefert (außer individuelle oder strukturelle Diskriminierung), das erschließt sich mir nicht. Im Übrigen möchte ich klarstellen, dass ich die verstärkte Beteiligung von Frauen in den Prüfungskommissionen sehr begrüße, aber aus anderen Gründen als die Verfasser dieser Studie: Es kann nicht sein, dass fast 60 % der Prüflinge Frauen sind, aber noch immer die Männer überwiegend die Prüfungsarbeit machen!
***
(Die Verwendung des generischen Maskulinums erfolgt in voller Absicht. Der verzweifelte Versuch der Gender-Umerzieher, die meinen, tatsächliche Diskriminierung durch totalitäre Sprachregulierung abschaffen zu können, kommt u.a. in der für viel Geld produzierten Broschüre: „Gender in der Lehre und Gender-Kompetenz“ der Fernuniversität zum Ausdruck. Viel Spaß beim Lesen von S. 89, wo mir als Juraprofessor verboten wird, „Hausfrauen und Bardamen“ in einen Fall einzubinden (was ich noch nie getan habe). Das ganze Elend der Broschüre wird auch auf S. 9 deutlich, wo in einer Fußnote das „Geschlecht“ definiert wird:
„Wenn wir in dieser Broschüre von Geschlecht sprechen, dann gehen wir davon aus, dass Geschlecht eine soziale Konstruktion ist. Die soziale Konstruktion von Geschlecht in unserer Gesellschaft geht davon aus, dass wir in einer zweigeschlechtlichen Gesellschaft (Heteronormativität) leben. […] Von dieser zweigeschlechtlichen/ heteronormativen Konstruktion von Geschlecht möchten wir uns bewusst abgrenzen. Wir gehen hingegen davon aus, dass Geschlechtsidentitäten vielfältig sind (vgl. Oakley, 1972 und Frey, 2003). […]“
Ja, wovon wird denn nun ausgegangen? Von einer sozialen Konstruktion oder von „vielfältigen Geschlechtsidentitäten“? Beides kann ja wohl nicht sein („hingegen“). Und ist die Annahme „vielfältiger Geschlechtsidentitäten“ nicht selbst eine soziale Konstruktion? Ich jedenfalls gehe zwar auch von vielfältigen Geschlechtsidentitäten aus. Damit würde unsere deutsche Sprache in Zukunft aber weitere Artikel neben „der“ und „die“ und neue Wortendungen erfinden müssen, um diese vielfältigen Identitäten sprachlich abzubilden. Ich bin der dezidierten Auffassung, dass unsere Sprache und insbesondere Rechtstexte nicht noch mehr durch gendergerechte Sprachungetüme verunstaltet werden dürfen. Die konsequente Verwendung des generischen Maskulinums stellt die einzig akzeptable Lösung des Gender-Mainstreaming-Problems dar.)