Diskriminierung im Staatsexamen? oder: „Glaube keiner Statistik, die Du nicht selbst gefälscht hast“

von Ulrich Wackerbarth

Ende letzter Woche berichtete die FAZ über eine empirische Studie von Towfigh/Traxler/Glöckner mit dem Titel „Geschlechts- und Herkunftseffekte bei der Benotung juristischer Staatsprüfungen“, an der u.a. mein Kollege an der Fernuniversität Andreas Glöckner beteiligt war. Die Studie, die in der ZDRW 2018, 111 veröffentlicht ist, wurde mit Mitteln des Landes NRW und mit Informationen des Justizministeriums über die Einzelbenotung unterstützt. Den Wissenschaftlern waren in einer Vorgängerstudie (ZDRW 2014, 8) über Lernfortschritt bereits im Jahr 2013 bzw. 2014 Notenunterschiede „aufgefallen“, die sie nach eigenem Bekunden zu einer intensiveren Untersuchung veranlassten. Ich selbst habe von der Studie am letzten Donnerstag aus der Zeitung erfahren.

Von den vielen Punkten, in denen die Untersuchung angreifbar ist, greife ich mir hier – ganz willkürlich – einige heraus, die nur die Geschlechtseffekte betreffen.

1. Voreingenommenheit der Prüfer wegen der Vornoten?

 

Großen Wert legen die Autoren auf die von ihnen beobachtete „Diskontinuität der Notenverteilung“ rund um die entscheidenden Notenstufen, also auf die Tatsache, dass die Gesamtnote fast nie eine 8,9 (ab 9,0 ist das vollbefriedigend erreicht) oder 6,4 (ab 6,5 ist befriedigend) ist. Die Prüfungskommission lässt einen Kandidaten(***) vielmehr entweder klar scheitern oder hebt ihn auf die nächste Notenstufe; im Nichterreichen der Notenschwelle liegt also ein eigenständiges Signal. Die Autoren tun so, als sei das Willkür der Prüfungskommission (ZDRW 2018, 140).

„Dieses Signal ist indessen nicht frei von Willkür, es hängt in hohem Maße von der konkreten Zusammensetzung der Prüfungskommission ab und enthält ein starkes dezisionistisches Element:“

Zunächst: jede Beurteilung durch Prüfer enthält naturgemäß ein starkes dezisionistisches Element, jede Beurteilung hängt von der Zusammensetzung der Prüfungskommission ab. Vor allem aber: Willkür liegt schon deshalb nicht vor, weil das Vorgehen der Prüfer gesetzlich geboten ist, was die Autoren vergessen zu erwähnen. § 18 Abs. 4 JAG NRW lautet nämlich:

„Der Prüfungsausschuss kann bei der Entscheidung über das Ergebnis der staatlichen Pflichtfachprüfung von dem rechnerisch ermittelten Wert für die Gesamtnote um bis zu einem Punkt abweichen, wenn dies auf Grund des Gesamteindrucks den Leistungsstand des Prüflings besser kennzeichnet und die Abweichung auf das Bestehen keinen Einfluss hat.“

Nur damit das nicht mißverstanden wird: „kann … abweichen“ heißt nicht, die Prüfer könnten machen, was sie wollen. Vielmehr müssen sie in jedem Einzelfall ihr Ermessen ausüben und sich Gedanken darüber machen, ob die in aller Regel bessere mündliche Leistung des Kandidaten (selbst diese Tatsache ist übrigens erklärlich, da Mißverständnisse – anders als bei den Klausuren – durch Nachfrage aufgeklärt werden können) seinen Leistungsstand besser kennzeichnet. Dies und nicht eine „strategische Generosität“ erklärt die Häufung der Noten oberhalb der Schwellenwerte.

Ob man das anders machen sollte, wie Towfigh/Traxler/Glöckner wünschen, oder überhaupt kann, bleibt zweifelhaft. Denn an einem persönlichen Eindruck und einer damit stets verbundenen Subjektivität der Bewertung kommt man nie vorbei, wenn man nicht die mündlichen Prüfung ganz abschafft. In jedem Fall aber gilt: Was hat eine angebliche Voreingenommenheit gegenüber dem Kandidaten wegen seiner Vornote mit der Diskriminierung von Frauen und Ausländern zu tun? Richtig: Nichts!

 

2. Hinweise, die gegen Diskriminierung von Frauen sprechen

 

a) Kontrolle nach dem Abischnitt?

Die Autoren versuchen, eine gefundene durchschnittliche Besserstellung von Frauen zu einer Schlechterbehandlung zu machen, indem sie den Abiturnotendurchschnitt als Ausgangspunkt nehmen. Siehe ZDRW 2018, 122 f.: im universitären Teil der Ersten Prüfung schneiden Frauen marginal besser ab als Männer, nicht aber wenn man nur diejenigen mit gleichem Abiturdurchschnitt betrachtet. Nach der Abinote zu kontrollieren, erscheint jedoch nicht naheliegend. Das Abitur misst nämlich selbst keine spezifisch juristischen Fähigkeiten.

b) Prädikatswahrscheinlichkeit bei gleicher Note im ersten Examen

Für die spätere berufliche Entwicklung hat es besondere Bedeutung, ein Prädikatsexamen zu erzielen. Das betonen auch die Autoren der Studie gleich am Anfang (ZDRW 2018, 115). Für Frauen, die unter gleichen Voraussetzungen wie Männer starten (die also die gleiche Note im ersten Staatsexamen erzielt haben), ergibt sich insoweit lediglich eine um 1% geringere Wahrscheinlichkeit, ein solches „vollbefriedigend“ im zweiten Examen zu erreichen und diese geringe Abweichung ist zudem nicht signifikant (ZDRW 2018, 135 f. mit Tabelle 11 Modell 3). Im Text der Studie wird diese Tatsache freilich eher verdeckt als hervorgehoben. Lieber wird der Geschlechtsunterschied auf das Erste Examen geschoben, während es doch eher naheliegt, dass jedenfalls im zweiten Examen Frauen, die mit gleichen Voraussetzungen gestartet sind, keine Nachteile erleiden.

c) Weniger Frauen als Männer fallen nach der mündlichen Prüfung im ersten Examen durch

Wenn man im Rahmen einer empirischen Studie gezielt u.a. die Frage der Diskriminierung wegen des Geschlechts untersucht, so sollte man wenigstens auch einen Blick auf die amtlichen Statistiken werfen.

Dabei hätte z.B. auffallen können, dass in der mündlichen Prüfung im ersten Examen statistisch im Schnitt weniger Frauen als Männer so schlecht benotet werden, dass sie die Prüfung insgesamt nicht bestehen. M.a.W.: es findet statistisch betrachtet in der mündlichen Prüfung eher eine Besserstellung der weiblichen Prüflinge statt und nicht eine Schlechterbehandlung, jedenfalls was das Bestehen angeht! Fakten, die in der Untersuchung aber nicht auftauchen.

 

3. Weitere Fakten und alternative Erklärungsansätze

 

Es ist außerdem auffällig, und auch darüber erfährt man nichts in der Studie, dass in NRW mittlerweile 58% Frauen und 42 % Männer sich zur staatlichen Pflichtfachprüfung melden (2016), das ist seit Jahren relativ konstant (überprüft bis 2012). Ebenfalls seit Jahren fallen nur aufgrund der diskriminierungsunverdächtigen Klausuren 8% mehr Frauen endgültig durch die Pflichtfachprüfung (im Schnitt haben 34 % der Frauen vs. nur 26 % der Männer nach den Klausuren einen sog. Block). Beides, die hohe Zahl der weiblichen Prüflinge und die hohe Blockquote nach den Klausuren verlangt nach Erklärungen, die die Verfasser der Studie nicht anbieten.

Ganz anders haben hingegen Hinz und Röhl bereits im Jahr 2016 (JZ 2016, 874, 879) hier verschiedene Erklärungsangebote gemacht, die Towfigh, Traxler und Glöckner pauschal als „strukturelle Diskriminierung“ abtun (ZDRW 2018, 117 vor Fn. 6). Mir hingegen erscheinen die von Hinz/Röhl dargestellten Ansätze sehr wohl relevant und sie haben m.E. überhaupt nichts mit Diskriminierung zu tun:

Ein solcher Erklärungsansatz könnte etwa ein nach Geschlecht unterschiedliches Abbruchverhalten der Studenten sein. Wenn Frauen bei gleicher Leistung eine geringere Rate des Studienabbruchs als Männer hätten, wäre die Analyse der Abschlussprüfungen durch Selektivität beeinflusst. Dazu passt etwa die eben erwähnte Tatsache, dass in NRW im Ersten Examen weit mehr Frauen an den Prüfungen beteiligt sind als Männer.

Ganz ohne diskriminiert zu werden, könnten mehr Frauen als Männer in den Rechtswissenschaften das für sie passende Studium erblicken. Vielleicht entscheiden sich demzufolge angesichts der heute zweifelhaften Berufsaussichten nur noch solche Männer für das Studium, die dieses dann besonders zielstrebig verfolgen. Dann wäre es kein Wunder, wenn sie hinterher auch (durchschnittlich) besser abschneiden, vgl. zu ähnlichen Ansätzen auch Hinz/Röhl, aaO S. 879.

Hinz und Röhl haben weiter gezeigt, dass Frauen unterdurchschnittlich oft einen wirtschaftsrechtlichen Schwerpunktbereich für den universitären Teil des ersten Examens wählen (Vgl. aaO S. 878). Ich weiß aus eigener Erfahrung, dass gerade im zivilrechtlichen Teil der mündlichen Prüfung besonderer Wert auf gesunden Menschenverstand und Mitdenken gelegt wird. Dort hilft ein wirtschaftliches Grundverständnis bzw. -interesse bei der Lösung der Fragen und davon profitieren vermutlich diejenigen, die hier ohnehin für sich einen Schwerpunkt gesetzt haben. Auch dies hat weder mit struktureller noch mit individueller Diskriminierung etwas zu tun.

 

4. Eine Studie mit Vorverständnis?

 

a) Handschrifterkennung durch die Korrektoren?

Nicht nachvollziehbar ist es für mich, wenn die Autoren unterstellen, dass ggf. die Handschrift für schlechtere Klausurbenotung verantwortlich ist (ZDRW 2018, 117 mit Fn. 6). Die Autoren legen nahe (ohne es freilich ausdrücklich zu behaupten), dass (manche) Korrektoren anhand der Handschrift erraten, dass die anonyme Klausur von einer Frau geschrieben wurde, um sodann (bewusst oder unbewusst) weniger Punkte zu vergeben. Mit einer solchen Annahme ist es dann aber nachgerade unvereinbar, dass die Klausuren von Frauen, die zum zweiten Staatsexamen mit gleicher Vornote aus der Ersten Prüfung wie die Männer starten, gerade nicht signifikant schlechter sind als die der zum Vergleich herangezogenen Männer (siehe ZDRW 2018, 124). Ich persönlich halte die Korrektur anonymisierter Klausuren mit Hinz und Röhl (JZ 2016, 879) für diskriminierungsunverdächtig.

 

b) Das segensreiche Wirken von Frauen in der Kommission

Sinnvoll ist es freilich, die Ergebnisse der mündlichen Prüfung nach den schriftlichen Vornoten zu kontrollieren. Da auch danach ein Unterschied in den erreichten mündlichen Noten verbleibt, spricht das zunächst einmal dafür, dass tatsächlich Frauen in der mündlichen Prüfung — statistisch betrachtet –schlechter abschneiden als Männer. Hier finden Towfigh, Traxler und Glöckner im Gegensatz zu Hinz und Röhl durchaus statistisch signifikant schlechtere Ergebnisse für Frauen, und zwar sowohl im ersten wie auch im zweiten Examen. Obwohl sie jedoch über Gründe dafür nur spekulieren können, wie sie selbst zugeben (Korrelationen, nicht Kausalitäten, ZDRW 2018, 139, s.a. 117), freuen sie sich, dass bereits eine Frau in der Kommission derartige Unterschiede zum Wegfall bringt.

„Dieser Geschlechterunterschied verschwindet jedoch, wenn mindestens eine Frau Teil der Prüfungskommission in der mündlichen Prüfung ist. Die Zusammensetzung der Kommission hat damit einen ausgleichenden Effekt auf das Erreichen der nächsten Noten-Stufe. Der Effekt ist jedoch lokal, d.h. auf die mündliche Note rund um die jeweiligen Schwellenwerte begrenzt; auf die Geschlechtsunterschiede in der durchschnittlichen Gesamtnote hat die Zusammensetzung der Kommission der mündlichen Prüfung keinen statistisch signifikanten Effekt.“

Es mag ja sein, dass die Anwesenheit einer Frau für den Wegfall des schlechteren Ergebnisses sorgt. Aber woher wollen Towfigh/Traxler/Glöckner wissen, dass hier nicht die beiden Männer in der Prüfung aus Angst, als Chauvinisten zu gelten, die ungerechtfertigte positive Diskriminierung durch die Prüferin einfach mitmachen? Dass sie einfach nicht widersprechen, wenn diese aus falsch verstandener Rücksichtnahme ihre Geschlechtsgenossin bevorzugt, und zwar genau dann, wenn es um die Wurst geht?

Auf S. 118 f. sagen Towfigh/Traxler/Glöckner selbst, dass – wie eine frz. Studie ergeben hat – Prüfer manchmal

„unbewusst und wohl vor allem bei der Benotung in mündlichen Prüfungen — von ihnen wahrgenommene Nachteile auszugleichen versuchen“.

Eine solche Erklärung kommt den Verf. der Studie dann aber nicht mehr in den Sinn, wenn es darum geht, die angeblich ausgleichende Wirkung einer Frau in der Prüfungskommission zu bewerten. Diese wird einfach vorbehaltlos begrüßt (ZDRW 2018, 141).

„So sollten die positiven Auswirkungen von Prüferinnen in Prüfungskommissionen zum Anlass genommen werden, ihren Einsatz in verstärktem Maße anzustreben“

 

5. Fazit.

Ich will gar nicht ausschließen, dass es Prüfer mit Vorurteilen gegenüber Frauen oder Personen mit Migrationshintergrund gibt oder manchmal auch eine unbewusste Diskriminierung stattfindet. Aber welchen Sinn eine solche Studie hat, die Fakten verschweigt und keinerlei Erklärungsansätze liefert (außer individuelle oder strukturelle Diskriminierung), das erschließt sich mir nicht. Im Übrigen möchte ich klarstellen, dass ich die verstärkte Beteiligung von Frauen in den Prüfungskommissionen sehr begrüße, aber aus anderen Gründen als die Verfasser dieser Studie: Es kann nicht sein, dass fast 60 % der Prüflinge Frauen sind, aber noch immer die Männer überwiegend die Prüfungsarbeit machen!

 

 

 

***

(Die Verwendung des generischen Maskulinums erfolgt in voller Absicht. Der verzweifelte Versuch der Gender-Umerzieher, die meinen, tatsächliche Diskriminierung durch totalitäre Sprachregulierung abschaffen zu können, kommt u.a. in der für viel Geld produzierten Broschüre: „Gender in der Lehre und Gender-Kompetenz“ der Fernuniversität zum Ausdruck. Viel Spaß beim Lesen von S. 89, wo mir als Juraprofessor verboten wird, „Hausfrauen und Bardamen“ in einen Fall einzubinden (was ich noch nie getan habe). Das ganze Elend der Broschüre wird auch auf S. 9 deutlich, wo in einer Fußnote das „Geschlecht“ definiert wird:

„Wenn wir in dieser Broschüre von Geschlecht sprechen, dann gehen wir davon aus, dass Geschlecht eine soziale Konstruktion ist. Die soziale Konstruktion von Geschlecht in unserer Gesellschaft geht davon aus, dass wir in einer zweigeschlechtlichen Gesellschaft (Heteronormativität) leben. […] Von dieser zweigeschlechtlichen/ heteronormativen Konstruktion von Geschlecht möchten wir uns bewusst abgrenzen. Wir gehen hingegen davon aus, dass Geschlechtsidentitäten vielfältig sind (vgl. Oakley, 1972 und Frey, 2003). […]“

Ja, wovon wird denn nun ausgegangen? Von einer sozialen Konstruktion oder von „vielfältigen Geschlechtsidentitäten“? Beides kann ja wohl nicht sein („hingegen“). Und ist die Annahme „vielfältiger Geschlechtsidentitäten“ nicht selbst eine soziale Konstruktion? Ich jedenfalls gehe zwar auch von vielfältigen Geschlechtsidentitäten aus. Damit würde unsere deutsche Sprache in Zukunft aber weitere Artikel neben „der“ und „die“ und neue Wortendungen erfinden müssen, um diese vielfältigen Identitäten sprachlich abzubilden. Ich bin der dezidierten Auffassung, dass unsere Sprache und insbesondere Rechtstexte nicht noch mehr durch gendergerechte Sprachungetüme verunstaltet werden dürfen. Die konsequente Verwendung des generischen Maskulinums stellt die einzig akzeptable Lösung des Gender-Mainstreaming-Problems dar.)

 

 

 

 

 

 

 

 

 

4 Reaktionen zu “Diskriminierung im Staatsexamen? oder: „Glaube keiner Statistik, die Du nicht selbst gefälscht hast“”

  1. Prof. Dr. Andreas Glöckner

    Herr Kollege Wackerbarth greift die Ergebnisse unserer oben zitierten Studien zu Unterschieden in der Benotung in den juristischen Staatsexamen in seinem Blog auf. Diese Studien wurden in einem unabhängigen interdisziplinären Projekt im Auftrag des Justizministeriums NRW unter Berücksichtigung der methodischen Standards der Psychologie, Ökonomie und der empirischen Analyse des Rechts durchgeführt.

    Kollege Wackerbarth hinterfragt bereits im Titel die generelle Nützlichkeit empirischer Daten und Analysen für den Erkenntnisfortschritt. Im Mittelteil greift er einige Punkte aus unseren Ergebnissen relativ unsystematisch heraus, spekuliert ohne empirische Basis über mögliche Erklärungsansätze und fragt sich in der Konklusion, „welchen Sinn eine solche Studie hat, die Fakten verschweigt und keinerlei Erklärungsansätze liefert (außer individuelle oder strukturelle Diskriminierung)…“

    Jeder Disziplin hat ihre eigene Methodik. In den von den Autoren der Studie vertretenen Bereichen der Psychologie, der Ökonomie und der empirischen Analyse des Rechts wird die von Kollegen Wackerbarth hier vertretene postfaktische Haltung überwiegend abgelehnt. Üblicherweise geht man davon aus, dass man sich auf nach aktuellem Stand der Wissenschaft generierte Analysen verlassen kann und das Zahlen nicht beliebig und beliebig interpretierbar sind.

    Den vor diesem Hintergrund massiven Vorwurf, dass wir Fakten verschweigen würden, untermauert Herr Kollege Wackerbarth nicht substantiell. Wir liefern neben einer Kurzzusammenfassung und den erwähnten Artikeln in ZDRW einen kompletten Bericht aller Analyse (62 Seiten) u.a. verfügbar auf folgender Webseite:
    https://www.hertie-school.org/de/news/detail/content/study-women-awarded-lower-scores-than-men-on-state-law-exams/

    Jeder Leser kann sich gerne selbst ein Bild machen, ob u.U. noch weitere Analysen sinnvoll gewesen wären. Den Vorwurf, dass wir Fakten verschweigen kann ich aber nur massiv zurückweisen. Wenn Kollege Wackerbarth (W) Analysen anders interpretieren möchte, steht ihm dies natürlich frei und gerne gehe ich im Folgenden auf seine diesbezüglichen Argumente ein.

    (zu W1): Notenhebungen sind prinzipiell kein Problem, wenn Sie für alle Personengruppen gleich erfolgen. Wir zeigen nun aber, dass Frauen und Personen mit Migrationshintergrund – nach Kontrolle für juristische Fähigkeiten – weniger wahrscheinlich über die Schwellen gehoben werden als Männer und Personen ohne Migrationsindikator.

    Darüber hinaus ist eine Benotung unter Kenntnisse der Vornoten messtheoretisch immer ein Problem, weil dann die mündliche Note nicht mehr unabhängig erhoben wird und somit kein Fehlerausgleich erfolgen kann und die Messung im Schnitt fehlerhafter wird (vgl. Axiome der Klassischen Testtheorie). Dies ist Basiswissen der Statistik und Diagnostik, ich würde auch dem juristischen Kollegen empfehlen, sich mit der Thematik in unseren Vorlesungen dazu etwas tiefer zu beschäftigen. Ich empfehle zur Lektüre auch unseren Aufsatz dazu im Anwaltsblatt: https://www.jurion.de/news/348053/Diskriminierungen-bei-Staatspruefungen-Gloeckner-und-Towfigh-untersuchen-die-Bedeutung-von-Geschlecht-und-Herkunft/

    (zu W2): Kollege Wackerbarth versucht hier Argumente aufzuführen, die gegen eine Diskriminierung sprechen.
    Kollege Wackerbarth hinterfragt zunächst unsere Analysen mit Kontrolle für Abiturnoten. Abiturnoten sind ein sehr gut etablierter Indikator für allgemeine kognitive Fähigkeiten (Intelligenz). Unsere entsprechenden Analysen zeigen zunächst, dass Frauen im Schnitt mit besseren Voraussetzungen in das Studium starten und dieses dann mit schlechteren Noten beenden. Dies ist interessant per se und deutet auf potenzielle Benachteiligung in Studium oder Examen hin, die nicht ignoriert werden dürfen. Ich möchte Kollegen Wackerbarth an Artikel 3 des Grundgesetzes erinnern: „(2) Männer und Frauen sind gleichberechtigt. Der Staat fördert die tatsächliche Durchsetzung der Gleichberechtigung von Frauen und Männern und wirkt auf die Beseitigung bestehender Nachteile hin.“
    Ich weiß nicht wie juristische Kollegen diesen Satz interpretieren, aber das Ignorieren einer solchen potenziellen Problematik bei der aktuellen Datenlage, widerspricht meinem Verständnis dieses Artikels des Grundgesetzes.
    Noch etwas problematischer ist, dass Kollege Wackerbarth unterschlägt, dass die schlechteren Noten für Frauen auch bestehen bleiben wenn man für Abiturnote (als Indikator für Intelligenz) und / oder die schriftlichen Noten kontrolliert, die ja offensichtlich juristische Kenntnisse messen, wie von ihm gefordert. Die Darstellung von Kollegen Wackerbarth ist somit irreführend.
    Der letztere Punkt wird noch dadurch verschärft, dass Herr Wackerbarth unsere Analysen zum zweiten Examen bei Kontrolle für das erste Examen missinterpretiert. In der Tat verschwindet im zweiten Examen der Geschlechter-Unterschied, wenn man für das erste Examen kontrolliert. Da das erste Examen mündliche Noten enthält, zeigt diese Analyse, wie von uns im Artikel auch erläutert, dass keine ZUSÄTZLICHE Diskriminierung im zweiten Examen stattfindet, die über die im ersten Examen hinausgeht. Die Analyse zeigt nicht, wie von Kollegen Wackerbarth behauptet, dass bei Kontrolle für juristischen Vorwissen der Geschlechterunterschied verschwindet. Dieser bleibt wie oben erwähnt bestehen.

    Als letztes Argument in diesem Kontext führt Kollege Wackerbarth Statistiken zu Durchfallern an, mit der Spekulation, dass hier Frauen bevorzugt werden. Dies ist nicht ausgeschlossen. In jedem Fall wären aber zusätzliche Analysen notwendig, um diese Spekulation zu prüfen und ein solches Ergebnis würde auch nicht unseren Ergebnissen widersprechen oder die aufgezeigte Problematik an den höheren Notenschwellen beheben.

    (zu W3): Hier diskutiert Kollege Wackerbarth verschieden alternative Erklärungsansätze aus der von uns ebenfalls zitierten Literatur.
    Es mag möglich sein, dass Frauen und Männer ein unterschiedliches Abbruchverhalten im Studium haben. Dies bedarf weiterer Analysen, die beispielsweise von Kollegen Wackerbarth an der FernUniversität sehr leicht durchgeführt werden könnten, um seine Spekulation zu überprüfen und potenziell zu erhärten. Eine Ursache für unterschiedliche Abbruchverhalten kann strukturelle Diskriminierung sein, die beispielsweise in der Ausgestaltung der Lehre zu suchen sein könnten.
    Der letzte von Kollegen Wackerbarth aufgeführte Punkt bezieht sich darauf, dass der von Männern häufiger gewählte „wirtschaftsrechtlichen Schwerpunktbereich“ den „gesunden Menschenverstand und [das] Mitdenken“ fördern und somit zu besseren Noten führen sollte. Dem mag so sein, ein empirischer Nachweis dafür wäre aber noch zu erbringen. Wenn ein solcher positiver Effekt des Studiums eines Teilbereichs des Rechts nachzuweisen wäre, wäre ein entsprechendes Training für alle Studierenden der Rechtwissenschaften und darüber hinaus zu empfehlen. Die üblichen Ergebnisse zur Stabilität und geringen Trainierbarkeit kognitiver Fähigkeiten (Intelligenz) sprechen klar gegen diese Erklärung. Fakt ist zunächst, dass wenn eine Personengruppe diesen Schwerpunkt häufiger wählt als eine andere und man dann für die Wahl des Schwerpunkts kontrolliert der Unterschied zwischen den Gruppen rein statistisch kleiner werden oder verschwinden muss. Entsprechend greift eine Erklärung, die auf dem Verschwinden von Gruppenunterschieden bei Kontrolle für den Schwerpunkt basiert, in jedem Fall zu kurz.

    (zu W4): Hier führt Kollege Wackerbarth zunächst an, dass er vermutet, dass man bei anonymen Klausuren anhand der Handschrift nicht das Geschlecht erkennen kann. Dies mag so sein, eine empirische Prüfung der Spekulation ist experimentell leicht zu realisieren und haben wir dem Landesjustizprüfungsamt vorgeschlagen. Im Übrigen ist diese Frage für unsere Argumentation irrelevant, da wir gerade auch Unterschiede in der mündlichen Prüfung nachweisen, die über die schriftliche Prüfung hinausgehen. Dies unterschlägt Kollege Wackerbarth auch hier leider wiederum.
    In diesem Abschnitt führt Kollege Wackerbarth darüber hinaus die Möglichkeit an, dass die positiven Effekte der Zusammensetzung der Kommission (mind. eine Frau in der Kommission beseitigt die niedrigere Wahrscheinlichkeit der Schwellenerreichung für Kandidatinnen) darauf zurückzuführen sein könnten, dass Prüfer sich der positiven Diskriminierung der Prüferin gegenüber Frauen anschließen. Diese Interpretation ist falsch und entspricht nicht dem statistischen Ergebnis: die niedrigere Wahrscheinlichkeit der Schwellenerreichung für Frauen gegenüber Männern – bei sonst gleichen Voraussetzungen inkl. Vornoten etc. – wird aufgehoben. Die „Anschlusshypothese“ von Kollegen Wackerbarth würde vielmehr dazu führen, dass es zunächst keinen Unterschied gibt und Frauen dann wahrscheinlicher die Schwelle erreichen als Männer. Dem ist nun aber einmal faktisch nicht so.
    (zu W5 und Fußnote): In der Diskussion führt Kollege Wackerbarth an, dass er aus Gründen der gerechteren Verteilung von Arbeit dafür plädiert, dass mehr Frauen als Prüferinnen eingesetzt werden. Der Bezug auf die hohe Studierendenzahl von Frauen (60%) als Begründung, ist hier leider wiederum unpassend, da dies nicht die relevante Basisrate ist: PrüferInnen sind nun mal u.a. Professorinnen und Professoren und von einer 60% Quote dürften die Rechtwissenschaften hier weit entfernt sein.

    Die Fußnote zu geschlechtergerechter Sprache und die Herabwürdigung der Arbeit der Kolleginnen zur Verbesserung der Lehre an der FernUniversität in dieser Beziehung, die im Übrigen einen Schwerpunkt auf Gerechtigkeit und Diversität legt, halte ich für unangemessen. Wie auch im sonstigen Text werden nach meiner Einschätzung hier Spekulationen mit großer Überzeugung vertreten und nicht weiter empirisch begründet. So schreibt Kollege Wackerbarth: „Die konsequente Verwendung des generischen Maskulinums stellt die einzig akzeptable Lösung des Gender-Mainstreaming-Problems dar.“ Es bleibt unklar, warum dies die einzige akzeptable Lösung ist und warum nicht weiter gedacht und diese wie verschiedene andere Möglichkeiten zur Beseitigung der Benachteiligung von Frauen empirisch und praktisch geprüft werden sollten.

    Zusammenfassend möchte ich betonen, dass ich es ausdrücklich begrüße, dass Kollege Wackerbarth und andere Rechtswissenschaftler und praktische Juristen kritische Argumente aufbringen, die uns dazu anregen, unsere Ergebnisse kritisch zu hinterfragen und unsere Methodik wenn angezeigt weiterzuentwickeln. Zentral sind dabei aber zwei Dinge zu beachten:
    – Zahlen und Fakten müssen die Basis des Austauschs bleiben und Interpretationen dürfen nicht ins Beliebige abgleiten. Spekulationen und persönliche Meinungen sind erlaubt und nützlich zur Hypothesengenerierung für zukünftige Untersuchungen. Diese müssen aber als solche kenntlich gemacht werden und wenn möglich zeitnah mit Daten belegt werden.
    – Das Aufzeigen potenzieller Benachteiligungen von Gruppen u.a. in Prüfungen ist wichtig. Pure Spekulationen über – im Sinne der PrüferInnen möglichst günstige – Alternativerklärungen dürfen nicht dazu führen, dass empirisch beobachtete Unterschiede ohne Anstrengungen zur weiteren Klärung des Sachverhalts abgetan werden.

  2. Ulrich Wackerbarth

    1. In der Tat, es mag sich jeder selbst ein Bild machen, ich erhalte meine Vorwürfe auch nach den Einwänden vollumfänglich aufrecht. Insbesondere der Vorwurf, es seien Fakten verschwiegen worden, bleibt aufrecht erhalten. Er bezieht sich vor allem auf
    – den unterlassenen Hinweis auf die gesetzliche Anordnung der Ermessensentscheidung über eine Punkteanhebung am Ende der Pflichtfachprüfung (in meinem Blog-Artikel unter 1.). Durch diese Unterlassung wird der Eindruck vermittelt, die statistischen Auffälligkeiten an den Notenschwellen beruhten auf reiner Willkür der Prüfer;
    – die unterlassenen Hinweise auf die – jedenfalls seit 2012 bestehenden — Ungleichgewichte in den Zahlen der männlichen und weiblichen Prüflinge (oben unter 3.). Ob meine Vermutung (oder „Spekulation“) zutrifft, die Ergebnisse könnten daher durch Selektion verzerrt sein, spielt keine Rolle; die Zahlen hätten jedenfalls offen angesprochen werden müssen, wenn man in einer Studie Diskriminierung als Erklärungsansatz „nicht auszuschließen vermag“;
    – die fehlende Auseinandersetzung mit den von Hinz und Röhl 2016 gegebenen Erklärungsansätzen (oben unter 3.). Auch insoweit meine ich vor allem und offenbar in scharfem Gegensatz zu meinen Kollegen Glöckner, das Zahlen zwar „nicht beliebig“ aber durchaus unterschiedlich interpretierbar sind. Bevor man in einer Studie unbewußte oder bewußte Diskriminierung auch nur „nicht auszuschließen vermag“, sollte man sich ganz sicher sein, dass alle anderen Erklärungsmöglichkeiten ausgeschlossen s i n d. Wenn das eine „postfaktische Haltung“ ist, so muss ich dieses Wort wohl künftig in einem anderen Licht betrachten.

    2. Was die übrigen Entgegnungen von Herrn Glöckner angeht, so glaube ich, sie bereits weitgehend im Blog-Artikel angesprochen zu haben, jedenfalls soweit sie sachlich sind. Daher nur noch 3 kurze Anmerkungen.
    – Ich glaube, dass es so etwas wie ein spezifisches Talent für Rechtswissenschaften gibt, das mit dem Abitur nicht gemessen werden kann, selbst wenn dieses ein verlässlicher Gradmesser für Intelligenz wäre (was ich ebenfalls nicht glaube, aber mich insoweit gerne eines Besseren belehren lasse)
    – Kollege Glöckner gibt zu, dass in der Tat im zweiten Examen der Geschlechter-Unterschied in der Gesamtnote verschwindet, wenn man für das erste Examen kontrolliert. Wie passt das damit zusammen, dass die Studie doch in der mündlichen Prüfung die besagte Frauenbenachteiligung an den Notenschwellen feststellen will (siehe ZDRW 2018, S. 138)? Ich habe hier auch nichts missinterpretiert, sondern lediglich bemängelt, dass keine alternativen Erklärungsansätze überprüft werden, sondern die Tatsache fehlender Unterschiede bei Kontrolle nach dem ersten Examen im Text der Studie eher versteckt als hervorgehoben wird.
    – Prüfer sind übrigens Richter, Staatsanwälte, Rechtsanwälte und Professoren, nur um dieses Mißverständnis einmal zu beseitigen…

  3. Welke

    Es dürften nur Abiturdurchschnittsnoten mit gleichen LKs/Abiturfächern gegenüber dem Staatsexamen verglichen werden, da die Erfahrung zeigt, dass Frauen geistig weniger anspruchsvolle Abiturfächer wählen.
    Z. B. zeigen Schüler mit guten Leistungen in Mathematik öfters auch gute Leistungen in Deutsch als andersherum.
    Männer wählen öfters den Mathematik-LK, Frauen öfters den Deutsch-LK. Da eine Mathematiknote eine höhere Intelligenz benötigt als die gleiche Deutschnote, ist davon auszugehen, dass bei gleicher Abiturnote von Mann und Frau der Mann statistisch eine höhere Intelligenz hat, da die Frau mit einer anspruchsloseren Fächerauswahl zur gleichen Abiturnote wie der Mann gekommen ist.

  4. Prof. Wackerbarth

    Diese Auffassung teile ich nicht. Intelligenz ist keine Frage von Leistungen in Mathematik oder Deutsch.