Aus der KapitalmarktforschungKredit-Scoring

Wie man ein verbrauchergerechtes Scoring einführen könnte

Der potentielle Kreditnehmer muss verstehen können, wie sich die Beurteilung seiner Kreditwürdigkeit zusammensetzt. Nur verständliche und transparente Scores geben die Möglichkeit einer Verhaltensänderung.

Wie man ein verbrauchergerechtes Scoring einführen könnte

Verbrauchergerechtes Kredit-Scoring ist möglich

Nur bei transparentem und verständlichem Urteil über die Kreditwürdigkeit entsteht die gewünschte edukative und präventive Wirkung

Die Verschuldung deutscher Haushalte bleibt trotz des Rückgangs nach den Coronajahren auf weiterhin hohem Niveau. Gleichzeitig geraten Auskunfteien wie die Schufa wegen mangelnder Transparenz immer heftiger in die Kritik. Der Sachverständigenrat für Verbraucherfragen hatte in seinem Gutachten „Verbrauchergerechtes Scoring“ (2018) gefordert, dass Auskunfteien den Bürgern die Merkmale und deren Gewichtung offenlegen, mit denen sie Kreditscores berechnen. Verbraucher sollten verstehen, woraus sich ihr Kreditwert erklärt, um vor diesem Hintergrund, soweit möglich, ihr Verhalten zu ändern. Trotz erster Bemühungen der Schufa ist diese Offenlegung bisher nicht befriedigend erfolgt. Im Gefolge einer EuGH-Entscheidung zur Schufa nimmt sich derzeit der Gesetzgeber dieser Frage an. Wir erklären in diesem Beitrag, auf welche Weise verbrauchergerechtes Scoring erreicht werden kann. 

Unser Argument ist:

  1. Selbst wenn Auskunfteien zu vollständiger Offenlegung der Merkmale und Gewichte verpflichtet würden, könnten Bürger wegen der meist sehr komplexen Algorithmen nicht verstehen, wie ihr Score zustande gekommen ist. So ist etwa der Schufa Score-Simulator lediglich eine recht ungefähre Annäherung an den tatsächlichen Algorithmus.
  2. Die derzeitigen Scoring-Algorithmen sind unnötig komplex. Dies gilt insbesondere für Scores, die mit Methoden des maschinellen Lernens entwickelt wurden. Wissenschaftliche Studien zeigen, dass einfache und damit verständliche Algorithmen Kreditausfall in der Regel genauso gut vorhersagen können wie komplexe Algorithmen, die selbst von Experten oft nicht durchschaut werden können.
  3. Daher fordern wir die Einführung einfacher, transparenter Algorithmen. Nur so kann man das Ziel erreichen, dass Bürger tatsächlich verstehen, wie ihr Score zustande kommt.

Weiter hohe Verschuldung

Das Gesamtvolumen aller Kredite und Verbindlichkeiten privater Haushalte und Organisationen ist von 2001 bis 2021 um 30% auf 1,96 Bill. Euro gestiegen. Damit bleibt es trotz eines kleinen Rückgangs seit der Coronajahre auf weiterhin hohem Niveau. Maßgeblicher Faktor sind Konsumentenkredite, die insbesondere für einkommensschwächere Haushalte (Haushalte in den unteren 50% der Einkommensklammer) die kreditorische Hauptbelastung darstellen. Gleichzeitig wird Konsum einfacher: per App und Kauf auf Rechnung, nicht zuletzt in Form des „buy now pay later“, sind Verbraucher nur wenige Klicks von denjenigen Konsumgütern entfernt, deren Erwerb mit zunehmend digitalen und personalisierten Methoden beworben wird.

Der Abschluss eines Kreditvertrages ist seit jeher durch Informationsasymmetrien gekennzeichnet: Die Bank entscheidet (individuell und auf Portfolioebene), an wen sie Kredit vergibt, zu welchem Zinssatz und mit welcher Eigenkapitalunterlegung. Um diese Variablen kundenindividuell anzupassen, muss sie die Kreditwürdigkeit potenzieller Kreditnehmer einschätzen, also die Fähigkeit und die Bereitschaft, die Kreditforderung zu bedienen. Auf den ersten Blick ist es somit ideal, wenn die Bank möglichst viel über den potenziellen Kreditnehmer erfährt, um ihn zielgenau zu beurteilen.

Vorteile für beide Seiten

Bei näherem Hinsehen wird aber deutlich: Vor allem im Konsumentenkreditgeschäft lohnt sich oft die intensive Informationssuche mit Blick auf individuelle Eigenschaften potenzieller Kunden für die Bank nicht – die Kosten für die Suche und vor Allem für die Validierung solcher Informationen werden schnell zu hoch. Genau hier liegt das Potenzial von Auskunfteien wie der Schufa. Durch die Identifikation von Personen mit geringem Kreditausfallrisiko über einen Score senken Auskunfteien die Kosten für Kreditgeber. Zugleich ermöglichen sie die Teilhabe am Zugang zur Finanzinfrastruktur. Gleichzeitig entsteht Überschuldungsschutz, indem signalisiert wird, wer durch die Aufnahme eines Kredites in ein hohes Risiko läuft, in Zahlungsschwierigkeiten zu geraten.

Mit der Mittlerrolle von Auskunfteien gehen aber auch unterschiedliche Risiken für Verbraucher einher. Werden Daten unsorgfältig erhoben oder verarbeitet, entsteht ein unrichtiger Score. Derzeit haben Verbraucher kaum eine Chance, dies zu bemerken, geschweige denn, es zu korrigieren. Zugleich tragen Verbraucher die negativen Konsequenzen solcher Fehleinträge, da sie entweder gar keinen oder einen unzutreffend bepreisten Kredit erhalten. Das gleiche gilt für eine positive Verhaltensänderung: Versteht ein Kreditbewerber nicht, welche Variablen seinen Score beeinflussen, kann er sich nicht um einen besseren Score bemühen.

Einsehbar und nachvollziehbar

Um eine edukative und entscheidungsunterstützende Wirkung zu entfalten, das zeigt unsere Forschung, muss ein Score sowohl transparent als auch verständlich sein. Transparent bedeutet, dass die Score-Formel und die darunter liegenden Variablen in Gänze eingesehen werden können. Verständlich bedeutet, dass die Score-Formel für die gescorte Person auch nachvollziehbar ist, die einzelnen Merkmale in kausalem Zusammenhang zu nachhaltigem Wirtschaften stehen und dass man idealerweise auf diese Merkmale Einfluss nehmen kann. Unter diesen Bedingungen reicht die Bedeutung eines Scores dann über die reine Vorhersage eines Zahlungsausfalles, die Prädiktion, hinaus. Er erlaubt die aktive Verhinderung eines solchen Falles durch positive Verhaltensänderung – die Prävention. Das geschieht zum einen, indem Verbraucher ein besseres Verständnis davon entwickeln, welche Handlungen den Score beeinflussen. Zum anderen können sie besser abschätzen, welche Risiken und Handlungen in ihrem individuellen Kontext angebracht sind. Die Anwendung einfacher, transparenter Prognosealgorithmen, sogenannter Psychologischer KI (PsyKI), hat in den letzten Jahrzehnten gezeigt, dass zwischen Transparenz und Trennschärfe (also der Prognoseleistung von Algorithmen wie z.B. Scoring-Formeln) kein Kompromiss liegen muss. In Situationen der Ungewissheit, wie bei der Vorhersage menschlichen Verhaltens, kann man beides haben: Verständlichkeit und Prognoseleistung.

Recht auf Auskunft

Vor diesem Hintergrund ist die Reform des Bundesdatenschutzgesetzes, mit der unter anderem auf ein vor einigen Monaten ergangenes EuGH-Urteil reagiert wird, von besonderem Interesse. Das EuGH-Urteil betraf den Fall eines deutschen Kreditbewerbers, der wegen eines nicht hinreichenden Scores abgelehnt wurde. Mit seinem Begehren, von der Schufa Einzelheiten zur Berechnung seines Scores zu erfahren, wandte er sich an das VG Wiesbaden, welches den Sachverhalt dem EuGH vorlegte. Die Datenschutzgrundverordnung (DSGVO) gewährt zwar derartige Informationsansprüche, wenn eine auf „ausschließlich automatisierter“ Datenverarbeitung beruhende „Entscheidung“ vorliegt. Bislang war man aber davon ausgegangen, dass nicht die Auskunftei, sondern die Bank die relevante „Entscheidung“ treffe. Die Bank konnte allerdings dem Kreditbewerber nicht weiterhelfen, da sie keinen Einblick in Daten und das Scoringmodell der Schufa hatte. In dieser etwas kafkaesk anmutenden Situation half der EuGH und gewährte dem Verbraucher ein Informationsrecht gegen die Auskunftei. Das gilt jedenfalls dann, wenn der Score eine „entscheidende Rolle“ bei der Kreditgewährung spielt.

Bestimmte Einzelheiten automatisierter Entscheidungen (und damit auch des Scorings) darf der nationale Gesetzgeber, innerhalb der Grenzen der DSGVO, regeln. Das deutsche BDSG enthielt zwar eine relevante Vorschrift, deren Europarechtskonformität war allerdings mit Inkrafttreten der DSGVO fraglich geworden. Die derzeit im Gesetzgebungsprozess befindliche Reform des BDSG soll hier Abhilfe schaffen. Ein neuer § 37a regelt künftig das Scoring. Hiernach soll eine ausschließlich auf automatisierter Verarbeitung beruhende Entscheidung zulässig sein, wenn „Wahrscheinlichkeitswerte“ zu einer natürlichen Person erstellt werden, die entweder deren Zahlungsfähigkeit und -willigkeit betrifft oder ein bestimmtes zukünftiges Verhalten dieser Person, welches für ein Vertragsverhältnis mit ihr relevant ist.

Drei Grundsätze angeordnet

Die Art und Weise, wie ein Wahrscheinlichkeitswert (Score) erstellt wird, regelt der Gesetzgeber detailliert. Dabei werden insbesondere drei Grundsätze angeordnet. Erstens dürfen bestimmte Daten von vornherein nicht genutzt werden. Hierzu zählen sensible Daten, beispielsweise zu Geschlecht, Religion oder ethnischer Zugehörigkeit. Damit wird den Vorgaben der DSGVO Genüge getan. Weiter dürfen der Name und die Anschrift der betroffenen Person nicht genutzt werden, ebensowenig personenbezogene Daten aus der Nutzung sozialer Netzwerke. Das erfolgt in Reaktion auf eine vor kurzem reformierte europäische Verbraucherkreditrichtlinie, die diese Einschränkungen enthält. Zweck dieser Richtlinienvorgabe ist es, die Diskriminierung im Kreditkontext auszuschließen. Aus demselben Grund dürfen auch Informationen über Zahlungseingänge und Ausgänge auf und von Bankkonten nicht verwendet werden. Zweitens darf das Scoring keine minderjährigen Personen betreffen. Drittens dürfen die genutzten personenbezogenen Daten nicht für andere Zwecke verarbeitet werden. Auch müssen diese „unter Zugrundelegung eines wissenschaftlich anerkannten mathematisch-statistischen Verfahrens nachweisbar für die Berechnung der Wahrscheinlichkeit des bestimmten Verhaltens erheblich sein“.

Angenommen hat sich der Gesetzgeber auch der Auskunftsansprüche von Verbrauchern. Es muss, wer Wahrscheinlichkeitswerte erstellt, „in präziser, transparenter, verständlicher und leicht zugänglicher Form in einer klaren und einfachen Sprache“ bestimmte Informationen mitteilen. Zu diesen zählen die für die Erstellung des Scorewerts genutzten personenbezogenen Daten und „Kriterien“, „die Gewichtung von Kategorien von Kriterien und deren Verhältnis zueinander“, allerdings nur derjenigen, „die den Wahrscheinlichkeitswert am stärksten beeinflussen“. Weiter müssen die „Aussagekraft des konkreten Wahrscheinlichkeitswertes“ und schließlich „die erstellten Wahrscheinlichkeitswerte und ihre Empfänger“ dem Verbraucher mitgeteilt werden. Die grundlegende Bedeutung von Transparenz gegenüber dem Verbraucher hat der Gesetzgeber damit zwar erkannt. Im weiteren Verlauf des Gesetzgebungsverfahren sind allerdings einige Desiderata noch zu berücksichtigen.

Viel Interpretationsspielraum

Was die Transparenzauflagen angeht, so weicht der Gesetzesentwurf mit den Begriffen „Kriterien“ und „Kategorien von Kriterien“ ohne Not von der Terminologie ab, welche der Sachverständigenrat für Verbraucherschutz (SVRV) und die Datenschutzkonferenz (DSK) vorgeprägt haben. Diese sprechen von „Merkmalen“ und definieren diese präzise. Durch die Verwendung vager Begriffe wie „Kategorien von Kriterien“ wird unnötig Vieldeutigkeit erzeugt. Auch rückt der Gesetzesentwurf davon ab, alle Score-relevanten Merkmale offenzulegen. Es sollen lediglich „die wichtigsten Merkmale“ angegeben werden. Auch das schafft unnötigen Spielraum für Intransparenz: nur die zwei wichtigsten, oder ein paar mehr?

Diskriminierung ist kaum zu verhindern

Die Verbote bestimmter Datenarten zur Score-Erstellung sind zum Teil in der DSGVO und der reformierten Verbraucherkreditrichtlinie vorgezeichnet. Telos beider Regelwerke ist, die Diskriminierung auf der Basis geschützter Merkmale zu verhindern. Insbesondere für Algorithmen-basiertes Scoring, welches mit sehr großem Datenmaterial (big data) arbeitet, kann dieses Ziel allerdings kaum erreicht werden. Das liegt am sogenannten redundant encoding: Weil eine künstliche Intelligenz, die big data auswertet, übergreifende Muster erkennt, ist die Relevanz einzelner Variablen sehr gering. Wird beispielsweise der Vorname der Person unterdrückt, mag damit die Verhinderung einer Geschlechterdiskriminierung intendiert sein. Eine KI wird aber das Geschlecht aus Korrelationen mit anderen Variablen erschließen, beispielsweise der Körpergröße, dem bevorzugten Ort, an dem Kleider eingekauft werden, möglicherweise auch dem Besuch bestimmter Ärzte, der Verwendung mancher Suchbegriffe in Google oder des Musikgeschmacks.

Immerhin: Auskunfteien müssen Verbrauchern gegenüber künftig deutlich transparenter sein, als sie es bisher waren. Die Schieflage, die dadurch entstand, dass Verbraucher für Unternehmen gleichsam „gläsern“ waren, diese ihre Modelle jedoch nicht offenlegen mussten, gleicht die neue Regelung aus. Auf den Schutz des Geschäftsgeheimnisses soll sich die Auskunftei künftig nicht mehr berufen dürfen. Zugleich geht der deutsche Gesetzgeber aber davon aus, dass die DSGVO wohl doch eine Abwägung zwischen Auskunftsanspruch und Geschäftsgeheimnis beinhaltet.

Diskussion angestoßen

Mit Blick auf die Zunahme KI-gestützter Scoring-Verfahren und des immer größer werdenden digitalen Fußabdrucks jedes Individuums hat der Gesetzgeber damit die Debatte über ein verbrauchergerechtes Scoring der Zukunft erst angestoßen. Die meisten Scoringmodelle bestehen derzeit aus statistisch-korrelativen Merkmalen mit bedingter Nachvollziehbarkeit und Beeinflussbarkeit. Das hat verständliche Gründe, legte der Gesetzesrahmen, in welchem Auskunfteien sich bewegten, bisher doch mehr Wert auf die „mathematisch-statistische Validität“ eines Scoring-Verfahrens als auf seine Nachvollziehbarkeit Verbrauchern gegenüber. Die Öffnung der Scoring-Verfahren hin zu mehr Transparenz erlaubt nun zum ersten Mal die Möglichkeit eines gesellschaftlichen Diskurses darüber, welche Merkmale und Scoring-Verfahren von Verbrauchern und Gesellschaft als fair und nachvollziehbar verstanden werden. Ausgeschlossen sind nach der KI-Verordnung beispielsweise Sozialkredit-Scores wie in China („social credit scoring“).

Wir halten Verständlichkeit für den einzig nachhaltigen Weg hin zu einer informierten demokratischen Meinungsfindung. Dem wird oft entgegengehalten, dass ein Algorithmus mit einer guten Vorhersagekraft nicht verständlich sein kann. Das ist jedoch nicht richtig. Bei Vorhersagen unter hochgradiger Ungewissheit – wie Grippe, Covid-19, Straftaten und Kreditausfall – hat es sich gezeigt, dass einfache Algorithmen in der Regel genauso gut sind wie komplexe Algorithmen. Scoring muss in Zukunft nicht mehr eine intransparente Zahl sein, die ein Verbraucher gleichsam auf geheimnisvollem Weg zugeordnet bekommt. Menschen sollten das Recht erhalten, zu verstehen wie ihr Score zustande kommt, und damit die Möglichkeit, ihr Verhalten zu verändern.

Wie geht es weiter?

Der Gesetzesentwurf treibt die Debatte um Transparenz im Kredit-Scoring weiter voran. Das ist trotz der erwähnten Mängel zu begrüßen. Doch es besteht mit Blick auf Verständlichkeit dem Verbraucher gegenüber noch Luft nach oben. Zum einen greift der Gesetzesentwurf nur in Situationen, in denen eine ausschließlich automatisierte Entscheidung getroffen wurde. Transparenz sollte aber auch für solche Scoring-Situationen einschlägig sein, in welchen einzelne „menschliche Handgriffe“ erfolgen. Zum anderen ist die Regulierung KI-basierter Scoring-Verfahren nicht nur mit der DSGVO, sondern auch mit der KI-Verordnung abzustimmen. Soweit intransparente black-box Algorithmen überhaupt zulässig sind, sollte in jedem Fall nachgewiesen werden müssen, dass diese deutlich bessere Vorhersagen treffen als einfache, verständliche Algorithmen. Nur in solchen Fällen sollte eine Abwägung zwischen Verständlichkeit und Trennschärfe überhaupt diskutiert werden. Wichtig ist auch, dass sich Auskunfteien darum bemühen, nachvollziehbare und beeinflussbare Merkmale in ihren Modellen zu verwenden. Denn nur so entfaltet Transparenz die gewünschte edukative und präventive Wirkung. Das würde das Scoring in Deutschland tatsächlich verbrauchergerecht und zukunftsfähig machen.

Von Gerd Gigerenzer und Katja Langenbucher
BZ+
Jetzt weiterlesen mit BZ+
4 Wochen für nur 1 € testen
Zugang zu allen Premium-Artikeln
Flexible Laufzeit, monatlich kündbar.