Partner von
Partner von

HR Digitalisierung

Kluge Maschinen sollen den perfekten Bewerber finden. Kann das funktionieren? Ein Selbstversuch.





• Es ist eine Stelle in den USA, auf die ich mich bewerbe: Kundenberater bei HireVue, einer Softwarefirma in Utah, Vollzeit, ab sofort. Qualifikation und Erfahrung habe ich keine, Englisch ist nicht meine Muttersprache, aber probieren kann ich es ja mal. Es winken knapp 40 000 US-Dollar Einstiegsgehalt. Über die App von HireVue logge ich mich ein, klicke mich durch die allgemeinen Geschäftsbedingungen und starte das Job-Interview. Eine potenzielle Kollegin taucht in einem Film auf, braune Haare, Jeansjacke, plaudert ein wenig und stellt die erste Frage: „Welche Art von Jobs hattest du bisher?“

Kaum ist der Videoclip vorbei, erscheint auf dem Bildschirm ein Countdown: 30 Sekunden habe ich Zeit, mir eine Antwort zu überlegen. Dann sehe ich mich selbst auf dem Smartphone-Bildschirm und beginne zu sprechen. Drei Minuten bleiben mir, um zu antworten. Elf weitere Fragen werden mir von Mitarbeitern der Firma in vorproduzierten Videoclips gestellt. Elf mal drei Minuten habe ich zum Antworten. Dann entscheidet ein Algorithmus von HireVue über mich. Das Unternehmen aus Utah ist einer der größten Anbieter auf einem potenziellen Milliardenmarkt: Personalentscheidungen durch Algorithmen.

Seit 13 Jahren bietet HireVue seine Dienste als Video-Interviewplattform an. So müssen Bewerber nicht mehr quer durchs Land reisen, wenn sie sich auf einen Job bewerben. Bis heute hat die Softwarefirma mehr als fünf Millionen Video-Antworten gesammelt. Doch warum sollten die Daten ungenutzt auf den Servern liegen? Diese Frage stellten sich die Gründer vor etwa vier Jahren. Seither setzen sie zur Auswertung der Antworten auch Algorithmen und maschinelles Lernen ein. Offenbar mit Erfolg: 2014 nimmt das Magazin »Forbes« die Firma aus Utah auf seine Liste „America’s most promising companies“. Unternehmen wie Unilever oder Vodafone vertrauen auf die Dienste der US-Firma. Bei Verkäufern oder Kundenberatern trauen sie den Algorithmen schon heute zu, die richtige Personalentscheidung zu treffen.

Immerhin soll, so die Vorstellung der Befürworter, ein Computer im Vergleich zu einer Person bei korrekter Anwendung schneller, effektiver und vorurteilsfrei sein. 25 000 Datenpunkte in Gestik, Mimik und der Sprache hat der Algorithmus von HireVue während meines Interviews erfasst. Anhand der Messwerte soll meine Persönlichkeit entschlüsselt, mit Angestellten aus dem Unternehmen verglichen und errechnet werden, wie gut ich mich als Kundenberater in Utah schlagen würde. Am Ende soll die Maschine so nicht weniger finden als den perfekten Kandidaten.

Der Mensch sieht, was er sehen will

Um den besten Kandidaten für eine Stelle zu finden, muss man die größte Schwachstelle minimieren: das menschliche Urteilsvermögen. Denn Vorurteile stehen einer objektiven Entscheidung im Wege. Sei es, weil der Interviewpartner die Haarfarbe eines Bewerbers nicht mag oder seinen Körpergeruch, Hunger hat oder müde ist. „Der Mensch ist zutiefst geprägt von Vorurteilen, Verzerrungen und Ablenkungen, die er gar nicht wahrnimmt“, sagt Claus-Christian Carbon, Professor für Psychologie an der Otto-Friedrich-Universität Bamberg. Zwar kann dieser sehr subjektive Eindruck helfen, wenn man kleine Arbeitsteams zusammenstellt, doch im größeren Kontext kann es fatal sein, nicht auf objektive Kriterien zu vertrauen. Er hat nachgewiesen: Wenn es darum geht, andere objektiv einzuschätzen, ist der Mensch miserabel.

Beispiel Passkontrolle am Flughafen: Teilnehmer einer Studie konnten in nur 74 Prozent der Fälle entscheiden, ob die Person auf dem Foto auch die Person vor ihnen war. Mitarbeiter des Flughafens kamen auf 75 Prozent. „Und dabei geht es nur darum, ein Gesicht zu erkennen“, sagt Carbon. „Viel schwerer tun wir uns, wenn wir Emotionen bewerten müssen.“ Während wir ein Lächeln noch recht sicher erkennen können, sieht es bei anderen Emotionsausdrücken wesentlich schlechter aus. Kommt das Gegenüber aus dem Ausland, etwa aus Asien oder dem arabischen Raum, fehlt uns dafür die kulturelle Erfahrung. Das verschlechtert unsere Leistung – teilweise sogar dramatisch, sagt Carbon. Im Prinzip können wir nur Menschen sicher beurteilen, die wir persönlich kennen, etwa die Familie oder sehr gute Freunde. „Und trotzdem glauben wir, dass wir Fremde einschätzen können und erkennen, ob sie fleißig oder verantwortungsbewusst sind. Verrückt, oder?“

Algorithmen sind dem Menschen in vielen Punkten überlegen: Sie werden nicht müde, haben keine Vorlieben und können in kürzester Zeit Unmengen von Daten verarbeiten. Seit einigen Jahren sind sie die heimlichen Helfer der Personalabteilungen. 72 Prozent aller Bewerbungen in den USA werden schon heutzutage von Computern bearbeitet, beurteilt und vor- sortiert: Wer die grundlegenden Anforderungen nicht erfüllt, scheidet aus, ohne dass ein Mensch die Bewerbung je gesehen hätte. Darüber hinaus kommen die Maschinen bei Routineaufgaben zum Einsatz. Schickt ein Bewerber etwa eine E-Mail, bekommt er eine automatisierte, aber personalisierte Antwort.

Der Computer verspricht Objektivität

Nun erstürmen die Maschinen auch die letzte Bastion der Personalabteilungen: das Bewerbungsgespräch. Anhand von Videos oder Persönlichkeitstests, die der Computer analysiert, soll er die Tauglichkeit der Bewerber errechnen. In den USA bieten solche Programme unter anderem die Unternehmen Applied Predicitive Technologies, Koru Careers Ltd. oder auch Pymetrics an. Letzterer lässt Bewerber sogar Spiele spielen und prüft sie auf mehr als 90 verschiedene Charaktereigenschaften.

Mit HireVue beginnt die Suche nach dem perfekten Bewerber bereits im Unternehmen. Die Mitarbeiter, die intern als die besten auf ihrer Position gelten, werden per Video interviewt. Der Algorithmus analysiert unter anderem ihre Mimik, Gestik und Aussprache und leitet daraus ein Muster ab. Dieses wird er später über die aufgezeichneten Videos der Bewerber legen. Zwischen acht und zwölf Fragen werden ihnen dort gestellt. In meinem Fall von Kayla, der Frau, die mich nach meinen bisherigen Jobs gefragt hatte, Quinton, Kim oder auch James. Diese Angestellten wollen wissen, ob ich ein Teamplayer bin, wie ich mit Feedback umgehe und zu welchen Uhrzeiten ich bereit wäre, zu arbeiten.

Im Anschluss bekommt der Personaler vom System angezeigt, zu wie viel Prozent ich für die Stelle geeignet bin. Zusätzlich kann er sich die aufgezeichneten Antworten anschauen und seine Favoriten markieren. „Vorbei sind die Zeiten von stundenlangen und auslaugenden Bewerbungsgesprächen“, sagt Loren Larsen, Technikvorstand von HireVue.

Nichtssagende Daten, nichtssagende Ergebnisse

Doch lässt sich die Eignung eines Menschen so einfach in eine Zahl pressen? Dorothea Alewell, Professorin für Personalwirtschaft an der Universität Hamburg, ist skeptisch. In ihren Vorlesungen lehrt sie unter anderem die Eignungsdiagnostik, die analoge Form des Auswahlprozesses. Insgesamt, so Alewell, gebe es drei Fragen, die man beantworten müsse: Wie messen wir den Erfolg für eine Stelle? Welche Merkmale braucht es, um erfolgreich zu sein? Und wie messen wir, ob jemand diese Merkmale mitbringt? „Das mag simpel klingen, bringt aber etliche Fallstricke mit sich“, sagt die Professorin.

Die ersten zeigen sich schon, bevor die Stelle überhaupt ausgeschrieben wird. Denn Mitarbeiter werden meist an kurzfristigen Erfolgen bemessen; ihre tatsächliche Qualität erweist sich jedoch über einen langen Zeitraum, nachdem Projekte beendet und bewertet sind. Da diese Daten aber oft nicht vorliegen, setzen die Firmen auf vermeintlich Erfolg versprechende, messbare Eigenschaften. Dazu zählen etwa Dominanz oder Führungsstärke. Für meine Bewerbung wohl auch, wie offen und freundlich ich bin. Welche Eigenschaften in welcher Kombination Erfolg ausmachen, kann man nur vermuten. Die Persönlichkeit ist ein schwammiger Begriff. Außerdem ändern sich Menschen von Situation zu Situation. Daher lässt sich von einem Video-Interview nur begrenzt auf Leistungen im echten Arbeitsleben schließen.

Dennoch sind die Programme beliebt, da sie als effizient und objektiv gelten. „Die künstliche Intelligenz fördert Diversität und reduziert Diskriminierung“, sagt Larsen. Mithilfe des Algorithmus kämen Leute, die sonst aufgrund von Hautfarbe oder der falschen Schule aussortiert würden, im Bewerbungsprozess weiter. „Es zählen Fakten“, sagt Larsen und meint Daten.

Auch Algorithmen diskriminieren

In der Praxis aber schleichen sich neue Probleme ein. Denn lernende Algorithmen verhalten sich wie Kinder, die ihre Eltern imitieren. Sie saugen Daten auf, suchen Muster und wenden sie an. Ob die Kriterien und Muster der Maschinen aber die gewünschten sind, das weiß niemand so genau. „Künstliche Intelligenz und neuronale Netze sind eine Blackbox“, erklärt Martin Spindler, Professor für Statistik an der Universität Hamburg. „Unternehmen werfen Daten rein und bekommen ein Ergebnis heraus.“ Der Weg dorthin ist aber kaum nachzuvollziehen.

Was eine solche Verzerrung anrichten kann, zeigt ein Beispiel aus den USA: Xerox Services hatte einen Algorithmus beauftragt, Mitarbeiter zu finden, die möglichst lange im Unternehmen bleiben. Später stellte die Firma fest, dass Mitarbeiter aus Außenbezirken seltener eingestellt wurden. Das Programm hatte festgestellt, dass ein langer Anfahrtsweg ein häufiger Kündigungsgrund ist. Weil aber gerade arme Menschen oft außerhalb der Stadt lebten, wurden sie ungewollt, aber systematisch diskriminiert.

Ein Problem, dessen man sich auch bei HireVue bewusst ist. Dort bekämpfen die Informatiker es mit statistischen Verfahren. Nach jeder Auswahl von Kandidaten prüfen sie den Algorithmus mit Stichproben auf diskriminierende Entscheidungen. „Im Ergebnis sehen wir, ob der Algorithmus verzerrende Muster gelernt hat. Dazu gehört zum Beispiel, ob das Verhältnis von Frauen und Männern sehr ungleich ist“, sagt Larsen. In diesem Fall fütterten die Programmierer den Algorithmus mit neuen Daten: „Nur mit konsequenter Überprüfung können die Maschinen besser und fairer werden.“

Perfekt sind die Maschinen also noch lange nicht. Und auch die Vorstellung, dass ein Computer tatsächlich anhand von Daten die Persönlichkeit eines Menschen entschlüsseln kann, bleibt utopisch. Mit Sicherheit kann man nur sagen, dass der Computer erfassen und auswerten kann, dass ich mich statistisch ähnlich zu einem anderen Interviewten verhalten habe und dass wir beide das gleiche Vokabular benutzen. Wie erfolgreich mich das als Kundenberater macht, können sie aber allenfalls schätzen – auch, wenn die Zahlen Exaktheit suggerieren.

Sie sind es auch, die den Siegeszug der Eignungsdiagnostik und der Algorithmen erklären. „Menschen lieben Zahlen“, sagt der Psychologieprofessor Carbon. Nicht, weil sie mit ihnen viel anfangen können, sondern weil sie ihnen Verantwortung abnehmen. Entwickelt sich ein Mitarbeiter nicht wie gewünscht, kann man sich auf die Daten berufen. Dieser Versuchung unterliegen Menschen nur allzu gern und vertrauen den Computern immer öfter. Bei Jobs, in denen sowohl der Aufgabenbereich als auch das Ziel klar einzugrenzen sind, kann das durchaus Vorteile haben. „Die Erfolgsprädikatoren sind hier eher bekannt, und der Computer kann sich auf sie fokussieren“, erklärt Carbon. Sind diese Merkmale hingegen schwer zu erkennen, ist der Mensch überlegen.

Als Helfer sind die Programme in den Personalabteilungen dieser Welt daher mehr als willkommen. Um ihren Job fürchten die Personaler aber nicht. In einer Umfrage der Universität Bamberg gaben nur 3,8 Prozent der Befragten an, sie glaubten, die Maschine könne sie aus dem Job drängen. Alewell sagt: „Personaler können sich schlicht und einfach wieder auf ihre Hauptaufgabe konzentrieren: die Mitarbeiter.“

Gefragt nach meinen Testergebnissen kann Larsen mir sagen, dass ich die Worte interacting, discuss und video oft benutzt habe. Das habe mir Pluspunkte gebracht. Dass ich die Augenbrauen zusammengezogen und oft excitement gesagt habe, hat mich Punkte gekostet. Über das Warum kann er aber vorerst nur spekulieren. Die Minuspunkte könnten etwa daher rühren, dass mein Gesicht nicht das Gleiche ausgedrückt habe wie meine Worte, sagt er.

Am Ende taucht auf seinem Bildschirm eine Zahl auf: 67 Prozent. Zu diesem Prozentsatz soll ich auf die ausgeschriebene Stelle im Kundendienst passen. Im Vergleich mit allen anderen Bewerbern wäre das der zweite Platz im Ranking und für mich die Gewissheit, in die nächste Runde zu kommen – als Fremdsprachler und ohne Erfahrung im Kundenservice. Dem Algorithmus sei Dank. ---