Bin ich gut genug?

Die Leistungsbewertung durch den Chef hat viele Nachteile – aber wer soll es sonst machen? Die Kollegen zum Beispiel. Oder ein Algorithmus.





• Die Frage treibt vermutlich viele Führungskräfte derzeit um: Was machen meine Angestellten eigentlich gerade im Home Office? Das Arbeiten von zu Hause aus, erzwungen durch die Corona-Pandemie, scheint sich als Dauerlösung zu etablieren. Nach Facebook und Twitter hat kürzlich auch die Allianz das Heimbüro zum Normalfall deklariert. Viele weitere Unternehmen werden folgen. In der Informationswirtschaft etwa rechnen drei Viertel der Firmen mit einer dauerhaften Ausweitung der Arbeit zu Hause.

Aber sitzt der Mitarbeiter tatsächlich am Rechner? Und selbst wenn – arbeitet er auch fleißig an der Präsentation? Oder genießt er zwischendurch noch mal die Höhepunkte des Champions-League-Finales vom Vorabend? Karsten Höppner, der Vorstandsvorsitzende der in München beheimateten Beratungsgesellschaft Q-Perior, macht sich darüber durchaus Gedanken. Selbstverständlich hat er „volles Vertrauen, dass die Mitarbeiter die Freiheiten verantwortungsbewusst nutzen und am Ende die gewünschten Ergebnisse liefern“. Und doch fürchtet er auf Dauer einen Leistungsabfall: „Der Energiefluss, der in einem Team vor Ort vorherrscht, ist in der virtuellen Zusammenarbeit natürlich ein anderer.“

Wäre Höppner ein Kontrollfreak, hätte er längst eines der gängigen digitalen Überwachungsprogramme im Einsatz. Sie heißen Protectcom („die Nr. 1 in Deutschland für Überwachungs- Software“), Time Doctor, Veri Clock, Activetrack, Enaible oder Teramind. Die Software schreibt ein Logbuch des Nutzerverhaltens: Sie wertet Tastatureingaben auf Mitarbeiter-Laptops aus, speichert besuchte Websites, aufgerufene Programme sowie geöffnete Ordner und fertigt alle paar Minuten einen Screenshot vom Bildschirm an. Der Wirtschaftsdienst »Bloomberg« berichtete, dass es in der Anfangszeit der Corona-Krise, als rund um den Globus Hunderte Millionen Menschen ins Heimbüro versetzt wurden, zu regelrechten „Panikkäufen“ derartiger Kontroll-Software kam, von einer Verdreifachung des Absatzes war zu lesen.

Offensichtlich hat die Pandemie einem Dauerbrenner-Thema zusätzliche Brisanz verschafft. Denn die Kontrolle und turnusmäßige Bewertung der Arbeitsleistung sorgte schon für Frust und böses Blut, als die Belegschaft noch im Büro saß. Im Jahr 2016 hat das Beratungsunternehmen Accenture 2100 Führungskräfte und Mitarbeiter aus elf Ländern nach ihrer Einschätzung gefragt: Fast zwei Drittel der Beschäftigten hatten das Gefühl, dass sich ihre Leistung nicht genau genug oder objektiv genug in ihrer Bewertung niederschlägt. 58 Prozent erleben den Bewertungsprozess insgesamt als eine eher negative Erfahrung.

Auch bei Q-Perior waren die Beurteilungen nicht unumstritten. „Wie will mein Vorgesetzter mich bewerten, wenn er mich wochenlang kaum zu Gesicht bekommt?“, grummelten die Berater, die meist beim Kunden sind und nur sporadisch im Büro auftauchen. Zwar lieferte ein Coach, sozusagen der Teamleiter des Beraters, dem Vorgesetzten Input. Aber gelegentlich kam es zur Verbrüderung von Coach und Mitarbeiter, in anderen Fällen setzten sich Vorgesetzte über das Feedback des Coachs einfach hinweg.

Markus Mann, Personalchef von Q-Perior, hatte eine Lösung, die sein Vorstandschef Höppner schnell überzeugend fand: „Wir schaffen die Leistungsbewertung komplett ab.“ Doch die erhoffte Begeisterung der Mitarbeiter blieb aus, stattdessen entbrannte „eine wilde Diskussion“ um das Thema Leistungsdifferenzierung: Wer leistet viel, wer leistet besonders gute, wer weniger gute Arbeit? „Das sind Fragen, die für unsere Leute sehr wichtig sind“, sagt Mann. „Sie wollen sich vergleichen. Das hatten wir falsch eingeschätzt.“

Die Grenzen der Demokratie

Mitarbeiter wollen nicht auf Leistungsbeurteilung verzichten – sie wollen eine andere, bessere. Damit, so bekundeten 89 Prozent der von Accenture Befragten, ließe sich dann auch ihre Arbeit verbessern. Q-Perior setzt deshalb auf Experimente, um über einen kontinuierlichen Austausch zwischen Mitarbeiter und Führungskraft zu einer besseren Beurteilung zu kommen. Zusätzlich zur Einschätzung durch Coach und Vorgesetzten wurde für die Teams eine App für Ad-hoc-Kommentare eingerichtet; es gibt eine „Kaffeegruppe“ mit wöchentlichen, eine Viertelstunde dauernden Feedback-Treffen und eine weitere App, mit der die Mitarbeiter sich mit einer Art Barometer selbst einschätzen können. Wie war die vergangene Woche? Habe ich mich gut gefühlt? Freue ich mich auf die nächste Woche?

Noch wird erprobt, ob das die Probleme löst, die Nachteile der alten Methode sind bekannt. Bei einer jährlichen Beurteilung durch den Vorgesetzten kann sich der Mitarbeiter oft kaum noch an den Anlass für Lob oder Kritik erinnern. Viele Vorgesetzte sind konfliktscheu, beurteilen die Leistungsschwachen zu gut, begünstigen, wer ihnen sympathisch ist, oder werten ab, wen sie als vermeintlichen Konkurrenten ansehen.

Einen radikal anderen Weg ging mehr als zwei Jahrzehnte lang das in Weßling bei München beheimatete Software-Unternehmen Mensch und Maschine AG (MuM). In guten Jahren bekam die Belegschaft zweimal jährlich eine Gehaltserhöhung – wie der Lohnzuschlag aufgeteilt wurde, entschieden die Beschäftigten selbst. Per elektronischer Stimmkarte bewertete jeder jeden, nach Leistung und Sympathie. Aus den anonymisierten Einzelnoten wurde für jeden ein Durchschnittswert errechnet und schließlich die Gehaltserhöhung nach Maßgabe des firmeninternen Rankings verteilt. „Das System ist aus dem gleichen Grund besser, aus dem die Demokratie der Diktatur überlegen ist“, pflegte Adi Drotleff zu sagen, der Gründer und Vorstandsvorsitzende des Unternehmens (siehe auch brand eins 08/2005 „Revolution Light“ und 07/2011 „Die lieben Kollegen“).

Stets steuerte ein strikter Leistungsgedanke das System. Es trennte die Zugpferde von den Mittelmäßigen. Die Gewinner konnten stolz auf das Votum der Kollegen verweisen. Die Verlierer dagegen sahen sich enormem Druck ausgesetzt. Niemand konnte verheimlichen, dass er im Urteil seiner Kollegen als Niete oder Faulpelz dastand.

Zwar kam es ab und zu vor, dass Abteilungen versuchten, das Ergebnis mit Extrem-Bewertungen zu ihren Gunsten zu verfälschen, oder dass ein Kollege trotz dürftiger Leistung gute Noten bekam, aus Mitleid oder Sympathie. Aber statistisch, davon war Drotleff überzeugt, „treten die Rächer kaum in Erscheinung. Auch wenn der Einzelne nicht gerecht urteilt – die Gruppe kommt diesem Ideal recht nahe.“

Vor einigen Jahren warf MuM die Gehaltsdemokratie über Bord – weil sie an ihre Grenzen gestoßen war. Das Unternehmen war von einigen Dutzend auf heute mehr als 900 Mitarbeiter gewachsen und an 60 Standorten im In- und Ausland vertreten. Schon lange kannte nicht mehr jeder jeden. Wie soll man aber beurteilen, wen man noch nie gesehen hat? Außerdem variieren selbst innerhalb Deutschlands die Gehälter je nach Region. Am Starnberger See muss Drotleff ganz andere Saläre zahlen als in Weimar.

Die Abschaffung der eigenwilligen Leistungsbewertung fiel nicht allen schwer: „Alle paar Jahre“, erinnert sich Drotleff, „gab es eine heftige interne Diskussion, ausgelöst durch die Verlierer.“ Und das waren „gefühlt 60 Prozent“ – weil einige, die eigentlich zu den Gewinnern zählten, trotzdem unzufrieden waren. Weil sie vielleicht nicht ganz so gut abgeschnitten hatten wie in den Vorjahren „oder weil ausgerechnet ein Kollege, den sie überhaupt nicht leiden können, etwas besser abgeschnitten hat“.

Heute praktiziert MuM ein klassisches Modell mit festen und variablen Gehaltsbestandteilen – letztere gekoppelt an überprüfbare Kennziffern. Lediglich das Weihnachtsgeld wird noch per Feedbackrunde aufgeteilt. Gehaltsdemokratie ultralight sozusagen.

Wie groß die Gefahr spektakulären Scheiterns ist, wenn sich Mitarbeiter gegenseitig bewerten, bekam im vorigen Jahr der Online-Modehändler Zalando zu spüren. Für etwa 5000 seiner Beschäftigten in Deutschland hatte er Zonar eingesetzt, eine Software zur Leistungsbeurteilung, die darauf basiert, dass sich Mitarbeiter, vor allem aus dem direkten Arbeitsumfeld, gegenseitig bewerten. Auf Basis der Einschätzungen erstellt ein Algorithmus individuelle Beschäftigten-Scores. Die wiederum dienen der Einteilung der Belegschaft in drei Gruppen: Top-, Good- und Low-Performer. Die Rangliste nutzt Zalando als Verteilungsmaßstab für Lohnsteigerungen und betriebliche Aufstiegsmöglichkeiten.

Philipp Staab, Soziologieprofessor an der Berliner Humboldt-Universität, hat die Wirkungsweise von Zonar in einer von der Hans-Böckler-Stiftung geförderten Studie untersucht. Sie basiert auf ausführlichen Analysen des Systems und Interviews, allerdings mit nur zehn Mitarbeitern. „Im Kern geht es darum, Beschäftigte permanent zu bewerten und so Disziplin im Arbeitsprozess zu erzeugen“, sagt Staab. Die Bewerteten reagierten entsprechend: Einer sprach von einer „360- Grad-Überwachung“, ein anderer von „Stasi-Methoden“. Zonar sorge dafür, dasss „man sich gegenseitig ständig beobachtet – und schürt auf diesem Weg Angst, Leistungsdruck, Selbstdisziplinierung und Stress“. Beschäftigten, die sich weigern mitzumachen, sei „der Weg zu Aufstiegsmöglichkeiten und Lohnerhöhungen versperrt“. Zalando dagegen sieht Zonar als „Instrument der Mitbestimmung“ und „gelebter Feedback-Kultur“. Das System sei „fairer als vorher“, als allein die Führungskraft über Aufstieg und Gehalt entschieden habe.

Die Chancen der Überwachung

Für die Mitarbeiter bleibt das System eine Blackbox. Niemand weiß, wer sich gerade welche Notizen über ihn macht. Auch ist völlig unklar, wie der Algorithmus die einzelnen Bewertungen gewichtet und zu einem Gesamt-Rating verarbeitet. Ein Fall für die Berliner Datenschutzbehörde: Sie prüft die Rechtmäßigkeit des Einsatzes von Zonar nun schon seit fast einem Jahr.

Der nächste Schritt auf dem Weg zur automatisierten Leistungserfassung ist unterdessen längst vollzogen. Warum die Mitarbeiter mit der Bewertung ihrer Kollegen drangsalieren, wenn die Maschine das auch allein bewerkstelligen kann? Bei Clickworkern etwa, die in mühseliger Kleinarbeit die KI-Hirne von Fahrerassistenzsystemen mit Trainingsdaten füttern, indem sie Fotos von Verkehrssituationen in ihre Bestandteile zerlegen, sie markieren und eingeben, was sie sehen, misst und bewertet ein Algorithmus Umfang und Qualität der Arbeit – und bestimmt damit über die Entlohnung. Auch Essenslieferdienste setzen bei der Bewertung ihrer Fahrer auf ein digitales Kontrollregime. Jeder Schritt – Auftragsannahme, Fahrt zum Restaurant, Entgegennahme des Essens, Fahrt zum Kunden, Übergabe an der Wohnungstür – muss vom Fahrer per Klick in der App bestätigt werden. So entsteht ein Echtzeit-Protokoll der Arbeit. Die leistungsstarken Fahrer dürfen sich die besten Schichten aussuchen. Wer bei der Bewertung schlecht abschneidet, muss nehmen, was übrig bleibt.

In der Logistik ermöglichen die Systeme mittlerweile eine Leistungs-Rückmeldung in Echtzeit. Sensorbasierte Feedbacksysteme wie der smarte Handschuh oder das smarte Armband verteilen durch eine kurze Vibration unmittelbar Lob, Tadel oder Fehlermeldungen – wenn der Lagerarbeiter beispielsweise das falsche Paket aus dem Regal genommen hat oder seine Leistung hinter der vorgegebenen Norm zurückbleibt.

Es geht dabei nicht nur um Leistung, sondern auch um Macht, um den „systematischen Ausbau betrieblicher Herrschaft“ – zu diesem Ergebnis kommt Eva-Maria Nyckel, Wissenschaftlerin im Lehrbereich von Philipp Staab an der Berliner Humboldt-Universität. Sie hat die cloud-basierte Unternehmens-Software Salesforce analysiert, mit der sich auch die Arbeitsleistung erfassen lässt. „Die Arbeiter werden hinsichtlich der Arbeitsschritte, die am Rechner stattfinden, vollständig durchleuchtet“, urteilt Nyckel. Ein Dashboard, also eine Art Armaturenbrett, gebe jedem Mitarbeiter zu jeder Zeit potenziell einen vollständigen Überblick über die Arbeitsleistung, auch im Vergleich, und ermögliche so „die datenbasierte Selbstoptimierung der jeweiligen Arbeitskraft“. Fazit: „Ein System weitgehend lückenloser Überwachung ist heute schon möglich.“

Wohin führt eine derartige digitale Vermessung der Arbeitsleistung? Niels Van Quaquebeke, Professor für Leadership and Organizational Behavior an der Hamburger Kühne Logistics University, hat die Einführung eines ähnlichen Systems in einer ausländischen Fabrik eines großen deutschen Unternehmens untersucht. „Dass die Manager das System in den höchsten Tönen loben“, hatte er erwartet. Die Überraschung kam, als er mit den Arbeitern in der Produktion sprach. „Die fanden das durchweg super.“

„Menschen wollen sich bei der Arbeit gut fühlen“, erklärt Van Quaquebeke. „Erreichen können sie das durch Selbstbestimmung und Vergleichsmöglichkeiten – aber nur wenn Transparenz herrscht und sie eine direkte Rückmeldung zur Qualität ihrer Arbeit bekommen.“

Früher etwa mussten die Arbeiter in dieser Fabrik für jedes Anliegen zum Vorarbeiter gehen, der oft keine Zeit hatte oder auch fachlich überfordert war. Die Mitarbeiter waren dann frustriert. Sie wussten nicht, warum sie eine Produktionsquote nicht erfüllt hatten oder eine Maschine nicht richtig lief. Das neue System, so Van Quaquebeke, empfanden sie „wie einen frischen Luftzug“. Es gab ihnen „mehr Gestaltungsmacht, weil sie nun viel besser und schneller begründen konnten, warum es beispielsweise an einer Produktionslinie hakt“. Innerhalb der Teams in der Produktion habe das System sogar einen Corpsgeist entfacht. Ein blinkendes Geldsäckchen auf dem Dashboard beispielsweise, Symbol für einen Bonus, den sich ein Team verdienen kann, könne eine ganze Gruppe anspornen, noch „eine Schippe draufzulegen“ oder bei einer benachbarten Arbeitsstation auszuhelfen.

Motor für Teamgeist oder digitale Effizienzpeitsche? Entscheidend ist nach Ansicht Van Quaquebekes letztlich, wer an welcher Stelle im Unternehmen die Verfügungsgewalt über die Daten hat. Das Management in der von ihm begutachteten Fabrik habe „der großen Versuchung widerstanden, die Daumenschrauben von Monat zu Monat anzuziehen“. Allerdings sei den Führungskräften auch klar gewesen, „dass die Akzeptanz des Systems auf null sinkt, sobald die Mitarbeiter so etwas wittern“.

Der Baseler Soziologe Simon Schaupp, der gemeinsam mit Eva-Maria Nyckel Salesforce untersucht hat, berichtet von einem Manager, in dessen Unternehmen die Software eingesetzt wird und der „selbst geschockt“ war vom möglichen Ausmaß an Überwachung. „Gib die Daten nicht mir als Vorgesetzten, sondern stell dem Mitarbeiter die Zeiten zur Verfügung, die er braucht im Vergleich zu dem, der am besten ist“, riet der Mann. „Dann kann der ja selber gucken und sich selber tunen.“ Dann müsse es der Manager nicht mehr tun.

Philipp Staab sieht den „digital gesteuerten agilen Taylorismus“, angeführt von Vorreitern wie Amazon und Zalando, in vielen Branchen auf dem Vormarsch, nicht nur in Fabrikhallen und Hochregallagern. Mittlerweile seien Techniken herangereift, „mit denen sich auch die bislang schwer erfassbaren Tätigkeiten in der Wissens- und Kreativbranche technisch abbilden und kontrollieren lassen“. Seit den Siebzigerjahren hatten sich diese Arbeitsmilieus große Freiräume der Autonomie erkämpft – „da stehen wir jetzt vor einem Trendwechsel“. Bislang waren betriebliche Tugenden wie Kreativität, Teamtauglichkeit oder Innovationskraft kaum zuverlässig messbar. Algorithmisches Management bot sich vor allem bei Tätigkeiten an, die sich zahlenmäßig exakt erfassen lassen – also jenen, die im Zuge der Automatisierung ohnehin weitgehend von Maschinen übernommen werden dürften.

Der Effekt von Kommunikation

Ganz ohne menschliches Zutun funktioniert die digitale Vermessung des Mitarbeiters bislang nicht. „Jeder Algorithmus in der Arbeitswelt wurde von Menschen programmiert“, so Staab, „er spiegelt die Bewertungsmaßstäbe von Menschen wider.“ Damit sei man „relativ nahe dran an Kontrollstrategien, die es schon früher gab. Nur ist der Algorithmus eben nicht transparent. Und er kann auch nicht befragt werden wie ein Vorgesetzter.“

Für Ben Waber, Gründer und Präsident des Bostoner Unternehmens Humanyze, das erstrangige Kunden wie die US Army, Bank of America, Nasa und die Boston Consulting Group hat, sind die schnöde Vermessung und Kontrolle von Arbeitsschritten, Stückzahlen oder Taktzeiten längst Schnee von gestern. Wabers Blick richtet sich nicht auf Tastatureingaben, sondern auf das Verhalten und das Befinden der Mitarbeiter. Wer spricht mit wem? Wie oft und wie lange? Wer redet kaum mit anderen? Ist der Gesprächspartner im Meeting oder an der Kaffeemaschine gelangweilt? Aufgeregt? Verängstigt? Zur Erfassung der Daten haben die Mitarbeiter ein kreditkartengroßes Gerät mit eingebautem Mikrofon am Rücken baumeln. Es registriert Stimmlage, Lautstärke, Sprechtempo, Pausen, vor allem aber Kommunikationsmuster.

Humanyze hat das System in drei Niederlassungen einer großen deutschen Bank getestet. Am Standort mit den besten Vertriebszahlen bei Geschäftskrediten registrierte die Software eine geradezu mustergültige Kommunikation: Jeder sprach mit jedem, keiner blieb außen vor. In der zweiten Filiale, deren Performance geringfügig schlechter war, zeigte sich, dass einige neue Mitarbeiter quasi ausgeschlossen waren. Auch mehrere Monate nach ihrer Einstellung sprachen sie nur mit ihrem Chef. Noch auffälliger war der Befund in der dritten Filiale, deren Vertriebsergebnis um zwei Drittel hinter dem der beiden anderen lag. Die Auswertung der Kommunikation offenbarte, dass es zwei Gruppen gab, die so gut wie keinen Austausch untereinander pflegten. Sie arbeiteten im gleichen Gebäude – aber auf verschiedenen Etagen.

Anschließend machte die Bank einen Test: In der Hälfte ihrer Niederlassungen sorgte sie dafür, dass Teams nicht mehr auf mehrere Etagen verteilt arbeiteten. Außerdem bekamen die Manager ein kleines Budget, aus dem Mitarbeiter neue Kollegen zum Mittagessen einladen konnten. Die Test-Filialen erwirtschafteten daraufhin – im Vergleich zu jenen Niederlassungen, in denen alles beim Alten blieb – bei Geschäftskrediten ein Verkaufsplus von elf Prozent. „Und wir reden hier nicht über ein paar Dollar“, sagt Ben Waber, „sondern über ein paar Hundert Millionen.“ ---

Abonnieren Sie unseren Newsletter um Artikel aus den Magazinen und Neuigkeiten aus dem Hause brand eins zu erhalten. Wir geben Einblicke in unsere Redaktion – inklusive Empfehlungen von Kolleginnen und Kollegen.
 

Ich habe die Informationen zum Datenschutz gelesen und bin damit einverstanden, dass die brand eins Medien AG mich künftig per E-Mail über interessante Medien- und Produktangebote ihrer Marken informiert. Der Nutzung meiner Daten kann ich jederzeit widersprechen.