Ausgabe 07/2015 - Schwerpunkt Maschinen

Wordsmith

Die Schreib-Maschinen

Haben sich dem automatisierten Journalismus verschrieben: Robbie Allen (links) und Joe Procopio von Automated Insights

• Philana Patterson hat in ihrer Karriere als Wirtschaftsjournalistin bei den Agenturen Bloomberg und Associated Press (AP) Hunderte Quartalsberichte verfasst, und je mehr Routine sie darin entwickelte, desto weniger Zeit brauchte sie, um die Meldungen fertigzustellen. E-Mail öffnen; aussagekräftige Informationen herausfiltern; mit historischen Daten, Analystenschätzungen und Zahlen der Konkurrenten abgleichen; Text schreiben: Profis erledigen das in weniger als einer halben Stunde.

Doch in 15 Sekunden schaffte es selbst Patterson nicht. So etwas kann nur der Roboter. Eine Software wie Wordsmith, die vor einem Jahr das Schreiben von Quartalsberichten bei AP übernahm. „15 Sekunden von dem Moment, in dem ein Unternehmen seine Daten veröffentlicht, bis zum druckfertigen Text – das ist unser Rekord“, sagt Patterson, die bei AP in New York für das Projekt Wordsmith verantwortlich ist.

Im Gegensatz zu Redakteuren aus Fleisch und Blut macht Wordsmith keine Rechenfehler, meldet sich nie krank, braucht weder Urlaub noch eine Mittagspause. Durchschnittlich sanken die Kosten pro Text um mehr als 99 Prozent auf ein paar Cent. Die Algorithmen des Schreibroboters produzieren Meldungen, die sich lesen, als hätte sie ein leicht gelangweilter Redakteur geschrieben:

Guess tops 1Q profit forecasts

Guess beats 1Q net income expectations, misses revenue

forecasts

LOS ANGELES (AP) Tue, June 2, 2015

Guess Inc. (GES) on Tuesday reported fiscal first-quarter

profit of $ 3.3 million. On a per-share basis, the Los Angelesbased

company said it had net income of 4 cents. The results

surpassed Wall Street expectations. The average estimate of

six analysts surveyed by Zacks Investment Research was for

a loss of 5 cents per share. The clothing company posted

revenue of $ 478.8 million in the period, falling short of

Street forecasts. Three analysts surveyed by Zacks expected

$ 489 million. Guess expects full-year-earnings to be 86

cents to $ 1.02 per share. Guess shares have dropped 12

percent since the beginning of the year. In the final minutes

of trading on Tuesday, shares hit $ 18.62, a decline of 27

percent in the last 12 months.

 This story was generated by Automated Insights (http://

automatedinsights.com /ap) using data from Zacks Investment

Research. Access a Zacks stock report on GES at

www.zacks.com /ap /GES

So klingt eine der kürzeren Meldungen aus Wordsmiths Feder. Der Roboter wird keinen Pulitzer-Preis gewinnen, aber er fasst alle wichtigen Fakten in leicht verständlicher Sprache zusammen. Mehr wollen die Kunden nicht, sagt Patterson. „Früher haben wir oft lange Meldungen rausgeschickt, die dann von den Redaktionen gekürzt wurden.“ Und auch für diese Texte gewann AP keinen Pulitzer-Preis.

Kurz nachdem die Nachrichtenagentur bekanntgab, dass sie immer häufiger den Computer texten lässt, erschienen Artikel, in denen Journalisten ihre Furcht ausdrückten, endgültig überflüssig zu werden – nicht nur in klassischen Printmedien, sondern auch in Onlinemedien wie Huffington Post oder Slate. Patterson kann über diese Ängste nur lachen: „Ich habe dank Wordsmith drei volle Stellen eingespart. Aber die Leute wurden nicht entlassen, sondern dürfen sich endlich richtigem Journalismus zuwenden, können recherchieren und kluge Gedanken entwickeln. Meine Kollegen sind glücklich, dass wir Wordsmith haben, denn er erledigt die Aufgaben, zu denen sie keine Lust haben.“

Der Schreibroboter als nimmermüder Fronarbeiter, der die sumpfsinnigen Jobs übernimmt, damit menschliche Kollegen anspruchsvollen Journalismus betreiben können – wird so die Zukunft in den Redaktionen aussehen?

Der Journalismus-Professor Nick Diakopoulos von der University of Maryland erforscht die Auswirkungen von Big Data und Automatisierung auf die Branche. Er sagt: „Die Algorithmen werden Arbeitsplätze sichern, nicht zerstören. Weil die Unternehmen mit ihrer Hilfe effizienter werden und neue Einnahmequellen erschließen können.“ Die Zahl der Kündigungen in amerikanischen Redaktionen hat sich in den vergangenen Monaten zumindest nicht erhöht. Doch um den besorgten Redakteuren endgültig Entwarnung zu geben, ist es noch zu früh. Wie sich das erweiterte Angebot von AP langfristig auswirkt, etwa bei regionalen Tageszeitungen, die ums Überleben kämpfen, muss sich noch zeigen. Diakopoulos jedenfalls verteidigt die Roboter: „Wenn es zu Entlassungen kommt, ist kaum die Technik schuld, sondern die prekäre Finanzlage der Publikation.“

Die Firma, die Wordsmith entwickelte, heißt Automated Insights (Ai). Ein Bürohaus in der Innenstadt von Durham, North Carolina. Tischtennisplatte, Tischfußball, eine Leinwand für Computerspiele. Die gut 50 Mitarbeiter lümmeln sich in Kissen auf dem Boden oder auf fleckigen Couchs. Weil das Gebäude in ein Baseballstadion integriert ist, dient der Balkon an Spieltagen der Durham Bulls (bekannt durch den Kevin-Costner-Klassiker „Annies Männer“) als Loge.

Hier ist kaum jemand älter als 30 – außer Robbie Allen und Joe Procopio, den Gründern der Firma. Sie sind die Einzigen, die ein Jackett zu Jeans und T-Shirt tragen.

Ai produzierte 2014 eine Milliarde Texte und wird die Zahl in diesem Jahr verdoppeln. Wie Allen bei jeder Gelegenheit erwähnt, erstellt Ai mehr Artikel als die großen klassischen Medienunternehmen weltweit zusammen. Die Firma boomt. Bis Anfang des Jahres sammelte Ai insgesamt elf Millionen Dollar Kapital ein und verkaufte sich kurz darauf an die Private-Equity-Firma Vista Equity Partners. Seit AP zu den Kunden gehört, könnte Robbie Allen jeden Tag irgendwo in der Welt auf einem Symposium zur Zukunft des Journalismus auftreten. „Ich habe meinen Vortrag so oft gehalten, dass ich manchmal nachts davon träume“, sagt er.

Die Frage, die Allen überall zuerst gestellt wird: Müssen Journalisten Angst vor Robo-Reportern wie dem Wordsmith haben? „Natürlich nicht. Algorithmen sind nicht in der Lage, eine Perspektive, eine Meinung, Gefühle, persönliche Erfahrungen oder Recherche-Ergebnisse in einen Text einfließen zu lassen. Eine Filmkritik oder einen Kommentar zu Obamacare kann kein Algorithmus schreiben. Wordsmith produziert journalistische Inhalte, wo vorher keine waren.“

Philana Patterson stimmt zu: „Wir bieten unseren Kunden Dienste an, die wir mit unserem Team niemals hätten leisten können.“ AP berichtet über zwölfmal so viele Unternehmen wie zuvor, demnächst wird das Angebot auf Tausende Firmen in Kanada und Europa erweitert. Redakteure haben Zeit, die Berichte der wichtigsten Konzerne wie Apple oder Boeing mit ihren eigenen Erkenntnissen aufzuwerten. 1400 Zeitungen, TV-Sender, Radiostationen, die AP beliefert, zahlen keinen Dollar extra für den zusätzlichen Service.

Ai sei kein Medienunternehmen, sagt Allen, sondern ein Big-Data-Unternehmen. „Die Menge an Daten in unserer Welt nimmt exponentiell zu. Wir glauben, Daten sind effizienter über Worte zu konsumieren als über Grafiken oder Statistiken.“ Das Motto der Firma hängt eingerahmt am Eingang: „Ein Wort sagt mehr als tausend Zahlen.“

Heute heißt das wichtigste Geschäftsfeld von Ai „Fantasy Football“. Mehr als 19 Millionen Amerikaner nehmen an dem Spiel teil, indem sie ihre persönlichen Traummannschaften aufstellen und in virtuellen Ligen gegeneinander antreten. Das populärste Forum betreibt Yahoo, und die Fans lieben es, weil sie vor und nach jedem Spieltag auf sie zugeschnittene Berichte zugeschickt bekommen, geschrieben vom Wordsmith. Etwa ein Drittel aller Texte, die Ai 2014 erzeugte, richteten sich an Fantasy-Football-Fans, und für diese Leser erlaubt sich Wordsmith einen flapsigeren Tonfall als bei Quartalsberichten:

 Picking fourth in the draft, team „King Dom“ delivered a

roster that even a spurned ex would have to appreciate.

They’re projected to finish third in the Dirty Dozen League.

… With a draft like that you might as well make it official.

Nominate yourself for the Toyota Hall Of Fame.

Seit Yahoo mit Ai zusammenarbeitet, hat sich die Verweildauer jedes Fantasy-Football-Fans auf 29 Stunden pro Jahr verdreifacht. Die Werbekunden sind begeistert von den personalisierten Inhalten, mit denen sie jedem Spieler eine individuelle und auf den entsprechenden Spielausgang abgestimmte Botschaft schicken können. Toyota etwa montiert ein Foto des Teilnehmers in die Windschutzscheibe eines beworbenen Autos.

Schreib das auf, Robo!

Die Idee, einen Schreibroboter zu entwickeln, kam Robbie Allen bereits, als er noch bei Cisco Systems als Software-Ingenieur arbeitete. „Ich war besessen von Sport-Statistiken, aber es nervte mich, wie sie aufbereitet waren. Zahlenkolonnen und Torten-Grafiken – fast unmöglich, diese mit Genuss zu konsumieren.“ Sein Kumpel Procopio, der vorher bereits neun erfolgreiche Start-ups begleitet hatte, entwickelte 2007 innerhalb einer Woche das Konzept für eine Firma, die aus statistischen Daten automatisch Texte generiert. Allen schrieb die Algorithmen.

Die beiden nannten ihr Projekt „Statsheet“, und um zu zeigen, was die Algorithmen zu leisten imstande waren, stellten sie innerhalb von zwei Monaten Websites ins Netz für jedes Profi- und College-Team in Football, Basketball, Eishockey und Baseball. 800 Portale, auf denen jeweils fünf Texte pro Tag erschienen – vollkommen selbstständig von der Software geschrieben. „Bis heute laufen die Seiten, ohne dass wir uns darum kümmern müssen“, sagt Procopio.

Amerikanische Sportfans sind süchtig nach Statistiken über ihre Mannschaften. Jeder Yankees-Fan weiß, wie viele Prozent der Bälle etwa Alex Rodriguez trifft, wenn er einem linkshändigen Pitcher gegenübersteht; jeder Cavaliers-Fan kennt LeBron James’ Quote bei Drei-Punkte-Würfen in Auswärtsspielen. Was würde diese Zielgruppe mehr erfreuen als Websites, die in Echtzeit Texte zu allen wichtigen Statistiken lieferten – abgestimmt auf den Geschmack jedes einzelnen Fans? Allen und Procopio waren von Statsheets Erfolg überzeugt.

Was die beiden nicht ahnten: Wie schnell sich Firmen aus anderen Branchen für ihr Produkt interessierten. Eine Bank fragte an, ob man täglich personalisierte Updates an die Kunden schicken könne statt wie bislang vierteljährlich. Bodybuilding.com hatte die Idee, Sportlern über Smartphones auf Knopfdruck Zusammenfassungen ihres Trainingsprogramms zu schicken. Und Wahlkampfmanager wollten den Bürgern individualisierte Informationen senden. Kein Problem für Statsheet.

Seit 2011 kamen schnell neue Kunden wie Samsung, der Online-Autohändler Edmunds.com, der Medienkonzern Comcast, der Versicherer Allstate hinzu. Die Gründer benannten ihre Firma um in Automated Insights – wegen der Initialen, die an Artificial Intelligence erinnern. Seit es Computer gibt, versuchen Programmierer ihnen das Schreiben beizubringen. 1976 präsentierte James R. Meehan an der Yale University die ersten schreibenden Algorithmen, die allerdings noch plumpe logische Fehler in ihre Geschichten einbauten:

 One day Joe Bear was hungry. He asked his friend Irving

Bird where some honey was. Irving told him there was a

beehive in the oak tree. Joe threatened to hit Irving if he

didn’t tell him where the honey was.

Fast 40 Jahre später sagt Robbie Allen: „Unsere Algorithmen sind so gut wie fehlerfrei. Wir können je nach Kunde den Tonfall und die Struktur der Texte anpassen. Sprachlich kann man nicht mehr viel verbessern.“

Wie schreibt Wordsmith einen Quartalsbericht für AP? Der Robot-Reporter braucht Daten, um arbeiten zu können. In einer Testphase war eine Urversion von Wordsmith mit einem geologischen Zentrum in Kalifornien verbunden und berichtete für die »Los Angeles Times« über Erdbeben. Heute bekommt der Roboter umfangreiche Datensätze aus verschiedenen Quellen eingespeist: von den Unternehmen selbst, dem Datendienst Zacks, Archiven, Analysten. Diese Daten durchforstet der Algorithmus nach Informationen, die einen Neuigkeitswert besitzen. Kriterien dafür, was der Roboter als interessant erachten soll, definieren die Programmierer von Ai nach Wunsch des Kunden.

Nachdem Wordsmith die extremsten statistischen Ausrutscher gefunden hat, wählt er eine rhetorische Perspektive aus, die zum jeweiligen Ereignis passt. Etwa: „Erwartungen übertroffen“ oder „schwächer als die Konkurrenz“ oder „Investitionen zahlen sich aus“. Jede dieser Perspektiven sortiert Wordsmith nach Wichtigkeit und ordnet sie im Text der Reihe nach an.

Diese Struktur muss Wordsmith in Verbindung bringen mit individuellen Fakten wie Namen, Orten, Zeiten, historischen Ereignissen. Schließlich feilt der Roboter an den Formulierungen mithilfe eines Prozesses, der Natural Language Generation heißt. Auch hier kommen vorher festgelegte Formate zum Einsatz, die sicherstellen, dass Worte nicht zu oft wiederholt werden und der Tonfall angebracht ist. So darf ein Baseballteam den Gegner „zerstören“ oder „in letzter Sekunde ein Wunder schaffen“; General Electric kann Siemens „Marktanteile abnehmen“ oder „an Profitabilität übertreffen“.

Lou Ferrara, Vice President und Managing Editor für Entertainment, Sport und interaktive Medien bei AP, sagte in einem Interview auf CNN: „Wie alle Medienunternehmen suchen wir ständig nach Möglichkeiten, unsere Effizienz zu steigern. Als wir von Ai hörten, wussten wir sofort, dass wir den Service ausprobieren mussten.“ Bis die Fehlerquote nahe null ging und Wordsmith die sprachlichen Standards von AP beherrschte, testeten die Programmierer in Durham ein halbes Jahr lang Algorithmen.

Denn die meisten Meldungen verschickt AP, ohne sie von einem Redakteur gegenlesen zu lassen, und falsche Informationen in Quartalsberichten können teuer werden, weil sie den Aktienkurs oder das Image einer Firma beeinflussen. AP muss für Fehler haften. Patterson kann keine Zahlen nennen, aber sie sagt, fast jedes Problem basiert auf Fehlern in den veröffentlichten Daten, nicht in der Arbeit von Wordsmith.

Die Entwicklung ist nicht aufzuhalten

„Wir sind so zufrieden mit dem Produkt“, sagt Ferrara, „dass wir es jetzt auch in der Sportberichterstattung einsetzen.“ Von der nächsten Saison an wird der Roboter Spielberichte für alle Teams in allen Sportarten der 1300 in Ligen organisierten Colleges und Universitäten anfertigen – jeweils aus der Perspektive des Siegers, Verlierers und neutralen Beobachters. Mehrere Hunderttausend Meldungen pro Saison. Die notwendigen Datensätze schickt der Dachverband NCAA. Keine Redaktion der Welt könnte so etwas leisten. Wordsmith erledigt das in Sekunden.

Ken Doctor analysiert die Medienbranche am Nieman Journalism Lab in Harvard. Er hat einen Rat für alle Journalisten, denen die Robo-Reporter unheimlich sind: „Es ist zu spät, sich zu beschweren. Roboter werden immer mehr Aufgaben übernehmen, auch wegen der wirtschaftlichen Zwänge der Branche. Den Journalisten bleibt nur, eine Symbiose einzugehen und die Reporter als Partner zu sehen, nicht als Gegner.“

Was das Image des Roboterjournalismus in den Firmenleitungen betrifft, brachte die Zusammenarbeit zwischen AP und Ai den Durchbruch. „Wir werden jetzt ernst genommen“, sagt Allen. AP pflegt seit ihrer Gründung 1846 die Tradition, revolutionäre Technik in den Journalismus einzuführen: 1914 die telegrafische Schreibmaschine; 1935 Wirephoto, ein Vorläufer des Fax, mit dem man Fotos per Telefonleitung schicken konnte; 1941 Radio-Nachrichten. Nun bringt sie der Welt den Roboterjournalismus. Ferrara und Allen rechnen damit, dass in zwei bis drei Jahren die meisten großen Redaktionen den Wordsmith oder ähnliche Software nutzen werden – nicht nur in den USA.

Derweil ist man bei Ai mit den Gedanken schon ein paar Schritte weiter. Wordsmith kann bislang nur sogenannte strukturierte Daten verwerten, also vorsortierte Zahlen. Der Plan sieht vor, in naher Zukunft Algorithmen zu schreiben, die auch Sensor-Daten zu Texten verarbeiten können. Aufnahmen von Überwachungskameras oder Mikrofonen, GPS-Daten, industrielle Qualitätskontrollen, Luftmess-Stationen – die Möglichkeiten, Daten zu sammeln, sind endlos, und es ist nur eine Frage der Zeit, bis Wordsmith daraus Texte formuliert. ---

Mehr aus diesem Heft

Maschinen 

„What about machines worries you?“

Eliza is a mock Rogerian psychotherapist. The original program was described by Joseph Weizenbaum in 1966. This implementation by Norbert Landsteiner 2005

Lesen

Maschinen 

Die Unentbehrlichen

Manche Tiere sind so gut in ihrem Metier, dass keine Maschine mit ihnen mitkommt. Drei Porträts.

Lesen

Idea
Read