Wie wir reden und welche Worte wir Tag für Tag verwenden, ist ausschlaggebend dafür, wie uns der Rest der Welt sieht - und das nicht nur in Gesprächen, die im echten Leben gehalten werden.
Mittlerweile verbringen wir schon fast so viel Zeit online, als wir es offline tun. Nebst Instagram oder Facebook findest du dich vielleicht auch manchmal auf Twitter wieder, wo du dann all deine Gedanken in 280 Zeichen festhälst und veröffentlichst. Sei es etwas Glückliches, komplett Komisches, oder auch etwas Deprimiertes. Genau letzteres interessiert sowie uns, als auch die Brunel University London. Zusammen mit der Leicester University und einigen Forscher*innen aus China entwickelten sie nämlich einen Algorithmus, der anzeigt, ob ein*e Nutzer*in Depressionen haben könnte - alles lediglich anhand der Tweets, welche die Person postet.
Über genau dieses Projekt haben wir mit Abdul Sadka gesprochen - er ist Direktor des Instituts für digitale Zukunft an der Brunel University. Er hat uns den Algorithmus genauer erklärt - funktionieren tut dieser unter anderem durch eine Datenbasis. Diese beinhaltet viele Twitter Nutzer*innen, dessen Tweets indikieren, dass sie Depressionen haben könnten. Durch sogenannte Neuronetworks lernt der Algorithmus auch mit jedem neuen User dazu - es werden nämlich neue Nutzer*innen mit jenen verglichen, die vom Algorithmus bereits "diagnostiziert" wurden, dass sie depressiv sein könnten. Falls ein User mit deren Eigenschaften nicht übereinstimmen, wird er oder sie verworfen.
Aber welche Eigenschaften werden untersucht? Das wären zum einen rein sprachliche Features, zum Beispiel Worte, die repetiert werden und depressive Konnotationen haben.
"The features could be personal - like identifying the social networking habits of particular users"
Es wird auch darauf geschaut, wie ein einzelner User Twitter benutzt - was gefällt ihm oder ihr? Was nicht? Wem folgt man, an was ist man interessiert?
Aber die grösste Frage ist womöglich: Wie genau ist der Algorithmus oder die Datenbasis? Kann man darauf vertrauen?
Die Antwort darauf ist, rein theoretisch, ja! Im Bereich des Machine Learning ist all das, was eine Genauigkeit von über 90% beträgt, sehr gut. Der Depressions-Indikator ist bei etwas über 88% angelangt - leicht unter dem Ziel, aber trotzdem ziemlich verlässlich. Wie die 90% geknackt werden könnten, dazu findet Abdul Sadka, dass einfach mehr Nutzer*innen untersucht werden könnten. Je mehr getestet wird, desto schneller lernt der Algorithmus dazu und desto genauer wird das Ganze.
Solch ein Algorithmus und solch eine Datenbasis haben grosses Potenzial, was auch von den Forschenden dieses Projekts anerkannt wird.
"It could be used in identifying signs of crimes before they actually happen [...] or investigate into crimes that have happened"
So Abdul Sadka selbst über den möglichen Zukunftsnutzen ihres Algorithmus'. Falls ein User eine Gefahr für jemanden - oder auch für sich selbst - darstellt, soll das schneller erkannt und behandelt werden.
Über diesen Twitter Algorithmus, welcher unter anderem von der Brunel University London erschaffen worden ist, haben wir noch mehr gesprochen. Das kannst du dir hier im Podcast anhören:
(Übrigens: Ein Algorithmus ist natürlich kein Ersatz für eine richtige Diagnose durch einen Arzt oder eine Ärztin :))
Weitere hilfreiche Links:
Brunel University London: https://www.brunel.ac.uk/
Ihr Blog: "Bot can spot depressed Twitter users in 9 out of 10 cases" via https://www.brunel.ac.uk/news-and-events/news/articles/Bot-can-spot-depressed-Twitter-users-in-9-out-of-10-cases
Ihr Forschungsbericht: "Cost-sensitive Boosting Pruning Trees for depression detection on Twitter" via https://ieeexplore.ieee.org/document/9691852