David Waldecker | Rezension |

Algorhythmen

Rezension zu „Computing Taste. Algorithms and the Makers of Music Recommendation“ von Nick Seaver

Nick Seaver:
Computing Taste. Algorithms and the Makers of Music Recommendation
USA
Chicago, IL 2022: The University of Chicago Press
xv, 203 S., 20,00 $
ISBN 978-0-226-82297-6

Die sich bei näherer Betrachtung weder als künstlich noch als intelligent erweisende artificial intelligence[1] wird aktuell breit diskutiert. Kritische Sozialforschung stellt zu Recht heraus, wie die Verwendung von KI rassistische, sexistische oder schlicht unsinnige Ergebnisse produziert, und wie deren Einsatz zur Deregulierung von Arbeitsverhältnissen oder der Umweltverschmutzung durch energieverschlingende Datenzentren beiträgt. In vielen Publikationen werden dabei Vermutungen darüber angestellt, dass die problematischen Resultate der KI-Produkte mit der Unreflektiertheit ihrer Entwickler zusammenhängen, die sich als meist junge, weiße Männer wenig Gedanken über rassistische oder sexistische Diskriminierung machen müssen.[2] Der Lebensstil sowie die Äußerungen von Eigentümern und Vorsitzenden großer Internetkonzerne lassen ebenso Kritik an der „tech-bro culture“ aufkommen.

Indem Nick Seaver nicht über, sondern mit diesen Programmierenden spricht, schließt seine unterhaltsam geschriebene Monografie hier eine Forschungslücke. Seine Studie befasst sich mit den Programmierenden der Empfehlungsalgorithmen, die in Musik-Streaming-Diensten wie Spotify oder Deezer zum Einsatz kommen. In einer Ethnografie von Start-Up-Unternehmen, Fachmessen, Uni-Seminaren und IT-Konferenzen hat der Autor sie bei der Arbeit beobachtet. Was auf den ersten Blick als trivialer Einsatz von Algorithmen erscheinen mag, erweist sich in Seavers Beschreibung als prägender Faktor für unseren alltäglichen Musikkonsum. Das Buch beschreibt dabei, welche Vorstellungen über Musik und Technik in die Programmierung, das Testen und das Nachjustieren dieser Algorithmen einfließen und inwiefern letztere dadurch selbst Kultur und nicht etwas ihr Außenstehendes sind.

Nick Seaver ist Kulturethnologe an der Tufts University in Massachusetts und hat bereits in früheren Arbeiten gezeigt, wie sich digitale Prozesse durch qualitative Sozialforschung untersuchen lassen.[3] In diesem Buch geht er der Frage nach, wie Menschen, die algorithmische Musik-Empfehlungssysteme entwickeln, ihre Arbeit verstehen: Wie denken sie über Musik, Musikhören und Geschmack nach und wie schlagen sich solche Vorstellungen in der Arbeit an Algorithmen und in den individualisierten Empfehlungen der Streamingdienste nieder? Bei der Beantwortung dieser Fragen verbindet Seaver Wissenschafts- und Technikforschung mit der soziologischen Thematisierung von Geschmacksbildung. Wie sich herausstellt, sind die beforschten Ingenieure keine „cultural dopes“ (Garfinkel), sondern in vielen Fällen selbst ehemalige Musiker oder Musikfans (S. 83). Des Weiteren bewegen sie sich in einem akademisch informierten Feld, das universitäre Forschung durch Ausgründung in Tech-Unternehmen überführt und so auch auf praktischer Ebene dazu nötigt, Wissenschafts- und Technikforschung zusammenzuführen.

Das Buch ist in eine Einleitung und sechs Kapitel unterteilt. Während die Einleitung den sozialwissenschaftlichen Zugang zum Digitalen darlegt, schildern die ersten Kapitel chronologisch die Entwicklung der musikbezogenen recommender systems seit den 1990er-Jahren; ausgehend von den Metaphern, mit denen die Programmierenden das Nutzerverhalten sowie ihre eigene Arbeit an Algorithmen beschreiben, beschäftigen sich die letzten drei Kapitel mit der Frage, wie dieses (Selbst-)Verständnis in der Ausgestaltung algorithmischer Systeme zum Tragen kommt.

Seaver beschreibt Algorithmen als Teil von Kultur, indem er empirisch nachvollzieht, wie bestimmte Vorstellungen davon, was Musikgeschmack, Genres oder Hörverhalten ausmacht, in diese Algorithmen einfließen. Das, was in Debatten um den digitalen Wandel als Algorithmen bezeichnet wird, sind nicht einfach mathematische Formeln, wie sie Seaver im Laufe seiner Ethnografie etwa in Informatik- und Data-Science-Seminaren begegnet sind. Vielmehr erweisen sich die Algorithmen in der Praxis der Programmierenden als eine komplexe Gemengelage, in der sich unterschiedliche und teils widersprüchliche kulturelle Vorstellungen im Code sedimentiert haben. Streaming-Anbieter kombinieren die Analyse verschiedener Daten über Hörende, Musik und Kontextfaktoren, um so eine Empfehlung bezüglich des nächsten Songs oder eine individualisierte Auswahl („Musik für Dich“) auf der Startseite ihrer Apps zu präsentieren. Aufgrund dieser Vielschichtigkeit spricht Seaver lieber von „algorithmic systems“ als von Algorithmen.

Die These des Buchs, Algorithmen seien nicht von Kultur abgekapselt, sondern Teil der zeitgenössischen (Musik-)Kultur, ist empirisch plausibel und bewahrt vor Technikdeterminismus ebenso wie vor einem Kulturessentialismus, der die Vereinnahmung der lebendigen Musikkultur durch technische, zweckrationale Prozesse moniert, die auch noch von kulturfernen Unternehmern und Ingenieuren implementiert werden. Tatsächlich ist Musik Kulturform (auch im Sinne einer Hochkultur) und Alltagsphänomen zugleich und zwangsläufig auf die Vermittlung durch technische Artefakte angewiesen. Seavers Studie zeigt, wie diese verschiedenen Aspekte bei der Entwicklung algorithmischer Systeme relevant werden. Die beforschten Ingenieure beziehen sich bei der Beschreibung ihrer Arbeitspraxis auf Theorien über Musik; des Weiteren reflektieren sie die Ergebnisse, welche die entwickelten Algorithmen liefern, vor dem Hintergrund ihrer eigenen Erwartungen an und Vorstellungen von guter Musikempfehlung, und ergänzen beziehungsweise überarbeiten sie dementsprechend.

Wie Seaver herausstellt, sind Algorithmen keine stabilen Entitäten, sondern es wird beständig an ihnen gearbeitet. Die Entwickler beobachten die Geschehnisse auf der Plattform und konturieren das System neu, wenn es sich bei Empfehlungen allzu sehr auf einzelne Genres oder Künstler:innen beschränkt. Hier zeigt sich, wie Einschätzungen der Entwickler, was eine passende Empfehlung ist und was nicht, beständig als Maßstab dafür herangezogen werden, wie gut der Algorithmus funktioniert.

Seavers Buch macht ebenfalls deutlich, dass Konzepte und Anwendungen der automatischen Musikempfehlung einem historischen Wandel unterliegen. So mussten Nutzende der ersten Dienste Mitte der 1990er-Jahre noch einen Bewertungsfragebogen ausfüllen und per Email einsenden, um ihre Musikpräferenzen automatisch mit denen anderer Nutzenden vergleichen zu lassen. Auf dieser Grundlage erhielten sie Vorschläge für neue, auf CD veröffentlichte Musik. Diese Dienste beruhten auf der – Soziolog:innen nicht unbekannten – Vorstellung, dass Geschmack gewissen Mustern folgt und sich daher anhand von Musikpräferenzen aus der Vergangenheit wahrscheinliche musikalische Vorlieben für die Zukunft voraussagen lassen.

Auf dieses Modell folgte das aktuell wirkmächtigere Paradigma der „capture“. Ziel der Empfehlungssysteme war es nunmehr, Nutzende dazu zu bringen, möglichst lange auf den Streaming-Plattformen zu verweilen. Dieser Paradigmenwechsel begleitete den Wandel des Felds von einer informatischen Nische für Musikliebhaber:innen hin zum Streaming, der zu Beginn der 2010er-Jahre auftretenden und inzwischen meistgenutzten Form des Musikhörens. Die in diesem Zusammenhang verwendeten „captivation metrics“ (S. 58) setzen nicht mehr auf Angaben der Nutzenden zu ihrem Musikgeschmack, sondern auf die Analyse von verschiedensten Daten, die bei der Nutzung eines Streaming-Dienstes zwangsläufig anfallen. Seaver analysiert diese Techniken im Hinblick auf die ethnologische Forschungsliteratur zum Fallenstellen, die er auf die Infrastruktur von algorithmischen Systemen bezieht – „an infrastructure is a trap in slow motion“ (S. 70).

Wie in dieser Literatur schon um 1900 analysiert wurde, sind Fallen „not just practical devices, but a kind of experimental system, caught up with basic questions of knowledge“ (S. 63). In diesem Sinn beruhen Überlegungen der Programmierer zu captivation metrics auch auf Vorstellungen über die Nutzenden. Die im Feld vorherrschende Hörertypologie bezieht sich auf dominante Nutzungsweisen von Musikplattformen und Abspielgeräten: als „lean-forward“ (S. 80) gelten Hörende, die aktiv nach neuer Musik suchen und Playlists zusammenstellen, während Hörende, die sich von der Musik tendenziell berieseln lassen, als „lean-back“ bezeichnet werden. Die Programmierenden begreifen sich als „lean-in“ und „avid listeners“, als begeisterte Musikhörende, und verhandeln damit auch ihre Differenz zum Gros der Nutzenden, die sie aufgrund der Nutzungsdaten als „lean-back“ begreifen (S. 81). Um unterschiedliche Nutzende auf der Plattform zu binden, werden die Empfehlungssysteme entsprechend variiert und multipliziert, also wie Fallen an die unterschiedlichen Beutetiere angepasst. So zeigt Seaver, dass die gängige Kritik an Tech-Unternehmen und ihren Mitarbeitenden, sie würden die Welt nur aus ihrer Warte betrachten, zu kurz greift. Demgegenüber hebt er einen Leitsatz hervor, der bei Diskussionen in diesem Feld regelmäßig Erwähnung findet: „Rather than imagining oneself as the user, one had to imagine the user as someone unlike the self“ (S. 85).

Die Mitarbeitenden bleiben aber nicht bei solchen Typologien stehen, sondern gehen davon aus, dass die gleiche Person je nach Situation unterschiedliche Musik auf verschiedene Weise hört (S. 86). Der in der qualitativen Sozialforschung oft angeführte „context“ (S. 88) wird auch von den Programmierenden aufgerufen, wenngleich auf andere Weise als in der Sozialforschung. In der praxeologisch orientierten Soziologie ebenso wie in der Ethnologie wird Kontext zum Beispiel bemüht, um die Bedeutung eines Artefakts oder einer Äußerung als Element der Situation ihres Gebrauchs zu verstehen. Ohne Zugriff auf den Vollzug der Situation müssen die Programmierenden den Kontext zum Beispiel über die Uhrzeit, wiederkehrende Nutzungsweisen und Smartphone-Metadaten – und damit über maschinell erfasste Daten – erschließen. Zu diesem Zweck werden immer mehr Daten angehäuft, die nicht direkt den Musikgebrauch betreffen (S. 93). So wird etwa aufgrund der Uhrzeit und einer universitären IP-Adresse darauf geschlossen, dass sich die Nutzende in der Universitätsbibliothek aufhält und eher Musik zum Lernen als zum Tanzen hören möchte. In der Konsequenz beteiligen sich Musikplattformen an der vielschichtigen Überwachung ihrer Nutzenden.

Neben den Aktivitäten der Hörenden dienen auch Charakteristika der Musik dazu, die Empfehlungssysteme auszufeilen. Dafür hat sich nach einer mathematischen und abstrahierenden Variante nun ein anderen KI-Systemen ähnliches Verfahren maschinellen Lernens durchgesetzt. Dabei verlassen sich die Programmierenden jedoch nie gänzlich auf die Algorithmen. Um zu überprüfen, ob diese Systeme auch in ihrem Sinn funktionieren, müssen die Entwickler:innen sich die Empfehlungen und Klassifizierungen immer wieder selbst anhören und die Ergebnisse mit ihrem musikalischen Wissen abgleichen. Dabei zeigt Seaver auch, dass den Ingenieur:innen die KI-Systeme teilweise ähnlich opak erscheinen wie den Nutzenden selbst (S. 114).

Die untersuchten Empfehlungsalgorithmen erweisen sich als Systeme, die teils gegenläufige Vorstellungen von Musik und Hörenden, der Relevanz von Kontext oder der individuellen Nutzung von Streaming-Plattformen verbinden. Als verbindende Grundannahme der Arbeit in diesem Feld beschreibt Seaver die Vorstellung, dass die Automatisierung der Musikempfehlung notwendig ist, damit Hörende sich in der unübersichtlichen Masse an Musik orientieren können. Diese Auffassung führt Seaver auf das kybernetische Konzept des „information overload“ aus den 1970er-Jahren zurück. Dabei moniert der Autor, dass der sogenannte Informationsüberfluss sich empirisch nicht prüfen lasse (S. 32 f.). Man kann sich daher fragen, ob der digitale Musikgebrauch nicht auch ohne Empfehlungsautomatisierung auskommen würde.

In der Gesamtdarstellung wird deutlich, wie sich die Diskurse im Feld an technizistischen und kybernetischen Vorstellungen von Musik, Wahrnehmung und Geschmacksbildung orientieren und wie sie dabei auch auf popularisierte Sozialtheorien zurückgreifen. Theoretische Erläuterungen der Programmierenden in Bezug auf die Herausbildung individuellen Musikgeschmacks oder in Hinblick auf die Entstehung von Genres entpuppen sich dabei als Teil eines modernen Diskurses über die Beziehung zwischen Kultur und Technik. Im Laufe der Kapitel erschließt sich dem Leser, wie sich recommender systems von einer technischen Fingerübung von Nerds für Nerds hin zu einem Teil der alltäglichen Infrastruktur des Musikhörens entwickelt haben. Diese Entwicklung geht auch an den Entwickler:innen nicht spurlos vorbei. So fragen sich einige von ihnen, ob sie den Nutzenden mit dieser Form der Empfehlungsinfrastruktur nicht einen Bärendienst erweisen. Einer der Entwickler erzählt etwa, dass er schließlich erkannt habe, dass die nun wirkmächtigen Plattformen eine nicht unerhebliche Macht über die Nutzenden haben und so auf musikalische Präferenzen nicht nur reagieren, sondern diese auch formen (S. 156).

Während Seaver die wenig beachtete Innenseite von Internetplattformen schildert, bleiben manche Aspekte des Gegenstands außen vor, wie zum Beispiel der Umgang der Nutzenden mit den Empfehlungssystemen. Dies ist angesichts seiner Forschungsfrage und Schwerpunktsetzung nachvollziehbar. Dennoch kann man festhalten, dass der Autor zwar einige kanonische Texte aus der Musiksoziologie referiert – neben Pierre Bourdieu und Antoine Hennion auch die Debatte um den kulturellen Allesfresser –, aber die an sich naheliegende Forschung im Bereich der ethnomusicology unerwähnt lässt. So beschreibt Seaver zwar die Diskussionen um Genres im Feld, wie viele musiksoziologische Texte überlässt aber auch er die weitergehende Beschäftigung mit der Musik der Musikwissenschaft. Ob eine Diskussion unter Programmierenden dazu stattfindet, wie nun das musikalische Material durch das plattformisierte Hören geformt wird, wie also Künstler:innen auf die Bedingungen plattformisierter Verbreitung und Wertschöpfung reagieren, bleibt ebenfalls unerörtert.[4]

Dennoch ist das Buch über seinen unmittelbaren Gegenstand hinaus aufschlussreich, weil es zeigt, wie eine für die technische Ausgestaltung algorithmischer Infrastruktur zuständige Gruppe ihre Arbeit reflektiert und sie ausführt. Damit leistet Seaver einen Beitrag dazu, die Rolle von algorithmischen Systemen in der Gegenwart zu erklären, denn recommender systems sind aus digitalen Diensten nicht mehr wegzudenken und finden sich nicht nur bei Netflix und Amazon, sondern auch auf den Seiten der New York Times und in den Mediatheken der öffentlich-rechtlichen Sendeanstalten (S. 69).

Weitere Forschung sollte nun die Frage nach den Entstehungsbedingungen algorithmischer Systeme in Unternehmen auch auf Kontexte und Organisationen übertragen, die polizeilicher, juristischer oder medizinischer Natur sind.

  1. Kate Crawford, Atlas of AI, New Haven, CT 2021, hier S. 7.
  2. Batya Friedman / Helen Nissenbaum, Bias in Computer Systems, in: ACM Transactions on Information Systems 14 (1996), 3, S. 330–347, hier S. 333; Stephen Cave / Kanta Dihal, The Whiteness of AI, in: Philosophy & Technology 33 (2020), 4, S. 685–703, hier S. 695.
  3. Nick Seaver, Algorithms as Culture: Some Tactics for the Ethnography of Algorithmic Systems, in: Big Data & Society 4 (2017), 2, S. 1–12, hier S. 6.
  4. Dazu etwa Max Alt / Jan Gerrit Papenburg, Streamability. Überlegungen zu einer Ästhetik des Musik-Streaming, in: Anna Schürmer / Maximilian Haberer / Tomy Brautschek (Hg.), Acoustic Intelligence. Hören und Gehorchen, Düsseldorf 2022, S. 227–246.

Dieser Beitrag wurde redaktionell betreut von Nikolas Kill.

Kategorien: Daten / Datenverarbeitung Digitalisierung Kultur Kunst / Ästhetik Technik Wissenschaft

David Waldecker

David Waldecker ist Soziologe. Nach einer Promotion zu „Adorno im Tonstudio“ (2020) und Mitarbeit im SFB „Medien der Kooperation“ an der Universität Siegen ist er seit Herbst 2023 an der Universitäts- und Landesbibliothek Darmstadt tätig.

Alle Artikel

Empfehlungen

Valentin Groebner

Zeig Dich im Zauberspieglein

Rezension zu „Body-Bilder. Körperkultur, Digitalisierung und soziale Netzwerke“ von Jörg Scheller und „Gesichtserkennung. Vernetzte Bilder, körperlose Masken“ von Roland Meyer

Artikel lesen

Jonathan Kropf

Schleichender Wandel mit ambivalenten Folgen

Rezension zu „Digitale Transformation“ von Jan-Felix Schrape

Artikel lesen

Tanja Kubes

Maschinen wie wir

Rezension zu „Künstliche Intelligenz und Empathie. Vom Leben mit Emotionserkennung, Sexrobotern & Co“ von Catrin Misselhorn

Artikel lesen

Newsletter