Die neuere wissenschaftliche Fokussierung auf das Bild, welche sich unter dem Namen „Bildwissenschaft“ allmählich zu etablieren beginnt, hat ihre Wurzeln in verschiedenen Fachrichtungen. Entsprechend lässt sich die Bildwissenschaft – indem sie sich quer zu den konventionellen Disziplinen entfaltet – als transdisziplinär oder in den Worten von William Mitchell[1] als eine „Undisziplin“ im positiven Sinne des Wortes bezeichnen. Allerdings hat sich die Bildwissenschaft (bisher) wenig aus den sozialwissenschaftlichen, sondern vor allem aus den geisteswissenschaftlichen Traditionen der Kunstgeschichte, der Philosophie und der Semiotik gespeist. Sie interessiert sich für die den Bildern „eigene, nur ihnen zugehörige Logik“, und Gottfried Boehm resümiert in diesem Zusammenhang: „Trotz zweieinhalbtausend Jahren europäischer Wissenschaft blieb dieses Problem seltsam marginalisiert“. Wenn Boehm weiter konstatiert: „Erst im 20. Jahrhundert bildeten sich Ansätze für einen wissenschaftlichen Bilddiskurs aus“,[2] so betrifft das wiederum zunächst nur die Geisteswissenschaften. Erst gegen Ende des 20. bzw. zu Anfang des 21. Jahrhunderts zogen die Sozialwissenschaften nach. Während im Bereich der Geisteswissenschaften möglicherweise bereits zu Recht von einem „iconic turn“[3] oder einem „pictorial turn“[4] die Rede ist, trifft dies im Bereich der Sozialwissenschaften wohl kaum zu. Denn dort steckt eine methodische Fundierung der Bild- und Fotoanalyse, die den Ansprüchen sozialwissenschaftlicher Empirie gerecht zu werden vermag, noch in den Anfängen.
Die sozialwissenschaftlich-empirische Bildanalyse stellt eine Domäne qualitativer Sozialforschung dar. Letztere sieht sich allerdings vor das Problem gestellt, dass die wesentlichen Innovationen im Bereich qualitativer Methoden seit Ende der 1970er-Jahre zunächst eng mit der Textinterpretation und – weiter gefasst – mit dem linguistic turn (Richard Rorty, Paul Ricœur und Jürgen Habermas) verbunden waren. Zwar hat diese enorme Fortschritte der Interpretationsverfahren bewirkt, die wiederum wesentlich dem methodologischen Prinzip zu verdanken sind, Texte als selbstreferenzielle Systeme zu behandeln. Damit ist vor allem gemeint, soweit wie möglich auf Kontextwissen zu verzichten. Der Erfolg dieser Verfahren der Textinterpretation wurde allerdings zumindest bis zum Anfang des 21. Jahrhunderts mit einer Marginalisierung des Bildes erkauft, denn die hochentwickelten qualitativen Verfahren vermochten sich nur schwer von der Bindung an die Logik von Sprache und Text sowie vom textlichen Vorwissen zu lösen. Letzteres wäre aber Voraussetzung, um zur Eigenlogik des Bildes vorzudringen, um „Bilder nicht mehr mit Texten zu erklären, sondern von Texten zu unterscheiden“, wie der Bildwissenschaftler Hans Belting formuliert.[5]
Die Bedeutung der Bildinterpretation in der sozialwissenschaftlichen Empirie
Die qualitativen Methoden der Bildanalyse unterscheiden sich voneinander ganz wesentlich dahingehend, in welchem Ausmaß sie am Text als generellem „Modell der Sozialwissenschaft“[6] festhalten oder aber die Eigenlogik des Bildes vor allem auf der Grundlage seiner formalen Gestaltung sowie in Ausklammerung des textlichen Vorwissens untersuchen. Am erstgenannten Pol ist die Bildinterpretation im Rahmen der Methodologie der „Objektiven Hermeneutik“[7] und der daran angelehnten „Kultursoziologischen Bildhermeneutik“[8] zu verorten, an dem anderen die dokumentarische Bildinterpretation auf der Grundlage der „Dokumentarischen Methode“.[9] Zwischen diesen Polen finden wir aktuell u. a. die in der Tradition der Sozialphänomenologie stehenden Bildinterpretationen im Bereich der „Hermeneutischen Wissenssoziologie“[10] und der „Visuellen Wissenssoziologie“[11], aber auch die Fotoanalyse von Erving Goffman[12] und die ethnografisch orientierten Ansätze der Fotoanalyse[13] sowie die unmittelbar an Erwin Panofsky anschließende „Seriell-ikonografische Fotoanalyse“.[14]
Korrespondenzen zwischen den wichtigsten Traditionen der Bildinterpretation
Die skizzierten qualitativen Methoden der Bildinterpretation werden der Komplexität der handlungs-, zeichen- und wissenstheoretischen Voraussetzungen der Bildanalyse, wie wir sie in den semiotischen bzw. semiologischen Theorien und Methodologien von Roland Barthes[15] und Umberto Eco[16] finden, nur partiell gerecht. Von ebenbürtiger Komplexität ist allerdings die ikonologische Methodologie des Kunsthistorikers Erwin Panofsky[17], die in der Ikonik von Max Imdahl[18] weiterentwickelt wurde. Gleiches gilt für die Wissenssoziologie Karl Mannheims, der mit seinem Zeitgenossen Panofsky in den 1920er-Jahren in engem Kontakt stand, und für die von Mannheim ursprünglich am Beispiel der Kunstinterpretation[19] entworfene Dokumentarische Methode. Letztere ist durch die Ethnomethodologie[20] in den 1960er-Jahren wieder aufgegriffen und seit den 1980er-Jahren von Ralf Bohnsack[21] zunächst als qualitative Methode der Text- und dann der Bildinterpretation ausgearbeitet worden.
Zwischen diesen Theorietraditionen und Methodologien werden deutliche Korrespondenzen sichtbar.[22] Übereinstimmungen zeigen sich u.a. zwischen der für die Semiotik bestimmenden Differenzierung zwischen denotierender und konnotierender Sinnebene auf der einen Seite und der ikonologischen Methode von Panofsky auf der anderen Seite, bei der zwischen vor-ikonografischer und ikonografischer Sinnebene unterschieden wird. Eco, der den konnotativen Code an dieser Stelle explizit als ikonografischen Code bezeichnet, erläutert diese Differenzierungen an einem Beispiel[23]: Auf der denotativen bzw. vor-ikonografischen Ebene kann ich auf einem Bild „eine halbnackte Frau mit einem Männerkopf auf einem Teller“ identifizieren. Erst auf der konnotativen bzw. ikonografischen Ebene erkenne ich auf der Grundlage des entsprechenden Vorwissens dieses Bild als die Darstellung der biblischen Salomé.
Welchen Eigensinn ein Bild im Unterschied zum Text besitzt, also wie einzigartig die verwendeten bildhaften respektive ikonischen Zeichen zusammengefügt sind, entscheidet sich auf der denotativen Ebene. Zwar bezieht die Entschlüsselung der denotativen Botschaft bzw. des „ikonischen Code“, wie Eco diese auch nennt[24], also jener Botschaft, die nur durch das vorliegende Bild zu vermitteln ist, immer auch den ikonografischen oder konnotativen Code mit ein, das Bild kann sich aber der (ikonografischen) Konnotationen „entledigen“. Somit liegt in ihm „eine Restbotschaft, die aus dem besteht, was vom Bild übrig bleibt, wenn man (geistig) die Konnotationszeichen ausgelöscht hat“.[25] Michel Foucault beschreibt das in seiner Interpretation von Diego Velázquez’ Gemälde „Las Meninas“ (1656) folgendermaßen: „Man muß also so tun, als wisse man nicht“[26] – beispielsweise, dass es sich bei den Abgebildeten um Mitglieder des spanischen Königshauses handelt. Wie Max Imdahl betont, kann eine derartige Analyse „prinzipiell von der Wahrnehmung des literarischen oder szenischen Bildinhalts absehen, ja sie ist oft besonders erfolgreich gerade dann, wenn die Kenntnis des dargestellten Sujets sozusagen methodisch verdrängt wird“.[27] Um auf den Fall von Salomé zurückzukommen: Auch wenn ich nicht weiß, dass auf dem Teller vor ihr der Kopf Johannes des Täufers liegt und dass Salomé auf Geheiß ihrer eigenen Mutter um dessen Hinrichtung bitten musste, kann ich aus der Gestik und Mimik der Personen, aus der Farbgebung des Bildes oder auch aus der Verteilung der Figuren im Raum bestimmte Erkenntnisse ziehen.
Eine derartige Sinninterpretation, die die konnotative oder ikonografische Ebene in einer noch genauer zu bestimmenden Analyseeinstellung „verdrängt“ oder ausklammert, lässt sich in sprachlicher Form nur schwer fassen. Vorzugsweise geschieht das in Gestalt von Gegensätzlichkeiten, in einer „Sinnkomplexität des Übergegensätzlichen“.[28]
Indem Erwin Panofsky seine Methode auch am Beispiel des „Alltagslebens“ und nicht allein der Kunst erläutert hat, wird die handlungs- und sozialwissenschaftliche Relevanz der Methode ersichtlich: Die Gebärde eines Mannes, die auf der vor-ikonografischen Ebene als ein ‚Hutziehen‘ identifizierbar ist, kann auf der ikonografischen Ebene einerseits als ein ‚Grüßen‘ interpretiert werden.[29] Andererseits kann man diese Gebärde aber auch mit einer spezifischeren Analyseeinstellung betrachten. Dann wird man sie vielleicht als Ausdruck oder Beleg für die „Wesensart“, den „Wesenssinn“ dieses Menschen[30] oder für dessen „Habitus“[31] verstehen – sei dieser nun individueller (z.B.: ‚linkisches Wesen’) oder „kollektiver Art“, beispielsweise Ausdruck eines Milieus oder einer Epoche.
Der Unterschied zwischen der ikonografischen und der ikonologischen Interpretation bei Panofsky lässt sich auch als Wechsel von der Frage „Was geschieht hier?“ zur Frage „Wie wird diese Gebärde hergestellt?“ charakterisieren. Panofsky ist mit dieser Veränderung der Perspektive der Dokumentarischen Methode von Mannheim gefolgt, auf den er sich explizit bezieht.[32] Auch Erving Goffman setzt bei der von ihm vorgelegten Fotointerpretation ganz wesentlich auf der Ebene von Gesten oder Gebärden, also auf der vor-ikonografischen Sinnebene an, die er als „small behaviors“ bezeichnet, noch bevor er sie überhaupt als eine Handlung (wie z.B. das ‚Grüßen‘) interpretiert.[33] Trotz ihrer genuin sozialwissenschaftlichen Relevanz hat die Methode von Panofsky zunächst wenig Einfluss auf die sozialwissenschaftliche Bildinterpretation ausgeübt. Erst Anfang des 21. Jahrhunderts haben Ulrike Pylarczyk und Ulrike Mietzner sowie Ralf Bohnsack sich umfassender in dieser Tradition verortet[34], wobei für Bohnsack[35] auch die Weiterentwicklung der Ikonologie durch die Ikonik von Imdahl[36] mit Bezug auf die Semiotik und philosophische Reflexionen u.a. von Foucault sozialwissenschaftliche Relevanz haben. Jürgen Raab sowie Roswitha Breckner haben sich in einigen Punkten angeschlossen.[37]
Den Besonderheiten der Fotointerpretation hat im Bereich der sozialwissenschaftlichen Empirie bisher allerdings lediglich die Dokumentarische Methode insofern Rechnung zu tragen vermocht, als es ihr gelingt, die Gestaltungsleistungen der abgebildeten BildproduzentInnen, nämlich der AkteurInnen vor der Kamera, von denen der abbildenden BildproduzentInnen zu unterscheiden – gemeint sind die AkteurInnen hinter der Kamera und diejenigen, die nach der Ablichtung an der Bildgestaltung beteiligt sind.[38] Es ist das wirklichkeitskonstituierende Potenzial der abbildenden BildproduzentInnen, welches für Uneingeweihte weitgehend latent bleibt. Folglich spricht Roland Barthes von der so verbreiteten wie „mythischen“ Vorstellung des rein abbildenden Charakters, des „rein ‚denotierenden’ Status der Fotografie“.[39]
Blicken wir ein letztes Mal auf Salomé: Bei der hier abgebildeten Bildproduzentin handelt es sich um die Sopranistin Alice Guszalewicz, die 1906 die Hauptrolle der Oper Salomé von Richard Strauss spielte. Die abbildende Bildproduzentin bzw. Fotografin ist leider nicht namentlich bekannt. (Quelle: Wikimedia Commons.)
Der schwierige Zugang zur Eigenlogik des Bildlichen
Der Kunsthistoriker Max Imdahl hat Panofskys Methode kritisch erweitert. Dessen besondere Leistung, den Habitus (einer Epoche) anhand von Analogien oder Homologien unterschiedlicher Darstellungs- und Kunstgattungen (von der Literatur über die Malerei und Architektur bis zur Musik) zu erschließen, bringt Imdahl auf die kritische Frage, wo dann (noch) das Besondere des Mediums Bild, also die Eigenlogik des Bildlichen, zu suchen sei. Konkret kritisiert er Panofskys ungenügendes Interesse an der formalen Komposition des Bildes. Denn deren Rekonstruktion stelle die Grundlage der Vermittlung jenes Sinnes dar, der sich im reinen Text und im textförmigen (ikonografischen) Vorwissen nicht offenbare. Für Imdahl ist eine strikte Fundierung der Interpretation in der Formalstruktur unverzichtbar, um sich von einer an der Textförmigkeit orientierten Sequenzialität und Narrativität zu lösen, wie er sie an den konventionellen Interpretationsverfahren kritisiert. Stattdessen müsse man sich der für das Bild konstitutiven „Simultanstruktur“ nähern.[40] In die Bildinterpretation gemäß der Dokumentarischen Methode sind diese Prinzipien als Grundlagen einer sozialwissenschaftlichen Bildanalyse eingegangen. Insbesondere soll so der Anspruch erfüllt werden, „Bilder nicht mehr mit Texten zu erklären, sondern von Texten zu unterscheiden“.[41] Im Bereich der sozialwissenschaftlichen Forschung tun wir uns deshalb schwer mit diesem Anspruch, weil wir nicht umhin können, all unsere Bemühungen um einen verstehenden Zugang zur Eigenlogik des Bildlichen letztlich wieder in Beobachtungsprotokolle und Interpretationen und somit in begrifflich-sprachliche Explikationen, also in Texte, münden zu lassen.