Samstag, 26. Januar 2013

Das Wikimedia-Commons-Problem ist nicht der Inhalt

Oh, so viel Energie, so viel Kreativität, soviel Geist und soviel Aufwand geht dort hinein, um das Wikimedia-Datei-Lager Wikimedia Commons zu verbessern. Mittlerweile sind dort 15 Millionen Datein enthalten, die schon einen ganz guten Überblick über die Welt wie sie gerade ist, ergeben.

Aber es gibt zwei Nachteile: (1) niemand findet je ein Bild in Commons, (2) niemand nutzt je ein Bild aus Commons nach. Das ist natürlich überspitzt gesagt. Aber wer in Commons schon mal auf Bildsuche gegangen ist, weiß vage was ich meine.

Krappmühle 5
Random file Nr. 1

Selbst ich, der ich nun lange genug im Wikiversum rumkrauche, empfinde im Normalfall die flickr-cc-suche als deutlich schneller und besser und zielführender als die Suche in Wikipedia. Sehr spezifische Anfragen klappen immerhin manchmal "suche mir ein  Bild des Innenhofs im Hamburger Rathauses" - vorausgesetzt man hat richtig geraten, wie das Hamburger Rathaus gerade in commons auf English genannt wird und vertippt sich nicht. Der richtige Treffer wäre Category:Courtyard of the City Hall in Hamburg während das eigentliche Rathaus liegt unter Category:Hamburger Rathaus. Selbst klar abgrenzbare Motive findet man nur mit einer Mischung aus Durchclicken, Glück und viel Übung.

Unrin hokkoutin
Random file Nr. 2

Wirklich schlimm wird es, wenn man mal ein schönes Kuchenbild mit Kerzen sucht. Im Normalfall muss man sich dann durch 100 Kuchenkategorien "Cakes with apples in Mongolia" und ähnlichen tippen - oder im seltenen Fall gibt es noch "Cakes with Candles", die auch heißen könnte "Candles on cakes" or "lighted cakes" oder noch 10 andere Beschreibungen. In den Kategorien sind dann zwei Handy-Bilder von schräg links oben in dezentem grünlichschimmer. It's a mess.

Kein Wunder, dass niemand Bilder nachnutzt, wenn man sie nicht findet. Oder wenn es mehr als seltsam ist, dass es etwa 20 verschiedenen Lizenzen gibt, die mal mehr oder weniger gut erklärt werden; und wenn sich die Welt - zu Unrecht - nicht sicher ist, ob die Bilder auf Commons überhaupt die notwendigen Rechte haben, die Commons bereitwillig weitergeht. Nur als kleines Beispiel: ich habe 190 Bilder vor vielen Jahren auf flickr hochgeladen und etwa 3500 aktuelle Bilder auf Commons. In er freien Wildbahn sind etwas mehr flickr-Bilder von mir im Umlauf als Commons-Bilder. Das kann nicht sein.

PAS COBERT (C. SENSECAP) - TORÀ - IB-423
Random file Nr. 3

Im Moment kann man vor allem Bilder auf Commons abwerfen und hoffen, dass sich das System mal so verändert, dass die Menschheit es nutzen kann. (Das ist natürlich ironisch, weil DER große Vorteil der Wikipedia die einfache Nutzbarkeit ist.) Vielleicht wäre es lohnender weniger Aufwand zu betreiben, um Commons zu füllen - aber dafür mehr Aufwand um die bereits behandenen Bestände auf Commons unter die Leute zu bringen.

9 Kommentare:

Anonym hat gesagt…

Wobei von allen Formaten die Bilder auf Commons noch richtig gut durchsuchbar sind.

Also los. Was muss gemacht werden?

Anonym hat gesagt…

Wobei von allen Formaten die Bilder auf Commons noch richtig gut durchsuchbar sind.

Also los. Was muss gemacht werden?

Anonym hat gesagt…

Das einzig sinnvollste wäre es, das unsägliche Kategoriesystem einzustampfen und durch ein einfaches Tagging-System zu ersetzten.

Dann wäre es auch nicht schlimm wenn ein Rathaus unter "City Hall", "Rathaus" und "Mairie" getaggt oder ob "Praha" auch als "Prag" und "Prague" getaggt ist.

ms hat gesagt…

Ein Wiki ist halt kein Fotodienst und das merkt man den Commons einfach zu deutlich an. Nicht nur die Suchfunktionen, sondern auch die Präsentation der Bilder, die Uploadfunktionen und so weiter sind absolut archaisch. Das war schon veraltet als es damals neu eingeführt wurde.

Dazu kommen wirklich bizarre Urheberrechtsverrenkungen. Erkläre es mal jemandem, dass man gerade sein Foto der Oldenbourg-Kugeln in Münster löscht, weil in den USA die Panoramafreiheit nicht gilt. Oder dass man irgendwelche Werke nach einem obskuren URAA-Abkommen löscht. Das ist nicht nur vollkommen bekloppt, da muss man auch absoluter Experte sein.

smial hat gesagt…

Ein sinnvolles Tagging könnte ja zusätzlich zu den Kategorien eingeführt werden. Dazu bräuchte es aber erstmal Werkzeuge. Bilder, die einmel in einer Unter-unter-unterkategorie versenkt wurden, findet niemand mehr wieder, es sei denn, es gäbe eine (selten vorzufindende) ausführliche Bildbschreibung, in der die Freitextsuche irgendwas findet.

Gern hat man aber bei der Suche entweder drei oder 42.000 Ergebnisse. Das ist Murks.

Bei den Nachnutzungen ergibt sich ein ganz klarer Trend: Bilder, die in Artikeln auf DE verwendet werden, findet man auf deutschen webseiten wieder. Bilder, die auf EN verwendet werden findet man weltweit wieder. Bilder, die in keinem Artikel stehen oder nur in Listenartikeln, nutzt niemand nach. Nirgends.

Auffällig ist auch, wieviele Nachnutzungen Dateinamen wie "180px_irgendeinMotiv" haben. Da ist nicht einmal bemerkt worden, daß es commons gibt mit größeren Bildversionen.

Raymond hat gesagt…

Eine Lösung habe ich nicht und mir ist auch nicht klar, inwiefern ein Tagging-System hier Abhilfe schaffen könnte. "Rathaus Köln", "Kölner Rathaus", "Townhall of Cologne" sind für mich 3 verschiedene Tags und in Abhängigkeit von der Sprache des suchenden Benutzers wird auch nur ein Teil der Bilder gefunden werden, oder?

Zu Smial: "... findet niemand mehr wieder, es sei denn, es gäbe eine (selten vorzufindende) ausführliche Bildbschreibung, in der die Freitextsuche irgendwas findet."

Eine ausführliche Bildbeschreibung ist das A und O überhaupt. Idealerweise mehrsprachig (*an die eigene Nase fass*). Diese sind, auch nur in einer Sprache, sehr zeitaufwändig. Im Moment arbeite ich mich noch durch Innenaufnahmen des Museum Schnütgen durch. Beispiel: https://commons.wikimedia.org/wiki/File:Museum_Schn%C3%BCtgen_-_Innenaufnahmen-6481.jpg

Die Beschreibung der Kunstwerken ist Feinstarbeit, aber sehr sehr wichtig, sowohl für das Museum als auch für jeden Nutzer.

Das Preis: Die Anzahl unbearbeiteter Fotos auf meiner Platte wächst und wächst. Andere Benutzer hingegen können mit tollen Uploadzahlen prahlen....

Und ich könnte regelmäßig K****, wenn jemand seine 200 Fotos auf Commons "ablädt" und diese nur beschriftet mit "London 2012". De facto wertlos, weil sie nicht gefunden und damit nicht genutzt werden können.

So, genug aufgeregt für einen Sonntagmorgen.

dirk franke hat gesagt…

@raymond: das mit den London-Fotos denke ich ja eigentlich auch. Ich habe sehr gekotzt als ein Commons-Admin 400 Tower-of-London-Fotos doppelt(!) ohne Beschriftung hingedumpt hat, und ich die mühselig sortiert und zugeordnet habe. Später alerdings habe ich dann rehabilitiert, weil er der einzige von 2 Millionen Touristen im Jahr war, der es geschafft hat, Fotos vom gesamten Nordteil der Festung zu machen und unter eine freie Lizenz zu stellen. Hätte er sich auf 10 Fotos beschränkt und die ordentlich beschriftet, wären es wieder die Motive gewesen, die es eh dutzendfach gibt. Oder anders: ich bin verwirrt.

Aber ein echtes Tagging-System würde ja nicht so laufen, dass ein Foto entweder die Tags hat "Kölner Rathaus", oder "Rathaus Köln", sondern "Köln", "Cologne", "Rathaus", "city hall", Town hall", "night", "yellow light", "nacht", "19 jahrhundert", "gotik" etc.

Wenn ich dann Bilder suche, gebe ich ein "Rathaus", "Barock", "Sonne" und kriege hoffebtliche alle deutschen Barockrathäuser im Sonnenschein.

Was übrigens ein schönes Beispiel für kollaboratives taggen ist, und wo auch ein bisschen erklärt wird, warum das gut ist, macht die BBC: http://tagger.thepcf.org.uk/

Anonym hat gesagt…

Vielleicht gibt es hier auch eine Möglichkeit das Tagging mit Wikidata zu verknüpfen.

Dort habe ich die Verknüpfung zwischen den verschiedenen Schreibweisen von Köln, Prag oder Augsburg etc. Es müsste also nicht einmal eine Datei mit verschiedensprachigen Tags versehen werden, wenn die Software erkennt, dass mit براغ "Prag" gemeint ist.

Somit könnte der Araber seine Bilder mit براغ taggen und der deutsche mit "Prag" und beide finden, was sie suchen.

Natürlich könnte man die Bildinformationen verschiedensprachig machen. Ich wäre jedoch eine Art "Babel-Bot" sinnvoller.

Marcus Cyron hat gesagt…

Etwa einmal im Monat ringe ich mich dazu durch und mache ein wenig Ordnung in irgendeiner mich betreffenden Kat. Und leider finde ich immer wieder genau das, was Raymond beschrieben hat. Gerede diese Woche habe ich in der Oberkat "Athen" sortiert. Und was fand man dort? Bilder eines Autraliers mit der Beschriftung und Kategorisierung "Athen" und "Olympia" und so etwas. Die Bilder waren dann teilweise aus Athen, teilweise aus Olympia, immerhin konnte ich alle Kunstwerke dank verschiedener Möglichkeiten einordnen. Offensichtlich hatte der Herr sie 2004 gemacht, als er zu den Olympischen Spielen in Griechenland war. niemand ohne Fachwissen hätte diese Bilder je nutzen können. Auch sonst versuche ich es schon lange wie Raymond zu machen - möglichst genaue Beschriftungen. Leider sind die am Ende oft weniger genau als man selbst möchte, weil man nie an alle Interessen und Eventualitäten denkt.