[Kobv-opus-tester] DINI-zertifikatsgerechte Zugriffsstatistik in Opus

Schobert, Dagmar dagmar.schobert at tu-berlin.de
Fr Apr 11 08:44:27 CEST 2014


Liebe Kolleginnen und Kollegen,

wir haben uns in den letzten Wochen etwas mit den Anforderungen des DINI-Zertifikates befasst und sind beim Punkt Zugriffsstatistik auf ein Problem gestoßen.

Anton Katzer, SHK in unserer Abt., fasst die Bedenken wie folgt zusammen:

----

Für das DINI-Zertifikat 2013 ist nach Punkt 2.7 Nr. E.7-1 eine öffentlich zugängliche Zugriffsstatistik erforderlich.
Zwar können wir mit Piwik Zugriffsstatistiken erstellen, allerdings bestehen nach unserer Meinung einige Probleme:



1) Piwik erfasst aufgrund der JavaScript-basierten Technologie keine Downloads, die nicht von innerhalb einer von Piwik getrackten Seite erfolgen. Praktisch ist ein Link von Google oder über Bookmarks direkt auf ein PDF nicht nachverfolgbar. Dazu kommen nicht erfasste Zugriffe (Frontdoor und Downloads) von Benutzern, die JavaScript deaktivieren oder Privacy-Addons wie Ghostery in ihrem Browser verwenden.



2) Aufgrund der URL-Struktur von Opus ist nicht immer nachvollziehbar, welche Zugriffe von tatsächlichen Benutzern und welche z.B. von Mitarbeitern des Universitätsverlages stammen, da von Piwik nicht zuverlässig nach IP-Adresse gefiltert werden kann.



3) Die Konfiguration von Piwik fasst einzelne Seitenaufrufe ab einer gewissen Komplexität zusammen. Die Daten werden dann nicht mehr aufgeschlüsselt nach Dokument, sondern zusammengefasst als "Andere" angezeigt. Beispielsweise gibt es im März 2014 laut Opus ca. 10000 Frontdoor-Zugriffe, jedoch sind nur ca. 2500 davon Dokumenten zuordenbar, die restlichen 7500 fallen unter "Andere".

Dieses Verhalten von Piwik existiert aus Performance-Gründen und kann eventuell behoben werden, indem die serverseitige Konfiguration geändert wird, wie hier beschrieben: http://piwik.org/faq/how-to/#faq_54

Es stellt sich aber die Frage, ob die aufgeschlüsselten Daten archiviert wurden.



Unserer Meinung nach ist Piwik zwar als Tool zur relativen Zugriffsanalyse sehr gut geeignet, es erfasst jedoch keine verlässlichen, absoluten Daten, wie für das DINI-Zertifikat (siehe auch Punkt M.7-4) gefordert wird.
Praktisch sehen wir keine Alternativen zur Auswertung der Server-Logs, denn nur damit können alle relevanten Zugriffe gezählt werden. Für Opus 3 gab es ein Script, dass die gefilterten Serverlogs in CSV-Dateien konvertiert zur Verfügung gestellt hat. Eine derartige Lösung ist zu bevorzugen, wobei das Format der Daten erst einmal zweitrangig ist.

Sehen wir das richtig? Wie sind die Erfahrungen anderer Instanzen?
Welche alternativen Möglichkeiten gibt es zur (möglichst COUNTER-Standard-gerechten) Zählung der absoluten Zugriffe auf jedes einzelne Dokument?

Viele Grüße,
Dagmar Schobert

---
Dagmar Schobert
Universitätsbibliothek der TU Berlin
Abt.-Ltg. Universitätsverlag/Hochschulschriften
Fasanenstr. 88, 10623 Berlin

Tel.: +49 (0)30 314 76127
Fax: +49 (0)30 314 76133
dagmar.schobert at tu-berlin.de<mailto:dagmar.schobert at tu-berlin.de>
http://www.ub.tu-berlin.de/universitaetsverlag-und-hochschulschriften/
http://opus4.kobv.de/opus4-tuberlin


-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <http://listserv.zib.de/pipermail/kobv-opus-tester/attachments/20140411/1b034b28/attachment.html>


Mehr Informationen über die Mailingliste Kobv-opus-tester