[Kobv-opus-tester] DINI-zertifikatsgerechte Zugriffsstatistik in Opus]

conrad-rempel at zib.de conrad-rempel at zib.de
Mi Apr 16 13:20:06 CEST 2014


Liebe Frau Schobert,

vielen Dank, dass Sie uns auf die Probleme aufmerksam gemacht haben. Wir
diskutieren derzeit intern einige Lösungsansätze und werden noch einige
Tests durchführen, um eine Entscheidung zu treffen, welchen Weg wir bei
der Statistik gehen können.


Dagmar Schobert wrote:
> Anton Katzer, SHK in unserer Abt., fasst die Bedenken wie folgt
zusammen:
> ----
> Für das DINI-Zertifikat 2013 ist nach Punkt 2.7 Nr. E.7-1 eine
öffentlich
> zugängliche Zugriffsstatistik erforderlich.
> Zwar können wir mit Piwik Zugriffsstatistiken erstellen, allerdings
bestehen nach unserer Meinung einige Probleme:
> 1) Piwik erfasst aufgrund der JavaScript-basierten Technologie keine
Downloads, die nicht von innerhalb einer von Piwik getrackten Seite
erfolgen. Praktisch ist ein Link von Google oder über Bookmarks direkt auf
> ein PDF nicht nachverfolgbar.

Das zeigt sich in der Tat so und hier müsste eine Lösung gefunden werden.

> Dazu kommen nicht erfasste Zugriffe
> (Frontdoor und Downloads) von Benutzern, die JavaScript deaktivieren
oder
> Privacy-Addons wie Ghostery in ihrem Browser verwenden.

Da ein Privacy-Addon so was wie eine globale Opt-Out-Regelung darstellt,
sollte man in diesem Fall den Nutzerwunsch respektieren und den Zugriff
nicht mitzählen.


> 2) Aufgrund der URL-Struktur von Opus ist nicht immer nachvollziehbar,
welche Zugriffe von tatsächlichen Benutzern und welche z.B. von
> Mitarbeitern des Universitätsverlages stammen, da von Piwik nicht
zuverlässig nach IP-Adresse gefiltert werden kann.

Hier bietet Piwik die Möglichkeit, IP-Adressen explizit vom Tracking
auszuschließen.

> 3) Die Konfiguration von Piwik fasst einzelne Seitenaufrufe ab einer
gewissen Komplexität zusammen. Die Daten werden dann nicht mehr
> aufgeschlüsselt nach Dokument, sondern zusammengefasst als "Andere"
angezeigt. Beispielsweise gibt es im März 2014 laut Opus ca. 10000
Frontdoor-Zugriffe, jedoch sind nur ca. 2500 davon Dokumenten
zuordenbar,
> die restlichen 7500 fallen unter "Andere".
> Dieses Verhalten von Piwik existiert aus Performance-Gründen und kann
eventuell behoben werden, indem die serverseitige Konfiguration geändert
wird, wie hier beschrieben: http://piwik.org/faq/how-to/#faq_54

Hier wird von Piwik eine Lösung angeboten, die wir uns anschauen werden.

> Es stellt sich aber die Frage, ob die aufgeschlüsselten Daten archiviert
wurden.
Bisher wurden noch keine Daten aus Piwik gelöscht.
> Unserer Meinung nach ist Piwik zwar als Tool zur relativen
Zugriffsanalyse
> sehr gut geeignet, es erfasst jedoch keine verlässlichen, absoluten
Daten,
> wie für das DINI-Zertifikat (siehe auch Punkt M.7-4) gefordert wird.
Praktisch sehen wir keine Alternativen zur Auswertung der Server-Logs,
denn nur damit können alle relevanten Zugriffe gezählt werden. Für Opus 3
> gab es ein Script, dass die gefilterten Serverlogs in CSV-Dateien
konvertiert zur Verfügung gestellt hat. Eine derartige Lösung ist zu
bevorzugen, wobei das Format der Daten erst einmal zweitrangig ist.

Unabhängig von den Lösungsansätzen in Piwik haben wir natürlich immer noch
die Möglichkeit, auf die Daten aus den Apache-Logs zurückzugreifen.

Wir werden uns mit dem Thema nach den Osterferien weiter beschäftigen, um
dann eine geeignete Lösung zu finden.


Voerst verbleiben wir

mit freundlichen Grüßen


Steffi Conrad-Rempel
-- 
OPUS-Hostingteam im KOBV

Konrad-Zuse-Zentrum
für Informationstechnik Berlin
Takustraße 7
D-14195 Berlin-Dahlem

Tel. +49 30 84185-343
conrad-rempel at zib.de
opusteam at zib.de










































Mehr Informationen über die Mailingliste Kobv-opus-tester