[Kobv-opus-tester] WG: PDF-Metadaten im Admin-Bereich anzeigen und Dokument ggfs. bereinigen

Schobert, Dagmar dagmar.schobert at tu-berlin.de
Do Jan 30 14:50:57 CET 2014


Liebe Opus4-Entwickler,
eine tolle Funktion, die uns bei der umständlichen Validierung und Qualitätssicherung der PDF-Dateien sehr helfen würde.
Auch aus unserer Sicht wäre es sehr wünschenswert, dass sie in Opus 4 integriert wird.
Viele Grüße,
Dagmar Schobert

---
Dagmar Schobert
Universitätsbibliothek der TU Berlin
Abt.-Ltg. Universitätsverlag/Hochschulschriften
Fasanenstr. 88, 10623 Berlin
Tel.: +49 (0)30 314 76127
Fax: +49 (0)30 314 76133
http://www.ub.tu-berlin.de/universitaetsverlag-und-hochschulschriften/
http://opus4.kobv.de/opus4-tuberlin
dagmar.schobert at tu-berlin.de<mailto:dagmar.schobert at tu-berlin.de>


Von: Kobv-opus-tester [mailto:kobv-opus-tester-bounces at zib.de] Im Auftrag von Sven Heitmann
Gesendet: Donnerstag, 30. Januar 2014 13:58
An: Opus-Tester
Cc: kluedo-admin at ub.uni-kl.de
Betreff: [Kobv-opus-tester] PDF-Metadaten im Admin-Bereich anzeigen und Dokument ggfs. bereinigen

Hallo OPUS4-Entwickler-Team,

wir haben hier in KL öfter das Problem, dass in den Metadaten von PDF-Dokumenten wenig sinnvolle Informationen stehen. Je nach verwendetem Programm zur Erzeugung des PDFs kann das Feld für den Titel schon mal den Dateinamen enthalten. Da diese Informationen aber teilweise für die Anzeige in Suchmaschinen genutzt werden, können wir diese Dokumente nicht unbearbeitet freischalten.

Deshalb haben wir mittels zwei zusätzlichen PHP-Dateien sowie einer JavaScript-Datei zwei Funktionen nachgerüstet. Im Admin-Bereich werden bei PDF-Dateien die zugehörigen Metadaten direkt eingeblendet. Zusätzlich kann bei Bedarf die Entfernung sämtlicher Metadaten über einen eingeblendeten Link ausgelöst werden. Die angepasste Version des Dokuments wird dann im incoming-Verzeichnis abgelegt und kann einfach importiert werden. Die Original-Datei bleibt erhalten und muss manuell im Admin-Bereich entfernt werden.

[cid:image001.png at 01CF1DBA.E6B4B9C0]

Folgende Anpassungen haben wir vorgenommen (passend für das OPUS4-Standard-Theme von OPUS 4.4.2):

1)    Paket exiftool, php5-fileinfo, php5-exif installieren (Paketbezeichnungen von openSUSE 13.1)

2)    JavaScript-Datei ./opus4/public/layouts/opus4/js/ubadmin.js erstellt

3)    Verzeichnis ./opus4/public/pdfmetadaten erzeugt

4)    PHP-Dateien ./opus4/public/pdfmetadaten/info.php und entfernen.php erstellt

5)    Die JavaScript-Datei für den admin-Bereich in die Datei ./opus4/public/layouts/opus4/common.phtml aufgenommen:
// UB: Auf den Admin-Seiten die Funktionalität zum Entfernen der Metadaten aus PDF-Dateien einbinden
if (Zend_Controller_Front::getInstance()->getRequest()->getModuleName() == 'admin') {
    $this->headScript()->appendFile($this->layoutPath() . '/js/ubadmin.js');
}

6)    Ggfs. den Zugriff auf /pdfmetadaten in der Apache-Config beschränken

a.     Apache 2.4:

<Location "/pdfmetadaten">

            Require ip 192.168.0.0/24

</Location>

b.     Apache 2.2:

<Location "/pdfmetadaten">

      Order Deny,Allow

      Deny from all

            Allow from 192.168.0.0/24

</Location>

7)    Die Funktionen stehen jetzt automatisch im Admin-Bereich zur Verfügung.

Wichtig: Natürlich darf die Funktion von jedem OPUS4-Repository verwendet werden. Wir können allerdings keine Haftung für Datenverlust etc. übernehmen. Der Einsatz erfolgt auf eigene Verantwortung.

Wir würden uns freuen wenn eine derartige Funktion – ohne JavaScript – direkt in OPUS4 integriert werden würde. Der Workflow zur Kontrolle von Dokumenten wird dadurch enorm vereinfacht.


Viele Grüße aus Kaiserslautern
Sven Heitmann & Michael Neufing

--
Regionales Hochschulrechenzentrum Kaiserslautern
TU Kaiserslautern
Abteilung Infrastruktur Softwaresysteme
Sven Heitmann

Paul-Ehrlich-Straße
Gebäude 32, Raum 324
D-67663 Kaiserslautern

Tel: +49 631 205 2813
Fax: +49 631 205 2355
E-Mail: heitmann at rhrk.uni-kl.de<mailto:heitmann at rhrk.uni-kl.de>

-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <http://listserv.zib.de/pipermail/kobv-opus-tester/attachments/20140130/0cca7a3e/attachment.html>
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : image001.png
Dateityp    : image/png
Dateigröße  : 16991 bytes
Beschreibung: image001.png
URL         : <http://listserv.zib.de/pipermail/kobv-opus-tester/attachments/20140130/0cca7a3e/attachment.png>
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : pdfmetadaten.zip
Dateityp    : application/x-zip-compressed
Dateigröße  : 3959 bytes
Beschreibung: pdfmetadaten.zip
URL         : <http://listserv.zib.de/pipermail/kobv-opus-tester/attachments/20140130/0cca7a3e/attachment.bin>
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : smime.p7s
Dateityp    : application/pkcs7-signature
Dateigröße  : 5776 bytes
Beschreibung: smime.p7s
URL         : <http://listserv.zib.de/pipermail/kobv-opus-tester/attachments/20140130/0cca7a3e/attachment.p7s>
-------------- nächster Teil --------------
Ein eingebundener Text mit undefiniertem Zeichensatz wurde abgetrennt.
Name: ATT00001.txt
URL: <http://listserv.zib.de/pipermail/kobv-opus-tester/attachments/20140130/0cca7a3e/attachment.txt>


Mehr Informationen über die Mailingliste Kobv-opus-tester