[Kobv-opus-tester] PDF-Metadaten im Admin-Bereich anzeigen und Dokument ggfs. bereinigen

Sven Heitmann heitmann at rhrk.uni-kl.de
Do Jan 30 13:58:11 CET 2014


Hallo OPUS4-Entwickler-Team,

 

wir haben hier in KL öfter das Problem, dass in den Metadaten von PDF-Dokumenten wenig sinnvolle Informationen stehen. Je nach verwendetem Programm zur Erzeugung des PDFs kann das Feld für den Titel schon mal den Dateinamen enthalten. Da diese Informationen aber teilweise für die Anzeige in Suchmaschinen genutzt werden, können wir diese Dokumente nicht unbearbeitet freischalten.

 

Deshalb haben wir mittels zwei zusätzlichen PHP-Dateien sowie einer JavaScript-Datei zwei Funktionen nachgerüstet. Im Admin-Bereich werden bei PDF-Dateien die zugehörigen Metadaten direkt eingeblendet. Zusätzlich kann bei Bedarf die Entfernung sämtlicher Metadaten über einen eingeblendeten Link ausgelöst werden. Die angepasste Version des Dokuments wird dann im incoming-Verzeichnis abgelegt und kann einfach importiert werden. Die Original-Datei bleibt erhalten und muss manuell im Admin-Bereich entfernt werden.

 



 

Folgende Anpassungen haben wir vorgenommen (passend für das OPUS4-Standard-Theme von OPUS 4.4.2):

1)    Paket exiftool, php5-fileinfo, php5-exif installieren (Paketbezeichnungen von openSUSE 13.1)

2)    JavaScript-Datei ./opus4/public/layouts/opus4/js/ubadmin.js erstellt

3)    Verzeichnis ./opus4/public/pdfmetadaten erzeugt

4)    PHP-Dateien ./opus4/public/pdfmetadaten/info.php und entfernen.php erstellt

5)    Die JavaScript-Datei für den admin-Bereich in die Datei ./opus4/public/layouts/opus4/common.phtml aufgenommen: 

// UB: Auf den Admin-Seiten die Funktionalität zum Entfernen der Metadaten aus PDF-Dateien einbinden

if (Zend_Controller_Front::getInstance()->getRequest()->getModuleName() == 'admin') {

    $this->headScript()->appendFile($this->layoutPath() . '/js/ubadmin.js');

}

6)    Ggfs. den Zugriff auf /pdfmetadaten in der Apache-Config beschränken

a.     Apache 2.4:

<Location "/pdfmetadaten">

            Require ip 192.168.0.0/24

</Location>

b.     Apache 2.2:

<Location "/pdfmetadaten">

      Order Deny,Allow

      Deny from all

            Allow from 192.168.0.0/24

</Location>

7)    Die Funktionen stehen jetzt automatisch im Admin-Bereich zur Verfügung.

 

Wichtig: Natürlich darf die Funktion von jedem OPUS4-Repository verwendet werden. Wir können allerdings keine Haftung für Datenverlust etc. übernehmen. Der Einsatz erfolgt auf eigene Verantwortung.

 

Wir würden uns freuen wenn eine derartige Funktion – ohne JavaScript – direkt in OPUS4 integriert werden würde. Der Workflow zur Kontrolle von Dokumenten wird dadurch enorm vereinfacht.

 

 

Viele Grüße aus Kaiserslautern

Sven Heitmann & Michael Neufing

 

--

Regionales Hochschulrechenzentrum Kaiserslautern

TU Kaiserslautern

Abteilung Infrastruktur Softwaresysteme

Sven Heitmann

 

Paul-Ehrlich-Straße

Gebäude 32, Raum 324

D-67663 Kaiserslautern

 

Tel: +49 631 205 2813

Fax: +49 631 205 2355

E-Mail: heitmann at rhrk.uni-kl.de

 

-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <http://listserv.zib.de/pipermail/kobv-opus-tester/attachments/20140130/b995eb73/attachment.html>
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : image001.png
Dateityp    : image/png
Dateigröße  : 16991 bytes
Beschreibung: nicht verfügbar
URL         : <http://listserv.zib.de/pipermail/kobv-opus-tester/attachments/20140130/b995eb73/attachment.png>
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : pdfmetadaten.zip
Dateityp    : application/x-zip-compressed
Dateigröße  : 3959 bytes
Beschreibung: nicht verfügbar
URL         : <http://listserv.zib.de/pipermail/kobv-opus-tester/attachments/20140130/b995eb73/attachment.bin>
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : smime.p7s
Dateityp    : application/pkcs7-signature
Dateigröße  : 5776 bytes
Beschreibung: nicht verfügbar
URL         : <http://listserv.zib.de/pipermail/kobv-opus-tester/attachments/20140130/b995eb73/attachment.p7s>


Mehr Informationen über die Mailingliste Kobv-opus-tester