[Kobv-opus-tester] Fehlermeldungen

Sascha Szott szott at zib.de
Don Dez 29 15:08:26 MET 2011


Sehr geehrte Frau Winter,

Ihre Anfrage bezüglich des E-Mail-Versands in OPUS4 wird ein Kollege im 
Januar beantworten. Ich habe Ihre Anfrage weitergeleitet. Hier bitte ich 
noch um etwas Geduld.

Auf die anderen Punkte gehe ich aber nachfolgend detailliert ein:

On 15.12.2011 14:29, Gerland, Friederike wrote:
> Außerdem haben wir noch folgende Fehlermeldungen:
>
> 1) Die Trunkierung der Suche geht nur, wenn der trunkierte Begriff
> kleingeschrieben ist. Beispiel: Mitig* ergibt keine Treffer, mitig*
> ergibt Treffer, obwohl sowohl "Mitigation", als auch "mitigate" in
> der Datenbank vorkommt.
Vielen Dank für diesen wichtigen Hinweis! Das werden wir mit OPUS 4.2.0 
hoffentlich beheben. Eigentlich erfolgt die Suche generell 
case-insensitive (das haben wir in der ausgelieferten Solr-Config auch 
so eingestellt; um ganz genau zu sein: sowohl beim Indexieren als auch 
beim Suchen werden sämtliche Token in Kleinbuchstaben umgewandelt). 
Lucene/Solr hat aber die Eigenheit, dass sogenannte "wildcard queries" 
eine besondere Behandlung bei der Anfrageanalyse erfahren und daher in 
diesem Fall das Lowercasing nicht angewendet wird. In der Solr-Community 
gibt es dazu auch noch keine klare Linie (Bug vs. Feature). 
Möglicherweise wird es aber im nächsten Solr/Lucene-Release (3.6) 
endlich eine Möglichkeit geben, das Lowercasing für wildcard queries 
direkt im Solr-Server zu aktivieren (siehe dazu das Solr-Ticket 
https://issues.apache.org/jira/browse/SOLR-2438).

Bis dahin werden wir in OPUS4 wohl wildcard queries vor dem Absenden der 
Anfrage an den Solr-Server selbst "lowercasen" müssen. Ich habe dazu das 
Bugticket OPUSVIER-2123 aufgenommen und hoffe, dass wir es mit OPUS 
4.2.0 beheben werden. Weiteres dazu können Sie dann dem Changelog 
entnehmen oder sich alternativ auch als Beobachter auf das Ticket 
OPUSVIER-2123 setzen.

> 2) Wir haben die Bibliographiefunktion auskommentiert in der
> config.ini. Trotzdem erscheint der Hinweis "Dokument wird nicht zur
> Bibliographie hinzugefügt" beim Überprüfen der eingegebenen Metadaten
> (s. Anhang, Seite:
> http://epub.wupperinst.org/publish/form/check#current). Doch dieser
> Hinweis ist missverständlich für die Nutzer, die nicht nachvollziehen
> können, woher er kommt. Wie können wir diesen Hinweis
> auskommentieren?
Soweit ich das sehe, ist die Anzeige des Bibliographie-Status im letzten 
Formularschritt fest im Anzeigecode verdrahtet. Aktuell kann die Anzeige 
nicht per Konfiguration ausgeblendet werden. Ich habe dazu den Feature 
Request OPUSVIER-2127 erstellt. Bis zur Abarbeitung können Sie sich aber 
behelfen, indem sie die Datei 
$BASEDIR/opus4/modules/publish/views/scripts/form/check.phtml editieren 
und dort die Zeile

<?= $this->bibliographieOverview(); ?>

entfernen.

Übrigens: Analog könnte man auch fragen, warum der besondere Hinweis "Es 
wurden keine Dateien hochgeladen." immer angezeigt wird, selbst wenn ein 
Upload von Dateien gar nicht unterstützt wird. Die Anzeige dieses 
Hinweistextes könnte am besten auch konfigurierbar sein. Wenn Sie diese 
Anzeige ebenfalls nicht wünschen, dann kommentieren Sie auch noch die Zeile

<?= $this->fileOverview(); ?>

in der Datei check.phtml aus.

Noch eine Warnung dazu: das Editieren der Datei check.phtml ist so 
eigentlich nicht vorgesehen und daher auch nur ein Woraround. Durch die 
manuelle Anpassung muss diese Datei nämlich bei jedem OPUS4-Update 
händisch aktualisiert werden (nach entsprechender Nachfrage des 
Update-Skripts). Da es sich aber nur um das Entfernen zweier Zeilen 
handelt, ist das mit geringem Aufwand realisierbar.

> 3) Speichert man ein Dokument mit Englischem Titel
> (Titelsprache=englisch) und Dokumentsprache=englisch ab und ändert
> dann die Dokumentsprache zu "deutsch", erscheint in der Ergebnisliste
> dieses Dokument mit unbekanntem Titel ("unbenanntes Dokument"). Es
> ist schon klar, dass dieses Vorgehen logisch keinen Sinn ergibt, doch
> ist es unserer Meinung ein Fehler, dass dann der Titel in der
> Ergebnisliste nicht mehr erscheint und auch nicht mehr suchbar ist.
> In der Frontdooransicht hingegen ist der Titel korrekt dargestellt.
> Sinnvoll wäre es sicherlich, beim Abspeichern abzuprüfen ob die
> Sprache des ersten eingegebenen Titels mit der Dokumentsprache
> übereinstimmt und falls nicht, eine Fehlermeldung zu produzieren.
Die Suchtrefferanzeige wird ausschließlich aus den Daten im Solr-Index 
gespeist (vor allem aus Performance-Gründen); es erfolgt hier keine 
Interaktion mit der Datenbank. Bei der Indexierung kommt der 
Dokumentsprache eine besondere Bedeutung zu. Bei der Indexierung werden 
nämlich nur Titel, Abstracts und Schlagworte in der Dokumentsprache 
berücksichtigt. Dies erklärt auch, warum Sie nach dem Setzen des 
Dokumenttitels auf eine Sprache, die nicht mit der Dokumentsprache 
übereinstimmt, die Anzeige "unbenanntes Dokument" erhalten. Analog kann 
der Titel auch nicht mehr gesucht werden (da er nicht mehr im Index steht).

Fraglich ist nun, wie bzw. wo man dieses "Problem" löst: im 
Publish-Formular erscheint ja bereits eine rote Warnung, wenn kein Titel 
/ Abstract in Dokumentsprache existiert. Im Admin-Formular stehen wir 
auf dem Standpunkt, dass dort alles erlaubt sein soll und wir daher auch 
keine Prüfung der Plausibilität vornehmen. Sollten wir dort evtl. einen 
Hinweis einblenden, der den Admin auf die Konsequenzen einer Änderung 
hinweist? Entspricht das Ihren Vorstellungen? Wenn Sie es wünschen, 
könnten wir das als Feature Request im Ticketsystem aufnehmen.

Bei der Suchtrefferanzeige / Suche sehe ich keine praktikable Lösung: 
Wenn z.B. kein Titelfeld in Dokumentsprache existiert, dann ist die 
Frage, auf welche Sprache dann ausgewichen werden soll, wenn mehrere 
Sprachen existieren. Da die Suchtrefferanzeige bewusst schlank gehalten 
ist, wollen wir auch vermeiden, diese mit mehreren Titelangaben pro 
Dokument zu überfrachten. Für die Details steht ja genügend Platz auf 
der Frontdoor zur Verfügung.


Beste Grüße und einen guten Rutsch,
Sascha Szott

-- 
Sascha Szott :: KOBV/ZIB :: <szott at zib.de> :: +49 30 84185-457