[Kobv-opus-tester] Fehlermeldungen
Sascha Szott
szott at zib.de
Don Dez 29 15:08:26 MET 2011
Sehr geehrte Frau Winter,
Ihre Anfrage bezüglich des E-Mail-Versands in OPUS4 wird ein Kollege im
Januar beantworten. Ich habe Ihre Anfrage weitergeleitet. Hier bitte ich
noch um etwas Geduld.
Auf die anderen Punkte gehe ich aber nachfolgend detailliert ein:
On 15.12.2011 14:29, Gerland, Friederike wrote:
> Außerdem haben wir noch folgende Fehlermeldungen:
>
> 1) Die Trunkierung der Suche geht nur, wenn der trunkierte Begriff
> kleingeschrieben ist. Beispiel: Mitig* ergibt keine Treffer, mitig*
> ergibt Treffer, obwohl sowohl "Mitigation", als auch "mitigate" in
> der Datenbank vorkommt.
Vielen Dank für diesen wichtigen Hinweis! Das werden wir mit OPUS 4.2.0
hoffentlich beheben. Eigentlich erfolgt die Suche generell
case-insensitive (das haben wir in der ausgelieferten Solr-Config auch
so eingestellt; um ganz genau zu sein: sowohl beim Indexieren als auch
beim Suchen werden sämtliche Token in Kleinbuchstaben umgewandelt).
Lucene/Solr hat aber die Eigenheit, dass sogenannte "wildcard queries"
eine besondere Behandlung bei der Anfrageanalyse erfahren und daher in
diesem Fall das Lowercasing nicht angewendet wird. In der Solr-Community
gibt es dazu auch noch keine klare Linie (Bug vs. Feature).
Möglicherweise wird es aber im nächsten Solr/Lucene-Release (3.6)
endlich eine Möglichkeit geben, das Lowercasing für wildcard queries
direkt im Solr-Server zu aktivieren (siehe dazu das Solr-Ticket
https://issues.apache.org/jira/browse/SOLR-2438).
Bis dahin werden wir in OPUS4 wohl wildcard queries vor dem Absenden der
Anfrage an den Solr-Server selbst "lowercasen" müssen. Ich habe dazu das
Bugticket OPUSVIER-2123 aufgenommen und hoffe, dass wir es mit OPUS
4.2.0 beheben werden. Weiteres dazu können Sie dann dem Changelog
entnehmen oder sich alternativ auch als Beobachter auf das Ticket
OPUSVIER-2123 setzen.
> 2) Wir haben die Bibliographiefunktion auskommentiert in der
> config.ini. Trotzdem erscheint der Hinweis "Dokument wird nicht zur
> Bibliographie hinzugefügt" beim Überprüfen der eingegebenen Metadaten
> (s. Anhang, Seite:
> http://epub.wupperinst.org/publish/form/check#current). Doch dieser
> Hinweis ist missverständlich für die Nutzer, die nicht nachvollziehen
> können, woher er kommt. Wie können wir diesen Hinweis
> auskommentieren?
Soweit ich das sehe, ist die Anzeige des Bibliographie-Status im letzten
Formularschritt fest im Anzeigecode verdrahtet. Aktuell kann die Anzeige
nicht per Konfiguration ausgeblendet werden. Ich habe dazu den Feature
Request OPUSVIER-2127 erstellt. Bis zur Abarbeitung können Sie sich aber
behelfen, indem sie die Datei
$BASEDIR/opus4/modules/publish/views/scripts/form/check.phtml editieren
und dort die Zeile
<?= $this->bibliographieOverview(); ?>
entfernen.
Übrigens: Analog könnte man auch fragen, warum der besondere Hinweis "Es
wurden keine Dateien hochgeladen." immer angezeigt wird, selbst wenn ein
Upload von Dateien gar nicht unterstützt wird. Die Anzeige dieses
Hinweistextes könnte am besten auch konfigurierbar sein. Wenn Sie diese
Anzeige ebenfalls nicht wünschen, dann kommentieren Sie auch noch die Zeile
<?= $this->fileOverview(); ?>
in der Datei check.phtml aus.
Noch eine Warnung dazu: das Editieren der Datei check.phtml ist so
eigentlich nicht vorgesehen und daher auch nur ein Woraround. Durch die
manuelle Anpassung muss diese Datei nämlich bei jedem OPUS4-Update
händisch aktualisiert werden (nach entsprechender Nachfrage des
Update-Skripts). Da es sich aber nur um das Entfernen zweier Zeilen
handelt, ist das mit geringem Aufwand realisierbar.
> 3) Speichert man ein Dokument mit Englischem Titel
> (Titelsprache=englisch) und Dokumentsprache=englisch ab und ändert
> dann die Dokumentsprache zu "deutsch", erscheint in der Ergebnisliste
> dieses Dokument mit unbekanntem Titel ("unbenanntes Dokument"). Es
> ist schon klar, dass dieses Vorgehen logisch keinen Sinn ergibt, doch
> ist es unserer Meinung ein Fehler, dass dann der Titel in der
> Ergebnisliste nicht mehr erscheint und auch nicht mehr suchbar ist.
> In der Frontdooransicht hingegen ist der Titel korrekt dargestellt.
> Sinnvoll wäre es sicherlich, beim Abspeichern abzuprüfen ob die
> Sprache des ersten eingegebenen Titels mit der Dokumentsprache
> übereinstimmt und falls nicht, eine Fehlermeldung zu produzieren.
Die Suchtrefferanzeige wird ausschließlich aus den Daten im Solr-Index
gespeist (vor allem aus Performance-Gründen); es erfolgt hier keine
Interaktion mit der Datenbank. Bei der Indexierung kommt der
Dokumentsprache eine besondere Bedeutung zu. Bei der Indexierung werden
nämlich nur Titel, Abstracts und Schlagworte in der Dokumentsprache
berücksichtigt. Dies erklärt auch, warum Sie nach dem Setzen des
Dokumenttitels auf eine Sprache, die nicht mit der Dokumentsprache
übereinstimmt, die Anzeige "unbenanntes Dokument" erhalten. Analog kann
der Titel auch nicht mehr gesucht werden (da er nicht mehr im Index steht).
Fraglich ist nun, wie bzw. wo man dieses "Problem" löst: im
Publish-Formular erscheint ja bereits eine rote Warnung, wenn kein Titel
/ Abstract in Dokumentsprache existiert. Im Admin-Formular stehen wir
auf dem Standpunkt, dass dort alles erlaubt sein soll und wir daher auch
keine Prüfung der Plausibilität vornehmen. Sollten wir dort evtl. einen
Hinweis einblenden, der den Admin auf die Konsequenzen einer Änderung
hinweist? Entspricht das Ihren Vorstellungen? Wenn Sie es wünschen,
könnten wir das als Feature Request im Ticketsystem aufnehmen.
Bei der Suchtrefferanzeige / Suche sehe ich keine praktikable Lösung:
Wenn z.B. kein Titelfeld in Dokumentsprache existiert, dann ist die
Frage, auf welche Sprache dann ausgewichen werden soll, wenn mehrere
Sprachen existieren. Da die Suchtrefferanzeige bewusst schlank gehalten
ist, wollen wir auch vermeiden, diese mit mehreren Titelangaben pro
Dokument zu überfrachten. Für die Details steht ja genügend Platz auf
der Frontdoor zur Verfügung.
Beste Grüße und einen guten Rutsch,
Sascha Szott
--
Sascha Szott :: KOBV/ZIB :: <szott at zib.de> :: +49 30 84185-457