[Kobv-opus-tester] Formeln und Sonderzeichen im Abstract eines Dokuments

Thoralf Klein thoralf.klein at zib.de
Mit Dez 7 13:35:30 MET 2011


Hallo,


On Wednesday 07 December 2011 08:54:04 Michael Neufing wrote:
> Hallo Herr Kolatzek, hallo Herr Klein,
> 
> Am 06.12.2011 17:12, schrieb Robert Kolatzek:
> > (Ich vermute aber, dass je nachdem, wie in die DB geschrieben bzw.
> > daraus gelesen wird, unter Umständen die für LaTeX lebenswichtigen
> > Backslashes gelöscht werden.)

nur zur Info: Wir entfernen keine Backslashes o.ä. ;)


[...]
> Der Hinweis auf MathJax von Herrn Klein finde ich daher sehr
> interessant. Das werden wir auf jeden Fall mal an-testen. Allerdings
> sehe ich dabei auch noch ein Paar Probleme, da die Abstacts z.B. auch im
> RSS-Feed enthalten sind und eventuell von anderen per OAI eingesammelt
> werden.

In der OAI-Schnittstelle und beim RSS greift das MathJax nicht.  D.h.
dort wird nur der reine Text ausgegeben.


> > Hätten Sie ein Beispiel für mich, ich würde gerne mal an solchen
> > Herausforderungen meine Idee testen.
> Auf https://kluedo.ub.uni-kl.de/frontdoor/index/index/docId/2812 finden
> Sie das Dokument, welches mich zu der Anfrage veranlasst hat. Im der
> dort verlinkten PDF-Datei finden Sie das Abstract, welches als Quelle
> verwendet wurde.

In dem verlinkten Dokument sehe ich aber noch ein anderes Problem:
Da sind zwei "Mojibakes"  <http://en.wikipedia.org/wiki/Mojibake> im
Abstract, die auf nicht darstellbare Sonderzeichen hinweisen.

Das passiert, wenn User per Acrobat ihre Daten direkt ins Textfeld
copy-pasten.  Das ist nicht unser Fehler, aber da wir das Problemn
bei uns bereits festgestellt haben, überlegen wir noch wie wir damit
umgehen sollen.

(Unsere Überlegungen gehen dahin, dass wir solche Sonderzeichen direkt
im Publish ungefragt entfernen.  Zum einen besteht natürlich die Frage,
was die User davon halten; zum anderen ist das keine Lösung für bereits
publizierte Dokumente.)


Gruß,
-- 
Thoralf Klein <thoralf.klein at zib.de>
Telefon: +49 (30) 841 85-216, Raum: 3011