[Kobv-opus-tester] Indexierung Umlaute in Solr

Dr. Karl-Josef Ziegler kziegler at uni-koblenz.de
Fr Apr 8 14:05:03 CEST 2016


Hallo!

Bei der Suche in Opus haben wir Probleme mit der Verarbeitung
(Normalisierung) von Umlauten und diakritischen Zeichen. Von unserem
OPAC sind es unsere Nutzer gewöhnt, dass z. Bsp. ö zu oe und ß zu ss bei
der Suche normiert und dann so auch indexiert wird. Die Suche nach piu,
piú und più ergibt dort auch dieselbe Treffermenge.

Es gibt bei Solr ja versch. Lösungsmöglichkeiten. Vom HBZ wurde getestet:

<filter class="solr.ASCIIFoldingFilterFactory"/>
<filter class="solr.SnowballPorterFilterFactory"language="German2" />

Ersteres wurde ja bereits von der UB Kaiserslautern vorgeschlagen.
Daneben gibt es aber auch noch:

<charFilter
class="solr.MappingCharFilterFactory"mapping="mapping-ISOLatin1Accent.txt"/>

also die Umsetzung mittels einer Mapping-Tabelle. Meine Frage wäre: wird
eines dieser Verfahren auch in das offizielle Release von Opus
aufgenommen oder wie soll dieses Problem ggf. in Opus gelöst werden?

-- 

Viele Grüße,

- Karl-Josef Ziegler


Mehr Informationen über die Mailingliste Kobv-opus-tester