[Kobv-opus-tester] OPUS-Suche und Akzente

Sven Heitmann heitmann at rhrk.uni-kl.de
Mo Mär 2 15:10:08 CET 2015


Hallo Frau Schade,

 

wir sind vor einiger Zeit bei KLUEDO auf das gleiche Problem mit diakritischen Zeichen gestoßen. Mit einer kleinen Anpassung an der „schema.xml“ des Solr und einer Neu-Indizierung lässt sich das Problem für OPUS 4 recht einfach lösen.

 

An zwei Stellen haben wir <filter class="solr.ASCIIFoldingFilterFactory"/> in der schema.xml ergänzt:

    <fieldType name="text" class="solr.TextField" positionIncrementGap="100" omitNorms="true">

      <analyzer type="index">

        <tokenizer class="solr.WhitespaceTokenizerFactory"/>

        <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>

        <filter class="solr.LowerCaseFilterFactory"/>

        <filter class="solr.ReversedWildcardFilterFactory" withOriginal="true" maxPosAsterisk="3" maxPosQuestion="2" maxFractionAsterisk="0.33" />

        <!-- UB: diachritische Zeichen -->

        <filter class="solr.ASCIIFoldingFilterFactory"/>

        <!-- /UB: diakritische Zeichen -->

      </analyzer>

      <analyzer type="query">

        <tokenizer class="solr.WhitespaceTokenizerFactory"/>

        <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="1"/>

        <filter class="solr.LowerCaseFilterFactory"/>

        <!-- UB: diakritische Zeichen -->

        <filter class="solr.ASCIIFoldingFilterFactory"/>

        <!-- /UB: diachritische Zeichen -->

      </analyzer>

    </fieldType>

 

Sie können gerne bei KLUEDO einmal nach "Nuria Castella" suchen:

https://kluedo.ub.uni-kl.de/

 

 

Viele Grüße

Sven Heitmann

 

--

Regionales Hochschulrechenzentrum Kaiserslautern

TU Kaiserslautern

Abteilung Infrastruktur Softwaresysteme

Sven Heitmann

 

Paul-Ehrlich-Straße

Gebäude 32, Raum 324

D-67663 Kaiserslautern

 

Tel: +49 631 205 2813

Fax: +49 631 205 2355

E-Mail: heitmann at rhrk.uni-kl.de

> -----Original Message-----

> From: Kobv-opus-tester [mailto:kobv-opus-tester-bounces at zib.de] On Behalf Of

> Katrin Schade

> Sent: Monday, March 02, 2015 8:53 AM

> To: kobv-opus-tester at zib.de

> Subject: [Kobv-opus-tester] OPUS-Suche und Akzente

> 

> 

> Liebes OPUS4-Entwicklerteam,

> 

> wir veröffentlichen in OPUS nun immer mehr Dokumente, deren Autorennamen oder

> Titel einen Akzent enthalten. Leider kann man diese Autoren und Titel in der OPUS-

> Suche dann nur finden, wenn man den Akzent mit angibt.

> Benutzerfreundlicher wäre es natürlich, wenn man auch über die Eingabe der Namen

> oder Titel ohne die Akzente zu den entsprechenden Treffern gelangt. Wie ist

> diesbezüglich der Stand der Dinge? Soll sich hier in Zukunft etwas ändern? Das

> Problem ist sicher schon bekannt.

> 

> Vielen Dank!

> 

> Beste Grüße aus Augsburg

> 

> Katrin Schade

> 

> 

> --

> Katrin Schade

> Universitätsbibliothek Augsburg

> Ref. Medien- und Publikationsserver  -  Digitalisierung

> 86135 Augsburg

> 

> Tel.:                         0821/598 5362

> Fax:                          0821/598 5413

> E-Mail:                       <mailto:katrin.schade at bibliothek.uni-augsburg.de> katrin.schade at bibliothek.uni-augsburg.de

> 

>  <http://www.bibliothek.uni-augsburg.de/> http://www.bibliothek.uni-augsburg.de/

> Lageplan:  <http://ubaz2.bib-bvb.de/uba-www/lageplan/Biblio_V16.html> http://ubaz2.bib-bvb.de/uba-www/lageplan/Biblio_V16.html

> 

> 

> Publikationen der Universität Augsburg jederzeit weltweit verfügbar:

>  <http://opus.bibliothek.uni-augsburg.de/> http://opus.bibliothek.uni-augsburg.de/

> 

> Literatur clever verwalten, effektiv wissenschaftlich arbeiten:

>  <http://www.bibliothek.uni-augsburg.de/service/literaturverwaltung/> http://www.bibliothek.uni-augsburg.de/service/literaturverwaltung/

> 

> --

> Kobv-opus-tester mailing list

>  <mailto:Kobv-opus-tester at zib.de> Kobv-opus-tester at zib.de

>  <http://listserv.zib.de/mailman/listinfo/kobv-opus-tester> http://listserv.zib.de/mailman/listinfo/kobv-opus-tester

-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <http://listserv.zib.de/pipermail/kobv-opus-tester/attachments/20150302/96116014/attachment.html>
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : smime.p7s
Dateityp    : application/pkcs7-signature
Dateigröße  : 6037 bytes
Beschreibung: nicht verfügbar
URL         : <http://listserv.zib.de/pipermail/kobv-opus-tester/attachments/20150302/96116014/attachment.p7s>


Mehr Informationen über die Mailingliste Kobv-opus-tester