Internationaal Instituut voor Sociale Geschiedenis en Lucene

Realisatie zoek- en web publicatiesysteem – search.iisg.nl

Het IISG heeft een veelheid aan beschrijvingen van hun collecties beschikbaar. Deze beschrijvingen zijn opgeslagen in diverse systemen en formaten; een bibliografisch systeem (Advance), database bestanden (MsAccess, MySql), XML documenten (EAD, MARC), ingescande plaatjes op een netwerkschijf, een website met HTML, MsWord en PDF documenten, en dergelijke. De IISG collecties worden door meerdere afdelingen, met behulp van meerdere tools beschreven en beheerd.

IISG wenst de collecties (meer dan een miljoen documenten) als een eenheid aan te bieden aan geĂ¯nteresseerden, via het web. De collecties moeten tesamen (op basis van de beschrijvingen) en ook afzonderlijk doorzoekbaar zijn. De zoekresultaten moet gesorteerd kunnen worden op relevantie, auteur, titel e.d.; voor ieder collectie gelden andere criteria. De zoekpagina's en de weergave van de resultaten moet voor zover van toepassing eenvormig zijn.

De oplossing mag de bestaande werkprocessen binnen het IISG niet raken. Het moet uitgaan van de bestaande diverse systemen en formaten, en "op de achtergrond" de beschreven webomgeving samenstellen.

Armatiek BV heeft hiervoor Lucene ingezet. Na een analyse van de betreffende collecties is een configuratie voor het inlees- en indexeerproces opgezet. Vastgesteld is onder andere wat moet worden opgenomen in de webomgeving, op welke manier de bevraging moet plaatsvinden, hoe de gegevens in lijstvorm en als detailpagina moeten worden weergegeven, en hoe vaak de gegevens ververst moeten worden. Een eerdere versie van Infofuze Enterprise Search (Valid/Search genaamd) is gebruikt voor een handzame inrichting van deze systeemonderdelen.

Doorlooptijd: 3 maanden.

Status: afgerond 2007.

Resultaat : search.iisg.nl