Wat is Lucene / Solr?

Lucene is een Java bibliotheek voor het doorzoeken van grote gegevensverzamelingen. Lucene is georiënteerd op zoeken binnen tekst. Een krachtige vraagtaal maakt complexe zoekopdrachten, binnen de "full text" maar ook binnen meer gestructureerde gegevens zoals namen, datums, nummers ed. mogelijk.

Armatiek heeft deze zoeksoftware geïntegreerd om o.a. XML document collecties te kunnen ontsluiten. Daarbij wordt ook een veelheid aan andere formaten ondersteund: MsWord, PDF, HTML, platte tekst, Email, etc. etc.

Solr (spreek uit: solar) is een implementatie van Lucene, gericht op maximale schaalbaarheid, en inzet in een webomgeving. Indexeren en zoeken wordt o.a. via webservices en RESTful URLs aangeboden. De functies van Lucene worden ook uitgebreid.

Lucene / Solr is het hart van Infofuze Enterprise Search.