Archiwa tagu: indeksacja

Lucene w wersji 3.0.0 już dostępny

Niedawno wydana została wersja 3.0.0 biblioteki programistycznej Lucene. Lucene to otwarta biblioteka Javy używana w oprogramowaniu dLibra do indeksowania i wyszukiwania w tekście. Wersja 3.0.0 tej biblioteki jest pierwszą, dla której niezbędna będzie Java w wersji 5. API zostało zostało uporządkowane aby umożliwić wykorzystanie zalet Javy 5. W najnowszym Lucene znajdziemy wiele optymalizacji i nowych funkcji aczkolwiek nie jest on w pełni kompatybilny ze starszymi wersjami z powodu dużej ilości zmian. Najważniejsze z nich to  wprowadzenie do IndexWritera wyszukiwania prawie w czasie rzeczywistym,  nowe typy zapytań, odrębne wyszukiwanie i cache’owanie na każdy segment, ulepszona obsługa wieloznaczników, lepsza obsługa Unicode, wysokowydajna obsługa pól numerycznych i wiele innych. Szczegółowe informacje dotyczące zmian w bibliotece Lucene można znaleźć tutaj.

Planujemy wykorzystać Lucene 3.0.0 w jednej z przyszłych wersji oprogramowania dLibra. Pomoże nam to poprawić wydajność indeksowania i wyszukiwania.

Lucene 3.0.0 was released on 25 November 2009. Lucene is an open Java framework that is used for indexing and searching text in dLibra software. Lucene 3.0.0 is the first release with Java 5 as a minimum requirement. The API was cleaned up to make use of Java 5’s advantages. Unfortunately it is not fully compatible with earlier releases due to many optimizations and new features. The most important are near real-time search capabilities added to IndexWriter, new query types, per segment searching and caching, improvements in wildcard searching, improved Unicode support, high-performance handling of numeric fields and much more. Detailed information on changes in Lucene framework is available here.

We are planning to use Lucene 3.0.0 in one of the future versions of dLibra software. It will help us improve indexing and searching performance.