Wszystkie wpisy, których autorem jest Marcin Mielnicki

Publiczne wydanie (części) systemu Clepsydra

Z przyjemnością informujemy o publicznym wydaniu części systemu Clepsydra, oprogramowania do agregacji i wzbogacania danych, wydanego na licencji Apache License 2.0.

Clepsydra to elastyczny i skalowany system do agregacji, przetwarzania i udostępniania danych z heterogenicznych źródeł. Został on zaprojektowany i rozwijany jako podstawa usług bazujących na agregacji i wzbogacaniu danych – np. metadanych opisujących dostępne on-line kolekcje obiektów dziedzictwa kulturowego z polskich instytucji pamięci. Federacja Bibliotek Cyfrowych to pierwsze wdrożenie tego systemu.

Pierwsze wydanie systemu zawiera jeden komponent, Clepsydra Storage, który przede wszystkim ma służyć jako elastyczna i skalowalna usługa pozwalająca na przechowywanie i dostęp do dużej ilości heterogenicznych danych. System Clepsydra powstaje w ramach prac PCSS w projekcie SYNAT.

Instrukcja instalacji, dokumentacja i kod źródłowy modułu Clepsydra Storage są dostępne tutaj.

Pierwszy hackaton Europeany

W dniach 01-02.03.2011 w Hilversum (Holandia) odbył się pierwszy hackaton organizowany przez Europeanę. Hackaton to nieformalne warsztaty, którego celem w tym przypadku było zaprezentowanie możliwości użycia API Europeany. Podczas dwóch dni programiści mieli okazję stworzyć ciekawe projekty – szkice, prototypy lub nawet kompletne aplikacje. Warsztaty odbywały się w Holenderskim Instytucie Dźwięku i Wizji (Beeld en Geluid).

API OpenSearch Europeany pozwala na tworzenie aplikacji, które mogą przeszukiwać i wyświetlać metadane zbiorów Europeany. Przy jego użyciu można wyszukać obiekty, a wyniki ograniczać stosując dowolne elementy metadanych. Następnie dla każdego wyniku można pobrać pełen opis metadanych w formacie ESE.

Projekty dotyczyły takich tematów jak integracja z systemami CMS, wizualizacja danych czy kanały internetowe. Marcin Mielnicki z PCSS stworzył usługę udostępniającą kanał Media RSS generowany na podstawie dowolnego zapytania wyszukiwawczego. Może on być wykorzystany do prezentowania wyników wyszukiwania przy np. pomocy przeglądarki multimediów Cooliris. Spotkanie zakończyło się prezentacją pomysłów i prototypów, a najlepsze z nich zostały nagrodzone. Wyniki prac są przeznaczone do niekomercyjnego użytku i będą promowane przez Europeanę.

Poniżej dostępne są zdjęcia ze spotkania.

Nowy model danych dla Europany

Europeana poinformowała, że został opublikowany Europeana Data Model (EDM), czyli model danych Europeany. Jest to nowy sposób organizacji danych, które Europeana będzie agregowała, przetwarzała i udostępniała. EDM jest znacznym ulepszeniem w stosunku do Europeana Semantic Elements (ESE), podstawowego modelu danych wykorzystywanego dotychczas i daje możliwość realizacji jakościowych zmian w sposobie, w jaki Europeana będzie traktowała metadane zebrane od dostawców treści i agregatorów.

Nowy model danych został opracowany przez uczestników projektów Europeana v1.0, EuropeanaConnect i ekspertów ze środowisk akademickich i kulturalnych. Ponadto EDM zatwierdzili specjaliści techniczni z bibliotek, muzeów, archiwów i zbiorów audiowizualnych. Jednak prace nad modelem danych nadal trwają i będzie on udoskonalany do końca roku 2010. EDM jest zgodny z ESE, więc żadne dane nie będą musiały być ponownie przekazywane.

Szczegółowe informacje można znaleźć w dokumentach EDM Primer i Definition of the EDM Elements.

Wszystkich zainteresowanych nowym modelem danych zachęcamy do udziału w dwóch bezpłatnych imprezach, które odbędą się w październiku: w konferencji Europeana Open Culture (14-15 października, Amsterdam) oraz w Dniu Europeany (19 października, Poznań).

Biblioteki europejskie i Google współpracują w zakresie digitalizacji

Google coraz intensywniej wspiera działania w zakresie digitalizacji dziedzictwa kulturowego. Od początku tego roku Google ogłosiło zawarcie umów, na mocy których zbiory z największych europejskich bibliotek zostaną zdigitalizowane i udostępnione za pośrednictwem serwisu Książki Google.

W marcu ogłoszono zawarcie umowy z Włoskim Ministerstwem Dziedzictwa Kulturowego. Dotyczy ona współpracy z Biblioteką Narodową we Florencji i Rzymie w celu digitalizacji do miliona dzieł nie objętych prawami autorskimi.

Następnym krokiem było ogłoszenie w czerwcu porozumienia z Austriacką Biblioteką Narodową, które obejmie do 400 000 książek z domeny publicznej. Wśród nich znajdą się także dzieła polskie, gdyż biblioteka ta posiada w swoich zasobach ok. 1800 tytułów w języku polskim.

W lipcu Google ogłosiło porozumienie z Holenderską Biblioteką Narodową – Koninklijke Bibliotheek. Google zeskanuje ponad 160 000 książek z domeny publicznej.

We wszystkich przypadkach to bibliotekarze wybiorą dzieła do digitalizacji spośród zasobów biblioteki. Google wykona proces skanowania książek i umieści je w serwisie Google Books. Będą one dostępne dla każdej osoby na świecie posiadającej dostęp do internetu. Ważne jest, iż biblioteki otrzymają kopie skanów. Dzięki temu kopie cyfrowe będą mogły być udostępnione na stronach internetowych biblioteki oraz przekazane do długoterminowej archiwizacji. Co więcej, użytkownicy będą mieli dostęp to cyfrowych książek poprzez Europeanę.

GeeCON 2010 zakończony

W dniach 13-14 maja 2010 odbyła się międzynarodowa konferencja GeeCON. Druga edycja imprezy poświęconej językowi Java oraz technologiom opartym na Java Vitrual Machine tym razem miała miejsce w Poznaniu, w kinie Multikino 51.

Organizatorami byli Grupa Informatyczno-Kulturalna, Polska Grupa Użytkowników Języka Java, Poznańska Grupa Użytkowników Języka Java przy współpracy Miasta Poznania, Poznańskiego Centrum Superkomputerowo-Sieciowego oraz Uniwersytetu im. Adama Mickiewicza. Podczas dwóch dni spotkań impreza zgromadziła około 450 uczestników z całego świata.

Konferencję rozpoczął Thorbiörn Fritzon wykładem pt. „The Future of Java”. Informacje na temat dalszych losów Javy były bardzo wyczekiwane zwłaszcza po przejęciu firmy Sun przez Oracle. Następnie rozpoczęło się blisko 40 wykładów prowadzonych w trzech równoległych sesjach. Dalibor Topic przedstawił status prac nad JDK 7. Podczas swojego show Bruno Bossola przekonywał nas do prawdziwego Programowania Obiektowego, natomiast Dawid Weiss pokazał jak szybka jest Java i w jaki sposób można ją przyspieszyć. Odbyły się także praktyczne prezentacje. Hans Dockter pokazał możliwości  Gradle – systemu budowania oprogramowania. Andres Almiray przedstawił proces tworzenia aplikacji desktopowej przy użyciu frameworku Griffon.

Prezentacje są dostępne na stronie konferencji.

Nowy sposób dostępu bazy OAIster

OCLC ogłosiło stworzenie nowej, dostępnej dla wszystkich strony pozwalającej na przeszukiwanie wyłącznie rekordów bazy OAIster.
Obecnie OAIster umożliwia dostęp do 23 milionów rekordów pochodzących od ponad 1100 organizacji z całego świata.
W bazie OAIster znajdziemy 220 000 obiektów cyfrowych z Polski. Większość zasobów pochodzi z największych i najpopularniejszych bibliotek cyfrowych. Poza nimi wyszukamy rekordy z serwisów skierowanych do wąskiej grupy specjalistów. Są to między innymi czasopisma z polskich uczelni (Instytut Fizyki Politechniki Wrocławskiej, Wydział Transportu Politechniki Śląskiej) oraz z innych instytucji naukowych (Instytut Oceanologii Polskiej Akademii Nauk, Polskie Towarzystwo Geologiczne), których nie znajdziemy w bibliotekach cyfrowych. Ciekawostką są zasoby wydawnictw medycznych oraz Narodowego Banku Polskiego.
Jeśli ktoś chciałby zwiększyć widoczność swoich zasobów cyfrowych może przekazać metadane do bazy OAIster. Instrukcje jak to zrobić znajdzie na tej stronie.

Iławska Biblioteka Cyfrowa

Od niedawna dostępna jest Iławska Biblioteka Cyfrowa (IBC), prowadzona przez Miejską Bibliotekę Publiczną w Iławie. IBC ma na celu budowanie otwartej kolekcji cyfrowej materiałów dotyczących powiatu iławskiego. Są to przede wszystkim artykuły z czasopism lokalnych i ogólnokrajowych oraz książki, rękopisy, mapy, pocztówki czy zdjęcia. Obecnie dostępnych jest ponad 800 obiektów podzielonych na trzy główne kolekcje: „Artykuły z czasopism ogólnokrajowych”, „Artykuły z czasopism regionalnych” oraz „Książki”. Dzięki porozumieniu z kilkoma wydawcami biblioteka może bezpłatnie publikować cyfrowe kopie artykułów z regionalnych gazet.

Iławska Biblioteka Cyfrowa jest kolejną lokalną biblioteką cyfrową, zbliżoną swoim charakterem m.in. do Nowohuckiej Biblioteki Cyfrowej czy Wejherowskiej Biblioteki Cyfrowej. W przypadku małej biblioteki cyfrowej szczególnie warto zadbać o dobrą widoczność w sieci. Prezentowane tam zasoby są unikalne i silnie powiązane z lokalną tematyką. Dlatego trudno je odnaleźć osobom nie mającym świadomości istnienia takiej biblioteki. O wiele łatwiej dotrzeć do materiałów dużych bibliotek cyfrowych, takich jak WBC czy KPBC, gdyż publikują one nie tylko materiały lokalne, ale również obiekty o charakterze ponadregionalnym.