Archiwa tagu: Europeana

Projekt LoCloud

LoCloud logo

W marcu 2013 rozpoczął się projekt LoCloud (http://locloud.eu), jest to sieć dobrych praktyk współfinansowaną przez program CIP ICT-PSP. Celem projektu jest wzbogacenie zasobów Europeany o ponad 4 miliony nowych obiektów cyfrowych z małych i średnich europejskich instytucji kultury. W dniach 19-20 marca br., w norweskim Archiwum Narodowym w Oslo odbyło się spotkanie inaugurujące działalność projektu. Na spotkaniu, którego celem było zaprezentowanie, przedyskutowanie i zaplanowanie kierunków działań tego trzyletniego projektu, zebrało się 32 partnerów z 28 różnych krajów. Zbiory małych i średnich instytucji kultury, takich jak muzea, archiwa i biblioteki, są nadal niezbyt licznie dostępne on-line. Technologie chmurowe (ang. cloud computing) mogą zaoferować tym instytucjom przystępne cenowo i łatwe w użyciu rozwiązanie problemu udostępniania zasobów w sieci.

Celem projektu LoCloud jest rozwój technologii chmurowych i wykorzystujących je usług, aby pomóc małym i średnim instytucjom lokalnym w udostępnianiu ich zasobów cyfrowych on-line, w szczególności na potrzeby portalu europeana.eu, europejskie cyfrowej biblioteki, muzeum i archiwum. Projekt określi potencjał infrastruktury stworzonej w oparciu o technologie chmurowe do gromadzenia i udostępniania treści lokalnych. Ma on też na celu rozwinięcie mikro-usług oferujących m.in. narzędzia do wzbogacania metadanych, geolokalizacji zasobów cyfrowych czy wielojęzyczne słowniki nazw miejsc historycznych. Ponadto powstanie specjalna aplikacja pozwalająca na połączenie treści zgromadzonych w Wikipedii z Europeaną.

LoCloud opiera się na współpracy licznej grupy partnerów technicznych, dostawców treści i serwisów agregujących, tworzących razem bardzo silne konsorcjum. Jako partner konsorcjum PCSS będzie realizował następujące zadania:

  • rozwój usług chmurowych pozwalających na zarządzanie treścią i metadanymi
    obiektów dziedzictwa kulturowego,
  • rozwój lekkiego narzędzia do budowy bibliotek cyfrowych wykorzystującego technologie chmurowe,
  • przewodzenie pakietowi roboczemu poświęconemu wsparciu małych i średnich instytucji kultury we wdrażaniu
    wyników LoCloud.

Toruńska konferencja Polskie Zbiory w Europeanie

Toruń w roku 1641

W dniach 18-19 października w Toruniu, na pięknie odrestaurowanej starówce, odbyła się organizowana przez Międzynarodowe Centrum Zarządzania Informacją ICIMSS konferencja Polskie zbiory w Europeanie.

Inauguracyjny wykład The Decision to Digitise wygłosiła pani Eleanor Kenny z Fundacji Europeana. Pozostałe wystąpienia, już w języku polskim, można podzielić na następujące grupy:

  • Prezentacja projektów związanych z Europeaną
  • Krajowa infrastruktura informatyczna dla zasobów dziedzictwa kulturowego
  • Możliwości wsparcia projektów digitalizacyjnych przez MKiDN
  • Problemy i potrzeby polskich instytucji kultury

Dwie prezentacje zostały wygłoszone przez przedstawicieli Ministerstwa Kultury i Dziedzictwa Narodowego: Strategia dygitalizacji Ministerstwa Kultury i Dziedzictwa Narodowego (Anna
Duńczyk-Szulc) oraz Projekt portalu MKiDN poświęconego digitalizacji zasobów dziedzictwa kultury (Agata Bratek). Portal powinien zostać udostępniony na początku roku 2013.

Wśród prezentowanych projektów związanych z Europeaną znalazły się:

  • Europeana Photography  (Europeana Photography – czyli dokumentacja pierwszego stulecia fotografii, Marta Miskowiec, Muzeum Historii Fotografii w Krakowie, Piotr Kożurno, ICIMSS)
  • Athena (Athena i Athena Plus – projekty zachęcające muzea do współpracy z Europeaną, Maria Śliwińska, ICIMSS)
  • Judaica Europeana (Judaica Europeana – projekt digitalizacji żydowskiego dziedzictwa kulturowego Europy, Edyta Kurek, Żydowski Instytut Historyczny im. Emanuela Ringelbluma, Warszawa)
  • APEX (Udział archiwów polskich w projekcie APEX, Anna Matejak, Naczelna Dyrekcja Archiwów Państwowych, Warszawa)

O swoich bieżących pracach, także tych związanych z Europeaną, opowiadali przedstawiciele kilku dużych instytucji:

  • Narodowy Instytut Muzealnictwa i Ochrony Zbiorów (Narodowy Instytut Muzealnictwa i Ochrony Zbiorów, jego działania i plany w zakresie digitalizacji muzealiów, Anna Kuśmidrowicz, Monika Jędralska)
  • Narodowy Instytut Audiowizualny (Wspieranie dygitalizacji przez Narodowy Instytut Audiowizualny na przykładzie projektu Europeana Awareness, Jarosław Czuba)
  • Biblioteka Narodowa (Udział Biblioteki Narodowej w bieżących projektach Europeany, Katarzyna Ślaska)

Poznańskie Centrum Superkomputerowo-Sieciowe przygotowało prezentację Federacja Bibliotek Cyfrowych: wsparcie instytucji kultury w udostępnianiu zbiorów on-line, agregacja metadanych na potrzeby Europeany (Marcin Werla, Justyna Walkowska), dostępna tutaj. W prezentacji przedstawiamy rolę Federacji Bibliotek Cyfrowych w środowisku polskich zasobów dziedzictwa kultury i w kontekście krajowej infrastruktury informatycznej nauki. Omawiamy też naszą współpracę z Europeaną, w tym kilka projektów, w które jesteśmy zaangażowani bądź będziemy zaangażowani w najbliższym czasie.

Sekcję problemową otworzyła prezentacja przygotowana przez prof. Dorotę Folgę-Januszewską Problemy udziału polskich muzeów w przekazywaniu zbiorów do Europeany. Przedstawiciele mniejszych instytucji byli zainteresowani uzyskaniem informacji na temat możliwości pozyskania środków na digitalizację.

Ważnym tematem była nowa umowa na udostępnianie danych Europeanie – Data Exchange Agreement. Materiały i opinie na jej temat można znaleźć pod tym adresem: http://fbc.pionier.net.pl/pro/dla-dostawcow-danych/wspolpraca-z-zewnetrznymi-serwisami/wspolpraca-z-europeana/. Umowa ta, oparta na licencji Creative Commons 0, która w niektórych miejscach stoi w opozycji do ściśle pojmowanego polskiego prawa – w polskim prawie nie jest możliwe zrzeczenie się praw autorskich, a w przypadku udzielenia nieodpłatnej licencji (co przewiduje tak zwana „awaryjna” licencja) należy wyszczególnić wszystkie przewidziane pola eksploatacji. Aktualne wytyczne MKiDN przewidują przekazywanie do Europeany metadanych, które nie są objęte prawami autorskimi (oznacza to, na przykład, wyłączenie opinii konserwatorskich). Bardzo dobrą wiadomością dla wszystkich europejskich czytelników jest to, że polska Biblioteka Narodowa zdecydowała się podpisać to porozumienie. W swoim wystąpieniu ogłosiła to pani wicedyrektor Katarzyna Ślaska z BN.

Innym powracającym tematem była potrzeba przetłumaczenia (przez grupę ekspertów z wszystkich zainteresowanych środowisk: muzealnych, bibliotecznych, archiwalnych) dokumentacji najpopularniejszych schematów metadanych na język polski, co ma prowadzić do bardziej spójnego i konsekwentnego sposobu korzystania z nich przez poszczególne instytucje.

Na konferencji obecne były także osoby prywatne, zainteresowane udostępnieniem swoich kolekcji online. Jedną z takich osób był pan Piotr Grzywacz z Tucholi, prowadzący prywatne Muzeum Sygnałów Myśliwskich.

Europeana i biblioteki: spotkanie w Bukareszcie

Cerkiew Włoska w Bukareszcie

W dniach 21-23 maja w Bukareszcie odbyło się wspólne spotkanie projektu Europeana Libraries oraz TEL (The European Library). Motyw przewodni spotkania to Patrząc w przyszłość: w jaki sposób nasza usługa odpowiada na potrzeby europejskich wspólnot badawczych? Pod tym adresem można znaleźć nagrania wideo z niektórych sesji.

PCSS uczestniczy w części Work Package 5 projektu EuropeanaLibraries. Głównym zadaniem tej grupy roboczej jest poprawa możliwości wyszukiwania wśród treści bibliotecznych w Europeanie poprzez zdefiniowanie przekształcenia metadanych w formacie ESE na format EDM oraz ustanowienie dobrych praktyk uwzględniających różne typy bibliotek obecnych w Europeanie.

Wewnętrznie portal Europeana przechodzi na nowy format reprezentacji danych EDM (Europeana Data Model). Format ten od stosowanego do tej pory ESE (Europeana Semantic Elements) różni się przede wszystkim tym, że jest formatem zgodnym z inicjatywami Semantic Web i Linked Open Data, wykorzystującym ontologię. EDM wprowadza wyraźnie rozróżnienie pomiędzy zasobem fizycznym (np. obraz albo starodruk), nazywanym w ontologii Provided Cultural Heritage Object (dostarczany obiekt dziedzictwa kulturowego) a odwzorowującym go zasobem elektronicznym (Web Resource), przy czym takich zasobów elektronicznych dla tego samego obiektu może być wiele. W schemacie ESE dane tych dwóch różnych typów zasobów bywają przemieszane. Schemat EDM dąży do postaci zdarzeniocentrycznej, zbliżonej do tej znanej z ontologii CIDOC CRM.

W przypadku bibliotek wyzwania związane z przejściem na schemat EDM są nieco odmienne niż w przypadku muzeów. Jedną z podstawowych kwestii było zadecydowanie, czy opisywanym obiektem dziedzictwa kulturowego ma być Egzemplarz/Item (konkretna książka), czy Realizacja/Expression (konkretne wydanie, stosując słownictwo z modelu FRBR).

Przed spotkaniem instytucje zaangażowane w prace WP5 zostały poproszone o zaproponowanie mapowanie wybranych kilku rekordów bibliograficznych ze swoich kolekcji do formatu EDM. Celem ćwiczenia było zgromadzenie uwag i wątpliwości związanych z profilem bibliotecznym EDM (zdefiniowanym osobno dla monografii, a osobno dla wydawnictw ciągłych). Po przeanalizowaniu wyników tej walidacji, następnym krokiem będzie przygotowanie (przez TEL) procesu automatycznego mapowania z oryginalnych schematów metadanych bibliotek do EDM oraz jego przetestowanie na nowej porcji rekordów w oparciu o nową infrastrukturę agregacji metadanych.

Udział PCSS w pracach projektu Europeana Libraries jest ściśle powiązany z zadaniami semantycznej integracji metadanych obiektów dziedzictwa kulturowego, realizowanymi przez PCSS w ramach etapu A10 projektu SYNAT.

„Kultura dla innowacji” i Hack4Europe 2012

W dniu 9 maja w Brukseli miało miejsce seminarium zatytułowane „Kultura dla innowacji” oraz spotkanie Ministrów Kultury krajów UE ze znaczącymi osobami ze środowisk instytucji kultury i firm komercyjnych związanych z kultura. W ramach tego spotkania Wiceprzewodnicząca Komisji Europejskiej Neelie Kroes oraz duński Minister Kultury w swoich wystąpieniach wyraźnie podkreślili rolę Europeany. Następnie wystąpienia wygłosiło kilku spośród zgromadzonych Ministrów Kultury pozostałych krajów UE, również popierając Europeaną i opisując bądź deklarując kierunki jej wsparcia. Ponadto Neelie Kroes otwarła tegoroczną edycje konkursu Hack4Europe 2012 która trwać będzie przez następnych kilka tygodni (kliknij w obrazek poniżej, aby powiększyć).

W ramach seminarium „Kultura dla innowacji”, rozpoczynającego opisywane spotkanie, przedstawiono różne punkty widzenia na problematykę otwartych danych. Podsumowaniem seminarium były następujące rekomendacje:

  • Inwestuj w digitalizację i przechowywanie zbiorów cyfrowych – tylko 15% dziedzictwa kulturowego zostało dotychczas zdigitalizowane!
  • Prawa, prawa, prawa! System praw autorskich musi być dostosowany do realiów epoki cyfrowej
  • Odkrywaj nowe modele biznesowe oparte na otwieraniu treści
  • Wykorzystuj siłę otwartości – dane, licencje, standardy

Pierwszy milion polskich obiektów cyfrowych w Europeanie!

W dniu dzisiejszym zakończyła się kolejna aktualizacja danych z Federacji Bibliotek Cyfrowych w Europeanie – portalu, który ma za zadanie dawać dostęp do zdigitalizowanego dziedzictwa kulturowego pochodzącego ze zbiorów instytucji kultury z całej Europy. Europeana zasilana jest danymi o obiektach dziedzictwa kulturowego poprzez sieć tzw. agregatorów metadanych – dużych serwisów internetowych, które gromadzą dane ze współpracujących instytucji i po wstępnym przetworzeniu przekazują je Europeanie. Wspomniana Federacja Bibliotek Cyfrowych jest jedynym polskim agregatorem metadanych i pośredniczy w transferze danych z 70 serwisów do Europeany. Dane te pochodzą w sumie z kilkuset instytucji kultury – zarówno bibliotek, jak i archiwów czy muzeów.

W ramach zakończonej 8 lutego aktualizacji danych, Federacja Bibliotek Cyfrowych przekazała Europeanie dane o 783 275 obiektach (poprzednio było to około 550 tysięcy). Kilka polskich instytucji dostarcza dane do Europeany niezależnie od Federacji, współpracując w tym celu z międzynarodowymi agregatorami metadanych. Instytucje te dostarczają w sumie informacje o kolejnych 313 950 obiektach. Tak więc 8 lutego 2012 r. łączna liczba obiektów cyfrowych widocznych w serwisie Europeana, a  udostępnianych przez polskie instytucje kultury i nauki przekroczyła milion i wynosi dokładnie 1 097 225. Dokładniejsze informacje na temat poszczególnych polskich dostawców danych zawiera tabela umieszczona na końcu tego tekstu.

Europeana udostępnia obecnie dane na temat  22 976 336 obiektów, a do grona europeanowych milionerów poza Polską (4,76% udział w łącznej liczbie obiektów) należy jeszcze siedem innych krajów:

  • Francja – 3 674 775 obiektów (15,99%)
  • Niemcy – 3 339 475 obiektów (14,53%)
  • Szwecja – 2 359 314 obiektów (10,27%)
  • Włochy – 2 086 224 obiektów (9,08%)
  • Hiszpania – 1 873 783 obiektów (8,16%)
  • Norwegia – 1 557 820 obiektów (6,78%)
  • Holandia – 1 222 818 obiektów (5,32%)
Poznańskie Centrum Superkomputerowo-Sieciowe, operator Federacji Bibliotek Cyfrowych, poza współpracą w zakresie dostarczania metadanych, pełni również rolę krajowego koordynatora działań PR Europeany. Prace te są realizowane w ramach projektu Europeana Awareness, we współpracy z Narodowym Instytutem Audiowizualnym.
Agregator metadanych Dostawca metadanych Liczba obiektów
Judaica Europeana Żydowski Instytut Historyczny 219 848
EFG – The European Film Gateway Filmoteka Narodowa 35 237
Athena Międzynarodowe Centrum Zarządzania Informacją 30 055
The European Library Biblioteka Narodowa 24 825
DISMARC – EuropeanaConnect Archiwa dźwiękowe Instytutu Sztuki PAN 3 407
EUscreen Project Telewizja Polska 578
Federacja Bibliotek Cyfrowych Wielkopolska Biblioteka Cyfrowa 150 888
Jagiellońska Biblioteka Cyfrowa 102 384
e-biblioteka Uniwersytetu Warszawskiego 94 214
Małopolska Biblioteka Cyfrowa 63 879
Kujawsko-Pomorska Biblioteka Cyfrowa 52 016
Śląska Biblioteka Cyfrowa 33 536
Elbląska Biblioteka Cyfrowa 29 769
Biblioteka Cyfrowa Uniwersytetu Wrocławskiego 28 627
Zachodniopomorska Biblioteka Cyfrowa „Pomerania” 21 690
Biblioteka Cyfrowa – Regionalia Ziemi Łódzkiej 21 014
Bałtycka Biblioteka Cyfrowa 16 936
Pomorska Biblioteka Cyfrowa 15 565
Świętokrzyska Biblioteka Cyfrowa 15 032
Podlaska Biblioteka Cyfrowa 13 003
Dolnośląska Biblioteka Cyfrowa 11 444
Zielonogórska Biblioteka Cyfrowa 9 613
Akademicka Biblioteka Cyfrowa KRAKÓW 9 531
Wejherowska Biblioteka Cyfrowa 6 539
Radomska Biblioteka Cyfrowa 6 377
Jeleniogórska Biblioteka Cyfrowa 6 114
Podkarpacka Biblioteka Cyfrowa 5 759
Chełmska Biblioteka Cyfrowa 5 621
Biblioteka Cyfrowa Polskiego Instytutu Antropologii 4 552
Biblioteka Cyfrowa Ośrodka KARTA 4 328
Biblioteka Cyfrowa UMCS 3 544
Biblioteka Cyfrowa Politechniki Łódzkiej 2 871
Wirtualne Archiwum Polskich Ormian 2 810
Biblioteka Cyfrowa Politechniki Warszawskiej 2 784
Mazowiecka Biblioteka Cyfrowa 2 763
Biblioteka Cyfrowa Politechniki Krakowskiej 2 693
Internetowa Biblioteka Wzornictwa 2 558
Pedagogiczna Biblioteka Cyfrowa 2 440
Krośnieńska Biblioteka Cyfrowa 2 297
Bialska Biblioteka Cyfrowa 2 291
Iławska Biblioteka Cyfrowa 2 061
Opolska Biblioteka Cyfrowa 1 905
Nowohucka Biblioteka Cyfrowa 1 782
Morska Biblioteka Cyfrowa 1 744
Biblioteka Cyfrowa Uniwersytetu Łódzkiego 1 720
Gdańska Biblioteka Cyfrowa 1 651
Repozytorium Cyfrowe Instytutów Naukowych 1 648
Cyfrowe Muzeum Narodowe w Warszawie 1 607
Cyfrowa Biblioteka Druków Ulotnych Polskich i Polski Dotyczących z XVI, XVII i XVIII Wieku 1 403
Cyfrowa Ziemia Sieradzka 1 400
Repozytorium Uniwersytetu im. Adama Mickiewicza 1 222
Biblioteka Cyfrowa Politechniki Śląskiej 1 187
Księgozbiór Wirtualny Bibliotek Kościelnych FIDES 1 133
Biblioteka Cyfrowa Instytutu Łączności 957
Repozytorium Cyfrowe Poloników 922
Sanocka Biblioteka Cyfrowa 736
Rolnicza Biblioteka Cyfrowa 680
Biblioteka Cyfrowa Politechniki Lubelskiej 547
Tarnowska Biblioteka Cyfrowa 487
Bibliologiczna Biblioteka Cyfrowa 432
Czytelnia Wirtualna Katolickiego Uniwersytetu Lubelskiego Jana Pawła II 303
Czytelnia kwartalnika „Bezpieczeństwo i Technika Pożarnicza” 262
Biblioteka Cyfrowa Uniwersytetu Warmińsko-Mazurskiego 260
Publiczne Archiwum Cyfrowe Agnieszki Osieckiej 238
Biblioteka Cyfrowa Fundacji Ormiańskiej KZKO 214
Biblioteka Cyfrowa ORE 192
Biblioteka Cyfrowa Małopolskiego Towarzystwa Genealogicznego 180
Armarium. dominikańska biblioteka cyfrowa 164
Kolbuszowska Biblioteka Cyfrowa 137
Cyfrowa Biblioteka Diecezjalna w Sandomierzu 122
ICM – DIR – Zasoby Polskie 121
Computer Science Journal 106
Otwórz książkę 93
Biblioteka Cyfrowa Katedry Lingwistyki Formalnej Uniwersytetu Warszawskiego 87
Biblioteka Cyfrowa Politechniki Koszalińskiej 81
Biblioteka Humanistyczna 9
Łączna liczba obiektów: 1 097 225

Warsztaty „Open data and re-use of public sector information”

W dniach 16-17 czerwca uczestniczyłem w konferencji Digital Agenda Assembly, zorganizowanej przez komisję europejską w Brukseli. Celem konferencji było podsumowanie realizacji planu rozwoju cyfrowej gospodarki Europy (Digital Agenda for Europe Communication). W czasie dwóch dni konferencji zorganizowano serię równoległych spotkań warsztatowych których tematyka związana była z m.in. konsolidacją i pobudzaniem cyfrowych rynków Europy, interoperacyjnością i standardami komunikacyjnymi, bezpieczeństwu usług elektrocznicznych, rozwojowi infrastruktury szerokopasmowego internetu, rozwojowi innowacyjnych usług elektronicznych, wzrostowi świadomości i umiejętności w zakresie technologii ICT.

Miałem przyjemność uczestniczyć w spotkaniu warsztatowym „Open data and re-use of public sector information” w czasie którego poruszano tematykę związaną z upublicznianiem i wykorzystaniem różnego rodzaju danych gromadzonych przez instytucje sektora publicznego. Przedstawiono przykłady scenariuszy wykorzystania tych danych dla tworzenia nowych usług oferowanych również przez instytucje komercyjne. Mowa była także o kosztach związanych z publikacją takich danych oraz o granicach transparentności sektora publicznego (głównie w kontekście bezpieczeństwa).

Bardzo spodobała mi się prezentacja Katalin Gallyas, która pokazała w jaki sposób do kwestii otwartych danych podchodzą władzę miasta Amsterdam. Katalin opowiadała o różnego rodzaju projektach w które miasto jest zaangażowane (m.in. OpenCities, Open Government Data Initiative) oraz o działaniach, które w ramach nich zostały przeprowadzone. Mam nadzieję, że ten dość krótki opis zachęci Państwa do zapoznania się z jej prezentacją.

W czasie warsztatów zaprezentowano wyniki Open Data Challenge oraz serii hackathonów Hack4Europe! (do tego tematu jeszcze wróce, w kolejnym wpisie). Open Data Challenge to konkurs zorganizowany przez Open Knowledge Foundation. Uczestnicy rywalizowali w kilku kategoriach między innymi najlepsza aplikacja wykorzystująca dane publiczne, najlepszy pomysł na aplikację czy najlepsza wizualizacja. W konkursie wzieło udział ponad 430 uczestników z 24 krajów Unii Europejskiej. Łączna pula nagród to 20 000 euro. Poniżej krótkie wideo podsumowujące wyniki konkursu.

Open Data Challenge from Open Knowledge Foundation on Vimeo.

Wygląda na to, że otwarte dane stają się coraz bardziej cennym kąskiem dla sektora prywatnego. Dowodem na to niech będą projekty sponsorowane przez gigantów rynku IT np. Google (http://opendatakit.org/ oraz sponsoring OpenData Challenge) czy Microsoft ( Open Government Data Initiative). Wraz z zainteresowaniem sektora prywatnego jest szansa, że zmiany w tym zakresie będą zachodzić szybciej niż dotychczas.

Hack4Europe! – Poland

7 i 8 czerwca, w zabytkowych wnętrzach Pałacu Działyńskich w Poznaniu, odbędzie się polska edycja hakatonu Hack4Europe!

„Hack4Europe!” to seria czterech spotkań zorganizowanych przez Fundację Europeana w czterech miastach: Poznaniu, Londynie, Barcelonie i Sztokholmie. Ich celem jest odkrycie ekonomicznego i społecznego potencjału otwartych danych dotyczących dziedzictwa kulturowego.

W wydarzeniu tym uczestniczyć będzie do 30 programistów z Polski i krajów sąsiedzkich. Uzyskają oni dostęp do zgromadzonych w Europeanie danych opisujących ponad 19 milionów obiektów dziedzictwa kulturowego. Dostęp będzie realizowany poprzez API Europeany.

Zaproszeni programiści będą mieli możliwość twórczej realizacji swoich pomysłów na wykorzystanie danych pochodzących z Europeany i zbudowanie prototypowych aplikacji. Najlepsze prototypy powstałe w czasie spotkania zostaną nagrodzone w następujących kategoriach:

  • największy potencjał komercyjny
  • najsilniejsze oddziaływanie społeczne
  • najbardziej nowatorski pomysł
  • najlepszy projekt zdaniem uczestników

Poza nagrodami od Fundacji Europeana, SpeedUp Investments ufundowało po 1 000 zł nagrody dla najlepszych prototypów z każdej z powyższych kategorii!

Autorzy czterech najlepszych prac z całej serii spotkań „Hack4Europe!” zostaną zaproszeni na spotkanie Digital Agenda Assembly, które odbędzie się w dniach 16-17 czerwca w Brukseli. Tam Neelie Kroes (wiceprzewodnicząca Komisji Europejskiej i komisarz europejski ds. agendy cyfrowej) w czasie specjalnej ceremonii nagrodzi zwycięzców.

Ponadto Fundacja Europeana pokryje wszystkim uczestnikom koszty dojazdu (w tym również przelot samolotem), noclegów (do 100 EUR dziennie, maks. 2 noce) oraz wyżywienia (do 50 EUR dziennie, maks. 2 dni).

Aby zgłosić swój udział należy zarejestrować się na stronie: http://hack4europepl.eventbrite.com/. Organizator potwierdzi uczestnictwo w konkursie w ciągu kilku dni.

Przydatne informacje

Hack4Europe Polska jest organizowane we współpracy z Poznańskim Centrum Superkomputerowo-Sieciowym i Biblioteką Kórnicką PAN, która udostępnia na potrzeby hakatonu zabytkowe pomieszczenia w Pałacu Działyńskich mieszczącym się przy Starym Rynku w Poznaniu.

Zapraszamy do udziału!!!

Pierwszy hackaton Europeany

W dniach 01-02.03.2011 w Hilversum (Holandia) odbył się pierwszy hackaton organizowany przez Europeanę. Hackaton to nieformalne warsztaty, którego celem w tym przypadku było zaprezentowanie możliwości użycia API Europeany. Podczas dwóch dni programiści mieli okazję stworzyć ciekawe projekty – szkice, prototypy lub nawet kompletne aplikacje. Warsztaty odbywały się w Holenderskim Instytucie Dźwięku i Wizji (Beeld en Geluid).

API OpenSearch Europeany pozwala na tworzenie aplikacji, które mogą przeszukiwać i wyświetlać metadane zbiorów Europeany. Przy jego użyciu można wyszukać obiekty, a wyniki ograniczać stosując dowolne elementy metadanych. Następnie dla każdego wyniku można pobrać pełen opis metadanych w formacie ESE.

Projekty dotyczyły takich tematów jak integracja z systemami CMS, wizualizacja danych czy kanały internetowe. Marcin Mielnicki z PCSS stworzył usługę udostępniającą kanał Media RSS generowany na podstawie dowolnego zapytania wyszukiwawczego. Może on być wykorzystany do prezentowania wyników wyszukiwania przy np. pomocy przeglądarki multimediów Cooliris. Spotkanie zakończyło się prezentacją pomysłów i prototypów, a najlepsze z nich zostały nagrodzone. Wyniki prac są przeznaczone do niekomercyjnego użytku i będą promowane przez Europeanę.

Poniżej dostępne są zdjęcia ze spotkania.

Domena publiczna i licencje Creative Commons w polskich bibliotekach cyfrowych (część 2)

W opublikowanym niedawno na tej stronie wpisie pt.: „Domena publiczna i licencje Creative Commons w polskich bibliotekach cyfrowych” przedstawiliśmy statystyki obrazujące udział obiektów z domeny publicznej w zbiorach polskich bibliotek cyfrowych oraz wykorzystanie licencji Creative Commons w tychże bibliotekach. Podstawowe statystyki z próbki około pół miliona obiektów wyglądały następująco:

  • Domena publiczna (dalej: PD) – 10,37%
  • Licencje CC (dalej: CC)- 0,1%
  • Prawa zastrzeżone, dostęp nieograniczony (dalej: RR-F) – 88,87%
  • Prawa zastrzeżone, dostęp ograniczony (dalej: RR-R)- 0,66%

Po szczegółowe informacje i szerszy kontekst dla interpretacji tych danych odsyłamy do wspomnianego już poprzedniego wpisu. Bardzo istotne jest to, iż powyższe statystyki nie koniecznie muszą odzwierciedlać faktyczny stan prawny obiektów. Zostały one przygotowane na podstawie informacji licencyjnych, jakimi opatrują poszczególne obiekty udostępniające je instytucje. Bardzo często brak jest podanych wprost informacji licencyjnych, a zamiast tego w polu „Prawa” opisu widnieje nazwa instytucji, która dany obiekt udostępniła on-line. Z punktu widzenia użytkownika końcowego trudno interpretować tego typu informację inaczej, niż jako stwierdzenie że dana instytucja posiada prawa do udostępnianego w sieci obiektu. Stąd też obiekty bez określonych wprost zasad licencjonowania zostały skategoryzowane jako obiekty, do których prawa są zastrzeżone. Dodatkowo część z tych obiektów udostępniana jest w sposób ograniczony (np. dostęp wyłącznie na terenie biblioteki).

W ramach dalszej analizy tych danych postanowiliśmy zestawić dane odnośnie licencji z danymi o dacie utworzenia/wydania udostępnianego obiektu. W przypadku obiektów digitalizowanych braliśmy pod uwagę datę utworzenia/wydania oryginalnego obiektu, a nie datę digitalizacji. Jest to uzasadnione zapisami Statutu Domeny Publicznej Europeany:

„Digitalizacja domeny publicznej nie oznacza tworzenia praw autorskich: prace, które w wersji analogowej znajdują się w domenie publicznej, nadal do niej należą po stworzeniu ich wersji cyfrowej.”

Ze względu na brak ogólnie przyjętego w polskich bibliotekach cyfrowych jednego sposobu zapisu dat, w celu przygotowania wspomnianego powyżej zestawienia musieliśmy opracować narzędzie, które pozwoliło na ujednolicenie dat i ich zestawienie z grupami licencji. W wyniku działania tego narzędzia udało się poprawnie przetworzyć daty utworzenia opisujące 96% obiektów ze wspomnianej próbki pół miliona obiektów. Zestawienie w formie graficznej wygląda następująco (kliknięcie na wykres spowoduje powiększenie go):

Dokładne dane zawiera poniższa tabela:

 Zakres lat Obiekty wg typu licencji  Łączna
 liczba obiektów 
 % próbki 
 RR-F   RR-R   PD   CC 
1001 – 1050 8 0 0 0 8 0,0017%
1051 – 1100 0 0 0 0 0 0,0000%
1101 – 1150 0 0 0 0 0 0,0000%
1151 – 1200 2 0 0 0 2 0,0004%
1201 – 1250 4 0 0 0 4 0,0008%
1251 – 1300 17 0 14 0 31 0,0065%
1301 – 1350 22 0 25 0 47 0,0098%
1351 – 1400 93 0 4 0 97 0,0203%
1401 – 1450 93 0 10 0 103 0,0216%
1451 – 1500 431 0 12 0 443 0,0928%
1501 – 1550 812 0 7 0 819 0,1716%
1551 – 1600 1 572 0 9 0 1581 0,3312%
1601 – 1650 1 467 0 25 0 1492 0,3125%
1651 – 1700 1 690 0 33 0 1723 0,3609%
1701 – 1750 2 948 0 59 0 3007 0,6299%
1751 – 1800 5 137 0 219 0 5356 1,1219%
1801 – 1850 37 951 0 6 567 0 44518 9,3254%
1851 – 1900 97 560 6 19 499 0 117065 24,5221%
1901 – 1939 177 237 453 22 326 3 200019 41,8988%
1940 – 1945 7 194 8 1 918 196 9316 1,9515%
1946 – 1989 45 877 1 926 185 44 48032 10,0615%
1989 – 2011 42 391 922 175 235 43723 9,1588%

W czasie zorganizowanego w czerwcu 2010 roku przez Bibliotekę Narodową i EBIB Seminarium prawnego dla bibliotekarzy cyfrowych pan Tomasz Ganicz w swoim wystąpieniu „Domena Publiczna w praktyce projektów Wikimedia” przedstawił zarys tzw. polskiego kalkulatora domeny publicznej, czyli algorytmu czy też zestawu kroków pozwalającego na określenie statusu prawnego dzieła. W kalkulatorze tym kluczowy jest rok 1939. Jeżeli dzieło zostało przed końcem tego roku upublicznione, to jest szansa iż znajduje się ono w domenie publicznej (por. slajd 20 i dalsze w prezentacji).

Dane z powyższej tabeli, po wyróżnieniu tylko dwóch przedziałów czasowych – do 1939 i po 1939 – przedstawiają się następująco:

 Zakres lat Obiekty wg typu licencji  Łączna
 liczba obiektów 
 % próbki 
 RR-F   RR-R   PD   CC 
1001 – 1939 327 044 459 48 809 3 376 315 78,8282%
1940 – 2011 95 462 2 856 2 278 475 101 071 21,1718%

Wspomniany kalkulator, poza rokiem 1939 jako graniczną datą upublicznienia dzieła, podaje jeszcze dwa inne warunki na mocy których dzieło może zostać uznane jako należące do domeny publicznej:

  • dla dzieł których autor jest nieznany, jest to 140 lat od upublicznienia dzieła,
  • dla dzieł których autor jest znany i nie przekazał on praw majątkowych za życia, jest to rok 1939 jako data śmierci autora.

Z pewnym przybliżeniem, można w takim razie przyjąć, że dzieła powstałe/upublicznione przed 1850 rokiem z bardzo dużym prawdopodobieństwem należą do domeny publicznej. W związku z tym powyższe statystyki można podzielić w następujący sposób:

 Zakres lat Obiekty wg typu licencji  Łączna
 liczba obiektów 
 % próbki 
 RR-F   RR-R   PD   CC 
1001 – 1850 52 247 0 6 984 0 59 231 12,4074%
1851 – 1939 274 797 459 41 825 3 317 084 66,4209%
1940 – 2011 95 462 2 856 2 278 475 101 071 21,1718%

Pierwszy wiersz (lata 1001 – 1850) to obiekty, które właściwie powinny być oznaczone jako dzieła znajdujące się w domenie publicznej. Drugi wiersz (lata 1851-1939) to obiekty, które z dużym prawdopodobieństwem do domeny publicznej należą – jednak występowanie publikacji w grupach licencji CC czy RR-R, pokazuje, że 100% pewności tutaj nie ma (najstarszy obiekt z grupy RR-R to rok 1887, najstarszy obiekt z grupy CC to rok 1926). Trzeci wiersz (lata 1940-2011) to obiekty, które najprawdopodobniej nadal objęte są prawami autorskimi.

Publikując to zestawienie mamy nadzieje, iż skłoni ono twórców polskich bibliotek cyfrowych do zastanowienia się nad sposobami wyrażania w metadanych statusu prawnego dzieł publikowanych on-line. Choć oczywiście zdajemy sobie równocześnie sprawę z tego, że w wielu przypadkach jasne określenie tego statusu jest trudne.