Wszystkie wpisy, których autorem jest Agnieszka Lewandowska

Co tam panie w Europeanie? (część 4)

Logo Europeany
Na początku tego tygodnia Europeana zaktualizowała dane bibliotek cyfrowych przyłączonych do Federacji Bibliotek Cyfrowych. Z radością możemy poinformować, że liczba przekazywanych publikacji od czasu ostatniej aktualizacji zwiększyła się o ponad 100 tysięcy i wynosi teraz dokładnie 462 796.  W związku z tym postanowiliśmy odświeżyć także statystyki odnośnie udziału danych z FBC i Polski w Europeanie, na tle innych krajów i dostawców metadanych (dane na dzień 2 lutego 2011).

Dostawcy Liczba obiektów Udział
Europeana 15,180,418 100.00%
1 Athena 1,794,755 11.82%
2 Culture.fr/collections 1,646,930 10.85%
3 The European Library 1,266,229 8.34%
4 Hispana 1,234,252 8.13%
5 Swedish Open Cultural Heritage 1,203,456 7.93%
6 Deutsche Fotothek 1,104,123 7.27%
7 Irish Manuscripts Commission 906,913 5.97%
8 Bibliothèque nationale de France 823,378 5.42%
9 ABM-utvikling 735,252 4.84%
10 Natinaal Archief 555,370 3.66%
11 CultureGrid 547,780 3.61%
12 Federacja Bibliotek Cyfrowych 462,796 3.05%
13 EFG – The European Film Gateway 328,056 2.16%
14 Bayerische Staatsbibliothek 321,290 2.12%
15 Scran 310,802 2.05%

Federacja Bibliotek Cyfrowych jest dwunastym największym dostawcą metadanych (z okołu 100 obecnie).  Na dzień dzisiejszy do Europeany dostarcza dane z 56 bibliotek cyfrowych, które posiadają obiekty z kilkuset różnego typu instytucji (biblioteki, archiwa, itp.) z terenu całej Polski. Jako kraj plasujemy się na 10 miejscu z 485,390 obiektami cyfrowymi. Liczba ta jest większa niż liczba obiektów z FBC, ponieważ ponad 20 tysięcy publikacji z polskiej Biblioteki Narodowej jest przekazywanych poprzez projekt The European Library.

Kraj Liczba obiektów Udział
Europeana 15,180,418 100.00%
1 Francja 2,626,362 17.30%
2 Niemcy 2,568,681 16.92%
3 Szwecja 1,417,259 9.34%
4 Hiszpania 1,293,029 8.52%
5 Włochy 1,270,837 8.37%
6 Holandia 1,153,212 7.60%
7 Irlandia 945,330 6.23%
8 Norwegia 940,472 6.20%
9 Wielka Brytania 897,137 5.91%
10 Polska 485,390 3.20%
11 Europa 396,956 2.61%
12 Słowenia 211,595 1.39%
13 Belgia 210,147 1.38%
14 Finlandia 191,481 1.26%
15 Grecja 172,935 1.14%

Na samym końcu należy podkreślić, że analiza tego typu statystyki jest trudna. Są one bardzo wrażliwe na rodzaj pojedynczego opisywanego obiektu w Europeanie. Dla przykładu, niektórzy opisują po kolei pojedyncze strony manuskryptów (właściwie jako odrębne obiekty),  a inni opisują cały manuskrypt jako jeden obiekt. Jako że w polskich bibliotekach cyfrowych standardem jest ten drugi sposób opisu, sądzę że można być zadowolonym z obecnego wyniku.

Poprzednie tego typu statystyki można znaleźć tutaj.

Polskie testy Europeany

EuropeanaLocal

W ramach projektu EuropeanaLocal, Poznańskie Centrum Superkomputerowo-Sieciowe przeprowadziło w styczniu br. serię testów portalu Europeana z grupą jego potencjalnych użytkowników.

Testy odbyły się na terenie Wielkopolski; głównie w Poznaniu (25 spotkań), ale także w Swarzędzu (2 spotkania) i w Koninie (1 spotkanie). Podczas 28 spotkań łącznie przetestowano 44 użytkowników z różnych grup docelowych (bibliotekarze, uczniowe, pracownicy centrów turystycznych, zwykli użytkownicy, itd.). Testy odbywały się w obecności moderatora i średnio trwały ok. 1 godzinę. Scenariusz spotkań był dosyć rozbudowany i wyglądał następująco:

  1. Przedstawienie celu spotkania.
  2. Wypełnienie kwestionariusza wstępnego, badającego zaznajomienie z Europeaną oraz wyszukiwarkami internetowymi.
  3. Krótkie przedstawienie Europeany przez moderatora i próba samodzielnego skorzystania z Europeany.
  4. Dyskusja z moderatorem nt. pierwszych wrażeń związanych z Europeaną.
  5. Wypełnienie kwestionariusza nt. pierwszych wrażeń.
  6. Wykonanie 7 praktycznych zadań związanych z portalem Europeana.eu.
  7. Dyskusja z moderatorem nt. wrażeń po wykonaniu zadań.
  8. Wypełnienie kwestionariusza końcowego będącego podsumowaniem testów.

Dzięki tym testom udało się zebrać wiele cennych uwag oraz zaobserwować wiele interesujących zachowań użytkowników na stronach Europeany (np.:  podczas pierwszego kontaktu z portalem czy realizacji bardziej zaawansowanych zadań, takich jak wyszukiwanie po datach).


Raport końcowy z testów.

Efekty spotkań zostały opracowane i przedstawione w raporcie końcowym dostępnym na stronach Repozytorium Zespołu Bibliotek Cyfrowych PCSS. Podsumowanie zostało przekazane do dalszej analizy członkom projektu EuropeanaLocal, którzy opracują raport zbiorczy z analogicznych testów przeprowadzonych we wszystkich krajach UE. Z naszej strony zachęcamy Państwa do zapoznania się z dokumentem!

Na końcu chcielibyśmy podziękować wszystkim uczestnikom badania za ich wysiłek i cenne uwagi, a w szczególności pracownikom Biblioteki Kórnickiej PAN, Centrum Informacji Miejskiej w Poznaniu, Centrum Informacji Turystycznej w Poznaniu i Biura Promocji Miasta Poznania.

Internet okiem humanisty

Dnia 7 grudnia 2010 r. w Warszawie odbyło się II seminarium w cyklu Informatyzacja Instytucji Kultury – Instytucje Kultury w Internecie. Celem spotkania było zaprezentowanie, w jaki sposób instytucje kultury mogą zaistnieć oraz promować się w Internecie oraz jakie korzyści daje obecność w sieci.

Podczas tego seminarium Agnieszka Lewandowska z Poznańskiego Centrum Superkomputerowo-Sieciowego zaprezentowała projekt Europeana, portal Europeana.eu oraz możliwości przekazywania danych do Europeany w ramach projektu EuropeanaLocal. Skupiono się na opisie Europeany oraz korzyściach jakie płyną z przyłączenia do niej danych (zwiększona widoczność, promocja, ciekawe sąsiedztwo, itp.). Przedstawiono także model przyłączenia oraz opisano możliwe ścieżki dla polskich regionalnych i lokalnych instytucji kultury. Liczymy, że w efekcie tej prezentacji uda się wzbudzić zainteresowanie tą tematyką w nowych środowiskach i dzięki temu przyłączyć nowe instytucje do Europeany poprzez projekt EuropeanaLocal i Federację Bibiotek Cyfrowych.

Jedną z wielu ciekawych prelekcji wygłoszonych w trakcie seminarium przedstawił pan Tomasz Rodowicz. Dotyczyła ona problematyki zainteresowania internauty teatrem i była zatytułowana „Teatr internetowy – czyli nowe media w kulturze”. Prezenter opowiadał o przyciągnięciu wirtualnego widza na podstawie własnych doświadczeń. Mowa była m.in. o nadawaniu tradycyjnego przedstawienia teatralnego (z normalną widownią) na żywo w Internecie, przy czym elementem scenografii był telebim wyświetlający komentarze internautów na temat przedstawienia. Tworząc w ten sposób trójkąt widz-aktor-internauta, którego każdy element współdziałał na siebie.

Strona główna serwisu Mapa Kultury

Na sam koniec zachęcamy także do zajrzenia na dwie strony:

  • Mapa Kultury – „pierwszy ogólnopolski portal interaktywny promujący polską kulturę regionów współtworzony przez użytkowników”,
  • Platforma Kultury – „interaktywny portal poświęcony kulturze i edukacji kulturalnej, mający na celu wymianę informacji, prezentację ciekawych praktyk i projektów z całej Polski oraz aktywizację środowisk kulturalnych”.

Powyższe strony zostały zaprezentowane w trakcie seminarium przez panią Karolinę Szczepanowską z Narodowego Centrum Kultury.

Seminarium „Geowizualizacja zasobów dziedzictwa kulturowego w Internecie”

W dniu 7 września 2010 w Archiwum Głównym Akt Dawnych w Warszawie odbyło się seminarium „Geowizualizacja zasobów dziedzictwa kulturowego w Internecie„. Seminarium prezentowało wyniki projektu badawczego „Metodyka opracowywania map zabytków ruchomych„, które było realizowane przez Instytut Geodezji i Kartografii oraz Naukową i Akademicką Sieć Komputerową. Projekt skupiał się na prezentacji zabytków ruchomych na mapie, w nowej, atrakcyjnej dla użytkownika formie. Celem było umożliwienie użytkownikowi dotarcie do opisu i obrazu zabytku przy pomocy zaawansowanej nawigacji na mapie, uwzględniającej charakterystykę tego typu obiektów.

Zabytki ruchome na mapie
Rysunek 1. Mapa dziedzictwa kulturowego Polski.

Jako typ obiektów źródłowych wybrano zabytki ruchome. Jak sama nazwa wskazuje, są to obiekty, które mogą łatwo zmienić swoje położenie geograficzne. Zaliczamy do nich takie obiekty jak: obrazy, rzeźby, itp. Zazwyczaj z takimi obiektami związanych jest wiele odniesień przestrzennych. Można je podzielić ze względu na:

  • tematykę obiektu,
  • miejsce powstania obiektu,
  • miejsca przechowywania obiektu.

W wypadku zabytków, odniesienia przestrzenne często wiążą się ze starym nazewnictwem oraz podziałem regionalnym. W związku z tym opisy zabytków ruchomych zostały przygotowane przez różnych specjalistów, w tym archiwistów czy historyków.

Odpowiednia prezentacja także była istotnym elementem projektu. Gdy użytkownik przeszukuje pewien zbiór danych przestrzennych, często zainteresowany jest nie tylko konkretną miejscowością, ale także powiatem, regionem, czy województwem. Dlatego zdecydowano się na prezentację pozwalającą przechodzić płynnie między różnymi poziomami granularności informacji przestrzennej. Dodatkowo w jasny, wizualny sposób przedstawiono na mapie różnice między lokalizacjami:

  • powiązanymi z tematyką obiektu,
  • będącymi miejscem powstania obiektu,
  • będacymi miejscami przechowywania obiektu.

Zasoby testowe, dla których obecnie istnieje prezentacja, to:

Z technicznego punktu widzenia, wykorzystano dwa standardy opisu obiektów:

Natomiast oprogramowanie jest połączeniem rozwiązań darmowych (np.: PostgreSQL + PostGIS) oraz komercyjnych (np.: ActionScript 3).

Zachęcamy Państwa do przyjrzenia się projektowi oraz przetestowaniu jego wyników! Więcej informacji na temat projektu znajdą Państwo tutaj, natomiast na temat seminarium tutaj.

Liczba bibliotek cyfrowych w Federacji Bibliotek Cyfrowych

Federacja Bibliotek Cyfrowych została pierwszy raz publicznie udostępniona 22 czerwca 2007 roku. Wówczas przyłączonych do FBC było 16 bibliotek cyfrowych. Dzisiaj lista ta jest dłuższa aż  o 41 pozycji i znajduje się na niej 57 bibliotek cyfrowych. Jest to wzrost ponad 3 krotny!

Przyrost bibliotek cyfrowych w FBC
Wykres 1. Przyrost bibliotek cyfrowych w FBC.

Na wykresie nr 1 widać tempo wzrostu od początku działalności FBC. Jak widać jest ono stałe i bez przerwy utrzymuje mniej więcej ten sam poziom. Jeżeli tendencja zostanie zachowana, liczba 100 bibliotek cyfrowych przyłączonych do FBC będzie osiągnięta za ok. 3 lata.

 Liczba nowych bibliotek cyfrowych w przeciągu roku
Wykres 2. Liczba nowych bibliotek cyfrowych w przeciągu roku.

Wyniki dla tempa wzrostu są zgodne z liczbą nowych bibliotek cyfrowych w przeciągu roku – utrzymują się mniej więcej na tym samym poziomie od początku działalności FBC (patrz wykres nr 2) i średnio wynosi 14 bibliotek cyfrowych rocznie. Jednak rok 2010 jeszcze się nie zakończył, więc liczymy, że będzie on rekordowy. Do dnia dzisiejszego przyłączyło się 16 nowych bibliotek cyfrowych w 2010 roku. Tylko jednej brakuje do rekordu.

A do końca roku pozostały 4 miesiące…

Aktualizacja danych w Europeanie

W ostatnich tygodniach Europeana zaktualizowała dane przekazywane poprzez Federację Bibliotek Cyfrowych. Pomimo napotkanych problemów udało się zakończyć operację z sukcesem. Podczas tej aktualizacji po raz pierwszy udało przekazać się miniatury dla większości publikacji (prawie 300 000 miniatur) z FBC. Ponadto zwiększyła się liczba publikacji z FBC do prawie 350 000. Dzięki funkcjonalności oprogramowania dLibra, część miniatur dla publikacji w formacie DjVu została wygenerowana automatycznie.

FBC w Europeanie
Obraz 1. Miniatury dla publikacji przekazanych poprzez FBC.

Ten transfer danych do Europeany był pierwszym transferem dla aż 6 nowych bibliotek cyfrowych:

Zachęcamy kolejne repozytoria cyfrowe do dołączenia do Federacji oraz poprzez Federację do Europeany. Więcej na ten temat tutaj.

Zastosowanie zaleceń Komisji Europejskiej odnośnie digitalizacji […] – Raport 2010 dla Polski

Dnia 28 lutego tego roku upłynął termin składania raportów na temat zastosowania zaleceń Komisji Europejskiej odnośnie digitalizacji, dostępności w Internecie dóbr kultury oraz ich długoterminowego przechowywania. Polska, jako członek Unii Europejskiej, także musiała złożyć taki raport na temat aktualnego stanu prac. Raport jest do ściągnięcia tutaj.

Wg dokumentu obecnie w Polsce znajduje się:

  • ok. 500 000 obiektów cyfrowych w bibliotekach (80% dostępne w Internecie),
  • ok. 1 000 000 obiektów cyfrowych w archiwach (20% dostępne w Internecie),
  • ok. 300 000 obiektów cyfrowych w muzeach (1-2% dostępne w Internecie).

Z czego ok. 350 000 (17.5%), głównie z bibliotek, znajduje się w Europejskiej bibliotece, archiwum i muzeum cyfrowym – Europeanie. Aby więcej obiektów cyfrowych było zdigitalizowanych, a następnie widocznych w Internecie utworzono cztery Centra Kompetencji:

Z dalszych ciekawych informacji z raportu, Biblioteka Narodowa szacuje obecnie, że w Polsce jest 1 600 000 książek w domenie publicznej. Jest to zasób, który może być swobodnie zdigitalizowany i udostępniony w Internecie. Dlatego w dokumencie założono, że co najmniej 1 000 000 zdigitalizowanych obiektów bibliotecznych z Polski znajdzie się w globalnej sieci do 2013 roku. Natomiast do końca 2020 roku 15 000 000 polskich obiektów cyfrowych znajdzie się w różnego typu repozytoriach cyfrowych:

  • bibliotekach cyfrowych,
  • archiwach cyfrowych,
  • kolekcjach audiowizualnych,
  • wirtualnych muzeach.

Pracami nad osiągnięciem tej liczby zajmuje się Zespół do Spraw Digitalizacji przy Ministerstwie Kultury i Dziedzictwa Narodowego oraz 4 już wspomniane Centra Kompetencji (więcej na ten temat tutaj).

Ponadto raport zawiera krótki opis i adresy kontaktowe do 5 wybranych dostawców treści do Europeany. Miło nam zauważyć, że aż 4 z 5 przedstawionych dostawców, znajduje się w Europeanie poprzez Federację Bibliotek Cyfrowych:

Osoby zainteresowane informacjami na takie tematy jak:

  • przewidywane koszty digitalizacji w następnych latach,
  • status partnerstwa publiczno-prywatnego,
  • Państwowe programy w Polsce zajmujące się digitalizacją,
  • długoterminowe przechowywanie

zachęcam do przeczytania całego raportu oraz wspomnianego w nim dokumentu – „Program digitalizacji dóbr kultury oraz gromadzenia, przechowywania i udostępniania obiektów cyfrowych w Polsce 2009-2020„.

400 tysięcy publikacji w polskich bibliotekach cyfrowych!

24 maja 2010 około godziny 10:20 łączna liczba publikacji w polskich bibliotekach cyfrowych przyłączonych do FBC przekroczyła 400 tysięcy.

Czterystutysięczna publikacja to „Mosty-Nasze Słowo : pismo Żydowskiej Partii Robotniczej (Poalej-Sjon Haszomer Hacair). R. 4 (1949) nr 44 (447)” udostępniana przez e-bibliotekę Uniwersytetu Warszawskiego.

Przy okazji oszacowaliśmy tempo przyrostu publikacji w polskich bibliotekach cyfrowych w przeciągu ostatnich 3 miesięcy. Wg danych przechowywanych w FBC średnio 15 000 publikacji jest dodawanych co miesiąc. Jeszcze pod koniec roku 2009 obliczyliśmy przyrost w granicach 10 000 publikacji miesięcznie. Oznacza to wzrost o 5 000 publikacji! Więcej znajdą Państwo na stronie z wykresem łącznej liczby publikacji.

Miło nam zauważyć także, że wysiłek bibliotekarzy cyfrowych jest doceniany przez portal Historia i Media. Portal ten rozpoczął cykl artykułów pod nazwą „Znalezione w polskich bibliotekach cyfrowych” o szczególnie atrakcyjnych materiałach odnajdywanych przy pomocy FBC. Zachęcamy do zapoznania się z nim!

Wszystkim współtworzącym polskie biblioteki cyfrowe serdecznie gratulujemy!

Europeana, a środowisko Open Source

Filozofia Open Source jest popularna w środowisku programistycznym. Wielu z nas korzysta z produktów OS w codziennej pracy (np.: Eclipse, Apache, Tomcat), jak i w codziennym życiu (np.: Firefox, Thunderbird, OpenOffice.org). Jako że budowa Europejskiej Biblioteki Cyfrowej – Europeany jest obecnie finansowana głównie z funduszy unijnych, pojawiały się pytania czy jej źródła będą powszechnie udostępnione. Roczny raport Europeany za rok 2010 odpowiada na to pytanie twierdząco 🙂

Otwarcie na środowisko Open Source realizowane jest poprzez portale EuropeanaLabs oraz delving (poprzednie Open Europeana). Głównym celem EuropeanaLabs jest stworzenie wspólnego miejsca rozwoju europejskiej biblioteki cyfrowej dla grupy projektów powiązanych z Europeaną.  Na stronach EuropeanaLabs znajduje się m.in. kod  źródłowy Europeany (udostępniony na najnowszej wersji licencji Open Source – EUPL) oraz dokumentacja techniczna powiązaną z projektem, np.:

Wszystkie wymienione strony są ogólnodostępne.

Natomiast portalem ściśle dedykowanym dla środowiska Open Source jest delving. Jego celem jest zachęcenie środowiska OS do wzięcia udziału w budowie portalu Europeany, dlatego znajdziemy tam:

Więcej szczegółów na temat tego jak włączyć się do budowy Europeany oraz różnic między EuropeanaLabs, a delving można znaleźć tutaj.

Roczny raport Europeany opisuje także przyczyny opisanego postępowania: przejrzystość działania i dzielenie się efektami prac,  które wpisują się jasno w formę działalności inicjatyw Unii Europejskiej. Czas pokaże czy otwarcie na środowisko Open Source przyniesie Europeanie wymierne korzyści. Obecnie jest to początek drogi i możemy tylko gdybać. Jednak mam nadzieje,  że inicjatywa ta zakończy sukcesem i w Europeanie znajdzie się także kod programistów nie powiązany z projektami naokoło Europeany.

Studencki Festiwal Informatyczny 2010

Poza wyjazdami nakierowanymi na rozwój wiedzy i wymianę doświadczeń w dziedzinie bibliotek cyfrowych (wyjazdy na takie konferencje jak ECDL, JCDL), pamiętamy także o naszym rozwoju w obszarze ogólnie rozumianej informatyki. Stąd też pomysł wyjazdu na konferencję czysto informatyczną prezentującą różnorodny przekrój tematów. Pozwala to zaznajomić z nowinkami ze świata IT i zastanowić nad ich możliwymi zastosowaniami w naszych projektach.

W dniach 11-13 marca w Krakowie odbywał się Studencki Festiwal Informatyczny 2010 – darmowa konferencja dla informatyków, gromadząca znanych prelegentów zarówno z Polski, jak i ze świata. Wśród mówców tej, jak i poprzednich edycji, były takie osoby jak:

Konferencję otworzył wykład prof. Jerzego Nawrockiego na temat formalizmu i zwinności w projektach informatycznych, jako odpowiedzi na syndrom LOOP:

  • L – late – przekraczanie terminów,
  • O – over budget – przekraczanie budżetów,
  • O – overtime – nadgodziny,
  • P – poor quality – kiepska jakość.

Wskazał na próby rozwiązania tego problemu przez różne koncepcje zarządzania projektem, które zakładają zwiększony formalizm (np.: ISO9000) lub zwiększoną zwinność (np.: XP). Oba podejścia mają jednak swoje wady (formalizm: za dużo dokumentacji, powolny proces decyzyjny; zwinność: brak klienta na miejscu, zbyt krótka perspektywa planu). Dlatego prof. Nawrocki zaproponował metodykę, która z obu podejść bierze to co najlepsze, przy okazji starając się niwelować ich słabości – XPrince. Cytując prelegenta „XP nie na czczo i nie przed snem”. Więcej na ten temat tutaj.

Kolejny interesujący prelegent, to dr Michał Korzycki przedstawiający temat sztucznej inteligencji w e-commerce na przykładzie systemów rekomendacji. Temat ten pojawia się także w bibliotekach cyfrowych, a jego odpowiednia realizacja nie jest trywialna. Prowadzący przedstawił temat na podstawie historii nagrody Netflix Prize, której celem było zwiększenie skuteczności systemu rekomendacji wysyłkowej wypożyczalni filmów DVD o 10% (zwycięski algorytm opisany na stronie Netflix Prize). Wg szacunków tej firmy, systemy rekomendacji zapewniają jej 60% dochodów! Wśród metod zastosowanych przez użytkowników prowadzący zwrócił uwagę na skuteczność prostych heurystyk opartych na wiedzy na temat natury człowieka, np.: jak ludzie mają zły humor gorzej oceniają i na odwrót. Na podstawie własnego doświadczenia (kilka systemów rekomendacji zrealizowanych dla klientów komercyjnych) dr Korzyski zostawił słuchaczy z kilkoma wnioskami:

  • ze względu na zwiększającą się ilość danych i produktów systemy rekomendacji są i będą potrzebne,
  • nie ma cudownego rozwiązania – wymagana jest duża ilość wiedzy „włożonej” w system,
  • najbardziej oczywiste rekomendacje nie są dla użytkownika interesujące – przecież sami mogą się domyślić,
  • algorytm jest istotnym narzędziem, jednak nie możemy zapomnieć, że ważne jest też jak go zastosujemy (odpowiednia prezentacja użytkownikowi wyników na stronie).

Na koniec tylko krótko o dwóch innych, ciekawych prezentacjach. Pierwsza to „Interfejs mózg-komputer” opisująca podstawowe mechanizmy, na podstawie których działają takie urządzenia. Przedstawiono także prace prowadzone w tym zakresie w Polsce na Uniwersytecie Warszawskim – kompletną, otwartą platformę BCI – OpenBCI. Druga prezentacja była o narzędziu Gradle do budowania kodu projektów informatycznych w elastyczny sposób. Projekt w założeniach ma łączyć w sobie zalety Ant’a, Apache Ivy oraz Maven2, jednocześnie niwelując ich wady.

Na stronach SFI można znaleźć sfilmowane prezentacje z różnych edycji. Zachęcamy do oglądania!