Wszystkie wpisy, których autorem jest Adam Dudczak

Ankieta dotycząca przechowywania kopii MASTER w polskich bibliotekach cyfrowych

Zapraszamy wszystkich Państwa do wypełnienia ankiety dotyczącej przechowywania kopii MASTER w tworzonych przez Państwa bibliotekach cyfrowych. Ankieta jest adresowana do instytucji, które tworzą bądź współtworzą biblioteki cyfrowe. Wyniki zostaną wykorzystane w czasie prac realizowanych przez PCSS w ramach projektu SYNAT (http://www.synat.pl) i zostaną opublikowane w formie raportu.

Ankieta będzie dostępna do 12 stycznia 2012 pod tym adresem.

Z góry dziękujemy za pomoc.

Warsztaty „Open data and re-use of public sector information”

W dniach 16-17 czerwca uczestniczyłem w konferencji Digital Agenda Assembly, zorganizowanej przez komisję europejską w Brukseli. Celem konferencji było podsumowanie realizacji planu rozwoju cyfrowej gospodarki Europy (Digital Agenda for Europe Communication). W czasie dwóch dni konferencji zorganizowano serię równoległych spotkań warsztatowych których tematyka związana była z m.in. konsolidacją i pobudzaniem cyfrowych rynków Europy, interoperacyjnością i standardami komunikacyjnymi, bezpieczeństwu usług elektrocznicznych, rozwojowi infrastruktury szerokopasmowego internetu, rozwojowi innowacyjnych usług elektronicznych, wzrostowi świadomości i umiejętności w zakresie technologii ICT.

Miałem przyjemność uczestniczyć w spotkaniu warsztatowym „Open data and re-use of public sector information” w czasie którego poruszano tematykę związaną z upublicznianiem i wykorzystaniem różnego rodzaju danych gromadzonych przez instytucje sektora publicznego. Przedstawiono przykłady scenariuszy wykorzystania tych danych dla tworzenia nowych usług oferowanych również przez instytucje komercyjne. Mowa była także o kosztach związanych z publikacją takich danych oraz o granicach transparentności sektora publicznego (głównie w kontekście bezpieczeństwa).

Bardzo spodobała mi się prezentacja Katalin Gallyas, która pokazała w jaki sposób do kwestii otwartych danych podchodzą władzę miasta Amsterdam. Katalin opowiadała o różnego rodzaju projektach w które miasto jest zaangażowane (m.in. OpenCities, Open Government Data Initiative) oraz o działaniach, które w ramach nich zostały przeprowadzone. Mam nadzieję, że ten dość krótki opis zachęci Państwa do zapoznania się z jej prezentacją.

W czasie warsztatów zaprezentowano wyniki Open Data Challenge oraz serii hackathonów Hack4Europe! (do tego tematu jeszcze wróce, w kolejnym wpisie). Open Data Challenge to konkurs zorganizowany przez Open Knowledge Foundation. Uczestnicy rywalizowali w kilku kategoriach między innymi najlepsza aplikacja wykorzystująca dane publiczne, najlepszy pomysł na aplikację czy najlepsza wizualizacja. W konkursie wzieło udział ponad 430 uczestników z 24 krajów Unii Europejskiej. Łączna pula nagród to 20 000 euro. Poniżej krótkie wideo podsumowujące wyniki konkursu.

Open Data Challenge from Open Knowledge Foundation on Vimeo.

Wygląda na to, że otwarte dane stają się coraz bardziej cennym kąskiem dla sektora prywatnego. Dowodem na to niech będą projekty sponsorowane przez gigantów rynku IT np. Google (http://opendatakit.org/ oraz sponsoring OpenData Challenge) czy Microsoft ( Open Government Data Initiative). Wraz z zainteresowaniem sektora prywatnego jest szansa, że zmiany w tym zakresie będą zachodzić szybciej niż dotychczas.

Podsumowanie Hack4Europe!

Hack4Europe! to seria czterech imprez organizowanych w tym samym tygodniu w Poznaniu, Londynie, Barcelonie i Sztokholmie. Wszystkie spotkania organizowała Fundacja Europeana przy wsparciu lokalnych partnerów. W Poznaniu tymi partnerami byli Poznańskie Centrum Superkomputerowo-Sieciowe oraz Biblioteka Kórnicka PAN.

Celem tych spotkań było przygotowanie prototypowych aplikacji wykorzystujących informacje dotyczące 18 milionów obiektów dziedzictwa kulturowego zgromadzonych przez portal Europeana.

W każdej z edycji Hack4Europe! zespoły programistów rywalizowały o nagrody w czterech kategoriach: największy potencjał komercyjny , najsilniejsze oddziaływanie społeczne , najbardziej innowacyjny pomysł oraz nagroda publiczności.

W sumie we wszystkich edycjach wzieło udział 85 programistów, którzy przygotowali 48 prototypów. Wśród stworzonych aplikacji znajdowały się m.in. aplikacje wykorzystujące możliwości współczesnych smartfonów, sieci społecznościowych, czy programy ułatwiające łączenie zasobów zgromadzonych w Europeanie z serwisami takimi jak Wikipedia, stworzono także gry oraz wizualizacje np. europejska mapa praw autorskich.

Poznańska edycja odbyła się w dniach 7-8 czerwca w Pałacu Działyńskich w samym sercu poznańskiego starego rynku. Wzieło w niej udział 18 programistów z całej Polski, którzy w ciągu dwóch dni intensywnej pracy stworzyli 8 prototypowych aplikacji. Jury wyróżniło trzy programy:

  • w kategorii aplikacja o największym potencjale komercyjnym zwyciężyła aplikacja Art4Europe stworzona przez zespół pracowników firmy ITraff Technology w składzie Jakub Jurkiewicz , Marcin Szajek , Jakub Porzuczek oraz Tomasz Grzywalski,
  • w kategorii najbardziej innowacyjny pomysł wygrał projekt o nazwie „Europeana Field Game” stworzona przez Zbigniewa Tenerowicza i Piotra Kaletę reprezentujących Akademickie Koło Aplikacji Internetowych z Politechniki poznańskiej,
  • w kategorii największe oddziaływanie społeczne zwyciężyła gra Hackmemory, stworzona przez Bartka Indyckiego i Darka Walczaka. Aplikacja ta zwyciężyła również w kategorii nagroda publiczności.

Oprócz nagrodzonych aplikacji powstały również narzędzia umożliwiające integracje danych pochodzących z Europeany z API Google Maps oraz MediaWiki. Nagrody dla uczestników ufundowała Fundacja Europeana oraz fundusz inwestycyjny Speed Up Group.

Zwycięzca w kategorii największy potencjał komercyjny czyli aplikacja Art4Europe to aplikacja mobilna umożliwiająca identyfikacje dzieł sztuki na podstawie wykonanych telefonem komórkowym zdjęć. Użytkownik znajdując się np. w muzeum robi zdjęcie obrazu swoim telefonem. Na tej podstawie uzyskuje z Europeany dodatkowe informacje o tym obrazie. Jeżeli opis obrazu jest w języku, którego nie zna użytkownik, aplikacja Art4Europe może ten opis przetłumaczyć, a nawet zamienić na postać audio (przeczytać). Dodatkowo użytkownik może zostać skierowany np. do sklepu internetowego z reprodukcjami obrazu czy książkami o tym obrazie.

Aplikacja, która otrzymała nagrodę za pomysłowość to również program na telefony komórkowe. Jej celem jest umożliwienie użycia obiektów dziedzictwa kulturowego do tzw. gier miejskich. Użytkownicy tej aplikacji mogą przy pomocy swoich telefonów wyszukiwać interesujące obiekty dziedzictwa kulturowego a następnie wirtualnie „upuszczać” je w przestrzeni miasta. Inni użytkownicy w ramach zadań określonych w grze mogą te przedmioty wirtualnie „zbierać” zyskując w ten sposób kolejne punkty.

Ostatni z trójki poznańskich zwycięzców to internetowa gra logiczna Hackmemory (dostępna pod adresem http://hackmemory.drivent.pl/memory/start) . Moderator tej gry (np. nauczyciel) może wybrać obiekty dziedzictwa kulturowego związane z jakimś konkretnym tematem (np. tematem lekcji historii). Z wizerunków tych obiektów tworzona jest gra logiczna, w którą mogą grać inne osoby (np. uczniowie w czasie lekcji). Za każdym razem gdy połączą oni wybrane przez moderatora obiekty mają okazję zapoznać się informacjami o tych obiektach.

Polscy laureaci wzieli udział w drugim etapie konkursu, gdzie spośród zwycięzców wszystkich 4 hackathonów wyłonione zostały projekty najlepsze w skali europejskiej. Wśród lauretów znalazł się projekt Art4Europe!, obok niego wyróżniono następujące projekty:

  • Casual Curator (Londyn) – aplikacja ułatwiająca wykorzystywania cyfrowych wizerunków obiektów dziedzictwa kulturowego i informacji o tych obiektach w edukacji.
  • Time Mash (Sztokholm) – projekt umożliwiający wyszukiwanie obiektów w Europeanie na podstawie przy pomocy telefonu komórkowego (na podstawie pozycji geograficznej użytkownika telefonu) i porównywanie obecnego stanu zabytków z ich cyfrowymi wizerunkami w Europeanie.
  • Timebook (Barcelona) – projekt reprezentujący informacje o znanych postaciach historycznych pobierane z Europeany i DBPedii w formie zbliżonej do portalu Facebook (z cytatami, powiązanymi postaciami jako przyjaciółmi itp.)

Wręczenie nagród odbyło się 16 czerwca 2011 w Brukseli w czasie konferencji Digital Agenda Assembly. Zwycięzcy odebrali nagrodę z rąk Wiceprzewodniczącej Komisji Europejskiej i komisarz europejską ds. agendy cyfrowej Neelie Kroes.

Instalacja Tesseract 3.0 na Ubuntu server 10.10

Tesseract to aplikacja służąca do automatycznego rozpoznawania tekstu (ang. Optical Character Recognition, OCR). Pierwotnie była ona rozwijana przez firmę Hewlett Packard. W 2005 roku kod aplikacji został uwolniony na licencji Apache. W chwili obecnej jego rozwój jest wspierany przez Google. We wrześniu 2010 opublikowano wersję 3.0, obok wielu innych nowych funkcji oferuje on również wsparcie dla języka polskiego.

Wiki na stronach projektu Tesseract jest chwilami niespójna dlatego zdecydowałem się opisać moje doświadczenia związane z instalacją wersji 3.0. Instalacji dokonałem przy wykorzystaniu Ubuntu 10.10 w wersji serwerowej działającej na wirtualnej maszynie stworzonej przy użyciu Oracle Virtual Box.

W pierwszej kolejności należy zainstalować build-essential i autoconf:

sudo apt-get install build-essential
sudo apt-get install autoconf

Następnie – zgodnie z tym co napisano na Wiki projektu, trzeba zainstalować wykorzystywane przez aplikację biblioteki:

sudo apt-get install libpng12-dev
sudo apt-get install libjpeg62-dev
sudo apt-get install libtiff4-dev
sudo apt-get install zlib1g-dev

Proszę zwrócić uwagę, że na stronie Tesseract’a jest błąd w nazwie pakietu zlib1g-gev.

Próbowałem zainstalować libleptonica (biblioteka Leptonica jest wymagana) z pakietu dostępnego w domyślnych repozytoriach Ubuntu, ale skrypt ./configure Tesseract’a nie wykrywa tak zainstalowanej biblioteki. Z problemem tym można sobie poradzić kompilując Leptonicę ze źródeł. Ściągnąłem źródła do wersji 1.6.7 z strony projektu. Proces budowania wygląda następująco:

./configure
make
sudo make install
sudo ldconfig

Kolejny krok to ściągnięcie źródeł tesseract-3.00.tar.gz ze strony projektu. Należy rozpakować archiwum, wejść do katalogu tesseract-3.0 i wydać polecenia:

./runautoconf
./configure

Po wywołaniu polecenia ./configure należy sprawdzić zawartość pliku config_auto.h pozwoli to określić czy wszystkie zależności zostały przez skrypt wykryte. Plik powinien zawierać dyrektywę #define odkomentowaną dla następujących zmiennych AVE_LIBLEPT, HAVE_LIBPNG, HAVE_LIBTIFF, HAVE_LIBJPEG oraz HAVE_ZLIB.

make
sudo make install
sudo ldconfig

Bez wydania polecenia ldconfig Tesseract może się w ogóle nie uruchomić.

Teraz wystarczy już tylko ze strony projektu ściągnąć pliki zawierające wsparcie dla potrzebnych języków i skopiować je do katalogu z ustawieniami, który domyślnie znajduje się w /usr/local/share/tessdata. Aby uruchomić OCR wystarczy wydać polecenie:

tesseract phototest.tiff out.txt -l eng 
more out.txt

Mam nadzieje, że powyższa instrukcja okaże się przydatna.

Kolejne sukcesy naszych tureckich kolegów

W poprzednim wpisie wspomnieliśmy o ogromnym sukcesie naszych tureckich kolegów, którzy zdołali uruchomić portal e-learningowy oraz program certyfikacji umiejętności w zakresie digitalizacji i bibliotek cyfrowych. Udało się tego dokonać w oparciu o materiały edukacyjne stworzone w ramach projektu ACCESS IT przez Zespół Bibliotek Cyfrowych PCSS.

Trzeba przyznać, że nasi tureccy koledzy nie marnują czasu. Wczoraj otrzymaliśmy wiadomość, że w ciągu tych niespełna 10 dni w tureckim portalu zarejestrowało się już 895 użytkowników!

Kursy edukacyjne ACCESS IT w Turcji

Kursy e-learningowe ACCESS IT (więcej informacji tutaj) zostały stworzone aby wesprzeć edukacje w zakresie digitalizacji i bibliotek cyfrowych w Grecji, Serbii i Turcji. W oparciu o materiały przygotowane przez Zespół Bibliotek Cyfrowych PCSS, partnerzy projektu ACCESS IT pracują w chwili obecnej nad uruchomieniem swoich portali e-learningowych. Z przyjemnością informujemy, że prace związane z tłumaczeniem i przystosowywaniem kursu zostały właśnie zakończone w Turcji.

Prof. Bülent Yılmaz (koordynator projektu ACCESS IT w Turcji) z uniwersytetu Hacettepe w Ankarze poinformował, że z dniem 10 stycznia 2011 studenci uniwersytetu Hacettepe oraz wszyscy zainteresowani będą mogli rozpocząć korzystanie z tureckiej wersji kursów ACCESS IT. Turecki portal dostępny jest pod adresem: http://193.140.238.102/moodle.

Większość materiałów z kursu „Digital Repositories for small memory institutions” (DRMSI) została przetłumaczona na język turecki. Poza tym, kurs ten został podzielony na dwie mniejsze części: „Digitisation” oraz „Digital Content Management”. W wyniku tych prac przyszli uczestnicy kursu będą mogli brać udział w trzech kursach (trzeci to niezmieniony kurs „Cooperation with Europeana”). Osoby, które ukończą kurs i zdadzą końcowy egzamin otrzymają certyfikat ACCESS IT sygnowany przez uniwersytet Hacettepe.

Pierwsza edycja kursu trwać będzie do 6 marca 2011.

II Konferencja i3: internet – infrastruktury – innowacje

W dniach 1-3 grudnia 2010 odbyła się we Wrocławiu druga edycja konferencji „i3: internet – infrastruktury – innowacje”. Konferencja organizowana jest przez Konsorcjum PIONIER. Istotną rolę w organizacji tegorocznej edycji odegrały Wrocławskie Centrum Siecowo-Superkomputerowe i PCSS.

W ramach konferencji Zespół Bibliotek Cyfrowych PCSS prezentował dwa referaty „Wyzwania techniczne związane z prezentacją dziedzictwa kulturowego w Internecie” oraz „Architektura i protokoły dla budowy systemu wiedzy – zadania PCSS w projekcie SYNAT”.

Referat „Wyzwania techniczne związane z prezentacją dziedzictwa kulturowego w Internecie” zawierał opis podejścia realizowanego w PCSS wobec prezentacji różnych typów obiektów cyfrowych (np. tekstowych, graficznych, audiowizualnych) przy użyciu elastycznego modelu danych wykorzystywanego w oprogramowaniu dLibra.

Druga prezentacja „Architektura i protokoły dla budowy systemu wiedzy – zadania PCSS w projekcie SYNAT” to ogólne omówienie obecnego stanu prac realizowanych w PCSS w ramach projektu SYNAT. Z uwagi na to iż projekt SYNAT znajduje się w początkowej fazie rozwoju, prezentacja zawierała omówienie ogólnej architektury systemu i kierunku w jakim rozwijać się będą prace w realizowanych przez PCSS zadaniach.

W czasie konferencji można było wysłuchać wielu interesujących referatów. Tematy sesji, podzielonych na trzy kategorie przewodnie („internet”, „infrastruktury”, „innowacje”), obejmowały takie zagadnienia jak e-zdrowie, e-edukacja, Internet Przyszłości, bezpieczeństwo.

W ramach sesji regionów przedstawiono działający w Czechach system (Elektroniczna Książka Danych Medycznych) stworzony przez IZIP. System został zamówiony przez największą czeską firmę zajmującą się ubezpieczeniami zdrowotnymi. System przechowuje dane o stanie zdrowia pacjenta, diagnozach, zleconych badaniach i ich wynikach. Dzięki temu badania nie są niepotrzebnie powtarzane, co prowadzi do znacznego ograniczenia wydatków. Innym ważnym celem systemu jest poprawa jakości służby zdrowia poprzez dostęp do dodatkowych danych z historii pacjenta, ułatwiających podjęcie odpowiedniej decyzji.
Uwadze Państwa polecamy prezentacje:

  • „Usługi Otwartej Administracji w przestrzeni miejskiej” wygłoszoną przez Bartosza Lewandowskiego z PCSS. W czasie prezentacji Bartek opowiedział o wdrażanej wspólnie przez PCSS i Urząd Miasta Poznań polityce otwartości w e-administracji.
  • „Znaczenie digitalizacji i udostępniania zasobów archiwalnych w Internecie dla rozwoju nowych inicjatyw społecznych”, w czasie której Piotr Skałecki opowiadał o projektach digitalizacyjnych związanych z genealogią między innymi o wyszukiwarce „Poznań Project: przeszukiwanie bazy małżeństw”, która umożliwia przeszukiwanie bazy zawierającej informacje o 540825 małżeństwach zawartych w latach 1820-1889 na terenie dawnej Prowincji Poznańskiej. Piotr wspominał również o projektach Polskiego Towarzystwa Genealogicznego takich jak Geneteka czy transkrypcja dokumentu „Polska Deklaracja o Podziwie i Przyjaźni dla Stanów Zjednoczonych”.
  • „Usługa URBANCARD” – prezentacja na temat karty miejskiej URBANCARD, za którą Urząd Miasta Wrocławia otrzymał nagrodę Pionier Innowacji. Prezentację wygłosił pan Dariusz Jędryczek.

Nagrania z większości prezentacji dostępne są na stronach konferencji (http://www.i3conference.net/online/program.php).

IX Ogólnopolska Konferencja „Automatyzacja bibliotek publicznych”

W dniach 25-26 listopada odbyła się dziewiąta edycja konferencji „Automatyzacja bibliotek publicznych”. Podobnie jak w latach poprzednich organizatorzy (Biblioteka Publiczna m. st. Warszawy, Zarząd Główny Stowarzyszenia Bibliotekarzy Polskich oraz Biblioteka Narodowa) zaprosili wszystkich zainteresowanych do gmachu Biblioteki Narodowej.

Konferencja przeznaczona jest przede wszystkim dla kadry kierowniczej wojewódzkich i powiatowych bibliotek publicznych, ale także dla osób zajmujących się informatyczną stroną rozwoju bibliotek publicznych. Hasło tegorocznej konferencji to „REGIONALNE SIECI WSPÓŁPRACY STRATEGIE, NARZĘDZIA, REALIZACJE”. Trzeba przyznać, że większość referatów idealnie wpasowała się w to hasło i mieliśmy okazję zapoznać się różnymi podejściami do realizacji automatyzacji bibliotek, w szczególności zaś rozwoju infrastruktury IT, budowy zintegrowanych systemów bibliotecznych, edukacji w zakresie nowych technologii, strategii współpracy zarówno z innymi bibliotekami jak i z samorządami, czy też bardziej ogólnie roli bibliotek publicznych w życiu lokalnych społeczności.

Program konferencji pełny był więc interesujących referatów. Na uwagę zasługuje zwłaszcza bardzo inspirująca prezentacja Edwina Bendyka pt. „Między bitami i atomami. Cyfrowa przyszłość książki”. Polecamy również Państwa uwadze wystąpienia pracowników Biblioteki Narodowej w szczególności zaś prezentację dyrektor Katarzyny Ślaskiej pt. „Centrum Kompetencji ds. digitalizacji zbiorów bibliotecznych” oraz referat Joanny Potęgi i Dariusza Paradowskiego pt. „Którędy płyną zera a którędy jedynki – workflow digitalizacji” – niestety slajdy z tej ostatniej nie są dostępne online (pozostaje tylko czekać na publikacje pokonferencyjną).

Bardzo interesujący referat wygłosiła pani Magda Miller z MBP w Gorlicach w swoim wystąpieniu pt. „Siła mądrego samorządu. Zintegrowany system biblioteczny dla pięciu powiatów Małopolski” opowiedziała w bardzo zajmujący sposób o powstaniu konsorcjum bibliotek pięciu powiatów Małopolski, którego celem jest pozyskanie środków na stworzenie zintegrowanego systemu bibliotecznego.

Zespół Bibliotek Cyfrowych PCSS prezentował kursy e-learningowe ACCESS IT. Prezentacja spotkała się z dobrym przyjęciem. Mamy nadzieje, że przygotowane przez nas materiały będą również używane przez polskie biblioteki publiczne.