Wszystkie wpisy, których autorem jest Tomasz Parkoła

Znakomite wyniki projektu Succeed

Końcowy przegląd techniczny projektu Succeed miał miejsce pod koniec lutego 2015 w Alicante. Eksperci zaproszeni prze Komisję Europejską ocenili wszystkie wyniki projektu. Ostatecznie projekt otrzymał najlepszą z możliwych ocen – „excellent” (znakomity), co oznacza, że projekt osiągnął wszystkie wyznaczone cele, przewyższając oczekiwania.

Projekt Succeed wspierał walidację i wykorzystanie wyników prac badawczo-rozwojowych w ramach projektów digitalizacyjnych. Kluczowe osiągnięcia projektu to:

  • Udoskonalone narzędzie IMPACT Interoperability Framework z 40 zintegrowanymi narzędziami, które mogą być wykorzystywane w ramach procesu digitalizacji. Narzędzie to uruchomione jest w ramach Centrum Kompetencji IMPACT w zakresie digitalizacji.
  • Przeszukiwalną listę ponad 260 narzędzi i zasobów przydatnych w procesie digitalizacji: http://succeed-project.eu/publications/available-tools/index-succeed.
  • Ponad 20 ewaluacji narzędzi wykorzystywanych w procesie digitalizacji. Prace zostały wykonane w ramach istniejących procesów digitalizacji przez 13 bibliotek z Europy, tj.: Wielkopolska Biblioteka Cyfrowa (Polska), Biblioteka Uniwersytetu w Salamance (Hiszpania), Biblioteka Uniwersytecka we Wrocławiu (Polska), Biblioteka Uniwersytecka w Bratysławie (Słowacja), Biblioteka Narodowa Finlandii (Finlandia), Biblioteka Uniwersytetu w Granadzie (Hiszpania), Biblioteka Uniwersytetu w Leuven (Belgia), Biblioteka Uniwersytetu w Antwerp (Belgia), Biblioteka Uniwersytetu w Darmstadt (Niemcy), Biblioteca Virtual Miguel de Cervantes (Hiszpania), Biblioteka Brytyjska (Wielka Brytania), Biblioteka Narodowa Francji (Francja), Biblioteka Narodowa Holandii (Holandia).
  • Dwa zestawy rekomendacji dla projektów digitalizacyjnych. Pierwszy dotyczy formatów i standardów związanych z digitalizacją. Drugi dotyczy schematów licencjonowania w kontekście projektów digitalizacyjnych. Podsumowanie online znajduje się na stronie: http://www.digitisation.eu/training/recommendations-for-digitisation-projects/.
  • Organizacja zawodów i konkursów w zakresie powiązanym tematycznie z digitalizacją i innowacyjnymi technologiami. Warto podkreślić, że w drugiej edycji konkursu Biblioteka Uniwersytecka we Wrocławiu otrzymała wyróżnienie.
  • Wiele wydarzeń, których celem było upowszechnienie technologii przydatnych w procesie digitalizacji (trzy międzynarodowe warsztaty, Digitisation Days, konferencja DATeCH oraz ceremonia przyznania nagród projektu Succeed).

Poznańskie Centrum Superkomputerowo-Sieciowe uczestniczyło we wszystkich pakietach roboczych projektu, kierując równocześnie pakietem roboczym, który opracował dwa zestawy rekomendacji dla projektów digitalizacyjnych.

Open Planets Foundation zmienia nazwę na Open Preservation Foundation

We wtorek organizacja Open Planets Foundation oficjalnie zakomunikowała zmianę nazwy na Open Preservation Foundation (zachęcamy zapoznanie się z wpisem na blogu OPF). Pierwotna nazwa nawiązywała do projektu europejskiego Plantes w wyniku którego powstała inicjatywa Open Planets Foundation. Choć początkowo część „Planets” w nazwie była jasnym nawiązaniem do zrealizowanego projektu, z biegiem czasu ten element stawał się dla zewnętrznych obserwatorów coraz mniej zrozumiały. Nowa nazwa bezpośrednio odzwierciedla misję i wizję organizacji – wspieranie społeczności w zakresie przechowywania danych cyfrowych. Pomimo tej zmiany akronim pozostaje ten sam – OPF. W najbliższym czasie uruchomiona zostanie również nowa odsłona strony OPF, która mamy nadzieję, jeszcze lepiej adresować będzie potrzeby społeczności Open Preservation Foundation.

 

Ankieta Succeed dotycząca licencjonowania i innowacyjnego wykorzystania materiałów dziedzictwa kulturowego

Szanowni Państwo,

Projekt Succeed zbiera informacje na temat sposobów licencjonowania danych i narzędzi w kontekście digitalizacji, a także na temat innowacyjnego wykorzystania cyfrowych materiałów do tworzenia nowych zasobów informacyjnych lub nowych narzędzi do ich przetwarzania.  Prosimy o wypełnienie ankiety, a jeśli chcą Państwo uzyskać informacje o wynikach analizy, prosimy o podanie adresu e-mail w jednym z pytań ankietowych. Ankieta znajduje się pod adresem: https://docs.google.com/forms/d/1LXEjvbgd6hzpY8blv1PWofGgWTm5HscN12oLhRTHPUA/viewform?usp=mail_form_link.

Prosimy o wypełnienie ankiety przed końcem czerwca.

Succeed (http://succeed-project.eu) jest europejskim projektem, który ma na celu promowanie wdrażania i walidacji innowacyjnych narzędzi, doskonalących proces digitalizacji dokumentów tekstowych.

Konferencja Digital Library Conference

Zapraszamy do uczestnictwa w konferencji Digital Library Conference, która odbędzie się w dniach 1-3 kwietnia 2014 roku. To już 15 wydanie tej konferencji w ramach której dyskutowane będą działania związane z Europeaną, zaawansowane technologie ICT dla bibliotek cyfrowych oraz wskazówki dla projektów digitalizacyjnych. Na konferencji wystąpią również przedstawiciele PCSS z dwoma referatami. Jednym z nich będzie „Cultural Heritage Institutions, Metadata Aggregators and The Cloud” traktujący o technologiach chmurowych dla bibliotek cyfrowych. Drugim będzie referat prezentujący wyniki jednego z pakietów roboczych projektu Succeed: „Succeed with us: recommendations for mass digitization projects”. Serdecznie zapraszamy do zapoznania się z całym programem (http://www.schk.sk/wordpress/digital-library-english/preliminary-agenda/) oraz do rejestracji (http://www.schk.sk/wordpress/digital-library-english/registration/).

Zapraszamy na szkolenie projektu SCAPE – przechowywanie obiektów cyfrowych

Szanowni Państwo!

Serdecznie zapraszamy na szkolenie projektu SCAPE, które odbędzie się 13 i 14 listopada 2013 roku w Danii. Szkolenie dotyczyć będzie aspektów związanych z długoterminowym przechowywaniem danych źródłowych, w szczególności planowania i zarządzania procesem przechowywania tych danych.

Szczegóły znajdują się na stronie http://www.scape-project.eu/events/11/effective-evidence-based-preservation-planning. Szkolenie prowadzone będzie w języku angielskim.

Zapraszamy!

Ankieta na temat standardów i formatów używanych w digitalizacji

Szanowni Państwo,
Europejski projekt Succeed (http://succeed-project.eu) uruchomił internetową ankietę dotyczącą standardów i formatów wykorzystywanych w procesie digitalizacji. Bardzo prosimy o udział w tej ankiecie pod adresem: https://docs.google.com/forms/d/16qvPbAZYUVmYz1MbeCGVcfxy0UXksr3-v5QQ7h3uETE/viewform. Celem tej ankiety jest zebranie informacji na temat bieżących praktyk w kontekście plików master (plików wzorcowych), wersji prezentacyjnych, formatów metadanych, OCR, itp. Informacje te pomogą nam zdefiniować rekomendacje na poziomie europejskim w zakresie digitalizacji dokumentów tekstowych. Prosimy o wypełnienie ankiety i ewentualnie podania adresu e-mail w celu otrzymania informacji zwrotnej o wynikach: https://docs.google.com/forms/d/16qvPbAZYUVmYz1MbeCGVcfxy0UXksr3-v5QQ7h3uETE/viewform. Prosimy o odpowiedź przed końcem września. Succeed (http://succeed-project.eu) jest europejskim projektem, który ma na celu promowanie wdrażania i walidacji innowacyjnych narzędzi, doskonalących proces digitalizacji dokumentów tekstowych.

Zawody w ramach konferencji ICDAR2013

Zapraszamy wszystkich zainteresowanych technikami rozpoznawania/analizy dokumentów tekstowych do wzięcia udziału w zawodach organizowanych przy konferencji ICDAR2013. Możliwe jest uczestniczenie w dwóch konkursach:

Głównym celem obu konkursów jest promowanie istniejących i powstających metod i systemów dedykowanych dla procesu digitalizacji lub rozpoznawania/analizy dokumentu.

Spotkanie rozpoczynające projekt Succeed

Tydzień temu – 1 lutego 2013 roku odbyło się spotkanie inicjujące projektu Succeed. Celem tego dwuletniego projektu, współfinansowanego w ramach 7 Programu Ramowego przez UE, jest promowanie i zwiększenie wykorzystania zaawansowanych narzędzi w ramach procesu digitalizacji, realizowanego przez różne instytucje kultury (np. biblioteki, muzea, archiwa). Specjalizowane silniki OCR, dedykowane zasoby lingwistyczne, czy też usługi konwersji danych to niektóre z przykładów narzędzi usprawniających proces budowania szeroko rozumianych bibliotek cyfrowych. Te i inne narzędzia będą promowane w ramach różnego rodzaju wydarzeń takich jak konferencje, konkursy, czy warsztaty. Wybrane narzędzia zostaną wdrożone i przetestowane w ramach istniejących projektów digitalizacyjnych.

Koordynatorem projektu Succeed jest Uniwersytet w Alicante. Pozostali partnerzy projektu to:  Biblioteka Narodowa Holandii, Duński Instytut Leksykologii, Fraunhofer IAIS, Poznańskie Centrum Superkomputerowo-Sieciowe, Uniwersytet Salford, Fundacja Wirtualnej Biblioteki Miguel de Cervantes Saavedra, Francuska Biblioteka Narodowa oraz Biblioteka Brytyjska.

Poznańskie Centrum Superkomputerowo-Sieciowe odpowiedzialne jest w projekcie przede wszystkim za:

  • pomoc instytucjom kultury we wdrażaniu nowych narzędzi w ramach prowadzonych przez nie projektów digitalizacyjnych
  • koordynację pakietu roboczego dotyczącego przygotowania rekomendacji związanych z formatami, standardami i modelem licencjonowania odnoszącymi się do digitalizacji, w szczególności dokumentów tekstowych.

Konferencja „Cyfrowe Spotkania z Zabytkami 5”

Tegoroczna konferencja cyfrowych spotkań z zabytkami odbyła się pod hasłem „Reprodukcja cyfrowa zabytku – metody, wiarygodność, trwałość.”. Konferencja odbyła się we Wrocławiu w dniach 19-20 listopada 2012 r. W ramach konferencji wygłoszono wiele ciekawych referatów związanych z przechowywaniem, wizualizacją i dostępem do cyfrowych reprezentacji zabytków dziedzictwa kulturowego. Przedstawiono standardy i formaty opisujące zabytki (np. standard STARC do opisu obiektów archeologicznych), zaprezentowano możliwości związane z wizualizacją obiektów muzealnych z wykorzystaniem technologii 3D, a także rozważano aspekty katalogowania zabytków. W ramach konferencji przedstawiono również narzędzia rozwijane przez Poznańskie Centrum Superkomputerowo-Sieciowe, w tym system dMuseion służący do budowy muzeów cyfrowych, system dLab dedykowany do zarządzania procesem digitalizacji oraz narzędzie dArceo zapewniające długoterminowe przechowywanie danych źródłowych.

Raport dotyczący porównania silników OCR FineReader i Tesseract

Dziś opublikowany został raport dotyczący porównania silników OCR FineReader oraz Tesseract. Oba narzędzia zostały przetestowane na skanach dokumentów historycznych (drukowanych przed 1850), które pochodzą z różnych polskich bibliotek cyfrowych. Porównanie dotyczyło antykwy i gotyku, a także obrazów z szumami i bez szumów. W celu przeprowadzenia porównania oba narzędzia zostały poddane procesowi trenowania.

Porównując wyniki obu silników OCR nie można stwierdzić, że jeden z nich znacząco przeważa nad innym, niemniej w raporcie opisano różnice pomiędzy silnikiem FineReader i Tesseract, ze wskazaniem na ich wady i zalety. Zachęcamy Państwa do zapoznania się z raportem, podejściem zastosowanym do porównania silników i otrzymanymi wynikami.

Wszystkie testy zostały opracowane na bazie pełnotekstowych transkrypcji wytworzonych w ramach projektu IMPACT. Samo porównanie zostało zrealizowane w ramach rozszerzenia projektu IMPACT w pierwszej połowie 2012 roku. IMPACT jest wspierany przez Unię Europejską w ramach 7 Programu Ramowego. Projekt jest koordynowany przez Bibliotekę Królewską Holandii.

Pełen raport jest dostępny do pobrania na stronach Zespołu Bibliotek Cyfrowych PCSS, w sekcji dotyczącej wyników projektu IMPACT.