Wszystkie wpisy, których autorem jest Adam Dudczak

64bitowa wersja DigitLabu

Udostępniliśmy właśnie 64bitową wersję systemu DigitLab. Dzięki wsparciu dla architektury 64bitowej DigitLab może wykorzystywać więcej niż 4GB pamięci operacyjnej co jest istotne szczególnie w przypadku zastosowań profesjonalnych. Oprócz tej istotnej zmiany udało nam się wzbogacić DigitLab o program Sigil uznane otwarte narzędzie do edycji plików ePub.

Obraz ISO dystrybucji można ściągnąć ze strony projektu http://digitlab.psnc.pl.

THATCamp Poznań – agenda spotkania

W najbliższy poniedziałek o 18:00 odbędzie się pierwszy poznański THATCamp. Więcej informacji o tym jak dotrzeć na spotkanie znajdziecie Państwo na stronie konferencji i3 lub na thatcamp.pl. Udział w imprezie jest bezpłatny i gorąco zapraszamy wszystkich zainteresowanych do przybycia. Otrzymaliśmy kilka bardzo ciekawych propozycji wystąpień, na ich podstawie udało nam się stworzyć program spotkania.

Czasy podane w programie są orientacyjne, każdy prelegent będzie miał 10 min na prezentację, poza tym w każdym bloku przewidziany jest czas na dyskusję.

18:00 – 18:10 Otwarcie i powitanie uczestników
18:10 – 18:50
  • „Milion blogów. Duże próby w badaniach piśmiennictwa elektronicznego” – Maciej Maryl
  • „Cybernetyczna Szeherezada – opowiadanie historii i nowe technologie” – Patryk Rzepecki
  • Wielkopolski Słownik Pisarek” – Lucyna Marzec
18:50 – 19:00 Przerwa
19:00 – 19:40
  • „PRO ARTE – Serwis Kulturalno-Literacki on-line (http://proarte.net.pl/)” – Patryk Szaj, Kinga Gąska, Katarzyna Kończal
  • „Jak powstaje „Praktyka Teoretyczna„?” – Krystian Szadkowski
  • „Performing Art & Science: idea i projekty HAT Center” – Michał Krawczak
19:40 – 20:20 Przerwa
20:20 – 21:00
  • „Z menadżerem bibliografii pod prąd” – Beata Koper
  • „W Wordzie piszę gorsze teksty. Instrumentarium w służbie humanistyki” – Emanuel Kulczycki
  • „Design Thinking w szkole i pracy” – Darek Walczak
21:00 – 21:10 Przerwa
21:10 – 21:40
  • „Edycje średniowiecznych tektów online, czyli o niebywałych możliwościach i równie wielkich wątpliwościach” – Rafał Wójcik
  • „Od skanu do tekstu w max. 12 krokach i dwóch smakach” – Adam Dudczak
21:40 – 22:00 Zamknięcie częśći oficjalnej, ewentualne dalsze dyskusje

Po części oficjalnej przeniesiemy się do któregoś z pobliskich pubów, szczegółowe informacje na ten temat zostaną podane w czasie zakończenia imprezy.

Premiera bośniackiej wersji kursów e-learningowych ACCESS IT plus

logo

Kolejne dobre wieści z Bałkanów ;-). „Cyfrowe repozytoria dla małych instytucji kultury” i „Współpraca z Europeaną„, kursy stworzone i udoskonalone przez PCSS w ramach projektów AccessIT oraz Access IT plus (projekty zostały ufundowane ze środków programu UE Kultura 2007-2013). Dzięki współpracy National and University Library of Republica Srpska (NULRS, naszego bośniackiego partnera) i Biblioteki Miasta Belgrad (serbski partner projektu Access IT plus) kursy zostały przetłumaczone na serbski i udostępnione w portalu e-learningowym hostowanym na serwerach NULRS.

Analogicznie jak w Polsce, Chorwacji, Grecji, Serbii i Turcji, bośniackiej kursy są dostępne za darmo dla każdego zainteresowanego digitalizacją, bibliotekami cyfrowymi i Europeaną. Aktualna edycja kursu trwać będzie 3 miesiące. Gratulujemy naszym kolegom i trzymamy kciuki za wszystkich uczestników kursu.

Kolejny etap beta testów WLT

circle1
W piątek 15 lutego 2013 w portalu Wirtualnego Laboratorium Transkrypcji (http://wlt.synat.pcss.pl) udostępniliśmy szereg nowych funkcji oraz usprawnień.
Oto najważniejsze z nich:

  • wyraźna poprawa wydajności i stabilności działania całego portalu,
  • zmiana sposobu zapisywania historii zmian transkrypcji,
  • import istniejącej publikacji DjVu na podstawie identyfikatora OAI
    (więcej na ten temat tutaj: http://bit.ly/15nMbhn),
  • wsadowy OCR dla wszystkich plików w projekcie,
  • system notyfikacji o zapisywaniu zmian w edytorze transkrypcji,
  • szereg mniejszych poprawek i usprawnień zgłaszanych przez użytkowników,
  • opublikowana została również pierwsza wersja dokumentacji dla użytkowników (https://confluence.man.poznan.pl/community/display/WLT).

Od uruchomienia BETA wersji WLT minęło kilka miesięcy. Dzięki informacji zwrotnej jaką otrzymaliśmy od użytkowników stało się jasne, że musimy dokonać poważnych zmian w silniku portalu. Najważniejsza z nich to zmiana sposobu przechowywania transkrypcji.

W najbliższym czasie zostaną dodane dwie nowe funkcje:

  • eksport projektów w formacie EPUB
  • możliwość  załadowania plików TIFF do projektu (zostaną one skonwertowane automatycznie do formatu PNG w rozdzielczosci 300 DPI).

Autorzy wpisu: Bogna Wróż, Adam Dudczak

Podsumowanie 2. edycji kursów e-learningowych FBC

Wraz z końcem stycznia zakończył się trwający od początku października cykl szkoleniowy kursów e-learningowych dostępnych w portalu Federacji Bibliotek Cyfrowych. Kursy „Współpraca z Europeaną” oraz „Cyfrowe repozytoria dla małych instytucji kultury” spotkały się z dużym zainteresowaniem. Kurs dotyczący Europeany przyciągnął dokładnie 100 osób natomiast na drugi omawiający tematykę digitalizacji i bibliotek cyfrowych zarejestrowało się 128 uczestników. Każdy z nich mógł uzyskać oprócz wiedzy również certyfikat potwierdzający udział w kursie i zdobyty wynik. Warunkiem uzyskania certyfikatu było pozytywne zaliczenie testów, oba kursy to razem 11 testów i ponad 255 pytań (57 w pierwszy i 198 w drugim). W sumie wystawiliśmy 78 certyfikatów: 27 dla uczestników kursu o Europeanie i 51 dla kursu na temat repozytoriów cyfrowych (z czego 31 w tej edycji). Gratulujemy wszystkim, którym udało się przebrnąć przez wszystkie testy ;-).
Keene High School (old) Graduating Class of 1875, Keene, New Hampshire

Osoby, które ukończyły kurs zostały poproszone o dokonanie jego oceny. Każdy z tematów kursu podlegał ocenie w skali od 1 do 5, zebraliśmy również indywidualne uwagi na temat treści.

Pierwszy temat kursu „Współpraca z Europeaną” – „Rzut oka na Europeanę” uzyskał średnią ocenę 4.71, a drugi temat „Techniczne aspekty Europeany” ocenę 4.24. Uwagi krytyczne dotyczyły przede wszystkim bardziej technicznych fragmentów kursu – uczestnicy prosili o jeszcze więcej praktycznych przykładów. Obiecujemy poprawę 😉 Większość uwag była jednak pozytywna, uczestnicy pisali w ankietach, że kurs bardzo pomógł w rozwoju umiejętności, które mają zastosowanie w ich codziennej pracy. Cytując jedną z uczestniczek:

„Kurs był bardzo bogaty w wiadomości. Temat pierwszy został przedstawiony w bardziej atrakcyjny i przyswajalny sposób, niemniej informacje zawarte w drugim okazały się niezwykle przydatne i ciekawsze 🙂 Wasze kursy spełniają oczekiwania i są bardzo konkretne. Cieszę się, że mogłam w nich uczestniczyć.”

Bardzo nas to cieszy i obiecujemy, że będzie jeszcze lepiej ;-).

Jeśli chodzi o kurs „Cyfrowe repozytoria dla małych instytucji kultury”, najwyżej ocenianym tematem było „Wprowadzenie do digitalizacji” z notą 4.77, natomiast najniższą ocenę (4.57) uzyskał temat „Tworzenie kolekcji cyfrowych”. Z opinii krytycznych, które zdobyliśmy należy wspomnieć o ujednoliceniu punktacji w quizach. Część ankietowanych stwierdziła że niepotrzebną była drobiazgowość w opisie programów, dla innych uczestników była to jednak zaleta. Pozytywne komentarze pojawiały się zarówno w ankietach jak i w mailach od uczestników np.:

„Jest to bardzo dobry kurs. Przygotowany w przystępny sposób. My przygotowujemy się do uruchomienia repozytorium i taka wiedza jest niezbędna”.

Zakończenie tego cyklu szkoleniowego wiąże się zamyknięciem możliwości zapisu dla nowych uczestników. Korzystać oraz powracać do kursu mogą osoby zarejestrowane, które już uczestniczyły w kursie. Wydawanie certyfikatów ukończenia wstrzymujemy do połowy marca kiedy to uruchomimy kolejny cykl szkoleniowy. Kursy zostaną zaktualizowane i wzbogacone o wszystkim będziemy Państwa informować.

Autorzy wpisu: Bogna Wróż, Adam Dudczak

Premiera chorwackiej wersji kursów e-learningowych ACCESS IT plus

View on Rijeka

Cyfrowe repozytoria dla małych instytucji kultury” i „Współpraca z Europeaną„, kursy stworzone i udoskonalone przez PCSS w ramach projektów AccessIT oraz AccessITplus, (projekty zostały ufundowane ze środków programu UE Kultura 2007-2013) zostały udostępnione w chorwackiej wersji językowej przygotowanych przez Bibliotekę Miejską w Rijece.

Tak samo jak w Polsce, Grecji, Serbii i Turcji, chorwackie kursy są dostępne za darmo dla każdego zainteresowanego digitalizacją, bibliotekami cyfrowymi i Europeaną. W przypadku chorwackiej wersji aktualna edycja kursu trwać będzie 3 miesięce. Po ukończeniu kursów istnieje możliwość uzyskania certyfikatów, które dostarczane są we współpracy z CSSU (Centrum stałego szkolenia bibliotekarzy) w Bibliotece Narodowej i Uniwersyteckiej w Zagrzebiu.

Więcej informacji o kursie można znaleźć na stronie projektu Access It plus.

Kultura 2.0: Cyfrowe archiwa – Narzędziownia

W dniach 26-27 października Narodowy Instytut Audiowizualny (NiNA) zoorganizował po raz kolejny konferencję (a właściwie festiwal) Kultura 2.0. Goście konferencji mieli możliwość uczestniczenia w różnego rodzaju prelekcjach, warsztatach, grach i pokazach. Szczegółowy program jest dostępny na stronach konferencji. PCSS był partnerem imprezy, ekipa Platon TV realizowała nagrania i transmisję obrad, natomiast Zespół Bibliotek Cyfrowych był odpowiedzialny za zorganizowanie akcji „Cyfrowe archiwa – Narzędziownia”.

O co chodziło w „Narzędziowni”? Biblioteki, archiwa i muzea cyfrowe kojarzą się zazwyczaj z dużymi instytucjami i bezcennymi zabytkowymi zbiorami. Jednak każdy z nas może znaleźć w zapomnianej szufladzie czy szafie rodzinne pamiątki, stare dokumenty, zdjęcia lub pocztówki warte zachowania, ale i szerszego udostępnienia. W ramach tej akcji chcieliśmy pokazać, jak za pomocą ogólnie dostępnych narzędzi (prosty skaner płaski, aparat cyfrowy, darmowe oprogramowanie) można stworzyć np. własne cyfrowe archiwum rodzinne i jak te materiały udostępnić w sieci zgodnie z kanonami cyfrowego bibliotekarstwa. Narzędziownia była podzielona na trzy stoiska: „Obróbka ze skanowaniem”, „Tran2|>ryp>ja”i „Niech wszyscy zobaczą!”.

fot. Justyna Walkowska

W ramach pierwszego przystanku („Obróbka ze skanowaniem”) uczestnicy mogli spróbować swoich sił w digitalizacji przyniesionych przez siebie materiałów. Pokazywaliśmy, jak przebiega sam proces skanowania i co się dzieje z cyfrowym materiałem, gdy trafia już na dysk twardy komputera. Całość działań na tym stoisku realizowaliśmy przy pomocy systemu DigitLab, używając takich narzędzi jak ScanTailor, gScan2PDF, Tesseract czy SimpleScan. Był to swoisty egzamin dla tego narzędzia, egzamin, który DigitLab zdał 😉 (przynajmniej naszym zdaniem). Bezpośredni kontakt z użytkownikami to rzecz bezcenna dla każdego twórcy narzędzi. Uwagi, które zebraliśmy, postaramy się uwzględnić w kolejnym wydaniu systemu.

Na stoisku numer 2 – o nieco dziwnym tytule „Tran2|>ryp>ja” – pokazywaliśmy, jak za pomocą „Wirtualnego Laboratorium Transkrypcji” (WLT) użytkownicy mogą tworzyć pełnotekstowe reprezentacje (transkrypcje) dokumentów tekstowych. Jak wiadomo, wynikiem procesu digitalizacji jest plik graficzny – cyfrowa reprezentacja zeskanowanego dokumentu. Nie zawiera ona, niestety, tekstu dokumentu w postaci cyfrowej, a dopiero dostęp do cyfrowego tekstu pozwala na stworzenie efektywnych mechanizmów wyszukiwania, zwiększa widoczność dokumentu w sieci i otwiera nowe możliwości w pracach badawczych. WLT oferuje użytkownikom mechanizm automatycznej konwersji skanów do postaci cyfrowego tekstu (tzw. OCR, od angielskiego Optical Character Recognition). Poza tym, użytkownicy mogą wspólnie pracować nad automatycznie rozpoznawanym tekstem i wprowadzać korekty w miejscach, w których program komputerowy się pomylił. Dzięki połączeniu metod automatycznych i wygodnego edytora transkrypcji, WLT umożliwia bibliotekarzom, naukowcom czy też hobbystom tworzenie wysokiej jakości reprezentacji tekstowej dla dokumentów historycznych.

Ostatnie stoisko demonstrowało zagadnienia związane z udostępnianiem zasobów w sieci zgodnie z kanonami cyfrowego bibliotekarstwa. Pokazywaliśmy, jak stworzyć własne archiwum cyfrowe przy pomocy narzędzi takich jak Omeka. Prezentowaliśmy również, jak wygląda proces umieszczania w sieci dokumentów w największych polskich bibliotekach cyfrowych, w których wykorzystywane jest oprogramowanie dLibra. W kolejnym kroku pokazywaliśmy, jak sprawdzić, kto linkuje do naszych zasobów i jak monitorować wykorzystanie tych zasobów za pomocą darmowych narzędzi. Duża część gości naszego stoiska nie słyszała o Federacji Bibliotek Cyfrowych i Europeanie, zatem staraliśmy się im ten temat przybliżyć.

Dla nas bezcenna była możliwość przetestowania naszych rozwiązań w bezpośrednich rozmowach z użytkownikami. Były to bardzo pracowite dwa dni i tak naprawdę nie mieliśmy zbyt wiele czasu, żeby uczestniczyć w prelekcjach czy warsztatach, które odbywały się w czasie festiwalu. Udało nam się za to rozejrzeć nieco po Poziomie 2.0 (taką nazwę nosiło drugie piętro budynku w którym odbywała się konferencja) na którym oprócz „Narzędziowni” prezentowane były różnego rodzaju instalacje. Z rzeczy, które bardzo przypadły nam do gustu należy wspomnieć o pracy dyplomowej Waldemara Węgrzyna pt. „Elektrobiblioteka” – który wykorzystał tradycyjną analogową książkę jako interfejs do wzbogaconej wersji elektronicznej.

Elektrobiblioteka Waldka Wegrzyna w serwisie Vimeo.

To oczywiście nie wszystko. Zapraszamy do zapoznania się z pełną lista tego, co można było zobaczyć na Poziomie 2.0. Mamy nadzieję, że w najbliższym czasie udostępnione zostaną nagrania z prelekcji z chęcią nadrobimy zaległości i obejrzymy to co nas ominęło ;-).

Autorzy wpisu: Adam Dudczak, Justyna Walkowska

Pierwszy polski THATCamp

W dniach 24-25 października 2012 odbędzie się pierwsza polska edycja THATCampu. Jest ona organizowana przez koalicję THAT-Camp Polska i odbędzie się w ramach konferencji w ramach Ogólnopolskiej Konferencji Naukowej „Zwrot Cyfrowy w humanistyce Internet Nowe Media-Kultura 2.0”. THATCamp odbędzie się w siedzibie Teatru NN na Starym Mieście w Lublinie (ul.Grodzka 21). Patronat nad imprezą objęło Poznańskie Centrum Superkomputerowo Sieciowe.

THATCampy (The Humanities And Technology Camp, http://www.thatcamp.org) to organizowane na całym świecie otwarte i nieformalne spotkania osób zainteresowanych nowymi technologiami w humanistyce i socjologii, a także w działalnościach instytucji naukowych i artystycznych (uniwersytety, galerie, archiwa, biblioteki, muzea). Uczestnictwo w tego typu imprezach jest bezpłatne.

Początki THATCampu sięgają roku 2008 kiedy to w Stanach Zjednoczonych odbył się on po raz pierwszy, zorganizowany przez Centrum Historii i Nowych Mediów (Center for History and New Media, CHNM) przy Uniwersytecie George’a Masona.

Więcej informacji o imprezie można znaleźć tutaj.

Autorzy wpisu: Bogna Wróż, Adam Dudczak

Konferencja Digital Humanities 2012

Konferencja Digital Humanities 2012 to jedna z najlepszych konferencji w jakich braliśmy udział w tym roku. Organizatorom udało się zgromadzić w jednym miejscu ponad 500 uczestników z całego świata. Począwszy od 16 lipca 2012, przez 5 dni odbyło się ponad 200 sesji, które w czasie głównej konferencji odbywały się w 5 równoległych ścieżkach wykładowych. Całość została zorganizowana na Uniwersytecie Hamburskim.

W tym sprawozdaniu chcielibyśmy przybliżyć Państwu kilka interesujących projektów i narzedzii, które zostały zaprezentowane w czasie Digital Humanities 2012. Zachęcamy do przejrzenia strony konferencji nagrania wideo ze wszystkich sesji są już dostępne.

Pierwszy projekt na naszej liście to „Programming historian 2„. Celem projektu jest stworzenie materiałów edukacyjnych dla historyków zainteresowanych wykorzystaniem narzędzi programistycznych takich jak Python. Pomysł jest bardzo ciekawy, realizuje go grupa ochotników z kilku ośrodków naukowych w Europie. W wyniku ich działań powstaje zbiór lekcji trwających od 30 do 60 minut w czasie ich trwania przyszły historyk-programista uczy się podstaw programowania i tego jak nowoczesne narzędzia programistyczne mogą zostać użyte w pracy historyka.

Neatline to jeden z najciekawszych projektów z punktu widzenia interfejsów użytkownika. Neatline to zestaw wtyczek do Omeki (narzędzie do budowy bibliotek cyfrowych), który pozwala w bardzo atrakcyjny wizualnie sposób prezentować użytkownikami historie przy pomocy mapy i osi czasu (przykładowa wystawa obrazująca przebieg bitwy o Chancellorsville). Narzędzie to potrafi również współpracować z urzadzeniami mobilnymi.

Kolejny projekt na który chcielibyśmy zwrócić Państwa uwagę to Pelagios. Nazwa projektu jest skrótem od pełnej nazwy „Pelagios: Enable Linked Ancient Geodata In Open Systems”. To zbiór dostępnych w sieci projektów związanych z starożytnością (np. Google Ancient Places, LUCERO) których zasoby są wykorzystywane aby odnaleźć informacje o starożytnych miejscach i pozwala na zwizualizowanie ich obecnego położenia. Aby tego dokonać w Pelagios wykorzystywane są technologie semantyczne (RDF), które pozwalają na reprezentację miejsc i odniesień do nich w wygodny i elastyczny sposób. W tej chwili twórcy skupiają się na starożytności, ale docelowo chcą zbudować bazę informacji geograficznych dedykowaną dla badań humanistycznych.

Jedna z najciekawszych prezentacji konferencji to „Visualizing the History of English” przeprowadzona przez Alexandara Marc. Marc przedstawił metodę wizualizacji angielskiego słownictwa za pomocą specjalnych wykresów tworzonych dla różnych okresów historycznych. Aby stworzyć te wizualizacje wykorzystano ogromną bazę Historical Thesaurus of English (składa się ona z 793 747 wpisów pogrupowanych 236 346 kategorie). Wideo z prezentacji dostępne jest na stronie konferencji.

Oprócz już wspomnianych prezentowane były również inne projekty związane z różnymi aspektami historii i geografii. Ogromny rozmach i możliwości w tym zakresie zostały zaimplementowane w The MayaArch3D Project, który łączy historię sztuki, archeologie z możliwościami oferowanymi przez systemy typu GIS i wirtualną rzeczywistość. Wszystko to zostało stworzone głównie z myślą o edukacji w zakresie historii sztuki i archeologii. Dostępny w tej chwili prototyp to wirtualny model miasta Maya, które znajdowało się w Copan w zachodnim Hondurasie. Naukowym celem tego projektu była analiza związków między formą i architekturą budowli, a środowiskiem w jakim one powstawały. Do stworzenia prototypu wykorzystano oprogramowanie do tworzenia gier komputerowych Unity3D w połączeniu z językiem PHP i bazą danych PostgreSQL.

QueryArch3D Demo Film from Jennifer von Schwerin on Vimeo.

To oczywiście nie wszystko, poniżej prezentujemy listę najciekawszych narzędzi i komponentów, które można wykorzystać w realizacji własnych prac i eksperymentów naukowych.

  • Zespół przetwarzania języka naturalnego ze Stanford udostępnia na swojej stronie WWW wyniki większości swoich prac. Strona oferuje dostęp do wielu przydantych narzędzi, które mogę być wykorzystane do przetwarzania języka naturalnego.
  • Apache Open NLP to biblioteka programistyczna, która umożliwia wykorzystanie możliwości uczenia maszynowego na potrzeby przetwarzania języka naturalnego.
  • Alchemy API – pomaga przekształcić tekst w wiedzę. Alchemy to platforma operująca w chmurze obliczeniowej, która jest wykorzystywana przez 18,000 programistów. Alchemy API to bardzo elastyczne narzędzie, które umożliwia między innymi ekstrakcję encji nazwanych, słów kluczowych, haseł autorytatywnych.
  • Kilka prezentacji w czasie DH 2012 wspominało o wykorzystaniu Open Calais platformy podobnej do Alchemy rozwijanej przez wydawnictwo Thomson Reuters. W chwili obecnej w wersji 4.6 fakt iż jest ona wciąż rozwijana świadczy o tym, że jest tego typu narzędzia są naprawdę potrzebne.
  • D3.js – Data-Driven Documents to bardzo interesująca biblioteka Javascriptowa, która umożliwia tworzenie i wizualizowanie dokumentów opartych o dane. Dzięki D3 każdy może osadzić w swojej stronie bardzo ładnie wyglądające wizualizację różnego rodzaju danych.
  • OKF annotator to projekt rozwijany przez Open Knowledge Foundation, który pozwala na adnotowanie większości typów zasobów sieciowych.
  • GeoStoryteller to narzędzie, które było wykorzystywane i rozwijane w ramach projektu German Traces NYC. To aplikacja edukacyjna, która pozwala opowiadać historie o różnego rodzaju rzeczywiście istniejących miejscach. Użytkownik zwiedzając dane lokacje może dzięki wykorzystaniu telefonu komórkowego dowiedzieć się o niej nowych rzeczy.

Na zakończenie chcielibyśmy jeszcze zwrócić Państwa uwagę na dwa dokuemnty:

Autorzy wpisu: Piotr Smoczyk, Adam Dudczak