Archiwa tagu: wlt

Nowa wersja portalu Wirtualnego Laboratorium Transkrypcji

Kilka dni temu wdrożona została nowa wersja portalu Wirtualnego Laboratorium Transkrypcji (http://wlt.synat.pcss.pl). W nowej wersji znajdą Państwo kilka nowych funkcji i udogodnień, zostały również naprawione zgłaszane przez Państwa błędy.

Najważniejsze zmiany jakie zostały wprowadzone:

  • edytor transkrypcji wspiera pracę z drukami wielokolumnowymi np. gazetami (opcja ta jest dostępna dla nowotworzonych projektów),
  • dodano mechanizm weryfikacji linii, z każdą linią skojarzona jest informacja o tym czy została ona już przejrzana,
  • usprawniony mechanizm importu plików TIFF,
  • możliwość pobierania transkrypcji w formie prostego pliku tekstowego,
  • link do podglądu całej strony w edytorze transkrypcji,
  • w widoku podglądu transkrypcji dodane zostały numery porządkowe linii,
  • w edytorze transkrypcji możliwe jest przesuwanie linii na konkretną pozycję (poprzez podanie jej numeru),
  • po zakończeniu wsadowego OCRa wysyłany jest mail do właściciela projektu,
  • w widoku historii zmian widoczna jest informacja o autorze zmian,
  • w formularzu tworzenia nowego projektu pole autor jest teraz opcjonalne.

Szczegółową notę do wydania z listą wszystkich zmian i poprawek możecie Państwo znaleźć tutaj.

Oprócz wymienionych powyżej zmian uruchomione zostało również forum sugestii i  usprawnień (jest ono dostępne tutaj), w ramach którego możecie Państwo przekazywać nam swoje propozycje ulepszeń w WLT oraz głosować na pomysły, które już zostały zgłoszone. Mogą Państwo wejść na forum korzystając z pomarańczowej zakładki “Twoja sugestia”, która znajduje się w prawym górnym rogu strony WLT. Gorąco zachęcamy do zgłaszania pomysłów i głosowanie na te, które są już widoczne na forum. Przebieg dalszych prac nad WLT zależy w dużej mierze od tego, które funkcje będą się wydawać Państwu najbardziej interesujące.

Nowe funkcje w portalu Wirtualnego Laboratorium Transkrypcji

Source: http://pl.wikipedia.org/wiki/Plik:Escribano.jpg

Z przyjemnością informujemy o wdrożeniu nowej wersji portalu Wirtualnego Laboratorium Transkrypcji (http://wlt.synat.pcss.pl).

Wersja ta to nowe funkcję i poprawki błędów zgłaszanych przez użytkowników. Wśród najbardziej istotnych zmian należy wymienić:

  • możliwość wyeksportowania wyników pracy w postaci pliku ePUB,
  • udostępnianie projektu tylko wybranym użytkownikom WLT,
  • wsparcie dla skanów w formacie TIFF po załadowaniu są one automatycznie konwertowane do formatu PNG,
  • zmiany w dialogu edytora transkrypcji,
  • szereg poprawek w wynikowych plikach hOCR.

Pełną listę zmian wraz z zrzutami ekranu można znaleźć na naszym wiki:
https://confluence.man.poznan.pl/community/display/WLT/Nota+do+wydania+z+dnia+2013-03-25

Kolejny etap beta testów WLT

circle1
W piątek 15 lutego 2013 w portalu Wirtualnego Laboratorium Transkrypcji (http://wlt.synat.pcss.pl) udostępniliśmy szereg nowych funkcji oraz usprawnień.
Oto najważniejsze z nich:

  • wyraźna poprawa wydajności i stabilności działania całego portalu,
  • zmiana sposobu zapisywania historii zmian transkrypcji,
  • import istniejącej publikacji DjVu na podstawie identyfikatora OAI
    (więcej na ten temat tutaj: http://bit.ly/15nMbhn),
  • wsadowy OCR dla wszystkich plików w projekcie,
  • system notyfikacji o zapisywaniu zmian w edytorze transkrypcji,
  • szereg mniejszych poprawek i usprawnień zgłaszanych przez użytkowników,
  • opublikowana została również pierwsza wersja dokumentacji dla użytkowników (https://confluence.man.poznan.pl/community/display/WLT).

Od uruchomienia BETA wersji WLT minęło kilka miesięcy. Dzięki informacji zwrotnej jaką otrzymaliśmy od użytkowników stało się jasne, że musimy dokonać poważnych zmian w silniku portalu. Najważniejsza z nich to zmiana sposobu przechowywania transkrypcji.

W najbliższym czasie zostaną dodane dwie nowe funkcje:

  • eksport projektów w formacie EPUB
  • możliwość  załadowania plików TIFF do projektu (zostaną one skonwertowane automatycznie do formatu PNG w rozdzielczosci 300 DPI).

Autorzy wpisu: Bogna Wróż, Adam Dudczak

Kultura 2.0: Cyfrowe archiwa – Narzędziownia

W dniach 26-27 października Narodowy Instytut Audiowizualny (NiNA) zoorganizował po raz kolejny konferencję (a właściwie festiwal) Kultura 2.0. Goście konferencji mieli możliwość uczestniczenia w różnego rodzaju prelekcjach, warsztatach, grach i pokazach. Szczegółowy program jest dostępny na stronach konferencji. PCSS był partnerem imprezy, ekipa Platon TV realizowała nagrania i transmisję obrad, natomiast Zespół Bibliotek Cyfrowych był odpowiedzialny za zorganizowanie akcji „Cyfrowe archiwa – Narzędziownia”.

O co chodziło w „Narzędziowni”? Biblioteki, archiwa i muzea cyfrowe kojarzą się zazwyczaj z dużymi instytucjami i bezcennymi zabytkowymi zbiorami. Jednak każdy z nas może znaleźć w zapomnianej szufladzie czy szafie rodzinne pamiątki, stare dokumenty, zdjęcia lub pocztówki warte zachowania, ale i szerszego udostępnienia. W ramach tej akcji chcieliśmy pokazać, jak za pomocą ogólnie dostępnych narzędzi (prosty skaner płaski, aparat cyfrowy, darmowe oprogramowanie) można stworzyć np. własne cyfrowe archiwum rodzinne i jak te materiały udostępnić w sieci zgodnie z kanonami cyfrowego bibliotekarstwa. Narzędziownia była podzielona na trzy stoiska: „Obróbka ze skanowaniem”, „Tran2|>ryp>ja”i „Niech wszyscy zobaczą!”.

fot. Justyna Walkowska

W ramach pierwszego przystanku („Obróbka ze skanowaniem”) uczestnicy mogli spróbować swoich sił w digitalizacji przyniesionych przez siebie materiałów. Pokazywaliśmy, jak przebiega sam proces skanowania i co się dzieje z cyfrowym materiałem, gdy trafia już na dysk twardy komputera. Całość działań na tym stoisku realizowaliśmy przy pomocy systemu DigitLab, używając takich narzędzi jak ScanTailor, gScan2PDF, Tesseract czy SimpleScan. Był to swoisty egzamin dla tego narzędzia, egzamin, który DigitLab zdał 😉 (przynajmniej naszym zdaniem). Bezpośredni kontakt z użytkownikami to rzecz bezcenna dla każdego twórcy narzędzi. Uwagi, które zebraliśmy, postaramy się uwzględnić w kolejnym wydaniu systemu.

Na stoisku numer 2 – o nieco dziwnym tytule „Tran2|>ryp>ja” – pokazywaliśmy, jak za pomocą „Wirtualnego Laboratorium Transkrypcji” (WLT) użytkownicy mogą tworzyć pełnotekstowe reprezentacje (transkrypcje) dokumentów tekstowych. Jak wiadomo, wynikiem procesu digitalizacji jest plik graficzny – cyfrowa reprezentacja zeskanowanego dokumentu. Nie zawiera ona, niestety, tekstu dokumentu w postaci cyfrowej, a dopiero dostęp do cyfrowego tekstu pozwala na stworzenie efektywnych mechanizmów wyszukiwania, zwiększa widoczność dokumentu w sieci i otwiera nowe możliwości w pracach badawczych. WLT oferuje użytkownikom mechanizm automatycznej konwersji skanów do postaci cyfrowego tekstu (tzw. OCR, od angielskiego Optical Character Recognition). Poza tym, użytkownicy mogą wspólnie pracować nad automatycznie rozpoznawanym tekstem i wprowadzać korekty w miejscach, w których program komputerowy się pomylił. Dzięki połączeniu metod automatycznych i wygodnego edytora transkrypcji, WLT umożliwia bibliotekarzom, naukowcom czy też hobbystom tworzenie wysokiej jakości reprezentacji tekstowej dla dokumentów historycznych.

Ostatnie stoisko demonstrowało zagadnienia związane z udostępnianiem zasobów w sieci zgodnie z kanonami cyfrowego bibliotekarstwa. Pokazywaliśmy, jak stworzyć własne archiwum cyfrowe przy pomocy narzędzi takich jak Omeka. Prezentowaliśmy również, jak wygląda proces umieszczania w sieci dokumentów w największych polskich bibliotekach cyfrowych, w których wykorzystywane jest oprogramowanie dLibra. W kolejnym kroku pokazywaliśmy, jak sprawdzić, kto linkuje do naszych zasobów i jak monitorować wykorzystanie tych zasobów za pomocą darmowych narzędzi. Duża część gości naszego stoiska nie słyszała o Federacji Bibliotek Cyfrowych i Europeanie, zatem staraliśmy się im ten temat przybliżyć.

Dla nas bezcenna była możliwość przetestowania naszych rozwiązań w bezpośrednich rozmowach z użytkownikami. Były to bardzo pracowite dwa dni i tak naprawdę nie mieliśmy zbyt wiele czasu, żeby uczestniczyć w prelekcjach czy warsztatach, które odbywały się w czasie festiwalu. Udało nam się za to rozejrzeć nieco po Poziomie 2.0 (taką nazwę nosiło drugie piętro budynku w którym odbywała się konferencja) na którym oprócz „Narzędziowni” prezentowane były różnego rodzaju instalacje. Z rzeczy, które bardzo przypadły nam do gustu należy wspomnieć o pracy dyplomowej Waldemara Węgrzyna pt. „Elektrobiblioteka” – który wykorzystał tradycyjną analogową książkę jako interfejs do wzbogaconej wersji elektronicznej.

Elektrobiblioteka Waldka Wegrzyna w serwisie Vimeo.

To oczywiście nie wszystko. Zapraszamy do zapoznania się z pełną lista tego, co można było zobaczyć na Poziomie 2.0. Mamy nadzieję, że w najbliższym czasie udostępnione zostaną nagrania z prelekcji z chęcią nadrobimy zaległości i obejrzymy to co nas ominęło ;-).

Autorzy wpisu: Adam Dudczak, Justyna Walkowska