Zespół Bibliotek Cyfrowych PCSS

Dział Usług Sieciowych – Poznańskie Centrum Superkomputerowo-Sieciowe
  • Wprowadzenie
  • O zespole
  • Działalność
    • Oprogramowanie
    • Projekty
    • Usługi internetowe
    • Wydarzenia
  • Publikacje
  • Blog
  • Pracuj z nami!
  • Kontakt

Wyniki prac projektu IMPACT

Prace prowadzone przez Zespół Bibliotek Cyfrowych PCSS zaowocowały przygotowaniem zestawu pełnotekstowych wersji cyfrowych wybranych dokumentów historycznych z czterech bibliotek cyfrowych w Polsce:

  • Biblioteka Elbląska (Elbląska Biblioteka Cyfrowa)
  • Biblioteka Kórnicka PAN (Wielkopolska Biblioteka Cyfrowa)
  • Biblioteka Uniwersytecka w Poznaniu (Wielkopolska Biblioteka Cyfrowa)
  • Instytut Dziennikarstwa Uniwersytetu Warszawskiego (Cyfrowa Biblioteka Druków Ulotnych Polskich i Polski Dotyczących z XVI, XVII i XVIII Wieku)
  • Uniwersytet Przyrodniczy we Wrocławiu (Dolnośląska Biblioteka Cyfrowa)

Poniżej znajduje się zestawienie dokumentów wraz z mozliwością pobrania zarówno plików źródłowych, jak i odpowiadających im wersji pełnotekstowych (transkrypcji). Wersje pełnotekstowe plików zapisane są w formacie PAGE XML, którego opis znajduje się tutaj. Pliki pełnotekstowe mają dokładność oscylującą w okolicach 99.95%. Istnieją dwie wersje plików z transkrypcją:

  1. Pliki z transkrypcją na poziomie regionów (paragrafów), poziom dokładności transkrypcji oscyluje w okolicach 99.95%.
  2. Pliki z transkrypcją na poziomie regionów (paragrafów), wzbogacone o informacje związane z regionami dla linii, słów i znaków. Informacje te pochodzą z automatycznego przetwarzania plików silnikiem OCR i nie były w żaden sposób poprawiane. Niemniej mogą być w pewnych sytuacjach pomocne, np. jeśli chcemy posiadać przybliżone współrzędne słowa lub znaku na pliku źródłowym. Poziom dokładności transkrypcji na poziomie regionu oscyluje w okolicach 99.95%.

W sumie przetworzone zostały 4693 pliki, a ich transkrypcje mają łącznie 6890677 znaków. Rozmiar plików master to w sumie około 16,5GB. Rozmiar wszystkich transkrypcji to około 300MB, a transkrypcje z dodatkowymi informacjami zajmują 700MB.

Pliki źródłowe zostały udostepnione przez odpowiednie biblioteki cyfrowe. Wszystkie materiały dostepne są na licencji Licencja Creative Commons Creative Commons Uznanie autorstwa 3.0 Polska.

W razie szczegółowych pytań lub uwag na temat dostępnych zasobów prosimy o kontakt.

Opis zestawu dokumentów Wersja prezentacyjna i metadane Pliki źródłowe (TIF) Transkrypcje – poziom regionów (PAGE XML) Transkrypcje – poziom regionów oraz poziom linii/słów/znaków (PAGE XML)
Adwersaria, albo terminata sprawy wojennej, która się toczyła w wołoskiej ziemi z tureckim cesarzem pokaż pobierz (plików: 26, ~130MB) pobierz (znaków: 31454) pobierz (dodatkowe regiony: 6795)
Ceremonie i porządek w koronowaniu Marii de Medici, królowej francuskiej i nawarskiej 13 maja 1610 pokaż pobierz (plików: 32, ~50MB) pobierz (znaków: 27477) pobierz (dodatkowe regiony: 6980)
Chorągiew Sarmacka w Wołoszech, to jest pospolite ruszenie i szczęśliwy powrót Polaków z Wołoch w roku 1621 pokaż pobierz (plików: 11, ~48MB) pobierz (znaków: 7139) pobierz (dodatkowe regiony: 2088)
Diariusz wiadomości od wyjazdu króla z Wilna do Smoleńska pokaż pobierz (plików: 32, ~120MB) pobierz (znaków: 55948) pobierz (dodatkowe regiony: 13281)
Discurs o cenie pieniedzy teraznieyszey y o niektorych skutkach iey? pokaż pobierz (plików: 64, ~307MB) pobierz (znaków: 70217) pobierz (dodatkowe regiony: 15924)
List o oblężeniu zamku Dyjamenckiego w Inflantach do Krzysztofa Moniwida Dorohostajskiego, dnia 22 października 1605 pisany pokaż pobierz (plików: 11, ~52MB) pobierz (znaków: 13867) pobierz (dodatkowe regiony: 4332)
Nowe Ateny albo Akademia wszelkiey scyencyi pełna, na różne tytuły iak na classes podzielona, mądrym dla memoryału, idiotom dla nauki, politykom dla praktyki, melancholikom dla rozrywki erygowana … / przez Xiędza Benedykta Chmielowskiego … . Część 1. pokaż pobierz (plików: 844, ~2770MB) pobierz (znaków: 1605794) pobierz (dodatkowe regiony: 368491)
Nowe Ateny, albo Akademia wszelkiey scyencyi pełna, na różne tytuły iak na classes podzielona, mądrym dla memoryału, idiotom dla nauki, politykom dla praktyki, melancholikom dla rozrywki erygowana … / przez Xiędza Benedykta Chmielowskiego … . Część 2. pokaż pobierz (plików: 810, ~2653MB) pobierz (znaków: 1247896) pobierz (dodatkowe regiony: 289459)
Nowe Ateny, albo Akademia wszelkiey scyencyi pełna, na różne tytuły iak na classes podzielona, mądrym dla memoryału, idiotom dla nauki, politykom dla praktyki, melancholikom dla rozrywki erygowana … . Część 3 albo Supplement. pokaż pobierz (plików: 741, ~2681MB) pobierz (znaków: 1165470) pobierz (dodatkowe regiony: 280205)
Nowe Ateny, albo Akademia wszelkiey scyencyi pełna, na różne tytuły iak na classes podzielona, mądrym dla memoryału, idiotom dla nauki, politykom dla praktyki, melancholikom dla rozrywki erygowana … . Część 4, a drugi Supplement. pokaż pobierz (plików: 632, ~2308MB) pobierz (znaków: 1127368) pobierz (dodatkowe regiony: 288779)
Nowe nowiny z Czech, Tatar i Węgier, przy tym rewokacja księcia czeskiego i jak radę cesarską z zamku oknem wyrzucali i innego króla sobie obrali pokaż pobierz (plików: 32, ~165MB) pobierz (znaków: 44268) pobierz (dodatkowe regiony: 9655)
Nowiny z Inflant o porażce, która się stała nad Karolem, księciem Sudermańskim przez Jana Karola Chodkiewicza dnia 27 września 1605 pokaż pobierz (plików: 8, ~35MB) pobierz (znaków: 8256) pobierz (dodatkowe regiony: 2770)
Nowiny z Moskwy albo wota z traktatów i konsulty panów radnych ziemi moskiewskiej, które carowi swemu podawali pokaż pobierz (plików: 32, ~148MB) pobierz (znaków: 49929) pobierz (dodatkowe regiony: 12059)
Nowiny z Rakuz o monstrancji luterskiej pokaż pobierz (plików: 27, ~124MB) pobierz (znaków: 33983) pobierz (dodatkowe regiony: 8043)
Nowiny z Torunia o zabronieniu przez heretyków nabożeństwa i procesji katolickich pokaż pobierz (plików: 7, ~33MB) pobierz (znaków: 8753) pobierz (dodatkowe regiony: 2917)
Oekonomika ziemianska generalna Punktámi Pártikulárnemi, Interrogatoryámi Gospodárskiemi, Praktyką Mieśięczną, Modelluszámi abo Tabułámi Arithmetycznemi obiaśniona. Pánom Dźiedzicznym, Arendarzom, Oekonomom, Attendętom, Urzędnikom, [...]. pokaż pobierz (plików: 242, ~1202MB) pobierz (znaków: 262860) pobierz (dodatkowe regiony: 62635)
O cieplicach we Skle Ksiąg Troie. Przez Erazma Syxta Philozophiey y Medicyny Doktora Napisanych? pokaż pobierz (plików: 195, ~1096MB) pobierz (znaków: 274754) pobierz (dodatkowe regiony: 57175)
Pasja żołnierzy obojga narodów w stolicy moskiewskiej krótko opisana pokaż pobierz (plików: 16, ~78MB) pobierz (znaków: 21396) pobierz (dodatkowe regiony: 4891)
Poseł z Wołoch z obozu polskiego. 1621 pokaż pobierz (plików: 11, ~57MB) pobierz (znaków: 9737) pobierz (dodatkowe regiony: 2817)
Powodzenia niebezpiecznego ale szczęśliwego wojska j. k. m. w Multanach opisanie pokaż pobierz (plików: 6, ~32MB) pobierz (znaków: 4795) pobierz (dodatkowe regiony: 1608)
Prawdziwa relacja i opisanie straszliwego trzęsienia ziemi 27 marca roku 1638 w Kalabrii pokaż pobierz (plików: 7, ~7MB) pobierz (znaków: 5841) pobierz (dodatkowe regiony: 2036)
Relacja chwalebnej ekspedycji Jana Kazimierza, króla polskiego i szwedzkiego pokaż pobierz (plików: 24, ~118MB) pobierz (znaków: 30512) pobierz (dodatkowe regiony: 6583)
Relacja koronacji cudownego obrazu Najświętszej Marii Panny na Górze Różańcowej [w Podkamieniu] pokaż pobierz (plików: 32, ~120MB) pobierz (znaków: 28738) pobierz (dodatkowe regiony: 7783)
Relacja prawdziwa o wejściu wojska polskiego do Wołoch i o potrzebie jego z pogaństwem we wrześniu i październiku 1620 pokaż pobierz (plików: 26, ~127MB) pobierz (znaków: 38398) pobierz (dodatkowe regiony: 10487)
Relacja spraw gdańskich na sejmie walnym warszawskim roku 1570 pokaż pobierz (plików: 62, ~333MB) pobierz (znaków: 60064) pobierz (dodatkowe regiony: 14180)
Szturm pocieszny smoleński, który był odprawiony szczęśliwie 13 czerwca 1611 pokaż pobierz (plików: 29, ~74MB) pobierz (znaków: 11171) pobierz (dodatkowe regiony: 2908)
SŁAWNA VICTORIA, NAD TVRKAMI. OD WOYSK KORONNYCH pokaż pobierz (plików: 28, ~122MB) pobierz (znaków: 22977) pobierz (dodatkowe regiony: 5836)
Sławna wiktoria nad Turkami od wojsk koronnych i Wielkiego Księstwa Litewskiego pod Chocimiem otrzymana pokaż pobierz (plików: 14, ~123MB) pobierz (znaków: 17520) pobierz (dodatkowe regiony: 4392)
Wieść z Moskwy prawdziwa krótkim rymem wyprowadzona pokaż pobierz (plików: 32, ~30MB) pobierz (znaków: 24034) pobierz (dodatkowe regiony: 5628)
Wyprawa i wyjazd sułtana Amurata, cesarza tureckiego, na wojnę do Korony Polskiej pokaż pobierz (plików: 32, ~55MB) pobierz (znaków: 44944) pobierz (dodatkowe regiony: 9825)
Wyprawa i wyjazd sułtana Amurata, cesarza tureckiego, na wojnę do Korony Polskiej (wersja 2) pokaż pobierz (plików: 32, ~149MB) pobierz (znaków: 45007) pobierz (dodatkowe regiony: 7358)
Zbiór rytmów duchownych Panegirycznych Moralnych i Swiatowych [...] Elżbiety z Kowalskich Druzbackiey [...] Zebrany y do druku podany przez J. Z. R. K. O. W. etc. [Załuskiego Józefa Andrzeja] pokaż pobierz (plików: 566, ~1274MB) pobierz (znaków: 450405) pobierz (dodatkowe regiony: 107884)
Żałosne opisanie upadku króla hiszpańskiego na morzu i na lądzie pokaż pobierz (plików: 30, ~135MB) pobierz (znaków: 39705) pobierz (dodatkowe regiony: 10709)
Komentarze rss
Komentarze rss
Trackback
Trackback
Drukuj tę stronę Drukuj tę stronę

One Response to “Wyniki prac projektu IMPACT”

  1. PSNC Digital Libraries Team » Full text versions of Polish historical documents available for download! pisze:
    wtorek, 10 sty 2012 o 15:10

    [...] related to data and available data for download can be accessed via IMPACT results website dedicated to PSNC Digital Libraries Team activities. See also:PSNC joined European IMPACT projectIMPACT Centre of Competence in 2012IMPACT project [...]

Leave a Reply

Kliknij tutaj, aby anulować odpowiadanie.

Tagi

ACCESS IT ankieta archiwizacja bezpieczeństwo biblioteki cyfrowe DART-Europe digitalizacja dLibra dMuseion Domena Publiczna Dublin Core długoterminowe przechowywanie danych e-book EDM edukacja ENRICH Europeana EuropeanaLocal FBC Firefox GeeCON Google Google Books Hack4Europe! hackaton i3 IMPACT Java konferencja Linked Data metadane ocr Open Access Open Data PBC2008 PBC2009 PBC2010 praca seminarium SYNAT warsztaty WBC wizjonerzy WWW zespół

RSS dL News

  • Noc Muzeów 2012 w Rzeszowie - PolskaLokalna.pl (Kraków) czwartek, 17 maj 2012
  • Akcja rzeszowskich muzealników - Rzeczpospolita środa, 16 maj 2012
  • Finansowanie polskiej nauki. Minister mówi o przełomie - Money.pl poniedziałek, 14 maj 2012

RSS dL Texts

  • Presentation
  • Dudczak, Adam, Country-scale infrastructure for creation of full text versions of historical documents from Polish Digital Libraries
  • Dudczak, Adam, Summary report on ACCESS IT plus training

RSS Twitter

  • The Velveteen Rabbit is such a sad, beautiful story. http://t.co/Y9AiGowH #recommended piątek, 18 maj 2012 MaruRey_es (Maru Reyes)
  • RT @TaiwanEgov: Focus Taiwan: Taiwan's first digital library opens in Taichung http://t.co/ICryR8rh #Taichung #digital #library #opening #Taiwan piątek, 18 maj 2012 2Taichung (Taichung news & info)
  • مخطوط متن فصوص الحكم http://t.co/hR4eYSNj piątek, 18 maj 2012 AbrarShahi (Abrar Ahmed Shahi)
  • US-German team (@UofA, @Uni_MR) report 1st VECSEL with continuous-wave output over 100 W at up to 3°C http://t.co/kVSPApvI piątek, 18 maj 2012 ElecLett (Electronics Letters)
  • 杉本の研究分野はインターネット上の色々な応用、特にディジタルライブラリ(Digital Library)やディジタルアーカイブ(Digital Archive)、それにそこで使われるメタデータを中心的な研究課題としています。 #mdlab_tweet piątek, 18 maj 2012 mdlab_tkb (杉本・永森研究室)

Język/Language

  • polski
  • english

Najnowsze wpisy

  • IMPACT: rezultaty projektu
  • Hack4Europe! 2012 – Warszawa, Leuven
  • jMet2Ont: przekształcanie metadanych z XML do postaci ontologicznej
  • Nowe projekty!
  • Mapowanie formatu MARC 21 rekordu bibliograficznego do schematu metadanych PLMET
  • Konsultacje on-line w MKiDN
  • Poszukujemy pracowników!
  • Dziedzictwo narodowe w formie cyfrowej w polskich bibliotekach cyfrowych
  • 900 000 obiektów w bazie FBC!
  • Warsztaty dotyczące wykorzystania Usługi Powszechnej Archiwizacji PLATON-U4

Archiwa

Meta

  • Zarejestruj się
  • Zaloguj się
  • Kanał RSS z wpisami
  • Kanał RSS z komentarzami
PCSS

Instytucja odpowiedzialna:Poznańskie Centrum Superkomputerowo-Sieciowe.

rss Komentarze rss Creative Commons License valid xhtml 1.1 design by jide powered by Wordpress