W opublikowanym niedawno na tej stronie wpisie pt.: “Domena publiczna i licencje Creative Commons w polskich bibliotekach cyfrowych” przedstawiliśmy statystyki obrazujące udział obiektów z domeny publicznej w zbiorach polskich bibliotek cyfrowych oraz wykorzystanie licencji Creative Commons w tychże bibliotekach. Podstawowe statystyki z próbki około pół miliona obiektów wyglądały następująco:
- Domena publiczna (dalej: PD) – 10,37%
- Licencje CC (dalej: CC)- 0,1%
- Prawa zastrzeżone, dostęp nieograniczony (dalej: RR-F) – 88,87%
- Prawa zastrzeżone, dostęp ograniczony (dalej: RR-R)- 0,66%
Po szczegółowe informacje i szerszy kontekst dla interpretacji tych danych odsyłamy do wspomnianego już poprzedniego wpisu. Bardzo istotne jest to, iż powyższe statystyki nie koniecznie muszą odzwierciedlać faktyczny stan prawny obiektów. Zostały one przygotowane na podstawie informacji licencyjnych, jakimi opatrują poszczególne obiekty udostępniające je instytucje. Bardzo często brak jest podanych wprost informacji licencyjnych, a zamiast tego w polu “Prawa” opisu widnieje nazwa instytucji, która dany obiekt udostępniła on-line. Z punktu widzenia użytkownika końcowego trudno interpretować tego typu informację inaczej, niż jako stwierdzenie że dana instytucja posiada prawa do udostępnianego w sieci obiektu. Stąd też obiekty bez określonych wprost zasad licencjonowania zostały skategoryzowane jako obiekty, do których prawa są zastrzeżone. Dodatkowo część z tych obiektów udostępniana jest w sposób ograniczony (np. dostęp wyłącznie na terenie biblioteki).
W ramach dalszej analizy tych danych postanowiliśmy zestawić dane odnośnie licencji z danymi o dacie utworzenia/wydania udostępnianego obiektu. W przypadku obiektów digitalizowanych braliśmy pod uwagę datę utworzenia/wydania oryginalnego obiektu, a nie datę digitalizacji. Jest to uzasadnione zapisami Statutu Domeny Publicznej Europeany:
“Digitalizacja domeny publicznej nie oznacza tworzenia praw autorskich: prace, które w wersji analogowej znajdują się w domenie publicznej, nadal do niej należą po stworzeniu ich wersji cyfrowej.”
Ze względu na brak ogólnie przyjętego w polskich bibliotekach cyfrowych jednego sposobu zapisu dat, w celu przygotowania wspomnianego powyżej zestawienia musieliśmy opracować narzędzie, które pozwoliło na ujednolicenie dat i ich zestawienie z grupami licencji. W wyniku działania tego narzędzia udało się poprawnie przetworzyć daty utworzenia opisujące 96% obiektów ze wspomnianej próbki pół miliona obiektów. Zestawienie w formie graficznej wygląda następująco (kliknięcie na wykres spowoduje powiększenie go):
Dokładne dane zawiera poniższa tabela:
Zakres lat | Obiekty wg typu licencji | Łączna liczba obiektów |
% próbki | |||
---|---|---|---|---|---|---|
RR-F | RR-R | PD | CC | |||
1001 – 1050 | 8 | 0 | 0 | 0 | 8 | 0,0017% |
1051 – 1100 | 0 | 0 | 0 | 0 | 0 | 0,0000% |
1101 – 1150 | 0 | 0 | 0 | 0 | 0 | 0,0000% |
1151 – 1200 | 2 | 0 | 0 | 0 | 2 | 0,0004% |
1201 – 1250 | 4 | 0 | 0 | 0 | 4 | 0,0008% |
1251 – 1300 | 17 | 0 | 14 | 0 | 31 | 0,0065% |
1301 – 1350 | 22 | 0 | 25 | 0 | 47 | 0,0098% |
1351 – 1400 | 93 | 0 | 4 | 0 | 97 | 0,0203% |
1401 – 1450 | 93 | 0 | 10 | 0 | 103 | 0,0216% |
1451 – 1500 | 431 | 0 | 12 | 0 | 443 | 0,0928% |
1501 – 1550 | 812 | 0 | 7 | 0 | 819 | 0,1716% |
1551 – 1600 | 1 572 | 0 | 9 | 0 | 1581 | 0,3312% |
1601 – 1650 | 1 467 | 0 | 25 | 0 | 1492 | 0,3125% |
1651 – 1700 | 1 690 | 0 | 33 | 0 | 1723 | 0,3609% |
1701 – 1750 | 2 948 | 0 | 59 | 0 | 3007 | 0,6299% |
1751 – 1800 | 5 137 | 0 | 219 | 0 | 5356 | 1,1219% |
1801 – 1850 | 37 951 | 0 | 6 567 | 0 | 44518 | 9,3254% |
1851 – 1900 | 97 560 | 6 | 19 499 | 0 | 117065 | 24,5221% |
1901 – 1939 | 177 237 | 453 | 22 326 | 3 | 200019 | 41,8988% |
1940 – 1945 | 7 194 | 8 | 1 918 | 196 | 9316 | 1,9515% |
1946 – 1989 | 45 877 | 1 926 | 185 | 44 | 48032 | 10,0615% |
1989 – 2011 | 42 391 | 922 | 175 | 235 | 43723 | 9,1588% |
W czasie zorganizowanego w czerwcu 2010 roku przez Bibliotekę Narodową i EBIB Seminarium prawnego dla bibliotekarzy cyfrowych pan Tomasz Ganicz w swoim wystąpieniu “Domena Publiczna w praktyce projektów Wikimedia” przedstawił zarys tzw. polskiego kalkulatora domeny publicznej, czyli algorytmu czy też zestawu kroków pozwalającego na określenie statusu prawnego dzieła. W kalkulatorze tym kluczowy jest rok 1939. Jeżeli dzieło zostało przed końcem tego roku upublicznione, to jest szansa iż znajduje się ono w domenie publicznej (por. slajd 20 i dalsze w prezentacji).
Dane z powyższej tabeli, po wyróżnieniu tylko dwóch przedziałów czasowych – do 1939 i po 1939 – przedstawiają się następująco:
Zakres lat | Obiekty wg typu licencji | Łączna liczba obiektów |
% próbki | |||
---|---|---|---|---|---|---|
RR-F | RR-R | PD | CC | |||
1001 – 1939 | 327 044 | 459 | 48 809 | 3 | 376 315 | 78,8282% |
1940 – 2011 | 95 462 | 2 856 | 2 278 | 475 | 101 071 | 21,1718% |
Wspomniany kalkulator, poza rokiem 1939 jako graniczną datą upublicznienia dzieła, podaje jeszcze dwa inne warunki na mocy których dzieło może zostać uznane jako należące do domeny publicznej:
- dla dzieł których autor jest nieznany, jest to 140 lat od upublicznienia dzieła,
- dla dzieł których autor jest znany i nie przekazał on praw majątkowych za życia, jest to rok 1939 jako data śmierci autora.
Z pewnym przybliżeniem, można w takim razie przyjąć, że dzieła powstałe/upublicznione przed 1850 rokiem z bardzo dużym prawdopodobieństwem należą do domeny publicznej. W związku z tym powyższe statystyki można podzielić w następujący sposób:
Zakres lat | Obiekty wg typu licencji | Łączna liczba obiektów |
% próbki | |||
---|---|---|---|---|---|---|
RR-F | RR-R | PD | CC | |||
1001 – 1850 | 52 247 | 0 | 6 984 | 0 | 59 231 | 12,4074% |
1851 – 1939 | 274 797 | 459 | 41 825 | 3 | 317 084 | 66,4209% |
1940 – 2011 | 95 462 | 2 856 | 2 278 | 475 | 101 071 | 21,1718% |
Pierwszy wiersz (lata 1001 – 1850) to obiekty, które właściwie powinny być oznaczone jako dzieła znajdujące się w domenie publicznej. Drugi wiersz (lata 1851-1939) to obiekty, które z dużym prawdopodobieństwem do domeny publicznej należą – jednak występowanie publikacji w grupach licencji CC czy RR-R, pokazuje, że 100% pewności tutaj nie ma (najstarszy obiekt z grupy RR-R to rok 1887, najstarszy obiekt z grupy CC to rok 1926). Trzeci wiersz (lata 1940-2011) to obiekty, które najprawdopodobniej nadal objęte są prawami autorskimi.
Publikując to zestawienie mamy nadzieje, iż skłoni ono twórców polskich bibliotek cyfrowych do zastanowienia się nad sposobami wyrażania w metadanych statusu prawnego dzieł publikowanych on-line. Choć oczywiście zdajemy sobie równocześnie sprawę z tego, że w wielu przypadkach jasne określenie tego statusu jest trudne.