Rozwój zasobów open access w Polsce

Bożena Bednarek-Michalska

Mija już 18 lat, odkąd wielu naukowców, bibliotekarzy i aktywistów ruchu otwartej nauki (Open Access Movement) stara się przekonać środowisko naukowe o tym, że produkty powstałe w tym obszarze powinny być dostępne bez barier w internecie, szczególnie wówczas, kiedy powstają za pieniądze podatników. W Polsce nie udało się jednak przekonać wielu do tej idei, jakkolwiek otwartych zasobów w sieci są miliony, Polacy chętnie z nich korzystają, wynikają z tego niepomierne korzyści, chociażby w zakresie szybkości przepływu informacji czy wzrostu innowacyjności np. medycyny. Na niemieckiej liście tworzonej przez bibliotekarzy z Regensburga, Electronic Journal Library odnotowano ponad 61 tysięcy tytułów czasopism, które otwierają swoje artykuły w różnych formach i modelach a Directory of Open Access Journals informuje o ponad 500 tytułach naukowych z Polski, które deklarują otwarty dostęp do swoich tekstów na różnych licencjach. Wydaje się, że nie jest to mało.

Baza danych SHERPA/RoMEO odnotowuje ponad 2500 wydawców naukowych, którzy stosują liberalną, „zieloną” politykę otwartości, z Polski wymienia 31 wydawców deklarujących otwartość, głównie są to wydawnictwa uczelniane, towarzystw naukowych i PAN.

Na liście opracowanej przez Koalicję Otwartej Edukacji znajduje się 36 repozytoriów naukowych oraz 3 platformy czasopism otwartych. W 32 repozytoriach (nie we wszystkich udało się odnaleźć informację o liczbie otwartych tekstów) przechowuje się ponad 300 tys. obiektów, niestety nie są to jedynie dane dotyczące otwartych tekstów naukowych, ponieważ niektóre repozytoria, np. UJ, UTP czy RCIN, przechowują w nich tylko opisy bibliograficzne, bez pełnych tekstów. W związku z tym, by mieć dane wiarygodne, należałoby przeprowadzić bardzo dokładną ankietę w instytucjach naukowych. Nikt tego do tej pory nie zrobił. Te niepełne dane idą w świat i fałszują także liczbę otwartych tekstów naukowych w wielkich wyszukiwarkach, takich jak BASE.

Niewielki udział

Czy mamy zatem w Polsce mało czy dużo otwartych zasobów nauki? Wydaje się, że niewiele, zważywszy na roczną produkcję wyników badań naukowych w Polsce. Polska Bibliografia Naukowa podaje, że w jej zasobach znajduje się 971 668 różnego typu publikacji naukowych opublikowanych od 2013 roku, w tym ponad 190 tys. w modelu open access , co daje 18% wyników. Rokrocznie przyrasta ponad 30-40 tys. otwartych publikacji na ponad 200 tys. wszystkich publikacji. Jedna duża uczelnia może rocznie pochwalić się liczbą 8 tysięcy nowych artykułów, książek czy innych materiałów naukowych, zatem wydaje się, że polski udział w procesie otwierania zasobów nauki jest faktycznie niewielki.

Jak wynika z opracowanego przez MNiSW Raportu nt. realizacji polityki otwartego dostępu do publikacji naukowych w latach 2015-2017 w Polsce niewiele się zdarzyło w ostatnich latach, choć przedstawiciele ministerstwa bywali na europejskich spotkaniach i konferencjach, debatując o wadze tego zagadnienia – np. brali udział w pracach Stałej Grupy Roboczej ERAC ds. otwartej nauki i innowacji (SWG OSI), a także w pracach OECD związanych z otwartą nauką i otwartymi danymi. Powstał kolejny zespół roboczy ds. otwartego dostępu, powołany przez ministra nauki i szkolnictwa wyższego na czas od 19 września 2016 r. do 30 czerwca 2017 r. Opracowywał on raport cząstkowy dotyczący otwartego dostępu do publikacji w Polsce. MNiSW prowadziło także szkolenia dla instytucji naukowych, zachęcając je do wprowadzania polityki OA.

Z punktu widzenia naszej wiedzy o rozwoju otwartych zasobów w Polsce ważne jest to, że MNiSW przygotowało w 2017 r. i przeprowadziło badanie ankietowe dotyczące wdrażania otwartego dostępu w Polsce składające się z 22 pytań. „Celem ankiety było m.in. pozyskanie informacji nt. posiadania (lub nie) polityk otwartego dostępu, otwartych repozytoriów i otwartych czasopism przez jednostki naukowe i uczelnie, poznanie opinii nt. barier w otwieraniu publikacji i danych badawczych, poznanie potrzeb środowiska naukowego związanych z otwartym dostępem. Ankietę w postaci elektronicznej (link) wysłano do 249 jednostek naukowych i uczelni, ponadto link do ankiety był dostępny na stronie internetowej MNiSW. W odpowiedzi otrzymano 168 wypełnionych ankiet (Patrz Raport s. 15)”.

„Procentowy udział otwartych publikacji jest zwykle bardzo niski lub nieznany (41% respondentów szacuje, że w ich instytucjach procentowy udział publikacji w otwartym dostępie mieści się w przedziale 0-20%; 27% respondentów deklaruje, że nie zna procentowego udziału publikacji w OA w ich instytucjach), 50% ankietowanych instytucji nie ma repozytoriów (nawet zamkniętych), tylko 20% respondentów deklaruje posiadanie instytucjonalnej polityki OA, 75% jednostek nie organizowało w 2016 r. żadnych wydarzeń nt. OA. (Raport s. 15)”.

Ankieta pokazała jednoznacznie, że polskie instytucje naukowe nie są przygotowane do otwierania swoich zasobów w internecie. Większość naukowców korzysta ze światowych zasobów otwartych, a jest już ich ponad 130 mln w 6500 źródłach (dane z BASE), ale niewielu (około 11%) do tego zasobu cokolwiek dodaje.

Mnogość rozwiązań technicznych

Dlaczego tak się dzieje? Nie można dziś tłumaczyć tego faktu brakiem wiedzy na temat otwierania zasobów w internecie, bo sieć funkcjonuje w Europie i Polsce od 25 lat, każdy zna jej wady i zalety, zawartość i sposoby ich wykorzystania. Obok otwartych całkowicie zasobów Polska nauka korzysta także z tych zamkniętych, czyli płatnych (często opłaconych w licencji krajowej przez MNiSW), ale dostępnych z serwerów wielu zagranicznych czy polskich uczelni, więc niektórzy je też postrzegają jako otwarte. Społeczność naukowa ma zatem dostęp do wiedzy świata, co stoi więc na przeszkodzie, by zakres tej wiedzy poszerzać o polskie wyniki badań?

Z informacji płynących od polskich czy międzynarodowych organizacji open access , takich jak KOED, SPARC czy EIFL, wynika, że jedną z ważniejszych barier mogących utrudniać upowszechnianie wiedzy także w Polsce jest mnogość różnych rozwiązań technicznych. Pracownicy nauki nie do końca wiedzą, które narzędzie optymalizuje ich widoczność w sieci (repozytorium instytucjonalne, czasopismo otwarte, biblioteka cyfrowa, ResearchGate czy inne). Takich wątpliwości nie mają fizycy, bo znają funkcjonujące od lat repozytorium otwarte arXiv, gdzie jest wszystko, czego potrzebują, gdzie sami deponują swoje utwory; ale takiego komfortu nie mają już humaniści. W Polsce pojawiały się inicjatywy budowania spójnej infrastruktury otwartej nauki, takie jak SYNAT czy KRONIKA, ale pozostały one tylko na papierze.

SYNAT dotyczył „utworzenia uniwersalnej, otwartej, repozytoryjnej platformy hostingowej i komunikacyjnej na sieciowe zasoby wiedzy dla nauki, edukacji i otwartego społeczeństwa wiedzy”, a realizowany był w ramach strategicznego programu badań naukowych i prac rozwojowych pt. Interdyscyplinarny system interaktywnej informacji naukowej i naukowo technicznej, finansowanego przez Narodowe Centrum Badań i Rozwoju na podstawie umowy SP/I/1/77065/10. Okres jego realizacji rozplanowano na trzy lata: od 16 sierpnia 2010 do 16 sierpnia 2013. Wykonawcą było konsorcjum 16 jednostek naukowych i badawczych pod kierownictwem lidera Interdyscyplinarnego Centrum Modelowania Matematycznego i Komputerowego Uniwersytetu Warszawskiego. Finansowanie odbywało się przez NCBR, wysokość dofinansowania wynosiła prawie 60 mln. Dziś o projekcie trudno znaleźć informację, a strona internetowa www.synat.pl nie działa.

Inne bariery

Kolejna bariera to ewaluacja. Polskie zasady oceny wyników nauki nie premiują otwartego udostępniania zasobów w sieci, tylko nadal opierają się na czasopismach „dobrej marki”, które są zwykle płatne i zamknięte w komercyjnych bazach danych. Generują dla wielkich wydawców ogromne zyski, z tego powodu są mocno obudowane narzędziami pokazującymi, jak bardzo są cytowane i wykorzystywane, co przekonuje naukowców do nich. Mimo wielu światowych merytorycznych dyskusji pokazujących wady stosowania wskaźnika Impact Factor do ocen, to rozwiązanie nadal funkcjonuje. Panująca w Polsce „punktoza” powoduje, że naukowcy starają się publikować nie tam, gdzie mają najwięcej czytelników, lecz tam, gdzie jest najwięcej punktów.

Kolejną barierą w uwalnianiu polskich zasobów w sieci jest prawo. Polscy naukowcy nie znają prawa autorskiego, nie znają swoich uprawnień, nie walczą z wydawcami, z ich niedobrymi praktykami (np. przejmowaniem wszystkich praw do artykułu na wszystkich polach eksploatacji), co prowadzi do tego, że autorzy lekką ręką pozbywają się dożywotnego prawa do dysponowania swoimi dziełami. Podpisują umowy, których albo nie czytają, albo nie rozumieją, albo nie wiedzą, że mogą je zmieniać, dodawać klauzule czy aneksy wymuszone np. przez Komisję Europejską czy innych grantodawców. Oddając artykuł naukowy wielkiemu wydawcy znajdą się w wybranym przez siebie czasopiśmie, będą widoczni w ich bazie cytowań, ale stracą prawo do dysponowania swoją twórczością. Coś za coś. Jeśli tak się dzieje, to powstaje dylemat, czy wolno cokolwiek z własnej twórczości umieścić w otwartym internecie? Odpowiedź na to pytanie może być prosta, jeśli słyszało się o tym, że wielcy wydawcy mają swoje polityki open access , wymuszone przez donatorów nauki, i można je sprawdzić w bazie Sherpa/Romeo, ale taką wiedzę także trzeba posiadać i chcieć do niej dotrzeć.

Zapisy na wyrost

Politykę open access ma od 2012 roku Unia Europejska, a od 2015 roku Polska, ponieważ Komisja Europejska zalecała jej utworzenie. Jak kraje europejskie realizują zalecenia unijne (rekomendacje z 2012 roku) związane z otwartą nauką, opisuje najnowszy raport Komisji Europejskiej zatytułowany Access to and preservation of scientific information in Europe. Wpisy o Polsce są nader optymistyczne, jak ten ze str. 12 opisujący Polską Bibliografię Naukową jako repozytorium prac naukowych, do którego można deponować pełne teksty. Jest to zapis na wyrost, bo w tej bibliografii są czasem odesłania przez DOI czy link do otwartych zasobów, ale mało kto deponuje tam swoje dzieła. Dane pochodzą najczęściej z baz bibliograficznych tworzonych na uczelniach, co oznacza, że w PBN mamy głównie do czynienia z opisami bibliograficznymi.

To samo dotyczy polskiej infrastruktury otwartej nauki, tej związanej z zabezpieczeniem zasobów cyfrowych. Na str. 26 raportu czytamy, że Polska ją poważnie rozwija. Nie każdy zgodziłby się z takim opisem polskiej rzeczywistości. Jakkolwiek niektóre pomysły i projekty były w Polsce planowane i realizowane (str. 43 raportu), to jednak nie przyniosły spektakularnych rezultatów i biblioteki naukowe, które są głównie odpowiedzialne za przechowywanie i udostępnianie otwartych zasobów nauki, nie mają takiego wsparcia, jakie faktycznie jest im potrzebne. W raporcie wymienia się projekty OCEAN, SYNAT, Infona, PBN (Polska Bibliografia Naukowa), WBN (Wirtualna Biblioteka Nauki), CEON (Centrum Otwartej Nauki ICM), FBN (Federację bibliotek Cyfrowych) i inne. Niektóre z nich działają, inne nie, ale rzuca się w oczy rozproszenie inicjatyw i brak interoperacyjności między wymienionymi wyżej systemami oraz różnorodność zasobów, jakimi się zajmują (otwarte/zamknięte, naukowe/nienaukowe, pełnotekstowe/niepełnotekstowe). Koordynacja tych wszystkich działań jest niezbędna i dla państwa korzystna, bo oszczędziłaby środki finansowe przeznaczone na budowanie zasobów.

Zaczynamy, nie kończymy

Nie wymienia się w raporcie Krajowego Magazynu Danych przy PIONIERZE, który tak bardzo jest potrzebny wszystkim bibliotekom. Choć wydano na niego duże pieniądze, nie działa on jak powinien, ponieważ nie ma kontynuacji finansowania i rozwijania, co jest typowe dla Polski. Potrafimy zacząć ważny projekt, pochwalić się nim, a potem go nie skończyć, za jakiś czas znów zaczynać wszystko od nowa, jakby się pracowało na infrastrukturalnej pustyni. KMD jest niezbędny, by polskie biblioteki (a także uczelnie) naukowe mogły w nim magazynować wszystkie pliki, jakie powinny być wieczyście przechowane, a potem migrowane do innych systemów oraz nowocześniejszych narzędzi.

Taką sytuację mamy w kraju od lat. Tam, gdzie nie ma spójnej krajowej strategii rozwoju otwartej nauki, tam nie można mówić o sensownym finansowaniu tego typu przedsięwzięć. W MNiSW nigdy nie było determinacji, by taką strategię wdrożyć, choć ją opracowano w latach 2014-2016 w ramach prac eksperckich i pierwszego Zespołu doradczego do spraw otwartego dostępu do treści naukowych. Podjęto także w ICM UW próbę obliczenia kosztów wdrożenia takiej kompleksowej strategii. Raport Analysis of Economic Issues Related to Open Access to Scientific Publications poświęcony był ekonomicznym aspektom otwartego dostępu do publikacji naukowych. Analiza wdrożonych na świecie otwartych modeli (z ekonomicznego punktu widzenia) uzupełniona była o przedstawienie obecnych i możliwych sposobów finansowania otwartego dostępu w Polsce. Raport przygotowali Bo-Christer Björk, Wojtek Sylwestrzak i Jakub Szprot w ramach działań Platformy Otwartej Nauki. Niestety na lekturach i papierze się skończyło i teraz kolejni ministrowie nauki czy cyfryzacji wyważają dawno otwarte drzwi.

Koszty nie są wysokie

Zasoby i infrastruktura otwartej nauki powstają oddolnie na polskich uczelniach i w krajowych instytucjach naukowych. Niektóre z nich są świadome trendów światowych i starają się w nie wpisać, nie czyni to jednak tej infrastruktury spójną i wydajną. Efekty tej działalności pokazują przytoczone wyżej statystyki. Koszty tworzenia repozytorium instytucji nie są wysokie, jeśli używa się systemów open source i zatrudnia dwie osoby do ich obsługi. W tej technologii autorzy sami deponują swoje dzieła w repozytorium, więc odpada także drogi koszt digitalizacji i pozyskiwania licencji. Kosztowniejsza jest koordynacja tych działań w skali kraju, co spoczywa w tej chwili na ICM UW, oraz magazynowanie wieczyste zasobów, co może być powierzone PCSS z Poznania, bo tam się znajduje Krajowy Magazyn Danych. Gdyby te dwa ośrodki mogły liczyć na stałe finansowanie działań otwartościowych, to w zasadzie sprawę można załatwić bardzo szybko.

Wiele aktywnych instytucji tworzących otwarte zasoby Polski zrzesza się w Koalicji Otwartej Edukacji, dzięki czemu jest w kraju spora grupa ludzi, którzy mają wiedzę i mogą pełnić rolę doradców zmian, co zresztą było wykorzystywane przez lata w różny sposób.

W tym roku Koalicja Otwartej Edukacji, największa w Polsce organizacja społeczna pracująca na rzecz otwartej nauki, koordynuje po raz dziewiąty Tydzień Otwartej Nauki, próbując dotrzeć ze swoim przekazem do środowisk naukowych, przekazując także dobre wieści, jak ta poniżej.

4 września 2018 r. jedenaście narodowych organizacji finansujących badania (wśród nich polski fundator Narodowe Centrum Nauki), przy wsparciu Komisji Europejskiej, w tym Europejskiej Rady ds. Badań Naukowych (ERC), ogłosiło uruchomienie inicjatywy cOAlition S, mającej na celu doprowadzenie do pełnego i natychmiastowego otwartego dostępu do publikacji naukowych. Koalicja ma ambitny Plan S, który składa się z jednego celu wymienionego powyżej i 10 bardzo ambitnych zasad, które mają zostać wdrożone w instytucjach donujących badania. Czy plan się uda? Trzymam kciuki, by tak było.

Bożena Bednarek-Michalska , Biblioteka Uniwersytecka w Toruniu, Koalicja Otwartej Edukacji
Artykuł powstał w ramach projektu „Otwieramy naukę – udział Polski w międzynarodowych obchodach Open Access Week” – zadanie finansowane w ramach umowy 868/P-DUN/2018 ze środków Ministra Nauki i Szkolnictwa Wyższego przeznaczonych na działalność upowszechniającą naukę.