Wkracza Lelewel

Henryk Hollender


Wyobraźmy sobie, że jestem badaczem i mam wszystko na kliknięcie. Artykuły z co najmniej kilkunastu tysięcy liczących się czasopism komercyjnych. Książki dostępne w rozmaitych bazach „e booków”. Niedrukowane prace naukowe, np. doktorskie, opublikowane elektronicznie w ramach zobowiązań autorów wobec instytucji zatrudniającej. Spuściznę kultury bez względu na typ wypowiedzi i pierwotnego nośnika, a w pierwszej kolejności nieprzebrane dokumenty tekstowe w postaci tak wizerunków, jak i plików podatnych na redakcję. Źródła historyczne. Otwarte naukowe zasoby Sieci. Metadane obiektów, które nie są jeszcze w całości dostępne cyfrowo, ale do których też chciałbym dotrzeć. Dane gospodarcze, statystyki, raporty instytucji, ekspertyzy, uchwały parlamentów, orzeczenia sądów, casusy i precedensy. Normy, patenty, aprobaty techniczne. A może jeszcze wzory chemiczne? I to wszystko mogę wybierać, filtrować, zestawiać, porównywać i analizować w ramach jednego mechanizmu heurystycznego. System nazywa się, dajmy na to, LELEWEL (Literaturę Elektronicznie, Lekko, Elegancko Wyszukują Entuzjaści oraz [zwykli] Ludzie) i właśnie wchodzi do użycia jako produkt zespołu, który zgarnął 60 mln PLN, wygrywając konkurs Narodowego Centrum Badań i Rozwoju na „utworzenie uniwersalnej, otwartej, repozytoryjnej platformy hostingowej i komunikacyjnej do sieciowych zasobów wiedzy dla nauki, edukacji i otwartego społeczeństwa wiedzy”.

Takiej platformy nie ma nigdzie na świecie. Brytyjski gigant JISC wspiera to takie, to inne przedsięwzięcie, duński DEFF to pięć niezintegrowanych modułów… Łatwiej scalać zasoby na poziomie poszczególnych użytkowników (bibliotek) lub tworzyć konsorcja posługujące się wspólnym mechanizmem dostępu, jak np. nieznana w Polsce usługa Athens (Eduserv). Zadanie było więc niełatwe. Wszak dopiero w przyszłości taka platforma może stać się na drodze tekstu do czytelnika stacją pierwszą i ostatnią, zgoła jedyną – na razie trzeba było zaprojektować system, który by agregował obiekty już zagregowane i dopuszczał (ba! zapewniał) rozproszenie zasobów. Czyli problem z konwersją nie tyle danych, co metadanych. W jednej bazie wyjściowej mogły być trzy klucze wyszukiwawcze, w innej – jak MEDLINE – ponad trzydzieści, a poważny użytkownik sobie życzył, żeby te możliwości były również dostępne w LELEWEL-u. A zatem trud i koszt scalenia oraz trud poruszania się po bazie, w której użytkownik będzie musiał na wstępie zignorować większość dostępnych instrumentariów poszczególnych baz „wsadowych”. Albo zgodzić się na kompromis, że jego docelowe instrumentarium zostanie konstrukcyjnie okrojone. Na przykład poprzez „zastosowanie jednorodnej klasyfikacji, umożliwiającej opis zjawisk z różnych dziedzin nauki, a także wymianę treści z zagranicznymi bazami danych” (Ogłoszenie konkursowe, p. L.6.b).

Dalej, uprawnienia użytkowników. Niestety, stworzenie LELEWEL-a znacząco wyprzedziło tę nieuniknioną chwilę w dziejach ludzkości, w której zasoby wiedzy stały się powszechnie i trwale otwarte. Mogę być więc użytkownikiem, który sobie kupuje te zasoby, i mogę być takim, któremu już je kupiła jego instytucja. Z instytucjami bywa różnie, małe uczelnie płacą mniej, są różne rozwiązania konsorcjalne, racjonalistyczna utopia jest zawsze bardziej szara niż świat biznesu. Tu LELEWEL niewiele ma do scalenia, chyba że ma również władzę (i biuro!), żeby zachowywać się jak konsorcjum zakupowe. Takiego typu: zasoby komercyjne uczelnie mają za darmo i z nikim się nie rozliczają, a cała ekonomika jest na poziomie zarządu platformy, który pozyskuje i generuje środki. A środków trzeba będzie potężnych, bo w takim systemie duża ich część zostanie pochłonięta nie przez contents, lecz przez „zindywidualizowane funkcje autoryzacji i rozliczania” (p. L.1.h) oraz „wysoką skalowalność operacyjną systemu” (p. L.1.g). Jeśli do tego ma dojść jeszcze prawdziwa interaktywność, i to „uwzględniająca zachodzące w skali międzynarodowej procesy transformacji form komunikowania naukowego” (p. L.1.b), to tych 60 milionów przestaje być naprawdę dużymi pieniędzmi. A system obsługujący obieg norm i patentów nie powstanie za żadne pieniądze, bo na to nikt się nie zgodzi – nabywcą tych produktów zawsze jest docelowy użytkownik. Integracja poprzez interoperacyjność – tak, tego wciąż za mało. Ale jak coś trzeba kupić, to trzeba, i żadne bazodanowe czary mary na to nie pomogą.

Jest jasne, że LELEWEL nie oznacza zaczynania od zera – odwrotnie, ogłoszenie konkursowe powiada wyraźnie (w dziale H.), że „system ma integrować istniejącą infrastrukturę, w tym platformę rozproszonych bibliotek cyfrowych i inne wirtualne zbiory publikacji naukowych”. Rozumiejąc to dosłownie i minimalistycznie, ma to być nakładka na Bibliotekę Wirtualną Nauki (ICM UW) i na sfederowane biblioteki cyfrowe, które w większości posługują się oprogramowaniem dLibra (Poznańskie Centrum Superkomputerowo Sieciowe). Zgoda, w bibliotekach cyfrowych są zarówno skarby dla humanistów, jak i coraz znaczniejsza liczba współczesnych (czasem nawet bieżących) czasopism naukowych. Gdyby wszakże zawartość tych czasopism rozlegle i skutecznie posadowić na jednej platformie, a obiekty zabytkowe pozostawić jak są, to koszty scalenia byłyby znacznie niższe. Na odrębności serwisów ucierpiałoby niewielu.