Tułaczka słownika bis

Henryk Hollender


W lutym 2008 r. zachwalaliśmy na tych łamach Słownik geograficzny Królestwa Polskiego i innych krajów słowiańskich oraz jego internetowe reedycje, ubolewając wszakże, że mimo ich wielości, nie jest to tekst traktowany z pietyzmem należnym dobrom kultury (i dziedzictwa narodowego naturalnie) – primo dlatego, że nie linkowany od katalogów bibliotecznych, secundo zaś dlatego, że nie u wszystkich wydawców przygotowany do pełnotekstowego wyszukiwania.

I właśnie ten felieton doczekał się kilku elektronicznych komentarzy w „Forum Akademickim”. Teraz, po dwóch latach, czas wyjaśnić, że faktycznie pochwały udzielone instalacji DIR wydają mi się dziś przesadzone. Przyjmuję też obszerne wyjaśnienie dr. Władysława M. Kolasy (obecnie: Uniwersytet Pedagogiczny im. Komisji Edukacji Narodowej), że już wtedy nie był to zapewne serwis oparty na nowoczesnych rozwiązaniach. Przyznaję, że w porównaniu z tym, co znalazłem wówczas w Małopolskiej Bibliotece Cyfrowej (MBC), wydał mi się on jednak atrakcyjny, nie tylko dlatego, że umożliwiał logiczną wędrówkę po strukturze słownika, ale także ze względu na to nieszczęsne poszukiwanie słowa w tekście (całym!), którego moim zdaniem wówczas jeszcze w MBC nie było, zdaniem zaś W. Kolasy – tylko nie potrafiłem go tam znaleźć. Hm, faktycznie nie szukałem wtedy „tajemniczej literki T w lewym rogu panelu wtyczki”, lecz powszechnie zrozumiałej, choć nie najmądrzej dobranej ikonki przedstawiającej lornetkę, która otwiera okno dialogowe do wprowadzenia poszukiwanego terminu. Podkreślam, że nie widzę sensu w zwracaniu się ani do szerokich rzesz humanistów, ani do uczonych starszej daty, zdaniami zaczerpniętymi z żargonu informatyków. Nie starałbym się też nigdy przekonywać ich do bibliotek cyfrowych formułami protekcjonalnymi, małomiasteczkowymi, jak „tajemnicza literka T”. Wyszukiwanie pełnotekstowe trudne do znalezienia to prawie tyle, co niedostępne. No i nie mogę posłużyć się wyszukiwaniem poprzez słowa w tekście w serwisie Federacji Bibliotek Cyfrowych, ponieważ czego jak czego, ale takiej funkcjonalności dawać on nie może. Przy okazji: zasoby Federacji Bibliotek Cyfrowych zostały właśnie przyłączone do Europeany (obok obecnej tam wcześniej CBN Polony). To jest naprawdę coś wielkiego!

Porównując jednak DIR i MBC nie możemy nie dostrzec, że DIR daje możliwość wyszukania terminu we wszystkich piętnastu tomach słownika razem wziętych, zaś MBC – ani trochę, bo muszę albo wybrać tom i w nim szukać, albo wybrać kolekcję. I to wielką kolekcję, zbudowaną na podstawie nieostrych kryteriów. Niechby w końcu była i ta kolekcja, ale mechanizm wyszukiwania jest chyba zawodny, skoro dziś, 16 grudnia 2009 r., wprowadziwszy do kolekcji Dziedzictwo Kulturowe przykładowy termin „Kijów”, uzyskałem informację o jego występowaniu w 106 różnych miejscach, tylko nie w Słowniku, który skądinąd widnieje na tym samym pierwszym ekranie jako „najczęściej czytana publikacja”. Za to otwierając Słownika tom 4 [Kęs – Kutno], wywołuję z łatwością Kijów w wielu miejscach, ze szczególnym uwzględnieniem strony 61, gdzie padają słowa, otwierające wspaniały artykuł: „Kijów, Kiew, Kyiw, gród prastary, mocno historyczny i arcysłowiański…”

W rękach wprawnego użytkownika taka biblioteka, jak MBC, jest potężnym, użytecznym narzędziem do badań naukowych. Równocześnie jednak jest przedszkolem bez względu na wzmiankowaną przez W. Kolasę liczbę klastrów, mianowicie przedszkolem metodyki bibliograficznej. Choćby dlatego, że daje opis w schemacie Dublin Core, ale tak luźno ujednoliconym i tak anarchistycznie wdrożonym, że każda biblioteka cyfrowa stosuje nie tylko różne rozumienie (a tym samym zawartość) poszczególnych pól, ale i niekiedy je rozmaicie nazywa. A jest tych bibliotek bardzo wiele. Spójrzmy oto na e−Bibliotekę Uniwersytetu Warszawskiego, żeby zobaczyć, jakie wygibasy musi robić krytyczniej wdrażająca dLibrę książnica, żeby ocalić jaki taki ład w obrębie haseł przedmiotowych i uwag, skoro je już ma i skoro je chce wykorzystać, i skoro The Dublin Core Metadata Initiative zaleca słownictwo kontrolowane w wypadku opisu rzeczowego. Równie dobrze można by dać tu opis w formie szczątkowej, ale uzupełnić go linkiem do katalogu, gdzie wypróbowane oprogramowanie obsłuży prawdziwie standardowy komplet metadanych.

Dlaczego zaś zdaniem W. Kolasy podchodzę do NUKAT jako do „nietykalnej świętości” i dlaczego MARC21 „w bardzo ograniczonym zakresie nadaje się do zasobów cyfrowych”, tego się już nie dowiadujemy. Tu się niestety u mojego Polemisty zaczyna czysta magia, zwieńczona powołaniem się na autorytet rady naukowej. Przyznaję, że raczej oczarował mnie autorytet Biblioteki Uniwersytetu Mikołaja Kopernika, która jako bodaj jedyna w Polsce wyciągnęła wszystkie konsekwencje z dostępnych dla MARC−a zasad opisu dokumentu elektronicznego zdalnego dostępu – bo o taki opis tu chodzi, a nie o linkowanie – i która daje swoim użytkownikom jednolite narzędzie penetracji wartościowych materiałów bez względu na nośnik, rozlegle katalogując zbiory bibliotek cyfrowych i tym samym wprowadzając je do NUKAT. Ale traf chciał, że Biblioteka ta jakoś akurat nie ma Słownika. Nic tu się zatem od dwóch lat nie zmieniło. Z jednym wyjątkiem. Polski Słownik został przygarnięty przez WorldCat, który opisuje elektroniczne wydanie Małopolskiej Biblioteki Cyfrowej. I – inaczej niż zazwyczaj – nie powołuje się na żadną instytucjonalną bibliotekę, która by poprzez skatalogowanie włączyła ten zabytek w wersji elektronicznej do swoich zbiorów.