Trove

Henryk Hollender

Cieszyńska truwła, skrzynia posażna, a może i niemieckie słowo Truhe, to mniej więcej angielskie trove, i taki właśnie kufer, tyle że z informacją, a nie z dobytkiem materialnym, mamy właśnie na ekranie. Ponad 300 milionów jednostek, ponad 30 tys. logowań w ciągu godziny, i wszystko zbiega się tam, gdzie ludzie chodzą do góry nogami: w Narodowej Bibliotece Australii.

Serwis ogłasza, że jest dla Australijczyków, ale to oznacza tylko, że tak kształtowano jego zawartość, a nie, że inne narody nie mogą z niego skorzystać. Jeśli więc znajdziemy sobie artykuł na jakiś temat ulubiony w Australii, na przykład dźwigania beli z wełną albo też wełnianych izolacji, i artykuł ten został zamieszczony we wpływowym czasopiśmie „Applied Ergonomics”, to on bez pudła pokaże nam się na ekranie, i to nie tylko jako opis bibliograficzny, ale i jako pełny tekst. Na komputerze ulokowanym w Polsce. Dlaczego mamy ten szczególny przywilej, by nad Wisłą oglądać „Applied Ergonomics”? Ach, nie ma to nic wspólnego z australijską wełną! Jest to czasopismo wydawane przez Elseviera, objęte bazą ScienceDirect, a w Polsce mamy oto takie warunki pracy, że z bazy tej korzystają wszystkie instytucje naukowe. Nie przeczytałbym zatem tego tekstu z komputera nieznajdującego się w obrębie sieci naukowej mojej uczelni albo z nią nieskomunikowanego, ale na uczelni (czy poprzez uczelnię) owszem korzystam – płaci ministerstwo, co baza rozpoznaje, gdy australijski serwis przekierowuje do niej moje zapytanie.

Trove pokazuje, że można jedną wyszukiwarką objąć najzupełniej heterogeniczne zasoby i nie wadzą sobie one wzajemnie. Są tu zatem – widać to na pierwszym ekranie, a na następnych ekranach to wraca jako kryteria ograniczania wyników wyszukiwania – książki, ilustracje i fotografie, zawartość czasopism i baz danych (także faktograficznych), zeskanowane dawniejsze czasopisma, muzyka, dźwięki i filmy, mapy, pamiętniki, listy i inne materiały rękopiśmienne, wybór zarchiwizowanych stron internetowych od 1996 r., informator o ludziach i organizacjach, wreszcie kilkanaście tysięcy list i spisów różnego rodzaju, na ogół nadesłanych przez czytelników. Do tego jedno okno dialogowe, gdzie wpisujemy frazę, która naszym zdaniem najlepiej pasuje nam do poszukiwanego materiału. Zgodnie z nową, googlowską zasadą, że najpierw sobie wyszukajmy szeroko, a później usuniemy niepotrzebne trafienia.

Odzwierciedla to popularny charakter serwisu, ale czy jest on nieprzydatny dla naukowca? Trove ma oczywiście dostępne jako alternatywę wyszukiwanie dla zaawansowanych, gdzie wprowadzamy jedną lub więcej fraz (połączonych algebrą boolowską), reprezentujących następujące atrybuty: tytuł, twórca, temat, słowo kluczowe, etykietka nadana przez użytkownika (ponad 10 tys. nowych wpisów tygodniowo), ISBN, ISSN. W świecie anglosaskim unika się już jednak kwalifikowania baz danych jako jednoznacznie popularnych lub jednoznacznie naukowych, a biegli użytkownicy reprezentujący różne potrzeby i kwalifikacje mogą sobie z tej jednej Truwły wybrać zupełnie odmienne dokumenty. Trove oferuje np. australijską prasę w komplecie, niepublikowane pamiętniki działaczy na rzecz praw aborygenów, setki dziewiętnastowiecznych fotografii, obserwacje pogodowe (tylko dla zarejestrowanych użytkowników). Oddzielny filtr wyszukiwania umożliwia zachowanie zasobów online (to znaczy takich, dla których w ramach sesji wywołujemy pełny dokument), w podziale na takie, które wymagają uprawnień (jak nasz dostęp do ScienceDirect – patrz powyżej), i na takie, które są pobierane z otwartego Internetu. Jest interesujące, że z ponad 17 mln książek, 3,5 mln reprezentuje tę ostatnią kategorię. Użytkownicy łączą się w społeczności, poprawiając wadliwe zapisy bibliograficzne i błędy w tekstach zrekonstruowanych za pomocą OCR, wypowiadając się na forum, komentując teksty.

Takie narzędzie z reguły wchłania katalog online, a dominują w nim bibliograficzno-abstraktowe i pełnotekstowe bazy danych. Tu akurat akcentuje się raczej „australiana”, ale podłączenie tych czy innych zasobów jest sprawą wyboru, a najlepsze produkty – dostępne na rynku i określane w dyskusjach zawodowych jako discovery service – umożliwiają uwzględnienie niemal wszystkiego, co oferują wydawcy i agregatorzy lub co wykonała sama biblioteka. Ponieważ zaś korzystanie z discovery service jest dla biblioteki kwestią dostępu do pewnej platformy i udostępniania z niej – zgodnie ze swoimi uprawnieniami, licencjami itd. – unikalnego zestawu materiałów dla swoich użytkowników, można przyjąć, że mówimy o przedsięwzięciach rozległych i pojemnych, nadających się nie tylko do pojedynczych co większych książnic, ale i do konsorcjów, regionów i krajów.

I już w tej chwili dyskusja o przydatności takich multiwyszukiarek sięga zenitu, także w Polsce. Kupować gotowe (niektóre od razu z zawartością) czy projektować samemu? I czy naprawdę scalą one nasze zasoby informacji bez szkody dla skuteczności wyszukiwania? Tu można mieć wątpliwości. Dopóki np. korzystamy z ScienceDirect bezpośrednio, możemy z powodzeniem wprowadzać słowa kluczowe artykułów jako frazę do wyszukania. Niestety, w Trove ten mechanizm nie działa. Ale może niebawem zacznie.