Wiele hałasu o nic?

Władysław Kraus


W artykule Andrzeja Pilca Biologia i biochemia („FA” 11/2006) wyliczono 71 „najczęściej cytowanych polskich publikacji ostatniego dziesięciolecia” z obu dziedzin. Warunek, że powinny to być wyłącznie prace opublikowane w tym dziesięcioleciu, nie wydaje się mieć racjonalnego uzasadnienia. Wśród nich znalazła się praca #9 na liście poniżej, opisująca końcowy etap badań nad strukturą odmian lipoksygenazy z nasion soi (por. lista prac), w których autorom udało się otrzymać krystaliczną postać odmiany L−1 enzymu i ustalić jego strukturę wpierw na poziomie rozdzielczości 2,6 Ă (#7), a potem 1,4 Ă (#9). W rywalizacji brali udział J.C. Boyington, B.J. Gaffney i L.M. Amzel z Johns Hopkins University w Baltimore (Maryland, USA). Ich wyniki (poziom 2,6 Ă) opublikowało „Science” w nr 5113 z 4 czerwca 1993 (vol. 260, s. 1482−1486). Praca dotarła do redakcji 8 lutego, a przyjęto ją do druku 14 maja 1993. „Polska” praca (#7) dotarła do „Biochemistry” dopiero 25 marca, ale nadano jej status accelerated publication, a przyjęty do druku manuskrypt z datą 5 maja 1993 znalazł się w nr 25 z 29 czerwca 1993. Ścigano się zatem wytrwale, ale ostatnie naukowe słowo stanowiła na tym etapie praca #9.

Lipoksygenazy to enzymy występujące powszechnie w organizmach roślinnych i zwierzęcych, zawierające w centrum aktywnym tzw. niehemowy i „niesiarkowy” atom żelaza. Badania trwały kilkanaście lat i obejmowały: ustalenie pierwszorzędowej struktury odmian L−1 i L−2 enzymu jako pierwszych lipoksygenaz (Gen Bank™/ EMBL Data Bank J02795 i J03211 – #1 i #2), wstępne badania krystalograficzne (#3 i #8), heterologiczną ekspresję białka w komórkach bakterii Escherichia coli (#4), identyfikację aminokwasów w bezpośrednim otoczeniu centrum aktywnego (#5) i zmiany jego właściwości po ich wymianie metodami inżynierii genetycznej (#6), a w końcu wspomniane rozwiązanie struktury krystalicznego enzymu (PDB Brookhaven 1YGE – #9, poprzedzone #7). Zdołano również ustalić pewne informacje na temat mechanizmu oddziaływania enzymu z błonami komórkowymi (#10). Wzięło w nich udział (zgodnie z listą prac) 19 osób, z tym że praktycznie we wszystkich etapach brali udział Bernard Axelrod (#9) z Purdue University w West Lafayette (Indiana, USA) i Janusz Steczko z Instytutu Katalizy i Fizykochemii Powierzchni PAN w Krakowie (#10). Dwie inne osoby z Purdue University uczestniczyły w czterech etapach prac (Jack E. Dixon – w początkowej części i Wladek Minor – w badaniach krystalograficznych), pięć osób – w dwu etapach każda, a pozostałych 10 osób było współautorami pojedynczych publikacji. Wyniki publikowano w „Biochemistry” (#4), „Journal of Biological Chemistry” (#3) oraz „Biochemical and Biophysical Research Communications”, „Protein Science” i „Protein Expression and Purification”. Można więc ocenić, że było to wieloletnie współdziałanie (uzależnione od źródeł finansowania na realizację kolejnych etapów).

Lista prac

#1. Shibata D., Steczko J., Dixon J.E., Hermodson M., Yazdaparast R., Axelrod B., 1987, Primary structure of soybean lipoxygenase−1, „J. Biol. Chem.” 262, 10080−10085. A 52, S 165+2.

#2. Shibata D., Steczko J., Dixon J.E., Andrews P.C., Hermodson M., Axelrod B., 1988, Primary structure of soybean lipoxygenase L−2, „J. Biol. Chem.” 263, 6816−6821. A 29, S 134+1.

#3. Steczko J., Muchmore C.R., Smith J.L., Axelrod B., 1990, Crystallization and preliminary X−ray investigation of lipoxygenase−1 from soybeans, „J. Biol. Chem.” 265, 11352−11354. A 4+2, S 18+1.

#4. Steczko J., Donoho G.A., Dixon J.E., Sugimoto T., Axelrod B., 1991, Effect of ethanol and low−temperature culture on expression of soybean lipoxygenase L−1 in Escherichia coli, „Protein Express. Purif.” 2, 221−227. A 26, S 39+2.

#5. Steczko J., Axelrod B., 1992, Identification of the iron−binding histidine residues in soybean lipoxygenase L−1, „Biochem. Biophys. Res. Commun.” 186, 686−689. A 7, S 17+1.

#6. Steczko J., Donoho G.A., Clemens J.C., Dixon J.E., Axelrod B., 1992, Conserved histidine residues in soybean lipoxygenase: functional consequences of their replacement, „Biochem.” 31, 4053−4057. A 29, S 54.

#7. Minor W., Steczko J., Bolin J.T., Otwinowski Z., Axelrod B., 1993, Crystallographic determination of the active site iron and its ligands in soybean lipoxygenase L−1, „Biochem.” 32, 6320−6323. A 60, S 109.

#8. Steczko J., Minor W., Stojanoff V., Axelrod B., 1995, Crystallization and preliminary X−ray investigation of lipoxygenase−3 from soybeans, „Protein Sci.” 4, 1233−1235. A 4, S 4.

#9. Minor W., Steczko J., Stec B., Otwinowski Z., Bolin J.T., Walter R., Axelrod B., 1996, Crystal structure of soybean lipoxygenase L−1 at 1.4 angstrom resolution, „Biochem.” 35, 10687−10701. A 161+6, S 184+6.

#10. Tatulian S.A., Steczko J., Minor W., 1998, Uncovering a calcium−regulated membrane−binding mechanism for soybean lipoxygenase−1, „Biochem.” 37, 15481−15490. A 18, S 18.

Uwaga: po literze „A” – liczby cytowań w „ostatnim dziesięcioleciu”, po „S” – liczby wszystkich cytowań, a po znaku „+” – liczba cytowań z błędami.

Wspólny mianownik

Prace #1−#8 odnotowano jako citing sources w bazie danych SCI®; a #9−#10 – w SCI−EXPANDED™. Cytowania wszystkich prac odnotowano po stronie cited items ostatniej bazy, lecz tylko w przypadku prac #9 i #10 oprogramowanie tej bazy powiązało je (z wyjątkiem 6 podanych z błędami) z właściwymi citing sources. Cytowania prac #1−#7 odnotowano jako cited items SCI®, cytowań pracy #8 tam nie zarejestrowano. W bazie SCI® nie istniał jednak system, który wiązałby rejestrowane w niej cytowania z właściwymi citing sources. Łącznie w obu bazach ~2 proc. z 756 odszukanych cytowań podano z błędami zapisu wykluczającymi powodzenie takiej operacji. Niemożliwe było zatem ustalenie w prosty sposób „polskich” prac, które uzyskały większą od przyjętej jako kryterium wyboru liczbę cytowań. Cytowania w SCI® rejestrowano tylko pod nazwiskiem pierwszego autora. W przypadku czasopism, których objętość przekraczała w roku 9999 stron, nie było możliwe poprawne odnotowanie cytowań do prac drukowanych na stronach 10 000 i dalszych: format zapisu przewidywał na to bowiem tylko cztery miejsca. Opuszczano wtedy „1” stojącą na najstarszym miejscu dziesiętnym. Gdy bezpośrednio po niej występowało jedno lub więcej zer, system je ignorował. Efekty te dotknęły prace #1 i #3: cytowania pierwszej zapisywano jako „SHIBATA−D−1987−J−BIOL−CHEM−V262−P80”, a drugiej – „STECZKO−J−1990−J−BIOL−CHEM−V265−P1352”. Wątpić należy, by osoba nie znająca właściwości struktury zapisu wiązała te cytowania z odpowiednimi pracami.

Z danych w omawianym tekście (pod nr 37) dla pracy #9 wynika, że jako „ostatnie dziesięciolecie” określono w nim lata 1996−2005 w SCI−EXPANDED™. Okres ten nie pokrywa się z kalendarzowymi latami 1996−2005. W tym „bazowym” przedziale czasu odnotowano bowiem także citing sources z numerów czasopism z lat rzeczywistych poprzednich (głównie z 1995), których do końca 1995 roku nie zdołano do bazy wprowadzić, a z drugiej strony z wydanych, z wyprzedzeniem, z 2006 roku, które producent bazy opracował w 2005. Podobnie niektóre dane związane z rzeczywistym rokiem 2005 odnotowane są w bazie w kolejnych latach „bazowych” (głównie 2006). W ten sposób praca #9 uzyskała – w publikacjach związanych nominalnie z latami rzeczywistymi 1996−2005 – 161 cytowań przypisanych do niej przez oprogramowanie bazy oraz 6 innych (3,6 proc. ogólnej liczby, o tyle więcej niż podano w artykule), w przypadku których to się nie udało. Można zatem zidentyfikować w zasobach SCI−EXPANDED™ 167 cytowań tej pracy w publikacjach z lat kalendarzowych 1996−2005. Podany przez autora tekstu warunek umieszczenia na liście („40 cytowań w ostatnim dziesięcioleciu”) spełniają w rzeczywistości trzy z podanych prac (#1, #7 i #9 z odpowiednio 52, 60 i 167 cytowaniami).

Istnieje wątpliwość, czy w stosunku do prac opublikowanych w różnych latach gromadzenie danych z jednego i tego samego przedziału czasowego nie zniekształca wyniku porównań? Czy istnieje zatem sposób „sprowadzenia do wspólnego mianownika” takich danych?

Życie publikacji

Jak wynika z moich obserwacji, konieczne jest w tym celu wzięcie pod uwagę „czasu życia” publikowanych prac w zasobie literatury naukowej, liczonego od roku ich publikacji, a nie czasu kalendarzowego. Ilustruje to rysunek wykonany na podstawie danych dla „10” podanych publikacji oraz blisko 10 tys. cytowań ok. 2 tys. artykułów z podobnego okresu („REF” ze zbiorów piszącego). Dane unormowano do wartości maksymalnych liczb cytowań (_cytaty) oraz ich sum (_kumulacja). Maksymalne liczby cytowań prac (odpowiednio 102 i 1124) obserwowane są w drugim roku „życia” obu kolekcji prac. Do tego momentu kolekcje te „gromadzą” jedynie ok. 25 proc. ogólnej liczby cytowań, które otrzymują w okresie 20 lat. Po ok. 4 latach jest to połowa, a zgromadzenie 3/4 zajmuje 7−8 lat. Można zauważyć, że uzyskują one liczby cytowań na poziomie wyraźnie wyższym niż w roku publikacji przez okres ponad 15 lat. Daje to ogólne wyobrażenie o sytuacji kolekcji prac (dla analizowanych przez piszącego różnych kolekcji prac z dziedziny nauk przyrodniczych, zbierających od kilkuset do kilkudziesięciu tysięcy cytowań obraz jest niemal identyczny – dane nieopublikowane), ale „zachowanie się” poszczególnych prac bywa różne.

Poziom 40 cytowań po upływie 4 lat „życia” wykazywały prace #1, #2, #7 i #9; po 7 latach – również praca #6, a po 15 latach – #4. Po 7 latach ponad 100 cytowań miały prace #1, #2 i #9, a po 10 latach także #6. W omawianym artykule zidentyfikowano tylko jedną z tych prac (#9). To zrozumiałe. Z jednej strony nie wzięto pod uwagę ograniczeń narzuconych przez struktury baz danych, a z drugiej niezbyt fortunnie uznano, że kilkuletnie różnice dat publikacji prac nie mają większego wpływu na ich recepcję.

Dla cytowanej dotąd blisko 170 razy pracy #1 okresowi zbierania danych (32 cytowania) odpowiada jej „wiek” 8−18 lat, do 10. roku „życia” zebrała ich 145. Domniemywać zatem należy, że porównywanie prac o różnym „stażu” w zasobie literaturowym nie jest dobrze uzasadnione metodologicznie. Sprawiło to, że z sześciu często cytowanych prac opisujących ważne badania z aktywnym udziałem Polaków dostrzeżono tylko jedną. Nie da się dowieść, że publikacja tej jednej byłaby możliwa bez wykonania badań opisanych w poprzednich.

Artykuły jako autonomiczne jednostki informacji o określonej dacie publikacji często stanowią tylko część przekazu o przedsięwzięciach badawczych trwających wiele lat. Przypuszczać można, że o liczbie ich cytowań decyduje przede wszystkim znaczenie takich badań w danej dziedzinie nauki. Nie zawsze jednak tak jest. Dobrej jakości dane o strukturze lipoksygenazy są potrzebne do rozpoczętych już obliczeń teoretycznych w celu wyjaśnienia mechanizmu działania enzymu. Stąd jednak pytanie, dlaczego równa co do wartości pracy #7 praca opublikowana w „Science” (wykorzystująca wyniki wcześniejszych „polskich” prac) zbiera o połowę więcej cytowań (221 w latach 1996−2005) niż lepsza z naukowego punktu widzenia praca #9 w „Biochemistry”?

Dr Władysław Kraus, chemik, biotechnolog, były nauczyciel akademicki. nckraus@cyf−kr.edu.pl. Z podziękowaniem dla pracowników Biblioteki Głównej AGH za umożliwienie dostępu do części bazy SCI® oraz zastrzeżeniem, że wyrażone tu poglądy i opinie autora nie stanowią w żaden sposób poglądów i opinii zatrudniającej go instytucji.