Publikowalność naukowa w Polsce

Ryszard Kierzek

Chcąc określić poziom nauki w Polsce i poprawić go, trzeba ustalić stan obecny. Analizy tego typu prowadzą różne instytucje i osoby, często opierając się na odmiennych kryteriach. Wydaje się, że stan polskiej nauki jest taki, jak postrzegają go inni. Nasi naukowcy i ich badania są częścią nauki międzynarodowej i tylko ogólnie przyjęte w świecie oceny badań mogą skutkować obiektywną analizą. Wydaje się, że stan nauki najlepiej opisuje liczba publikacji, częstotliwość ich cytowania oraz parametry będące pochodną ich obu. Cytowanie publikacji świadczy, że wyniki w niej zawarte były wartościowe dla osób cytujących, a autor nie ma wpływu (jeśli pominąć autocytowania) na ten proces.

Przedstawione w niniejszym artykule wyniki analiz uzyskano na podstawie bazy danych Institute of Information (ISI) Web of Knowledge (Thomson Reuters) za lata 1973–2009. Bazę przeszukiwano na podstawie adresu podanego w publikacji. Jeśli w adresie autorów podano słowo kluczowe „Poland”, co świadczyło o afiliacji do polskiej instytucji naukowej, to taką publikację uwzględniano, niezależnie czy adres z Polski był jedynym, czy jednym z wielu. Ograniczenia bazy ISI pozwalają zanalizować dane dotyczące jednorazowo do 10 tys. publikacji. Wymaga to analiz w krótszych okresach, a uzyskanie całościowego obrazu – zsumowania danych cząstkowych. Niestety, taki sposób nie pozwala bezpośrednio określić indeksu Hirscha (indeks H, IH). Można jednak obliczyć ogólną liczbę publikacji, sumę ich cytowań i pokazać pewne tendencje w stosunku do poszczególnych dyscyplin.

Baza danych ISI Web of Knowledge umożliwia podział publikacji według dyscyplin, a dokładnie – według obszarów badań (ang. subject areas ). ISI podaje jednorazowo sto obszarów badań, ułożonych z podaniem odpowiedniej liczby publikacji. Praktycznie wszystkie dyscypliny podzielone są na bardziej specyficzne obszary. System pozwala jednak zsumować poszczególne dane i obliczyć dane sumaryczne do każdej dyscypliny.

W artykule ograniczono się do analiz siedmiu dyscyplin, których wkład w dorobek naukowy Polski jest największy i sumarycznie sięgający 82 proc. i 88 proc., odpowiednio do liczby publikacji i cytowań. Są to: astronomia, biologia, chemia, fizyka, inżynieria materiałowa, matematyka i medycyna. Pozostałe obszary badań, niewchodzące w skład tych dyscyplin, zsumowano i przedstawiono w tabeli jako „łącznie pozostałe dyscypliny”. Przypisanie większości obszarów badań do poszczególnych dyscyplin jest na ogół proste, są jednak takie, do których prawo rościć sobie może więcej niż jedna dyscyplina. W tej sytuacji pewne dyscypliny z pogranicza zostały przez autora arbitralnie zaliczone do jednej z dyscyplin. Na pewno można zrozumieć krytykę takiego przypisania i każdy mógłby podać argumenty za innym przyporządkowaniem. Takie sporne obszary to np. immunologia i neurosciences przypisane do medycyny, biofizyka (biologia), spektroskopia (chemia) czy fizyka matematyczna (fizyka). Żaden kontrowersyjny obszar nie był jednak na tyle liczny w publikacje, że mógłby zmienić całościową analizę określonej dyscypliny.

Kontrowersje budzić może również dokładne określenie przedmiotu analizy – należy zdefiniować, co jest, a co nie jest publikacją. Należało rozstrzygnąć, czy jest nią abstrakt konferencyjny, recenzja książki, korekta artykułu lub notatka bibliograficzna, czy tylko artykuł, praca przeglądowa i komunikat (ang. letters ). Udział tych ostatnich jest dominujący i wynosi od 65 do 90 proc., zależnie od analizowanego okresu i dyscypliny, z której pochodzi. Ostatecznie w tym opracowaniu zdecydowano się na analizę pełnych danych oraz osobno zawierających jedynie artykuły, prace przeglądowe i komunikaty.

Kolejne ograniczenie wynika z tego, że baza ISI przypisuje część publikacji więcej niż do jednego obszaru badań. Analizę danych przedstawioną w artykule przeprowadzono na dwa sposoby. W pierwszym analizowano bazę rok po roku, wyszukując publikacje jedynie według adresu „Poland”. W drugim prowadzono badanie dłuższych okresów; pierwszej selekcji dokonywano również według adresu „Poland”, a następnie wybrano z tej puli i zsumowano obszary (subject areas ) przypisane siedmiu wybranym dyscyplinom. Rozbieżności wynosiły około 12 proc. na korzyść drugiego sposobu. Także możliwość przypisania określonej publikacji do dwóch obszarów może się pojawić podczas analizy według sposobu drugiego.

Pełne tabele zamieszczono na stronie internetowej Instytutu Chemii Bioorganicznej PAN (www.ibch.poznan.pl).

Analiza ogólna

W badanym okresie liczba publikacji w przybliżeniu rosła liniowo, z pewnymi okresami fluktuacji nakładającymi się na zaburzenia polityczne. Intensywny wzrost liczby publikacji i ich cytowań obserwuje się od 1995 roku. W roku 2008 nastąpił jednorazowy, skokowy wzrost liczby publikacji (o około 40 proc.), który poprzedzał trzyletni okres zahamowania. Analizę w przypadku obu elementów przeprowadzono w dwóch wariantach. W pierwszym liczono tylko artykuły, prace przeglądowe i komunikaty, w drugim – wszystkie formy publikowania wyników.

Analiza form publikowania prac w Polsce prowadzi do następujących spostrzeżeń:

1. Najobszerniejszą kategorią publikacji naukowych są artykuły. Stanowią one ponad 76 proc. wszystkich publikacji i są źródłem największej liczby cytowań (około 88 proc.).

2. Mniej więcej od połowy lat 90. intensywnie zaczyna rosnąć liczba streszczeń konferencyjnych (meeting abstractsproceedings papers ). Ich udział procentowy w ciągu ostatnich pięciu lat stanowił 30–40 proc. wszystkich publikacji. Szczególnie duży jest w medycynie (43,7 proc.) i fizyce (33,1 proc.), a najniższy w matematyce (16,6 proc.). Częstotliwość cytowania tego typu prac jest niska, 5–10 razy niższa niż przeciętnego artykułu.

3. W Polsce opublikowano tylko 15 prac, które cytowane były więcej niż tysiąc razy i 78 prac, które cytowane były więcej niż 500 razy (w tym 15 prac cytowanych więcej niż tysiąckrotnie). Jest to pięć razy mniej niż średnio w świecie, gdzie prace cytowane powyżej tysiąc razy stanowią 0,025 proc., a powyżej 500 razy - 0,107 proc. wszystkich prac. Przeciętna polska publikacja z lat 1973–2009 cytowana była 7,47-krotnie.

W wybranych dyscyplinach

Publikowalność jako miara poziomu naukowego pokazuje zróżnicowanie dyscyplin. Wynika to z liczby naukowców pracujących w danej dyscyplinie, a także z historycznie ukształtowanego poziomu naukowego. Uczeni pracujący w astronomii, biologii, chemii, fizyce, inżynierii materiałowej, matematyce i medycynie publikują szczególnie dużo prac. W tabeli zebrano sumaryczne dane o liczbie publikacji i cytowań w wymienionych dyscyplinach. Duża liczba publikacji sprawia, że obecna forma bazy ISI nie pozwala jednorazowo zanalizować danych z każdej dyscypliny za cały okres. Dlatego przeszukiwano bazę w 1–8-letnich przedziałach czasowych, tak aby liczba publikacji pochodząca z dyscypliny o najwyższej ich liczbie (najczęściej była to chemia) była mniejsza niż 10 tys. To uniemożliwia bezpośrednie określenie wartości indeksu H do każdej dyscypliny za cały analizowany okres, a jedynie za okresy cząstkowe. Porównanie zmian liczby publikacji i cytowań z siedmiu dyscyplin pozwala ocenić tendencje zmian w ostatnich 36 latach.

Spojrzenie na polską naukę przez pryzmat dyscyplin dostarcza interesujących obserwacji. Oczywiście można się spodziewać zarzutów, że ISI ogranicza bazę do czasopism z listy filadelfijskiej. Należy jednak pamiętać, że obejmuje ona ponad 6 tys. najlepszych czasopism ze wszystkich dyscyplin. Jest też prawdą, że procentowy udział czasopism z listy filadelfijskiej wobec tych, które są wydawane, zależy od dyscypliny. Nikt też nie kwestionuje, że różne dyscypliny stosują odmienne formy upowszechniania wyników badań i nie zawsze są to artykuły, prace przeglądowe czy komunikaty.

Najwięcej publikacji pochodzi z astronomii, biologii, chemii, fizyki, inżynierii materiałowej, matematyki i medycyny. Łącznie ukazało się 366 684 publikacji, z czego 301 555, czyli 82,2 proc., pochodziło z tych dyscyplin. Istnieje problem prostego określenia udziału liczby cytowań, gdyż od roku 1999 liczba polskich publikacji przekracza rocznie 10 tys. i bezpośrednia analiza, która podałaby liczbę cytowań, nie jest możliwa, a manualne ich zliczanie jest nieracjonalne. Analizę cytowań przeprowadzono również przeszukując bazy danych z podziałem na dyscypliny. W tamtym okresie polskie publikacje cytowane były 2 737 797 razy, z czego prace z astronomii, biologii, chemii, fizyki, inżynierii materiałowej, matematyki i medycyny cytowane były łącznie 2 409 552-krotnie (88 proc. całości).

Sporo ciekawych obserwacji daje bardziej szczegółowe porównanie prac pochodzących z owych wiodących dyscyplin. Interesujących informacji dostarcza skonfrontowanie liczby publikacji z liczbą pracowników z danej dyscypliny. Zwykle przyjmuje się, że liczba publikacji jest proporcjonalna do liczby pracowników w danej dyscyplinie. Jednak porównanie takich parametrów, jak: średnia cytowań publikacji, indeks H czy zmodyfikowany indeks H, pokazuje, że są one w małym stopniu uzależnione od liczby naukowców, a bardziej od wartości naukowej publikacji. Wydaje się, że bardziej prawidłową zależność liczby pracowników i publikacji obserwuje się jedynie w obrębie tej samej dyscypliny. Dane z owych siedmiu dyscyplin zestawiono w tabeli.

Prześledźmy, jak w latach 1973–2009 zmieniała się liczba publikacji i cytowań oraz indeks H w różnych dyscyplinach.

Liczba publikacji . We wszystkich analizowanych okresach najwięcej publikacji dostarczała chemia, jakkolwiek w ostatnich latach liczba publikacji we wszystkich dyscyplinach (zwłaszcza w medycynie, inżynierii materiałowej i astronomii) szybko rośnie. Obserwacja ta dotyczy zarówno przypadku, kiedy do puli wliczane są tylko artykuły, prace przeglądowe i komunikaty, jak również wtedy, gdy uwzględniane są wszystkie formy publikacji. W niektórych dyscyplinach (szczególnie medycynie, fizyce i inżynierii materiałowej) materiały konferencyjne (meeting abstracts i proceeding papers ) stanowią dużą cześć wszystkich publikacji. Jest tak prawdopodobnie dlatego, że większa liczba pracowników uczestniczy w konferencjach.

Liczba cytowań . Zebrane w tabeli liczby uwzględniają także autocytowania, które – według wcześniejszych analiz – stanowią zwykle 30–40 proc. cytowań. Większy ich procent obserwuje się, gdy prace publikują kilkudziesięcio- lub kilkusetosobowe grupy z wielu instytucji. Szczególnie często zdarza się tak w medycynie i fizyce jądrowej, czasami w astronomii, prace takie nie dominują jednak w żadnej dyscyplinie i nie zaburzają całościowej analizy. Liderami są fizyka (678 364 cytowania; 24,9 proc. całości) i chemia (649 056; 23,7 proc.). Jeśli porównać średnią cytowania pojedynczej publikacji, to absolutnym liderem jest astronomia (15,49). Wysoką średnią cytowań mają także fizyka (9,60), biologia (8,95) i chemia (7,64). Dla przypomnienia, w przypadku Polski w latach 1973–2009 średnia cytowań pojedynczej publikacji wynosi 7,47.

Indeks Hirscha . Obliczenie w sposób bezpośredni IH z wszystkich polskich publikacji czy owych siedmiu dyscyplin za okres 1973–2009 jest utrudnione. Wynika to z ograniczeń bazy ISI. Umożliwia ona jedynie dokładne określenie IH dla określonych przedziałów czasowych. We wszystkich analizowanych szczegółowo przedziałach czasowych fizyka ma najwyższy indeks H, a chemia, biologia, medycyna i astronomia ma nieco niższą i na podobnym poziomie wartość IH. Stosując bardziej pracochłonną metodę, określono także wartość IH w astronomii, biologii, chemii, fizyce, inżynierii materiałowej, matematyce i medycynie oraz łącznie w pozostałych dyscyplinach. Podobnym sposobem określono wartości IH wszystkich prac opublikowanych wtedy w Polsce. Wartości te zostały podane w tabeli. Najwyższym IH poszczycić się może fizyka (194). Wartości w medycynie, chemii i biologii są na podobnym poziomie i wynoszą odpowiednio 155, 139 i 136. IH w astronomii to 111, a w matematyce i inżynierii materiałowej – 69. Pozostałe dyscypliny łącznie uzyskały wartość IH równą 123, natomiast w stosunku do wszystkich polskich publikacji wynosi on 260. Znaczy to, że z 366 684 polskich publikacji (z afiliacją do instytucji naukowej w Polsce), jedynie 260 cytowanych było co najmniej 260 razy. Nie jest to wartość, która może zadowalać. Na przykład badacze z University of Rochester, klasyfikowanego jako 30–35 uczelnia w USA, w tym samym czasie opublikowali 76 902 prace, których wartość IH wynosi 337; dodatkowo 44 publikacje pochodzące z tej uczelni cytowane było ponad tysiąc razy, a 170 – ponad 500 razy.

Bardzo ciekawie wygląda przyjrzenie się zmodyfikowanemu indeksowi Hirscha (hm). Porównuje on liczbę publikacji (N) i wartość IH (h) według zależności hm = h/N0.4. Zmodyfikowany IH jest szczególnie wysoki (3,40) w astronomii, niższy w fizyce, medycynie i biologii. Wysoka wartość tego indeksu świadczy, że publikacje z tej dyscypliny są szczególnie dobrze cytowane, mimo umiarkowanej ich liczby. Koreluje to w dużym stopniu z wartością cytowania średniej publikacji, która w astronomii jest „astronomicznie” wysoka (15,49), czyli ponad dwukrotnie wyższa niż we wszystkich polskich publikacjach. Natomiast suma cytowań prac wliczanych do IH lub pierwiastek z tej wartości (indeks R) czy średnia cytowania pracy wliczanej do indeksu Hirscha (indeks A) informuje o cytowalności tej grupy publikacji. Duża wartość tych parametrów w fizyce, chemii i medycynie dobrze koreluje z udziałem prac z tych dyscyplin na liście prac cytowanych przynajmniej 500 razy.

Ciekawe wnioski wysnuć można z porównania liczby pracowników pracujących w danej dyscyplinie. Obliczenie „średniej liczby publikacji na osobę” jest ułomne, gdyż obejmuje obecną grupę pracowników. Prawdopodobnie w ostatnich 36 latach proporcje między grupami uczonych analizowanych dyscyplin były podobne. „Średnia liczby publikacji na osobę” pokazuje wyjątkowo wysoką publikowalność astronomów, a także chemików, fizyków i osób z dziedziny inżynierii materiałowej.

Trudno w prosty sposób skomentować przedstawione dane. Poza tym nie jest celem tego artykułu antagonizowanie uczonych z poszczególnych dyscyplin. Oczywiście należy wspierać w różny sposób całą naukę w Polsce, wszyscy jednak wiemy, że dobry gospodarz szczególnie dba o te kury, które znoszą „złote jaja”.

Prof. dr hab. Ryszard Kierzek, chemik, jest kierownikiem Pracowni Chemii RNA w Instytucie Chemii Bioorganicznej PAN w Poznaniu. Sumaryczne zestawienie liczby publikacji i cytowań w Polsce w różnych dyscyplinach w latach 1973–2009Dyscyplinanaukowa Liczba publikacji Liczba cytowań Średnia cytowań Liczba publikacji Liczba cytowań Średnia cytowań Indeks Hirscha Modyfikowany indeks Hirscha Suma cytowań prac wliczanych do indeksu Hirscha Średnia cytowania publikacji wliczanych do indeksu Hirscha (Indeks A) Pierwiastek z sumy cytowań prac wliczanych do indeksu Hirscha (Indeks R) Profesor Doktor habilitowany Doktorzy Razem Średnia publikacji na osobę Publikacje obejmujące jedynie artykuły, prace przeglądowe i komunikaty Publikacje obejmujące wszystkie formy 1 Pracownicy naukowi 2 Chemia 70804 578928 8.18 84917 649056 7.64 139 1.60 38139 274.4 195.3 915 769 5036 6720 12.64 Fizyka 51189 592191 11.57 70659 678364 9.60 194 2.54 66948 345.1 258.7 906 928 3794 5628 12.55 Biologia 31662 326576 10.31 38872 347796 8.95 136 2.15 31163 229.1 176.5 1365 1096 7005 9466 4.11 Medycyna 42005 402265 9.58 64403 440424 6.84 155 2.19 44634 288.0 211.3 2032 1302 14316 17650 3.65 Astronomia 6079 102911 16.93 6838 105918 15.49 111 3.40 24387 219.7 156.2 60 64 169 293 23.34 Matematyka 14596 71711 4.91 16405 77518 4.73 69 1.49 8862 128.4 94.1 491 565 2618 3674 4.47 Inżynieria materiałowa 11737 78901 6.72 19461 110476 5.68 69 1.63 7867 114.0 88.7 301 256 1302 1859 10.47 Pozostałe dyscypliny – łącznie 51246 281400 5.49 65129 328245 5.04 123 1.46 23343 189.8 152.8 13164 11320 69865 64349 1.01 Polska – wszystkie dyscypliny 279318 2434883 8.71 366684 2737797 7.47 260 1.55 119503 459.6 345.7 18792 16300 104105 139197 2.63 1 – obejmuje także notes, meeting abstracts, proceeding papers, editorial materials, book review, corrections, bibliographic item, news item; 2 – na podstawie danych Ośrodka Przetwarzania Informacji (OPI)