Informatyczne wsparcie nauki

Cztery polskie klastry obliczeniowe znalazły się w najnowszym światowym zestawieniu superkomputerów Top 500, aktualizowanym dwa razy do roku. Najwyższe, 84. miejsce zajął Zeus Akademickiego Centrum Komputerowego Cyfronet Akademii Górniczo-Hutniczej, z mocą 88 teraflopsów (88 bilionów zmiennoprzecinkowych operacji na sekundę). Od czerwca Zeus awansował o 77 pozycji.

Na dalszych miejscach uplasowały się: gdańska Galera (297), poznański Reef (313) i wrocławska Supernova (372). Na liście nie zabrakło również liczących ponad tysiąc serwerów farm komercyjnych portali internetowych. Nk.pl może pochwalić się 185., a Allegro.pl – 249. lokatą. Pod względem liczby superkomputerów Polska jest więc dziewiątym krajem na świecie i piątym w Europie, za Niemcami, Francją, Wielką Brytanią i Rosją. Jest to efekt systematycznej rozbudowy infrastruktury informatycznej, współfinansowanej przez Ministerstwo Nauki i Szkolnictwo Wyższego oraz władze samorządowe, przy wykorzystaniu funduszy unijnych.

Niewątpliwy sukces Polski stał się okazją do spotkania wiceminister nauki prof. Marii Elżbiety Orłowskiej z przedstawicielami centrów superkomputerowych, naukowcami wykorzystującymi moc obliczeniową najsilniejszych maszyn i reprezentantami firm informatycznych; konferencja odbyła się w Warszawie 25 listopada 2010 roku. Sekretarz stanu w MNiSW zapewniła, że resort nadal będzie wspierać tworzenie informatycznych klastrów, „abyśmy mogli liczyć się w nauce europejskiej i tej raz zdobytej pozycji w technologiach superkomputerowych nie utracić”. Prof. Orłowska obiecała, że podczas polskiego przewodnictwa w radzie Unii Europejskiej, które rozpocznie się w lipcu 2011 roku, odbędzie się wiele dyskusji na temat budżetu przeznaczanego na naukę i infrastrukturę badawczą, w tym informatyczną.

Duża moc, duże pieniądze

W Polsce komputery dużej mocy (KDM) działają w Gdańsku, Krakowie, Poznaniu, Warszawie i Wrocławiu. Wsparcie komputerów dużej mocy obliczeniowej dla nauki jest jednym z priorytetów MNiSW wskazanym w Programie rozwoju infrastruktury informatycznej nauki na lata 2007-2013, który ma na celu m.in.: utrzymanie ośrodków KDM jako centrów usług i obliczeń dużej mocy, składowania dużych zasobów danych, w tym wieloletnich serwisów typu biblioteki cyfrowe nauki, naukowych baz danych, infrastruktury gridowej oraz oprogramowania naukowo-badawczego. To zadanie MNiSW realizowane jest w ramach środków dostępnych w budżecie nauki oraz z funduszy strukturalnych.

Utrzymywanie centrów superkomputerowych oznacza zarówno inwestowanie w rozwój mocy obliczeniowej i pamięci masowej, jak i pokrywanie wysokich kosztów eksploatacji, choćby energii potrzebnej do chłodzenia urządzeń. Na KDM przeznacza się pieniądze z budżetu państwa i funduszy strukturalnych. W ostatnich 2 latach funkcjonowanie pięciu ośrodków pochłonęło prawie 42 mln zł z budżetu na naukę. Cała e-infrastruktura w 2010 roku kosztowała budżet około 238 mln zł. Dużo więcej wydano z Funduszu Nauki i Technologii Polskiej. Minister Orłowska przypomniała, że 2 proc. środków pochodzących z prywatyzacji polskich przedsiębiorstw nasze państwo przeznacza na infrastrukturę, a z tego 15 proc. na infrastrukturę informatyczną.

Na rozwój i modernizację infrastruktury MNiSW wyasygnowało dodatkowo 259 mln euro z Programu Operacyjnego Innowacyjna Gospodarka. W trzech konkursach (rozwój infrastruktury informatycznej nauki, rozwój zasobów informacyjnych nauki w postaci cyfrowej, rozwój zaawansowanych aplikacji i usług teleinformatycznych) z otrzymanych 193 wniosków ministerstwo sfinansowało 60 projektów. Największym z nich jest PL-Grid z budżetem około 80 mln zł (szerzej na temat projektu pisał prof. Kazimierz Wiatr w numerze 9/2010 FA), innym – POWIEW (55 mln), którego celem jest tworzenie rozwiązań do najnowszych i przyszłych architektur obliczeniowych.

Współpraca – nasz największy atut

Charakterystyczną cechą owych projektów jest działanie w ramach konsorcjów. W PL-Grid pracują razem Akademickie Centrum Komputerowe Cyfronet AGH, Interdyscyplinarne Centrum Modelowania Matematycznego i Komputerowego (ICM), Poznańskie Centrum Superkomputerowo-Sieciowe przy Instytucie Chemii Bioorganicznej PAN, Centrum Informatyczne Trójmiejskiej Akademickiej Sieci Komputerowej oraz Wrocławskie Centrum Sieciowo-Superkomputerowe. POWIEW tworzą trzy pierwsze instytucje, a w konsorcjum Pionier (sieć optyczna z ponad pięcioma tysiącami kilometrów światłowodów) znajdują się aż 22 ośrodki naukowe.

Prof. Kazimierz Wiatr uznał ową umiejętność porozumienia i wspólnego działania za najważniejszą przyczynę sukcesów. – W publikacjach socjologicznych pisze się, że jednym z czterech kryteriów, które będą wpływały na rozwój kapitału intelektualnego, a tym samym na rozwój gospodarki jest umiejętność społecznego współdziałania. To nasz największy kapitał, resztę można kupić – przekonywał dyrektor krakowskiego Cyfronetu. Zdaniem inż. Pawła Gepnera z Intela współpraca centrów, które jednocześnie na wielu polach rywalizują ze sobą, jest w skali europejskiej wyjątkowa. Dr Gepner przypomniał, że Polacy są cenieni na rynku informatycznym, zajmują wysokie stanowiska w amerykańskich centrach obliczeniowych: – Myślę, że pod tym względem zajmujemy nawet wyższą pozycję niż 8. w świecie – dodał.

Współpraca oznacza jeszcze coś innego. Superkomputery pozwalają aktywnie włączać się w pracę zespołów międzynarodowych, bez czego nie istnieje współczesna nauka. Prof. Jacek Kitowski z Cyfronetu przyznawał: – Potencjalni partnerzy projektów unijnych pytają, co wniesiemy aportem oprócz wiedzy. Możemy zaoferować możliwość korzystania z infrastruktur lokalnych i nasze duże moce obliczeniowe. W opinii dr. Macieja Stroińskiego z Poznańskiego Centrum Superkomputerowo-Sieciowego to połączenie (najlepsze wyposażenie plus wspólne działanie) pozwala nam uczestniczyć w najważniejszych projektach europejskich związanych z Internetem przyszłości (GÉANT, FEDERICA etc.). Pięć centrów KDM uczestniczy też w budowie europejskiego superkomputera nowej generacji (PRACE).

Służebne centra obliczeniowe?

Na komputerach dużej mocy prowadzi się wyrafinowane obliczenia, co widać na przykładzie użytkowników PL-Grid. Biolodzy analizują krótkie sekwencje DNA i modelują proces zwijania białek, chemicy badają oddziaływania między cząsteczkami, fizycy gromadzą dane z CERN. Najbardziej skomplikowany projekt Zeusa to symulacja działania nowego leku grzybobójczego. – Na zwykłej sieci komputerów PC obliczenia trwałyby 165 lat – oszacował prof. Wiatr. Prof. Marek Niezgódka z Interdyscyplinarnego Centrum Modelowania Matematycznego i Komputerowego UW dodał, że połączenie eksperymentu z obliczeniami wielkoskalowymi oznacza nieprawdopodobne przyspieszenie procesu badawczego i aplikacyjnego.

Wśród debatujących pojawił się dylemat: czy zacząć od rozwoju infrastruktury, a wtedy pojawią się pomysły na badania, czy może czekać na ludzi ze świetnymi ideami i dopiero dla nich „stawiać” superkomputery? Uznano, że najbezpieczniejsze jest zbalansowanie obu elementów. Jednak w sytuacji, gdy nauka staje się wyścigiem, a różnica w opublikowaniu artykułu między konkurującymi ze sobą zespołami coraz częściej wynosi zaledwie kilka dni, nie można doprowadzić do sytuacji, w której są pomysły, a brakuje zasobów.

Zdaniem prof. Wiatra u podstaw sukcesu w rankingu Top 500 leżą wszystkie badania prowadzone na najpotężniejszych komputerach: – Nasza rola jest usługowa, służebna, najważniejsze są prowadzone badania . Potwierdza to przykład prof. Tadeusza Krygowskiego, tegorocznego laureata nagrody FNP, który ogromną większość swych wyników osiągnął dzięki obliczeniom wykonywanym w ICM. – Idea, która towarzyszyła powołaniu w Polsce całego programu strategicznego rozwoju infrastruktury informatycznej nauki na początku lat 90., a wtedy często kontestowana, brzmiała tak: nie sama sieć tworzy naukę, choć jest niezwykle potrzebnym narzędziem, ale badania naukowe, które dopiero dzięki takiej infrastrukturze mogą być podejmowane w kraju lub we współpracy z czołowymi ośrodkami – przypomniał prof. Niezgódka. Dyrektor ICM sądzi zresztą, że to infrastruktura obliczeniowa stała się pierwszym składnikiem infrastruktury badawczej na dużą skalę, który pozwolił podejmować w Polsce badania konkurencyjne w skali światowej.

Pięć ośrodków, które tworzą konsorcjum PL-Grid, reprezentuje środowiska naukowe, które dostarczają ponad 75 proc. publikacji w czasopismach o najwyższej randze. Prof. Kitowski stwierdził, że PL-Grid był wyjściem naprzeciw tym środowiskom w zakresie obliczeniowym. Jednocześnie centra KDM same tworzą naukę. W przyjętych klasyfikacjach, obok badań teoretycznych i eksperymentalnych, wymienia się nauki obliczeniowe (computational science); przy Komisji Informatyki PAN działa zespół im dedykowany. Według prof. Niezgódki obecność naukowców, którzy potrafią być twórczymi partnerami dla zespołów naukowych z mniejszym doświadczeniem w obliczeniach, jest jedną z najważniejszych wartości ośrodków superkomputerowych. – Umiejętność integrowania wiedzy z odpowiednich dziedzin z implementacją komputerową to jedna z podstawowych spraw w dzisiejszej nauce. To nie tylko usługa, ale i kreowanie nowych metodologii badawczych – mówił.

Wszystko płynie

Najmocniejszym komputerem świata na liście Top 500 jest chiński Tianhe-1A, osiągający szybkość ponad 2,5 petaflopsów (2,5 biliarda obliczeń na sekundę, 1015); w poprzednim, czerwcowym zestawieniu zajął miejsce siódme. Moc krakowskiego Zeusa to dzisiaj ponad sto teraflopsów (1014), podczas gdy w listopadowym rankingu było ich 88. To pokazuje, jak szybko zmienia się obliczeniowy świat.

– Na podstawie przetasowań na liście widać dokładnie, kto inwestuje w informatykę i kto ma kadry zdolne podjąć wyzwania technologiczne – mówiła prof. Maria Elżbieta Orłowska. W tym kontekście awans Polski cieszy. Jednak choć nasze zasoby obliczeniowe rosną, to moc mamy wciąż dużo mniejszą niż Francja, Wielka Brytania czy Niemcy. Krzysztof Góźdź z Hewlett-Packard skonstatował, że najsilniejszy polski system osiąga zaledwie 2 proc. wydajności największego systemu na świecie i 8 proc. największego systemu w Europie. Sumaryczna wydajność polskich KDM to niecałe 300 teraflopsów, a to stanowi mniej niż 0,6 proc. łącznej wydajności wszelkich systemów na liście, pochodzących z 30 krajów. Dr Stroiński dodał, że cztery komputery reprezentujące polską naukę osiągają zaledwie 0,45 proc. sumarycznej mocy Top 500, a wtedy jako kraj spadamy na 14. miejsce w świecie i pozostałe kraje europejskie z listy nas wyprzedzają. Trzeba także pamiętać, że Finlandia, Hiszpania czy Holandia, których w najświeższym zestawieniu brakuje, budują „petakomputery” i z pewnością nas prześcigną. – Naszym celem jest, by użytkownicy mogli być maksymalnie blisko wielkich wyzwań, które stoją przed naukami obliczeniowymi, a te wyzwania, to czasem 20, 50 czy 80 lat obliczeń – powiedział dr Stroiński, a prof. Wiatr przyznał, że trzeba nadążać za potrzebami klientów, zwiększać moce obliczeniowe, a jednocześnie w pełni wykorzystywać możliwości superkomputerów.

Pewnie nigdy nie będziemy konkurować mocą komputerów naukowych z Chińczykami i Amerykanami, ale naszą siłą może być powszechność i dostępność. Wirtualna Biblioteka Nauki, akademickie sieci miejskie, usługi archiwizacyjne, naukowa interaktywna telewizja HD, wideokonferencje – mamy się czym pochwalić. – Zamiast wciąż wyrównywać szanse, promujmy nasze sukcesy – zachęcali uczestnicy konferencji. Najnowszy ranking Top 500 z pewnością takim sukcesem jest. ☐