BOINC – jedynie ciekawostka?

Łukasz Świerczewski

Większość z nas z pewnością słyszała o superkomputerach – co kilka lub kilkanaście miesięcy można znaleźć informację o rozbudowie polskich systemów obliczeniowych. Okres efektywnego życia takich maszyn jest bardzo krótki, technologia warta dzisiaj dziesiątki tysięcy lub nawet miliony złotych z czasem zostanie wyparta przez rozwiązania z nowszej generacji, które teraz nie zdążyły jeszcze opuścić laboratoriów. Wielu początkujących badaczy zwyczajnie nie stać na zakup oraz eksploatację wydajnych systemów, a często nawet występują trudności z uzyskaniem dostępu do jakichkolwiek zasobów.

Dużą pomocą może okazać się pomysł zastosowania tzw. platform gridowych. Umożliwiają one, przy stosunkowo niskim nakładzie własnym, rozwiązywanie problemów dużej skali, w zakresie znacznie większym niż pozwalają na to wieloprocesorowe stacje robocze lub klastry komputerowe. Do tego typu rozwiązań można zaliczyć BOINC – Berkeley Open Infrastructure for Network Computing, czyli Otwartą Infrastrukturę Przetwarzania Rozproszonego Berkeley. System jest rozwiązaniem z dziedziny obliczeń rozproszonych, które zyskało popularność wśród najlepszych ośrodków badawczych na świecie. Początkowo na platformie działał jedynie słynny już projekt SETI@Home, jednak szybko została ona zaprzęgnięta do pracy przez wiele zespołów naukowych. Całość jest tworzona w Uniwersytecie Kalifornijskim w Berkeley pod kierownictwem dr. Davida Andersona, szefa wcześniej wspomnianego SETI@Home.

Zalety i ograniczenia

W tym momencie powstaje wiele pytań: Czy to wszystko jest legalne i bezpieczne? Czy odczuję spadek komfortu podczas korzystania z komputera (przecież będzie on coś liczył)?

W Internecie nie ma rzeczy całkowicie bezpiecznych. Łącząc się z globalną wioską, potencjalnie zawsze możemy zostać zaatakowani. Korzystanie z BOINC jest uważane jednak za znacznie bezpieczniejsze niż przeglądanie witryn www. Na naszych komputerach zostaną uruchomione aplikacje tworzone przez badaczy, których głównym celem jest poszukiwanie odpowiedzi na pytania nurtujące współczesną naukę. Wszelkie zadania będą miały w naszym systemie najniższy priorytet i zostaną wykonane wręcz niezauważanie w tle. Użytkownik nie odczuje wykonywania dodatkowych operacji, a dotychczas niewykorzystywany potencjał komputera znajdzie swoje zastosowanie. W ten sposób swój mały wkład w rozwój nauki może mieć każdy – bez względu na wiek lub posiadane wykształcenie.

Aktualnie najszybszym jawnym systemem komputerowym jest „Jaguar” Cray XT5-HE, który znajduje się w Oak Ridge National Laboratory. Posiada on 224 162 rdzeni, co daje wydajność praktyczną na poziomie ok. 1,7 PFlops – 1,7 biliarda operacji zmiennoprzecinkowych na sekundę. Według danych udostępnianych przez Berkeley wydajność całej infrastruktury BOINC wynosi ok. 6 PFlops, co ponad trzykrotnie przewyższa możliwości „Jaguara”. Tak olbrzymie możliwości daje 547 717 komputerów udostępnionych przez 305 818 użytkowników.

Oczywiście nie wszystkie problemy można efektywnie rozwiązywać z wykorzystaniem tego typu systemów rozproszonych – największym ograniczeniem jest tutaj sama komunikacja. Wszelkie informacje przesyłane są przez Internet, który z założenia jest bardzo powolny. Problemem jest także niezawodność podłączonych komputerów, które - należy pamiętać - są cały czas maszynami prywatnymi i wcale nie muszą na czas wykonać zleconych im zadań.

Pomimo wielu niedogodności okazuje się, że z bardzo dużym powodzeniem można wykorzystać BOINC do rozwiązywania różnorakich problemów z takich dziedzin jak: matematyka, fizyka, astronomia, biologia i chemia. Już kilka lat temu możliwości technologii przetwarzania siatkowego (ang. grid computing) skusiły brytyjski koncern lotniczo-zbrojeniowy BAE Systems, a kilka korporacji farmaceutycznych miało plany wykorzystać komputery firmowe do zaawansowanych obliczeń. Własne Virtual Campus Supercomputing Center, oparte na platformie UC Berkeley, obecnie posiadają m.in.: CERN, California State University Fullerton, Oxford University, University of Washington, University of Delaware, University of Wisconsin - Milwaukee, Max Planck Institute i Barcelona Biomedical Research Park.

Polska w tyle

W Polsce przetwarzanie rozproszone nie przyjęło się. Żadna polska uczelnia wyższa ani ośrodek badawczy nie stosuje tego typu rozwiązań. Być może wydają się one zbyt mało profesjonalne lub brakuje ludzi, którzy mogliby się tym zająć. W kraju działają tylko trzy prywatne projekty oparte na idei przetwarzania rozproszonego: Enigma@Home (rozszyfrowywanie wiadomości z okresu II Wojny Światowej), DNETC@HOME (łamanie szyfrów z rodziny RC5) i Goldbach’s Conjecture Project (matematyka teoretyczna). W ramach zagranicznego PrimeGrid polski matematyk dr Jarosław Wróblewski prowadzi podprojekt AP26, który obejmuje poszukiwanie ciągu arytmetycznego złożonego z 26 liczb pierwszych. Warto także wspomnieć o stowarzyszeniu Polski Projekt BOINC oraz największym polskim zespole zrzeszającym wolontariuszy wspierających i rozwijających przetwarzanie rozproszone - BOINC@Poland.

Patrząc jednak na wszystko z drugiej strony zauważymy, że gwałtowny postęp techniki doprowadził do tego, że dzisiaj praktycznie każdy ośrodek może sobie pozwolić na zakup wydajnych platform obliczeniowych. Warto tutaj wspomnieć m.in. o powszechnie stosowanych procesorach graficznych i opartych na nich personalnych superkomputerach klasy TESLA, które są potężnym narzędziem w rozwiązywaniu pewnej wąskiej klasy problemów. Daleko nam do światowej czołówki, nie tylko pod względem najszybszych superkomputerów, lecz niekiedy nawet otwartości na najnowsze technologie. Przyjęło się natomiast twierdzenie, że Polacy mają najlepszych informatyków na świecie, które najprawdopodobniej jest zwykłym mitem. Trudno wysuwać takie przypuszczenia na podstawie wydarzeń historycznych, dotyczących głównie złamania szyfru Enigmy lub sukcesów w określonych konkursach, które nijak mają się do dorobku całej tej, jakże bogatej, dziedziny. Informatyków mamy wielu, ale co cechuje tych prawdziwych?

Łukasz Świerczewski, student Instytutu Informatyki i Automatyki Państwowej Wyższej Szkoły Informatyki i Przedsiębiorczości w Łomży, administrator międzynarodowej platformy Goldbach’s Conjecture Project, działającej w ramach struktury przetwarzania rozproszonego danych BOINC, rozwijanej przez Uniwersytet Kalifornijski w Berkeley.