Czy komputer widzi więcej niż człowiek?

Publikujemy artykuł, który zajął pierwsze miejsce w V konkursie „Skomplikowane i proste. Młodzi uczeni o swoich badaniach”. Jacek Śmietański


Zanim spróbuję odpowiedzieć na tytułowe pytanie, chciałbym sprawdzić, drogi Czytelniku, Twój wzrok. Spójrz niżej i zastanów się – co przedstawia Rysunek 1?

Rysunek 1. Co to jest?

Wzrok – jeden z najważniejszych zmysłów człowieka. Jak działa? Dlaczego widzimy? Jak powstaje obraz? Te pytania od lat były zmorą uczonych. I choć dzisiaj wiemy już bardzo dużo o budowie oka i o procesie widzenia, wciąż jest to zjawisko fascynujące i tajemnicze.

Metoda perfuzji

Czytałem niedawno rozważania filozoficzne na temat procesu widzenia. Autor stwierdza, że tak naprawdę widzimy nie to, co w rzeczywistości przedstawia obraz, ale to, co chcemy na nim zobaczyć. Postrzeganie uzależnione jest od doświadczenia, wcześniej widzianych obrazów, a także od kontekstu, w jakim dany obraz jest oglądany.

Wróćmy do rysunku. Zdjęcie przedstawia prostatę, czyli gruczoł krokowy. Wykonano je podczas badania rezonansu magnetycznego. Czy takie, drogi Czytelniku, było Twoje przypuszczenie?

Nawet jeśli wiemy, co przedstawia obraz, jego interpretacja może przysporzyć sporych trudności. I to nie tylko kwestia niezbędnej wiedzy i doświadczenia (obraz prostaty może zrozumieć tylko doświadczony lekarz radiolog), ale też indywidualnych możliwości. Wszak każdy człowiek nieco inaczej odbiera barwy, reaguje na kontrast czy oświetlenie. A obiekty, których szukamy na obrazie, wcale nie muszą mieć wyraźnych krawędzi ani kolorów łatwo odróżnialnych od tła. Problem staje się tym poważniejszy, gdy mamy do czynienia z obrazami medycznymi. Na naszym obrazie szukamy nowotworu. Niepoprawna interpretacja takiego zdjęcia, np. niezidentyfikowanie widocznych oznak raka, może prowadzić do bardzo poważnych komplikacji, nawet do śmierci pacjenta. I takie sytuacje niestety się zdarzają.

Tylko w 2006 r. w Polsce z powodu raka prostaty zmarło blisko 4000 mężczyzn, a liczba zachorowań z roku na rok wzrasta. Nowotwór ten jest wyjątkowo zdradziecki. Rozwija się bezobjawowo nawet przez kilkanaście lat. Gdy pojawią się symptomy choroby, jest już zwykle za późno na podjęcie skutecznych działań. Tymczasem wcześnie wykrytego raka można z powodzeniem leczyć. Dlatego tak dużo ostatnio się słyszy o konieczności regularnego wykonywania badań profilaktycznych. Niestety, nie zawsze to wystarcza. Obecnie stosowane metody diagnostyczne cechują się dosyć niską skutecznością. Aby zatem możliwe było uzyskanie jednoznacznej i pewnej diagnozy, także w zbyt trudnych obecnie do zdiagnozowania przypadkach, konieczne jest opracowanie nowych, lepszych metod badania.

Taką metodą może być perfuzyjna tomografia komputerowa. W efekcie klasycznego badania tomograficznego uzyskuje się obraz anatomiczny wybranego fragmentu ciała. Jednak na takim obrazie trudno dostrzec patologiczne zmiany w obrębie gruczołu krokowego. Dlatego zwykła tomografia w diagnozie wczesnego raka prostaty jest mało przydatna. Z pomocą przychodzi opcja perfuzji. W badaniu perfuzyjnym możemy zobrazować nie tylko budowę, ale też funkcjonowanie diagnozowanego narządu. Liczne badania wykazały, że rozwijający się rak zużywa ogromne ilości energii. Istniejące w tkance naczynia krwionośne są niewystarczające, aby dostarczyć do komórek nowotworowych odpowiednią ilość składników odżywczych. Dlatego w sąsiedztwie komórek rakowych tworzą się dodatkowe naczynia. W efekcie w obszarze zaatakowanym przez nowotwór zwiększa się przepływ krwi. Ponadto te nowe, nieprawidłowe naczynia nie są zbyt szczelne. Owe parametry – przepuszczalność naczyń, wielkość i czas przepływu krwi można zmierzyć, wykonując badanie perfuzyjne.

W czym więc problem? Mamy metodę wykrywającą zwiększony przepływ krwi. Wiemy, że w miejscach o zwiększonym przepływie należy spodziewać się nowotworu. Brzmi wspaniale! Niestety, rzeczywistość okazuje się bardziej skomplikowana. Prostata jest narządem niezwykle słabo ukrwionym. Różnice w przepływie krwi mogą być niewielkie, zbyt małe do zarejestrowania przez tomograf. A nawet jeśli zostaną one wychwycone, problemem może się okazać zbyt niska rozdzielczość urządzenia, co powoduje, że obraz staje się niewyraźny. Kolejną trudność stanowi możliwa niejednoznaczność wyniku – zwiększony przepływ krwi występuje również w łagodnym rozroście stercza. Tym niemniej zostały przeprowadzone badania kliniczne, w których udało się wskazać lokalizację raka prostaty właśnie podczas badania perfuzyjnego, w sytuacji gdy tradycyjnie stosowane metody zawiodły.

Algorytm AI

Perfuzyjne obrazy prostaty są niezmiernie trudne w interpretacji. Łatwo tu o pomyłkę, błąd w diagnozie. A przy tak ważnym badaniu, gdzie od podjęcia właściwej decyzji zależeć może los pacjenta, konieczna jest szczególna uwaga i precyzja. Pojawił się więc pomysł, aby do interpretacji obrazów zatrudnić komputery. Tylko czy bezduszna, bezrozumna maszyna będzie w stanie pokazać lekarzowi, w którym miejscu znajduje się nowotwór?

Podczas studiów informatycznych zafascynowały mnie zagadnienia sztucznej inteligencji. I choć mrzonki o maszynie myślącej, samodzielnie podejmującej wszystkie decyzje, należy włożyć między bajki, to jednak w wielu dziedzinach istnieją urządzenia, które nie tylko wykonują z góry zaplanowany algorytm, ale też potrafią rozwiązywać problemy decyzyjne. Mamy np. systemy interpretujące zdjęcia satelitarne (wykorzystywane w przewidywaniu pogody). Coraz bardziej udoskonalane są urządzenia rozpoznające pismo czy mowę. Systemy sztucznej inteligencji obecne są także w życiu codziennym. Każdy z nas chyba miał do czynienia z „inteligentną” sygnalizacją świetlną.

Czy techniki sztucznej inteligencji można wykorzystać w medycynie? Naturalnie. Powstały już liczne prace na ten temat oraz wiele programów komputerowych wspomagających decyzję lekarza. Ponieważ jednak w różnych technikach diagnostyki obrazowej otrzymywane zdjęcia mają inny charakter i różnie się je interpretuje w zależności od diagnozowanego narządu, to nie udało się opracować uniwersalnej metody sprawdzającej się we wszystkich problemach. Wielu twierdzi zresztą, że to niemożliwe.

Ale może da się opracować algorytm, który pomógłby w interpretacji perfuzyjnych obrazów prostaty? Taki jest cel mojej pracy.

Koło ratunkowe

Analizowane obrazy to zbiór kolorowych plamek. Brak na nich wyraźnych, łatwo identyfikowalnych obiektów, które można by utożsamiać z obszarem chorym bądź zdrowym. Dlatego nie sprawdzi się tutaj często stosowana w praktyce metoda poszukiwania krawędzi. Nie można też po prostu powiedzieć, że „czerwony to rak, niebieski to obszar zdrowy”. Zdecydowałem się zatem na analizę tekstur, czyli poszukiwanie w poszczególnych fragmentach obrazu cech, które pozwolą na poprawne odróżnienie obszaru zdrowego od chorego.

Jak wyodrębnić takie cechy? Jak je zmierzyć? Komputer to specjalista od liczb. Nie można mu powiedzieć: „ten fragment obrazu jest inny, bo ma więcej krzywych linii”. Taką informację trzeba przedstawić w postaci konkretnej liczby, np.: cecha o nazwie „zakrzywienie” ma w danym miejscu wartość 1000, podczas gdy w innych częściach obrazu nie więcej niż 1. W tym celu zastosowałem technikę opierającą się na „macierzach współwystąpień”. Taka macierz to tablica liczb wyznaczana dla poszczególnych fragmentów obrazu na podstawie analizy „współwystępowania” (w określonym kierunku i odległości) par punktów o tym samym kolorze. Liczymy np. ile jest sąsiadujących ze sobą w poziomie par punktów czerwonych, zielonych, niebieskich. Na podstawie zliczonych par punktów można wyznaczyć wartości różnych cech obrazu. Niektóre z nich, jak energia, entropia, kontrast, korelacja, mają swoje wytłumaczenie fizyczne, np. entropia jest miarą chaosu. I rzeczywiście – im większe uporządkowanie (mniejszy chaos) tekstury, tym mniejsza wartość entropii.

Aby wyznaczyć wspomniane macierze oraz cechy, należy podzielić badany obraz całej prostaty na szereg mniejszych podobrazów. Wartości cech będą wyznaczane oddzielnie do każdego podobrazu, a następnie porównywane ze sobą. Ale jak dobrać kształt i wielkość podobrazów (tzw. regionów zainteresowania)? Zbyt mały region spowoduje, że uwypuklone zostaną mało istotne różnice w obrębie jednego rodzaju tekstury (np. w obszarze zdrowym), z kolei analizując zbyt duży obszar, możemy utracić bardzo cenne informacje. Także kształt rozważanego podobrazu może mieć znaczący wpływ na wyniki.

Podczas badań zauważyłem ważną rzecz – nie ma sensu analizować centralnego obszaru prostaty, gdyż zwiększona perfuzja w tym obszarze jest spowodowana łagodnym rozrostem stercza. Nie ma tu nowotworu, więc obszar centralny należy pominąć, aby nie wpływał negatywnie na wynik obliczeń. I tu pojawia się kolejny problem – jak duży region należy pominąć? Jak interpretować obszary brzegowe, mogące zawierać mniej punktów niż inne? Ostatecznie, spośród rozmaitych przetestowanych obszarów, najlepszą metodą okazała się technika „koła ratunkowego” (Rys. 3), w której obszar na obwodzie został podzielony na równej wielkości fragmenty.

Sześć cech

Poszukiwanie miejsca, w którym uwidoczniony jest nowotwór, polegało – jak już wspomniano – na obliczaniu oraz porównywaniu ze sobą wartości cech poszczególnych fragmentów obrazu. Niestety, obrazy pochodzące od różnych pacjentów są bardzo zróżnicowane – za bardzo, aby możliwe było wskazanie jednej cechy, której wartości w obszarach zdrowych zawsze byłyby inne niż w obszarach chorych. Trzeba zatem analizować kilka cech jednocześnie. Konieczne jest w tym celu określenie wagi (znaczenia) każdej cechy oraz zdefiniowanie jakiejś miary, która pozwoli na porównywanie zestawów cech oraz stwierdzenie, który jest lepszy od innych.

Ile cech możemy wyznaczyć? Policzmy. Do każdej macierzy obliczano 21 cech. Do jednego obrazu można wygenerować przynajmniej kilkadziesiąt macierzy (różne kierunki i odległości współwystępowania). Ponadto można przecież rozważać różne kształty i wielkości podobrazów, a sam obraz źródłowy może być przed analizą przetworzony (w celu polepszenia jego jakości) na praktycznie nieskończoną liczbę sposobów. Bez większego wysiłku można wyodrębnić tysiące cech, z których każda będzie opisywała inne właściwości obrazu. To niewątpliwa przewaga technik komputerowych nad ręczną analizą. Więcej cech to więcej możliwości. Ale zwiększanie przestrzeni cech oznacza też ogromny wzrost liczby potrzebnych obliczeń. Już przy zaledwie kilkunastu cechach sprawdzenie wszystkich kombinacji przekracza możliwości nawet najlepszych superkomputerów. A my mieliśmy takich cech ok. 1000! Udało się na szczęście opracować algorytm, który w sensownym czasie (kilka godzin przy pojedynczym eksperymencie) znajduje rozwiązanie – jeśli nie optymalne, to na pewno zbliżone do optymalnego.

Koniec końców, po przeprowadzeniu wielu eksperymentów, po przetestowaniu proponowanych rozwiązań na różnych obrazach prostaty pochodzących od ponad 50 pacjentów, udało się wyodrębnić sześć opisujących te obrazy cech. Owe sześć cech wystarczyło, aby z wysoką skutecznością (ok. 86 proc.) odróżnić obszar zdrowy od chorego na badanych obrazach.

To, oczywiście, nie koniec pracy. Zanim zaproponowany algorytm znajdzie zastosowanie w profesjonalnych tomografach, trzeba przetestować jego skuteczność na większej grupie obrazów. Trzeba pochylić się nad zdarzającymi się jeszcze przypadkami błędnego rozpoznania – czy uda się je wyeliminować? Przed nami jeszcze sporo wyczerpujących, ale i fascynujących badań.

Wróćmy do tytułowego pytania. Czy komputerowe techniki widzenia i rozumienia obrazu są lepsze niż postrzeganie człowieka? Zasadniczo nie. Ale istnieją sytuacje, gdy komputerowa precyzja, determinizm i niezależność od wpływu środowiska stają się bardzo cenną wartością. Wówczas komputer może wskazać coś istotnego, na co człowiek nie zwróci uwagi. I właśnie dlatego komputerowo wspomagana diagnostyka medyczna jest naszą nadzieją na skuteczniejszą identyfikację chorób i szybsze ich leczenie.