Szkodliwy hurraoptymizm w kwestii AI

Mój ojciec miał w zwyczaju mówić: „najpierw pomyśl, później zrób”. Mam wrażenie, że w przypadku zastosowań sztucznej inteligencji ludzkość działa wbrew założeniom tej prostej zasady: najpierw robimy, a później zaczynamy myśleć nad konsekwencjami – mówi dr Marcin Romańczyk, współautor opublikowanej w „The Lancet Gastroenterology and Hepatology” pracy „Endoscopist deskilling risk after exposure to artificial intelligence in colonoscopy: a multicentre, observational study”.

Dr Marcin Romańczyk. Fot. MP.PL

Należy określić, jak wygląda nasza interakcja ze sztuczną inteligencją, jakie przynosi owoce i w przypadku oddziaływań negatywnych – jak im przeciwdziałać

Potencjał jest ogromny – sztuczna inteligencja może m.in. poprawiać diagnostykę i skracać kolejki. Trudno wyrokować, czy tak się stanie, wiemy natomiast, że zadzwonił dzwonek alarmowy i pewnym kwestiom musimy się przyjrzeć z większą wnikliwością

O naszych interakcjach z AI możemy myśleć wielowymiarowo, zarówno w kontekście percepcji, jak i nadmiernego polegania na zdobyczach technologii

Zaprzęgając AI do pracy, wygenerowaliśmy problem, z którym musimy się teraz zmierzyć

Jerzy Dziekoński: Dyskusje na temat zagrożeń ze strony sztucznej inteligencji toczą się już od pewnego czasu, ale głównie dotyczą tego, że AI wykluczy ludzi z pewnych zawodów, a nie że będzie wysoko wykwalifikowanych specjalistów okradać z kompetencji. Skąd wziął się pomysł na takie badanie? Czy miał Pan takie obserwacje w środowisku? Czy może tendencja zarysowała się w wynikach innych badań, niekoniecznie związanych z medycyną?

Dr Marcin Romańczyk: To badanie nie zostało zaplanowane pod tego typu znalezisko. Przeprowadziliśmy je, ponieważ mogliśmy kolekcjonować dane ze względu na nasz udział w projekcie ACCEPT, który dotyczy badania skuteczności sztucznej inteligencji w prewencji raka jelita grubego w kolonoskopiach przesiewowych. W ramach projektu badawczego jednoczasowo w ośrodkach, które zostały włączone do badania, zaimplementowano moduły sztucznej inteligencji. Pacjenci następnie byli losowo przydzieleni do grup badanych przy użyciu AI i bez użycia AI. Jest to projekt wieloletni i wieloośrodkowy z bardzo dużą grupą docelową osób badanych. Niejako przy okazji chcieliśmy sprawdzić, w jaki sposób modyfikowane są nasze umiejętności poprzez ekspozycję na oprogramowanie przy użyciu oceny kolonoskopii diagnostycznych (osób objawowych lub nadzoru po przebytych kolonoskopiach).

Historia sztucznej inteligencji stosowanej w kolonoskopii wiąże się z tworzeniem algorytmów pomagających endoskopistom w wykrywaniu polipów w obrębie jelita grubego. Generalnie założenie jest takie, że oprogramowanie ma razem z lekarzem szukać gruczolaków, aby je usunąć, co jest prewencją raka jelita grubego. Kiedy unity AI zostały przebadane na tyle, żeby potwierdzić ich skuteczność, takie urządzenia trafiły na rynek. Przy czym trzeba zaznaczyć, że nie są to nowego rodzaju endoskopy z zupełnie nowym trybem obrazowania. Chodzi o zupełnie inny rodzaj informacji, którą lekarze zaczęli otrzymywać. Stwierdziliśmy, że warto coś takiego sprawdzić.

Wyniki, jak rozumiem, zaskoczyły także badaczy.

Tak. Rozpoczynając badanie, wiedzieliśmy, że mamy trzy opcje. Pierwsza wiązała się z poprawą percepcji lekarzy dzięki zastosowaniu AI. Potencjalnie osoby mniej doświadczone albo z mniejszymi umiejętnościami poprzez ekspozycję na AI mogłyby zobaczyć zmiany, których wcześniej nie były w stanie zauważyć, i tym samym nauczyć się je rozpoznawać.

Druga opcja to osłabienie percepcji endoskopistów poprzez ekspozycję na nowe narzędzia. I to właśnie pokazują wyniki, co w zasadzie łatwo można wyjaśnić. Weźmy prostą analogię z życia codziennego – używanie map elektronicznych; wystarczy spróbować odnaleźć jakiś adres w Warszawie, żeby przekonać się, jak bardzo polegamy dzisiaj na tej technologii.

Trzecia opcja wiązała się z tym, że stosowanie AI nie przyniesie większej różnicy. Okazało się jednak, że potwierdził się wariant drugi.

Ile ośrodków wzięło udział w projekcie?

Projekt, o którym wspomniałem, jest prowadzony przez prof. Yuichi Mori, badacza z Uniwersytetu w Oslo. Ośrodkiem koordynującym to badanie w Polsce jest CMKP. Wzięliśmy udział w tym projekcie, a badanie, o którym rozmawiamy, to był pomysł poboczny. Zrobiliśmy to przy okazji. Projekt rozpoczął się w 2021 roku, do badania włączyliśmy ok. 1400 pacjentów; część osób przebadano przed włączeniem modułu sztucznej inteligencji i część już po ich zainstalowaniu, ale nie z marszu, tylko z pewną przerwą, aby operatorzy mogli przyzwyczaić się do nowych ustawień endoskopu. Daliśmy okres rozruchowy. W międzyczasie wygaszony został program badań przesiewowych finansowany z Ministerstwa Zdrowia i kolonoskopia była wykonywana jedynie „na skierowanie”, więc ograniczyliśmy czas włączania pacjentów, aby uniknąć kierowania ich na kolonoskopię profilaktyczną i w ten sposób zaburzyć grupę badaną. Program przesiewowy został przywrócony w ramach Narodowego Funduszu Zdrowia w podobnej formie, ale biorąc pod uwagę to, że już same dane retrospektywne obarczone są pewnym ryzykiem błędu, nie chcieliśmy wprowadzać do badania kolejnego elementu. W ciągu trzech miesięcy mieliśmy przeanalizowane dane.

Czy w świetle tych wyników powinniśmy pomyśleć o zaciągnięciu hamulca bezpieczeństwa w rozpędzonym pociągu zwanym AI? Z drugiej strony szereg argumentów przemawia przecież za tym, żeby rozwiązania wspierane przez sztuczną inteligencję w medycynie rozwijać. Co Pana zdaniem przemawia za jedną bądź drugą opcją? A może powinniśmy szukać takich ścieżek kształcenia ustawicznego, które pozwolą na utrzymanie kompetencji lekarzy na wysokim, jednolitym poziomie niezależnie od tego, czy sztuczna inteligencja w medycynie będzie stosowana, czy nie?

Mój ojciec ma w zwyczaju mówić: „najpierw pomyśl, później zrób”. Mam wrażenie, że w przypadku zastosowań sztucznej inteligencji ludzkość działa wbrew założeniom tej prostej zasady: najpierw robimy, a później zaczynamy myśleć nad konsekwencjami.

To, co należy zrobić teraz, to przede wszystkim określić, co tak naprawdę się dzieje, jak wygląda nasza interakcja ze sztuczną inteligencją, jakie przynosi owoce i w przypadku oddziaływań negatywnych, jak im przeciwdziałać.

Nie mówię o kształceniu podyplomowym, gdzie uczymy się z literatury bądź nabywamy doświadczeń pod okiem mistrza czy mentora, który pokazuje, jak wykonywać określone procedury czy interpretować wyniki badań, analizować dostępne dane, a następnie dobierać model postępowania. W tym wypadku współpracujemy z pewnym tworem zewnętrznym, na który wcześniej nie byliśmy eksponowani i nikt nam nie powiedział, w jaki sposób z niego korzystać. Powinniśmy dołożyć wszelkich starań, żeby określić w ogóle, w jaki sposób ta interakcja przebiega, w jaki sposób możemy ją modulować, aby nasze działania były jak najbardziej efektywne. Czy tego chcemy, czy nie, sztuczna inteligencja będzie towarzyszyła nam w każdym aspekcie życia, nie tylko w medycynie, ale też w szeroko rozumianej przestrzeni publicznej. Od tego nie uciekniemy i wszelkie zakazy kończyłyby się w ślepej uliczce. Przede wszystkim powinniśmy postawić na dalszy rozwój projektów. Zakładam, że zarówno instytucje publiczne, jak i niepubliczne, kierując się różnymi interesami, powinny zmierzać do jednego celu – żebyśmy mogli ze zdobyczy technologicznych korzystać w jak najbardziej efektywny sposób. Potencjał jest ogromny – sztuczna inteligencja może poprawiać diagnostykę i skracać kolejki, ułatwiać pracę i sprawiać, że nasze życie będzie prostsze i lepsze. Na razie trudno wyrokować, czy tak się stanie, wiemy natomiast, że zadzwonił dzwonek alarmowy i pewnym kwestiom musimy się przyjrzeć z większą wnikliwością...

... i nie cedować całkowicie odpowiedzialności na algorytmy.

Ale też nie próbować powstrzymać postępu, argumentując to np. wynikami naszego badania. Z drugiej strony, dotychczas działaliśmy w tej materii trochę „na hejnał”, wprowadzając bezrefleksyjnie kolejne systemy. Warto zastanowić się nad mechanizmami naszych zachowań i nad tym, jakie to ma implikacje kliniczne, czy w końcowym rozrachunku jest to korzystne dla pacjentów.

Na koniec chciałem Pana zapytać, nad czym pracuje Pan obecnie, czy są to badania w jakiś sposób powiązane z tematem sztucznej inteligencji?

Po pierwsze pracujemy – bo działam w zespole. Mamy kilka projektów w toku i kilka propozycji, które mają na celu określenie, w jaki sposób systemy, których używamy, wpływają na nasze zachowanie. O naszych interakcjach z AI możemy myśleć wielowymiarowo, zarówno w kontekście percepcji jak i over-reliance, czyli nadmiernego polegania na zdobyczach technologii, osłabieniu koncentracji, czy skuteczności wykrywania zmian, która może wiązać się z dodatkowymi czynnościami manualnymi. Może okazać się, że wcale nie widzimy mniej na ekranie, ale w inny sposób wykonujemy badanie. Chcemy też określić, na ile skuteczność systemów, którymi obecnie dysponujemy, jest zależna od operatora. Wydaje się to oczywiste, że jeśli pokażemy więcej, jeśli podejdziemy do badania bardziej skrupulatnie, więcej czasu poświęcimy na zobrazowaniu błony śluzowej, szanse na znalezienie zmian będą większe. Nie mamy tego typu danych, czy i w jakim zakresie operatorzy, którzy więcej czasu poświęcają na wycofywanie aparatu, korzystają ze wspomagających systemów, czy też nie. Z jednej strony chcemy sprawdzić, w jaki sposób wygląda interakcja operatora z AI w oparciu o wyniki naszego badania, gdzie widzimy, że jego skuteczność jest w jakiś sposób modulowana, a z drugiej, czy to, co odkryliśmy, jest w jakiś sposób możliwe do zmodyfikowania. Myślę, że hurraoptymizm dotyczący AI, przekonanie, że będzie to remedium na wszelkie bolączki, jest mocno na wyrost.

Bo razem z AI narodziły się problemy, których wcześniej nie było.

Zaprzęgając AI do pracy, wygenerowaliśmy problem, z którym musimy się teraz zmierzyć. I temu ma również służyć jeden z naszych projektów badawczych.

Rozmawiał Jerzy Dziekoński