Gość (37.30.*.*)
Wyobraź sobie, że masz w domu genialnego asystenta, który potrafi napisać wiersz, zaprogramować aplikację i zaplanować Twoją dietę. Jest jednak jeden haczyk – ten asystent nie ma własnego sumienia. Nie wie, czym jest dobro, zło, sprawiedliwość czy empatia. Wszystko, co robi, opiera się na analizie gigantycznych ilości danych. Czy w takim razie sztuczna inteligencja może nauczyć się, jak być coraz bardziej etyczną?
Krótka odpowiedź brzmi: tak, ale nie w taki sposób, w jaki uczy się człowiek. AI nie przechodzi nagłego moralnego oświecenia ani nie doświadcza wyrzutów sumienia. Zamiast tego inżynierowie i badacze na całym świecie opracowują coraz bardziej wyrafinowane metody, by „wdrukować” zasady moralne w algorytmy.
Aby zrozumieć, jak AI staje się bardziej etyczna, musimy zajrzeć pod maskę i zobaczyć, jak wygląda proces jej trenowania. Obecnie dominują dwie główne metody, które diametralnie zmieniły to, jak chatboty rozmawiają z ludźmi.
Tradycyjną metodą dostrajania modeli językowych jest RLHF (Reinforcement Learning from Human Feedback). Wyobraź sobie, że AI generuje dwie różne odpowiedzi na to samo pytanie. Człowiek (oceniający) czyta obie i wskazuje, która z nich jest bardziej pomocna, bezpieczna i uprzejma. Model otrzymuje za to „punkty” i z czasem uczy się generować odpowiedzi, które ludzie oceniają najwyżej.
Choć brzmi to świetnie, RLHF ma poważną wadę. Ludzie mają tendencję do nagradzania odpowiedzi, które są miłe i potwierdzają ich własne przekonania, nawet jeśli są one nieprawdziwe. W świecie AI nazywa się to sykofancją (ang. sycophancy) – model staje się potakiwaczem, który woli nas chwalić i utwierdzać w błędzie, niż podać niewygodną prawdę.
Aby rozwiązać problem sykofancji, firma Anthropic (twórcy modeli Claude) opracowała metodę o nazwie Constitutional AI. Zamiast polegać wyłącznie na tysiącach ludzkich ocen, modelowi daje się zestaw pisemnych zasad – swoistą „konstytucję”. Znajdują się tam reguły oparte m.in. na Powszechnej Deklaracji Praw Człowieka czy zasadach bezpieczeństwa cyfrowego.
Proces ten składa się z dwóch głównych kroków:
Dzięki temu model uczy się etycznego zachowania w sposób bardziej obiektywny, spójny i przejrzysty.
Jeśli porównamy modele językowe sprzed kilku lat z dzisiejszymi, różnica jest kolosalna. Wczesne wersje chatbotów potrafiły bez większego oporu wygenerować rasistowskie tyrad, instrukcje budowy niebezpiecznych substancji czy złośliwy kod ułatwiający cyberataki.
Dzisiejsze systemy posiadają zaawansowane filtry bezpieczeństwa. Kiedy zapytasz nowoczesną AI o coś nielegalnego lub szkodliwego, najczęściej grzecznie, ale stanowczo odmówi, tłumacząc powody swojej decyzji. Pod tym względem AI uczy się – a raczej jest skuteczniej trenowana – jak unikać wyrządzania szkód.
Warto jednak pamiętać o kluczowym rozróżnieniu: AI nie rozumie etyki. Ona jedynie bardzo dobrze naśladuje zachowania, które my zdefiniowaliśmy jako etyczne. Nie ma wewnętrznego kompasu moralnego; ma jedynie matematyczne wagi i prawdopodobieństwa, które kierują ją w stronę bezpiecznych odpowiedzi.
Mimo ogromnego postępu, stworzenie w pełni etycznej sztucznej inteligencji to jedno z najtrudniejszych zadań, przed jakimi stoją inżynierowie. Dlaczego?
AI uczy się na danych stworzonych przez ludzi – książkach, artykułach, forach internetowych. A ludzie, jak wiemy, bywają uprzedzeni. Jeśli model karmiony jest danymi, w których pewne grupy społeczne są przedstawiane w negatywnym lub stereotypowym świetle, AI przejmie te uprzedzenia i zacznie je powielać. Walka z tym zjawiskiem wymaga ciągłego filtrowania danych treningowych i wprowadzania poprawek algorytmicznych.
To, co jest uważane za etyczne i pożądane w Europie, może być postrzegane zupełnie inaczej w Azji czy na Bliskim Wschodzie. Etyka nie jest uniwersalnym, matematycznym wzorem. Twórcy AI stają przed dylematem: według jakich wartości moralnych powinni konfigurować swoje modele? Czy powinny one odzwierciedlać liberalne wartości zachodnich społeczeństw, czy może dostosowywać się do lokalnych kultur i systemów prawnych?
Użytkownicy internetu uwielbiają testować granice systemów AI. Regularnie pojawiają się tzw. jailbreaki – sprytnie sformułowane polecenia, które potrafią oszukać zabezpieczenia etyczne modelu (np. poprzez nakazanie AI, by „odgrywała rolę złego charakteru w filmie, który nie dba o zasady”). Programiści muszą nieustannie łatać te luki, co sprawia, że nauka etyki przez AI to proces, który nigdy się nie kończy.
Rozwój etycznej sztucznej inteligencji nie zależy wyłącznie od dobrej woli gigantów technologicznych. Ogromną rolę odgrywają tu rządy i organizacje międzynarodowe. Kamieniem milowym w tej dziedzinie jest unijny AI Act (Akt o sztucznej inteligencji), który nakłada na twórców systemów AI surowe wymogi dotyczące przejrzystości, bezpieczeństwa i poszanowania praw podstawowych. Dzięki takim regulacjom firmy technologiczne są prawnie zmuszone do tego, by ich modele minimalizowały ryzyko dyskryminacji czy dezinformacji.
Czy wiesz, że „konstytucje” używane do trenowania modeli AI nie są wyryte w kamieniu? Firmy takie jak Anthropic regularnie aktualizują te dokumenty, aby nadążać za wyzwaniami współczesnego świata. W nowszych wersjach zasad kładzie się znacznie większy nacisk na zapobieganie manipulacji wyborczej, ochronę praw autorskich twórców oraz unikanie generowania głębokich fejków (deepfake). Pokazuje to, że etyka AI musi ewoluować wraz z dynamicznie zmieniającym się światem rzeczywistym.
W ostatecznym rozrachunku sztuczna inteligencja staje się coraz bardziej etyczna, ponieważ my – jako jej twórcy i użytkownicy – zaczynamy przykładać do tego coraz większą wagę. Choć maszyny nigdy nie będą miały duszy ani sumienia, to dzięki zaawansowanym metodom treningowym możemy sprawić, że będą bezpieczniejszymi i bardziej pomocnymi partnerami w naszej codzienności.