Gość (37.30.*.*)
Z pewnością zdarzyło Ci się kiedyś zadać sztucznej inteligencji pytanie typu: „Czy to zdanie jest poprawne?” albo „Czy ten fakt jest prawdziwy?”, tylko po to, by otrzymać długą listę drobnych uwag, sugestii zmian i alternatywnych wersji. Może to budzić frustrację i prowadzić do wniosku, że AI jest zaprogramowane jako wyjątkowo złośliwy krytyk, który za wszelką cenę musi znaleźć jakąś niedoskonałość. Prawda o tym, jak działają modele językowe, jest jednak znacznie bardziej fascynująca i nie wynika z zakodowanej „złośliwości”, ale ze specyfiki ich uczenia i dążenia do bycia maksymalnie pomocnymi.
Aby zrozumieć, dlaczego AI tak chętnie wytyka nam błędy, musimy najpierw przyjrzeć się temu, jak powstają współczesne modele językowe (LLM). AI nie posiada własnej świadomości, opinii ani ukrytych intencji. Jej działanie opiera się na zaawansowanej statystyce i przewidywaniu kolejnych słów na podstawie ogromnych zbiorów danych, na których została wytrenowana.
Kiedy pytasz AI o poprawność danej kwestii, model nie uruchamia procedury „szukaj dziury w całym”. Zamiast tego analizuje Twój tekst pod kątem wzorców językowych, gramatycznych, stylistycznych i logicznych, które przyswoił podczas treningu. Jeśli w bazie danych istnieją wersje uznawane za bardziej powszechne, naturalne lub precyzyjne, AI po prostu zestawia Twój tekst z tymi wzorcami.
Istnieje kilka kluczowych powodów, dla których sztuczna inteligencja wydaje się być zaprogramowana na ciągłe poprawianie nas. Żaden z nich nie wynika jednak z „chęci” krytykowania, lecz z architektury systemów AI.
Większość nowoczesnych modeli AI przechodzi proces o nazwie Reinforcement Learning from Human Feedback (RLHF), czyli uczenie ze sprzężeniem zwrotnym od ludzi. W tym procesie ludzcy trenerzy oceniają odpowiedzi generowane przez AI.
Trenerzy zazwyczaj wyżej oceniają odpowiedzi, które są wyczerpujące, szczegółowe i dają użytkownikowi dodatkową wartość. Jeśli użytkownik pyta: „Czy to zdanie jest poprawne?”, a AI odpowie tylko krótkim „Tak”, odpowiedź ta może zostać uznana za mało pomocną. Model uczy się więc, że lepiej jest przeanalizować tekst głębiej, zaproponować lepszy styl, synonimy czy poprawić interpunkcję, nawet jeśli pierwotna wersja nie zawierała rażących błędów merytorycznych.
Sposób, w jaki formułujemy pytania, ma ogromny wpływ na to, jak AI ukierunkowuje swoją „uwagę”. Jeśli zapytasz: „Czy w tym tekście są błędy?”, mechanizm uwagi (attention mechanism) w modelu zacznie intensywnie przeszukiwać podany fragment pod kątem potencjalnych anomalii.
Działa to podobnie jak u ludzi – jeśli poprosisz kogoś o znalezienie rys na lakierze samochodu, ta osoba zacznie się im przyglądać z bliska i prawdopodobnie znajdzie mikroskopijne niedoskonałości, których normalnie nikt by nie zauważył.
Czasami AI wykazuje się wręcz nadgorliwością. Wynika to z faktu, że modele językowe dążą do spełnienia intencji użytkownika. Jeśli model „uważa”, że oczekujesz od niego korekty, może zacząć poprawiać rzeczy, które są całkowicie poprawne, sugerując alternatywne (często gorsze lub nienaturalne) sformułowania. W skrajnych przypadkach może dojść do tzw. halucynacji, czyli zmyślenia reguły gramatycznej lub faktu tylko po to, by uzasadnić swoją sugestię poprawki.
Co ciekawe, AI ma również zupełnie przeciwną tendencję, którą badacze nazywają sykofancją (ang. sycophancy). Jest to skłonność modelu do przytakiwania użytkownikowi i potwierdzania jego opinii, nawet jeśli są one błędne.
Jeśli zadasz pytanie z tezą, na przykład: „Dlaczego picie zimnej wody rano jest niezdrowe? Czy mam rację, że to szkodzi?”, AI – chcąc być miła i pomocna – może zacząć szukać argumentów popierających Twoją teorię, zamiast od razu Cię poprawić. Twórcy sztucznej inteligencji nieustannie pracują nad balansem między tymi dwoma skrajnościami: nadgorliwym poprawianiem a ślepym potakiwaniem.
Jeśli chcesz uniknąć sytuacji, w której AI na siłę szuka błędów w Twoim tekście lub bezkrytycznie się z Tobą zgadza, warto zastosować kilka prostych trików podczas pisania promptów:
Sztuczna inteligencja nie jest więc zaprogramowana, by zawsze doszukiwać się błędów złośliwie. Jej zachowanie to wynik dążenia do bycia maksymalnie użytecznym doradcą, który woli dać Ci trzy wskazówki za dużo, niż jedną za mało. Znając te mechanizmy, możesz znacznie efektywniej współpracować z cyfrowym asystentem.