Czy zastanawiałeś się kiedyś, dlaczego sztuczna inteligencja czasami ignoruje Twoje najgłębsze prośby, mimo że napisałeś w prompcie wielkimi literami „TYLKO” albo „WYŁĄCZNIE”? W świecie prompt engineeringu słowa-klucze, które mają narzucać modelom językowym (LLM) rygorystyczne ramy, są tematem gorących dyskusji. Eksperci badający zachowanie algorytmów takich jak GPT-4o czy Claude zauważają, że to, co dla człowieka brzmi jak jasny rozkaz, dla sieci neuronowej może być sygnałem do... zrobienia dokładnie czegoś przeciwnego. Dlaczego tak się dzieje i jak prawidłowo używać wyrażeń typu „skup się na”, „oprzyj się na” czy „weź pod uwagę”, aby wycisnąć z AI maksimum możliwości?
Pułapka absolutów, czyli dlaczego „tylko” i „wyłącznie” mogą zawieść
Słowa takie jak „tylko” czy „wyłącznie” mają za zadanie stworzyć twarde ramy (tzw. negative constraints lub ograniczenia wykluczające). Intuicja podpowiada nam: im mocniej ograniczymy AI, tym bardziej precyzyjny będzie wynik. Badania i praktyka prompt engineerów pokazują jednak zupełnie inny obraz.
- Efekt różowego słonia (Content anchoring): Modele LLM działają w oparciu o mechanizm uwagi (attention mechanism). Kiedy piszesz „nie używaj żargonu i pisz wyłącznie prostym językiem”, model musi najpierw przetworzyć tokeny związane z „żargonem”. Paradoksalnie, zakazane słowo staje się dla niego silnym punktem odniesienia w przestrzeni semantycznej, co może sprawić, że zakazana treść i tak pojawi się w wygenerowanym tekście.
- Brak ścieżki ewakuacyjnej: Jeśli każesz modelowi odpowiedzieć „wyłącznie na podstawie załączonego tekstu”, a w tekście nie ma odpowiedzi na pytanie użytkownika, AI wpada w pułapkę. Zamiast przyznać się do braku wiedzy, model może zacząć halucynować, próbując za wszelką cenę spełnić Twoje żądanie.
Jak okiełznać „tylko” i „wyłącznie”?
Eksperci radzą, aby te słowa stosować zawsze w połączeniu z tzw. „bezpiecznym wyjściem” (exit strategy) oraz bardzo precyzyjnym formatowaniem. Zamiast pisać ogólne „użyj tylko tych danych”, lepiej sformułować to tak:
„Odpowiedz na pytanie, używając wyłącznie informacji zawartych w poniższym tekście. Jeśli w tekście nie ma odpowiedzi na to pytanie, napisz dosłownie: 'Brak danych w źródle'. Nie próbuj wymyślać ani dedukować odpowiedzi na własną rękę.”
Siła pozytywnych dyrektyw: „skup się na” i „uwzględnij”
W opozycji do zakazów stoją dyrektywy pozytywne (affirmative constraints), takie jak „skup się na” czy „uwzględnij”. W testach porównawczych prompty sformułowane w sposób twierdzący osiągają znacznie wyższe wskaźniki dokładności niż te oparte na samych zakazach.
- Wskazywanie celu zamiast przeszkód: Kiedy piszesz „skup się na korzyściach biznesowych”, dajesz modelowi jasny wektor w przestrzeni ukrytej (latent space). Zamiast marnować zasoby obliczeniowe na analizowanie tego, czego ma unikać, AI od razu kieruje swoje „głowice uwagi” na pojęcia związane z biznesem i korzyściami.
- Budowanie struktury: Słowo „uwzględnij” działa jak lista kontrolna dla modelu. Eksperci od promptów zalecają, aby po tym słowie zawsze następowała konkretna, mierzalna lista elementów (np. „uwzględnij 3 przykłady kodu, 2 statystyki i jedno wezwanie do działania”). Dzięki temu AI łatwiej weryfikuje własny tekst przed wygenerowaniem ostatecznej odpowiedzi.
„Oprzyj się na” i „weź pod uwagę” – fundamenty uziemienia
Te dwa wyrażenia są absolutnymi faworytami inżynierów pracujących nad systemami RAG (Retrieval-Augmented Generation), czyli systemami, które łączą AI z zewnętrznymi bazami wiedzy.
- „Oprzyj się na” (Grounding): To sformułowanie dosłownie kotwiczy model w rzeczywistości. Mówi modelowi: „Twoja wiedza ogólna jest teraz drugorzędna, priorytetem są te konkretne fakty”. Pomaga to drastycznie zredukować halucynacje.
- „Weź pod uwagę” (Contextual weighting): To wyrażenie pozwala modelowi na bardziej elastyczne i wieloaspektowe myślenie. Zamiast sztywno blokować inne ścieżki (jak przy „wyłącznie”), nakazuje AI przeanalizować dany element (np. „weź pod uwagę ton głosu naszej konkurencji”) i zintegrować go z ogólną strategią wypowiedzi.
Dlaczego modele językowe reagują tak, a nie inaczej? Spojrzenie pod maskę
Aby zrozumieć, dlaczego te słowa mają tak ogromne znaczenie, musimy na chwilę wejść w świat matematyki i statystyki, na których opierają się sieci LLM.
- Tokenizacja i prawdopodobieństwo: AI nie widzi słów tak jak my – rozbija tekst na mniejsze fragmenty, zwane tokenami. Każdy token ma swoją wagę i wpływa na prawdopodobieństwo wystąpienia kolejnych tokenów.
- Mechanizm uwagi (Attention): Słowa takie jak „skup się na” czy „oprzyj się na” działają jak matematyczne mnożniki. Zwiększają one wagę (uwagę) przypisaną do tokenów, które następują po nich. Z kolei słowa negatywne („nie rób X”) często wysyłają sprzeczne sygnały matematyczne, ponieważ sam token „X” otrzymuje wysoką uwagę, mimo że stoi przy nim zaprzeczenie.
- Dążenie do średniej statystycznej: Bez wyraźnych drogowskazów takich jak „skup się na”, model ma tendencję do generowania odpowiedzi, które są statystyczną średnią jego danych treningowych – czyli często nudnymi, ogólnikowymi tekstami. Precyzyjne ukierunkowanie wyrywa model z tej strefy komfortu.
Złote zasady promptowania od ekspertów
Jeśli chcesz, aby Twoje prompty działały za każdym razem bez zarzutu, wdroż te cztery zasady wypracowane przez najlepszych inżynierów promptów:
- Zastępuj zakazy nakazami (Affirmative over negative): Zamiast pisać „nie używaj trudnych słów”, napisz „używaj języka prostego, zrozumiałego dla dwunastolatka”.
- Łącz podejścia (Mixed constraints): Najlepsze wyniki w testach osiągają prompty, które najpierw jasno definiują cel pozytywny, a na końcu dodają jedno lub dwa precyzyjne wykluczenia (np. „Napisz artykuł o zdrowym żywieniu, skupiając się na diecie śródziemnomorskiej. Nie wspomnij ani słowem o suplementach diety”).
- Bądź binarny i mierzalny: Unikaj zwrotów takich jak „bądź zwięzły” czy „napisz krótko”. Zastąp je twardymi regułami: „maksymalnie 150 słów”, „użyj dokładnie 3 akapitów”.
- Zapewnij drogę ucieczki: Przy rygorystycznych ograniczeniach („użyj wyłącznie...”) zawsze dodaj instrukcję na wypadek, gdyby warunek nie mógł zostać spełniony.
Ciekawostka: Czy wiesz, że kolejność ma znaczenie?
Badania nad zjawiskiem Lost in the Middle (zagubieni w środku) pokazują, że modele językowe najlepiej zapamiętują instrukcje umieszczone na samym początku oraz na samym końcu promptu. Jeśli umieścisz kluczowe „skup się na” w środku długiego, kilkunastostronicowego kontekstu, istnieje duże prawdopodobieństwo, że AI po prostu je przeoczy. Dlatego najważniejsze ograniczenia i dyrektywy zawsze umieszczaj na samym końcu swojej instrukcji!