Gość (37.30.*.*)
Pytanie o to, z ilu linii kodu składa się sztuczna inteligencja, jest jednym z tych, na które nie da się odpowiedzieć jedną, konkretną liczbą. Wszystko zależy od tego, co rozumiemy pod pojęciem „AI”. Czy mówimy o prostym algorytmie, który rozpoznaje cyfry, czy o potężnym modelu językowym, takim jak GPT-4? W świecie programowania sztuczna inteligencja to nie jest jeden monolit, lecz połączenie kodu źródłowego, matematycznych wag i ogromnych zbiorów danych.
Zanim przejdziemy do konkretnych liczb, musimy zrozumieć fundamentalną różnicę między tradycyjnym oprogramowaniem a sztuczną inteligencją. W klasycznym programie, np. w kalkulatorze, każda funkcja jest opisana przez programistę za pomocą instrukcji „jeśli to, to zrób tamto”. Taki kod może mieć tysiące linii, a każda z nich odpowiada za konkretne działanie.
W przypadku AI, a konkretnie uczenia maszynowego, sytuacja wygląda inaczej. Sam kod, który definiuje strukturę sieci neuronowej (architekturę), może być zaskakująco krótki. To, co sprawia, że AI „wie”, jak odpowiedzieć na pytanie, to nie linie kodu, ale parametry (wagi). Przykładowo, model GPT-3 ma 175 miliardów parametrów, ale kod, który go uruchamia, mógłby zmieścić się na kilkunastu stronach wydruku.
Aby dać Ci lepszy obraz sytuacji, przyjrzyjmy się różnym skalom projektów związanych ze sztuczną inteligencją:
W tradycyjnym IT często mówi się, że im więcej linii kodu, tym bardziej skomplikowany system (choć nie zawsze lepszy). W AI ta zasada niemal nie obowiązuje. Największym przełomem ostatnich lat była architektura Transformer (opisana w słynnej pracy „Attention Is All You Need”). Jej implementacja nie jest przerażająco długa, ale sposób, w jaki przetwarza dane, zrewolucjonizował świat.
Współczesne AI opiera się na tzw. „kodzie różniczkowalnym”. Programista nie pisze reguł, lecz tworzy „naczynie” (architekturę) i proces nauki. To komputer, analizując petabajty danych, sam „zapisuje” swoją wiedzę w postaci macierzy liczb. Gdybyśmy chcieli zamienić te miliardy parametrów na linie kodu w formacie if-then, otrzymalibyśmy nieskończenie długi i nieczytelny ciąg instrukcji.
Warto dodać, że obecnie granica ta jeszcze bardziej się zaciera. Narzędzia takie jak GitHub Copilot czy ChatGPT same generują tysiące linii kodu na minutę. Szacuje się, że w dużych firmach technologicznych już teraz znaczny procent nowego kodu jest współtworzony przez sztuczną inteligencję. Oznacza to, że AI „rozmnaża” linie kodu znacznie szybciej, niż jakikolwiek człowiek byłby w stanie to policzyć.
Jeśli szukasz krótkiej odpowiedzi, oto przybliżone wartości:
Zatem sztuczna inteligencja to paradoksalnie dość „krótki” program, który operuje na niewyobrażalnie wielkich bazach matematycznych zależności. To nie długość kodu świadczy o jej potędze, lecz jakość danych i moc obliczeniowa użyta do jej wytrenowania.