Z ilu linii kodu składa się sztuczna inteligencja?

programowanie sieci neuronowe kod źródłowy

architektura sieci neuronowych jak działa sztuczna inteligencja ile kodu ma AI

Gość (37.30.*.*)

3 miesiące temu

Odpowiedź:

Pytanie o to, z ilu linii kodu składa się sztuczna inteligencja, jest jednym z tych, na które nie da się odpowiedzieć jedną, konkretną liczbą. Wszystko zależy od tego, co rozumiemy pod pojęciem „AI”. Czy mówimy o prostym algorytmie, który rozpoznaje cyfry, czy o potężnym modelu językowym, takim jak GPT-4? W świecie programowania sztuczna inteligencja to nie jest jeden monolit, lecz połączenie kodu źródłowego, matematycznych wag i ogromnych zbiorów danych.

Kod kontra parametry – gdzie kryje się „inteligencja”?

Zanim przejdziemy do konkretnych liczb, musimy zrozumieć fundamentalną różnicę między tradycyjnym oprogramowaniem a sztuczną inteligencją. W klasycznym programie, np. w kalkulatorze, każda funkcja jest opisana przez programistę za pomocą instrukcji „jeśli to, to zrób tamto”. Taki kod może mieć tysiące linii, a każda z nich odpowiada za konkretne działanie.

W przypadku AI, a konkretnie uczenia maszynowego, sytuacja wygląda inaczej. Sam kod, który definiuje strukturę sieci neuronowej (architekturę), może być zaskakująco krótki. To, co sprawia, że AI „wie”, jak odpowiedzieć na pytanie, to nie linie kodu, ale parametry (wagi). Przykładowo, model GPT-3 ma 175 miliardów parametrów, ale kod, który go uruchamia, mógłby zmieścić się na kilkunastu stronach wydruku.

Ile linii kodu mają różne systemy AI?

Aby dać Ci lepszy obraz sytuacji, przyjrzyjmy się różnym skalom projektów związanych ze sztuczną inteligencją:

Prosta sieć neuronowa: Jeśli chciałbyś napisać w języku Python prostą sieć rozpoznającą odręcznie pisane cyfry (popularny zbiór MNIST), wystarczy Ci około 20–50 linii kodu przy użyciu bibliotek takich jak PyTorch czy TensorFlow.
Modele open-source (np. Llama od Meta): Sam kod odpowiedzialny za „wnioskowanie” (czyli generowanie odpowiedzi przez gotowy model) to zazwyczaj kilkaset do kilku tysięcy linii. To niewiele więcej niż skomplikowany skrypt do obsługi bazy danych.
Biblioteki i frameworki: To tutaj kryje się prawdziwy ogrom pracy programistycznej. Biblioteki takie jak TensorFlow czy PyTorch, na których buduje się niemal całe współczesne AI, składają się z milionów linii kodu (C++, Python, CUDA). To one stanowią fundament, na którym inżynierowie stawiają swoje modele.
Systemy autonomiczne (np. samochody Tesla): Tutaj AI jest częścią ogromnego ekosystemu. Całe oprogramowanie sterujące pojazdem, łączące analizę obrazu z kamer, radary i systemy bezpieczeństwa, to prawdopodobnie dziesiątki milionów linii kodu.

Dlaczego linie kodu nie są miarą zaawansowania AI?

W tradycyjnym IT często mówi się, że im więcej linii kodu, tym bardziej skomplikowany system (choć nie zawsze lepszy). W AI ta zasada niemal nie obowiązuje. Największym przełomem ostatnich lat była architektura Transformer (opisana w słynnej pracy „Attention Is All You Need”). Jej implementacja nie jest przerażająco długa, ale sposób, w jaki przetwarza dane, zrewolucjonizował świat.

Współczesne AI opiera się na tzw. „kodzie różniczkowalnym”. Programista nie pisze reguł, lecz tworzy „naczynie” (architekturę) i proces nauki. To komputer, analizując petabajty danych, sam „zapisuje” swoją wiedzę w postaci macierzy liczb. Gdybyśmy chcieli zamienić te miliardy parametrów na linie kodu w formacie if-then, otrzymalibyśmy nieskończenie długi i nieczytelny ciąg instrukcji.

Ciekawostka: AI pisząca kod

Warto dodać, że obecnie granica ta jeszcze bardziej się zaciera. Narzędzia takie jak GitHub Copilot czy ChatGPT same generują tysiące linii kodu na minutę. Szacuje się, że w dużych firmach technologicznych już teraz znaczny procent nowego kodu jest współtworzony przez sztuczną inteligencję. Oznacza to, że AI „rozmnaża” linie kodu znacznie szybciej, niż jakikolwiek człowiek byłby w stanie to policzyć.

Podsumowanie w liczbach

Jeśli szukasz krótkiej odpowiedzi, oto przybliżone wartości:

Logika modelu AI: od 100 do 5 000 linii kodu.
Infrastruktura do trenowania: od 10 000 do 100 000 linii kodu.
Biblioteki fundamentowe (silniki): od 1 do 5 milionów linii kodu.
Wiedza modelu (parametry): miliardy punktów danych (to nie jest kod sensu stricto, ale to one decydują o inteligencji).

Zatem sztuczna inteligencja to paradoksalnie dość „krótki” program, który operuje na niewyobrażalnie wielkich bazach matematycznych zależności. To nie długość kodu świadczy o jej potędze, lecz jakość danych i moc obliczeniowa użyta do jej wytrenowania.

Jakie masz pytanie?