Jakie masz pytanie?

lub

Ile zasobów mocy obliczeniowej zużywa AI na stworzenie (wygenerowanie) obrazka lub przerobienie zdjęcia?

koszt energetyczny generowania zużycie mocy obliczeniowej AI zasoby GPU do obrazów
avatar

Gość (37.30.*.*)



Odpowiedź:

To, ile zasobów mocy obliczeniowej pochłania sztuczna inteligencja na wygenerowanie obrazka lub przerobienie zdjęcia, to jedno z najczęściej pomijanych, ale jednocześnie kluczowych pytań w kontekście dynamicznego rozwoju AI. Odpowiedź nie jest prosta, ponieważ zależy od wielu czynników, ale możemy ją sprowadzić do konkretnych liczb i porównań.

W skrócie: wygenerowanie pojedynczego obrazu przez zaawansowane modele, takie jak Midjourney, DALL-E czy Stable Diffusion, zużywa zaskakująco dużo energii, choć z perspektywy użytkownika końcowego jest to proces niemal natychmiastowy.

Energetyczny koszt generowania obrazu: naładowanie smartfona

Kiedy wpisujesz prompt i czekasz kilka sekund na spektakularny efekt, za kulisami pracują potężne centra danych. Badacze ze startupu Hugging Face i Carnegie Mellon University przyjrzeli się temu problemowi i doszli do zaskakujących wniosków.

Według ich szacunków, wygenerowanie jednej grafiki przez AI zużywa tyle energii, co jednorazowe naładowanie smartfona.

W szerszej skali, koszty środowiskowe stają się bardziej namacalne:

  • Emisja CO2: Wytworzenie 1000 obrazów uwalnia do atmosfery około 1 kg dwutlenku węgla. Biorąc pod uwagę, że codziennie generowane są miliony, jeśli nie miliardy, obrazów, skala problemu rośnie lawinowo.
  • Porównanie z innymi zadaniami: Generowanie obrazów okazało się jednym z najbardziej wymagających energetycznie procesów spośród 13 różnych analizowanych operacji AI, przewyższając nawet modelowanie językowe i generację tekstu (na których bazuje np. ChatGPT).
  • Wysokie zapotrzebowanie na chłodzenie: Należy pamiętać, że oprócz samego zasilania serwerów, ogromne ilości energii pochłania również chłodzenie centrów danych, które obsługują te procesy.

Ciekawostka

Jedno zapytanie do ChatGPT może być nawet pięciokrotnie bardziej energochłonne niż zwykłe wyszukiwanie w Google. To pokazuje, że nawet na poziomie tekstowym AI jest znacznie bardziej "prądożerna" niż tradycyjne technologie.

Zasoby obliczeniowe: Co jest potrzebne do generowania?

Moc obliczeniowa AI jest mierzona głównie w kontekście czasu pracy na jednostkach GPU (Graphics Processing Unit), które są kluczowe dla szybkich obliczeń równoległych w modelach generatywnych.

W przypadku popularnych modeli, takich jak Stable Diffusion, które można uruchomić lokalnie na własnym komputerze, wymagania sprzętowe dają nam wgląd w to, jakiego rodzaju zasoby są potrzebne do wykonania zadania:

Element sprzętu Minimalne wymagania Zalecane wymagania
Karta graficzna (GPU) 4 GB pamięci VRAM (np. NVIDIA lub AMD) 8 GB VRAM lub więcej (np. NVIDIA GeForce RTX 3060 z 12 GB VRAM)
Pamięć RAM 8 GB 16 GB+
Miejsce na dysku 20 GB (na modele i oprogramowanie) 50 GB+

Generowanie obrazu na procesorze (CPU) jest możliwe, ale drastycznie wydłuża czas oczekiwania, dlatego praktycznie zawsze wykorzystuje się do tego celu karty graficzne. Szybkość generowania zależy bezpośrednio od mocy i ilości pamięci VRAM karty graficznej.

Przerabianie zdjęć: Czy to jest mniej wymagające?

Przerabianie zdjęć za pomocą AI, czyli tzw. edycja typu image-to-image (np. usuwanie obiektów, zmiana tła, dodawanie elementów za pomocą promptów, jak w narzędziach typu Magic Edit w Canvie czy OpenArt), również opiera się na modelach generatywnych, często tych samych co do tworzenia obrazów od zera (np. Stable Diffusion).

Zużycie mocy obliczeniowej w przypadku edycji jest bardzo zbliżone do generowania, ponieważ:

  1. Inpainting/Outpainting: Proces usuwania lub dodawania elementów wymaga od modelu "zrekonstruowania" brakujących pikseli lub wpasowania nowego obiektu w istniejący kontekst, co jest zadaniem obliczeniowo intensywnym.
  2. Generowanie w tle: Zmiana tła lub stylu często polega na wygenerowaniu zupełnie nowego obrazu lub jego dużej części, bazując na oryginalnym zdjęciu jako punkcie wyjścia.

Ostateczne zużycie zasobów zależy od złożoności zadania: proste usunięcie tła jest mniej wymagające niż skomplikowane dodanie fotorealistycznego obiektu w określonym stylu i oświetleniu. Jednak w obu przypadkach, mówimy o obciążeniu, które wymaga dostępu do potężnej infrastruktury GPU w chmurze lub bardzo wydajnej karty graficznej na komputerze lokalnym.

Podziel się z innymi: