Gość (37.30.*.*)
Granica między rzeczywistością a fikcją cyfrową nigdy nie była tak cienka jak teraz. Jeszcze kilka lat temu obrazy generowane przez sztuczną inteligencję można było łatwo rozpoznać po zdeformowanych dłoniach, nienaturalnym rozmyciu tła czy dziwnych artefaktach przypominających senny koszmar. Dziś stoimy na progu momentu, w którym odróżnienie wygenerowanego obrazu od prawdziwego zdjęcia zrobionego aparatem cyfrowym staje się dla ludzkiego oka praktycznie niemożliwe.
Jeśli zastanawiasz się, jak blisko jesteśmy tej wizji, odpowiedź brzmi: jesteśmy już na samym finiszu, a w wielu aspektach po prostu tam dotarliśmy. Narzędzia, które mamy do dyspozycji obecnie, potrafią generować obrazy o tak nieprawdopodobnym poziomie szczegółowości, że nawet profesjonalni fotografowie mają problem z ich jednoznaczną oceną.
Kluczowymi graczami na polu fotorealizmu są obecnie zaawansowane modele, takie jak rodzina FLUX.2 (stworzona przez Black Forest Labs) oraz Midjourney v7. Szczególnie FLUX zrewolucjonizował rynek, oferując niesamowicie realistyczną teksturę skóry (z widocznymi porami, drobnymi włoskami, piegami i niedoskonałościami), naturalne zachowanie światła oraz fizykę cieni, która idealnie naśladuje optykę prawdziwych obiektywów fotograficznych.
Wystarczy wpisać odpowiedni opis (prompt), aby otrzymać portret człowieka, który wygląda, jakby został zrobiony profesjonalną lustrzanką w studiu fotograficznym lub dynamiczne ujęcie uliczne z idealnie odwzorowanym efektem rozmycia tła (bokeh). Dla przeciętnego odbiorcy, przeglądającego media społecznościowe czy strony internetowe, te obrazy są już teraz w 100% nie do odróżnienia od rzeczywistości.
Warunek dotyczący darmowego i łatwego dostępu również został już w dużej mierze spełniony. Tworzenie takich obrazów nie jest już zarezerwowane dla programistów czy osób z ogromnym budżetem.
Choć jesteśmy niezwykle blisko ideału, to przy bardzo wnikliwej analizie (szczególnie przy dużym przybliżeniu) wprawne oko wciąż może dostrzec pewne niuanse. Te drobne błędy to ostatnia przeszkoda na drodze do absolutnej perfekcji:
Biorąc pod uwagę tempo rozwoju technologii generatywnych, dzielący nas dystans kurczy się w zastraszającym tempie. Szacuje się, że w ciągu najbliższych 12 do 24 miesięcy (czyli w okolicach lat 2027–2028) algorytmy fizyczne i generatywne zostaną dopracowane do tego stopnia, że nawet przy maksymalnym zoomie i analizie fizyki światła, ludzkie oko nie będzie w stanie znaleźć żadnego punktu zaczepienia.
Wtedy jedynym sposobem na odróżnienie prawdy od fikcji będzie zaawansowana analiza metadanych lub specjalne algorytmy kryptograficzne.
W odpowiedzi na zalew fotorealistycznych grafik AI, branża fotograficzna i technologiczna zaczęła aktywnie wdrażać standard o nazwie C2PA (Coalition for Content Provenance and Authenticity). Jest to technologia, która pozwala aparatom fotograficznym na cyfrowe "podpisywanie" zdjęć w momencie ich wykonywania. Taki kryptograficzny podpis udowadnia, że dany obraz powstał poprzez naświetlenie fizycznej matrycy aparatu, a nie w wyniku obliczeń procesora graficznego. W świecie, w którym nasze oczy przestają być wiarygodnym sędzią, to właśnie matematyka musi stanąć na straży prawdy.