×

W jaki sposób sztuczna inteligencja generuje obrazy?

MidJourney to sztuczna inteligencja tworząca obrazy na podstawie zapytań. Dzięki aplikacji Discord i specjalnego kanału po wpisaniu komendy “/image:” możemy podać interesującą nas frazę w języku angielskim. Po krótkiej chwili wygenerowane zostaną dla nas cztery wersje obrazków. Możemy wtedy wybrać jeden i powiększyć lub stworzyć kolejne na jego podobieństwo. To wspaniałe narzędzie może służyć do generowania krajobrazów, ilustracji, wystrojów wnętrz, czy nawet oprawy graficznej dla naszych produktów. Jak więc to działa?

Sztuczna inteligencja potrafi “wyłapywać” elementy na zdjęciach i tworzyć do nich automatycznie podpisy. Do tworzenia obrazów proces ten został odwrócony i opracowany, aby nie tyle co wyszukiwał nam już istniejący, a łączył i tworzył coś zupełnie nowego. AI “uczy się” tego poprzez pewnego rodzaju trening. Aby jak najlepiej zrozumieć działanie przejdziemy przez jego etapy.

n

nWykorzystywane są do tego zbiory danych, które tworzone są przy pomocy alt tekstów- opisów zastępczych obrazu na blogach czy mediach społecznościowych dla wyszukiwarek. Wcześniej wspomniany trening odbywa się przy pomocy przestrzeni utajonej (latent space). Osadza w niej podobne do siebie elementy blisko siebie. Na zdjęciu widzimy kolejno dwa i trzy wymiary, aby w łatwy sposób zwizualizować co mniej więcej zachodzi w przypadku AI. Działanie to jest jednak dużo bardziej skomplikowane, ponieważ w MidJoruney jest to nawet pięćset wymiarów rozpoznających kształty, tekstury itp.

n

zdjęcie

n

Poprzez algorytmy głębokiego uczenia (deep learning), który polega na tworzeniu sieci neuronowych, sztuczna inteligencja uczy się odpowiedniego rozpoznawania obrazów wykorzystując wszystkie wymiary. Po odszukaniu wskazanych fraz, przystępuje do tworzenia obrazu. Poprzez iterację układa piksele tworzące obraz. Jest to losowy proces, który sprawia, że nie dostaniemy dwóch takich samych obrazów. Nawet, gdy wpiszemy takie same zapytanie w innej sztucznej inteligencji nie powtórzy się, ponieważ będziemy w innej ukrytej przestrzeni. n

iteracja pikseli w trakcie tworzenia obrazu

n

Wśród użytkowników i twórców zadawane często jest pytanie, z którym chciałabym was zostawić. Kto tak naprawdę jest twórcą obrazów?

n

Natalia Traczewska