22/02/2026
Sztuczna Inteligencja … czyli Hołd Wolności.
Ten post jest dla mnie wyjątkowy. Ten post jest kontynuacją historii … sięgającej lat 1998-99.
Post jest kombinacją wielu rzeczy. Przede wszystkim jest przesłaniem symbolicznym. Ten film jest do indywidualnego odbioru, jednak na końcu napiszę, co autor miał na myśli … ale po kolei.
Film powstał w pełni przy wykorzystaniu sztucznej inteligencji. Każdy kadr, głos, efekty video czy dźwiękowe, wszystko co widzicie nie zostało nagrane, nie zostało użyte żadne realne zdjęcie.
Jedyną realną rzeczą jaką wykorzystałem w tym filmie jest narracja. Tekst powstał ponad 25 lat temu, w języku polskim i jest wstępem do dłuższego opowiadania które napisałem. Tak się zaczyna „Hołd wolności czasu i miłości”. Do tej pory przeczytało to 4 osoby i nadal zostanie schowane w półce. Jedyne co chciałem przekazać to sam początek. Jest on symbolicznym przesłaniem do własnych odczuć.
W tych czasach jest nam lepiej i wygodniej coś zobrazować, mógłbym skomponować film na materiale zbieranym nawet miesiącami, ale … to też dla mnie było pewnego rodzaju wycieczką.
Film powstał w pełni przy wykorzystaniu AI. Tekst był dla mnie podstawą. Na samym początku wykorzystałem stworzonego agenta w ChatGPT, który, ogarnął mi każdą sekundę tego klipu. Wygenerował mi dokładny timeline wraz z promptami do midjourney, które stały się podłożem do generowania materiałów video.
Po tekście, postał głos, w sumie to trzy głosy. Pierwotnie miałem używać do tego Heygen, lecz ograniczyłem się tylko do ElevenLabs. Tam powstał, podkład narratora oraz głosy męski i żeński. Tam też wygenerowałem kilka efektów dźwiękowych takich jak odgłos bicia serca czy pogłos jadącego pociągu.
Mając tekst i głos, kolejno wygenerowałem podkład muzyczny. W suno wygenerowałem 2 piosenki, pierwsza miała być spokojna i nostalgiczna a druga zaś szybka i epicka. Podkład został modyfikowany w zależności od akcji filmu, dodatkowo w jego trakcie nie trzymałem się żadnych reguł takich jak nie przekrać -3dB, dźwięk został dostosowany do akcji.
Po podkładzie muzycznym przyszedł czas na video. Tutaj stosowałem taki narzędzia jak: Kling, RunawayML, Veo od Google, ChatGpt, eleven Labs, Midjourney, PixVerse oraz Higgsfield a nawet generative refill od Adobe Premiere.
O ile początek miał być bardzo szeroko pojęty, zatem nie trzymałem się za bardzo spójności obrazu, lecz w drugiej części posiłkowałem się kontynuacją kadrów, a każdy następny miał być kontynuacją poprzednich. Dzięki kadrom początkowym i końcowym otrzymałem tą spójność.
Materiał video trafił do takich programów jak Adobe Premiere, gdzie powstał cały film, After Effects, gdzie rzuciłem kilka efektów oraz Photoshop gdzie podciągałem jakość czy trzymałem proporcje.
Ten film jest o tyle nietypowy, gdyż w całości postał w AI, z doświadczenia wiem, że najlepszym przekładem jest realna rzecz kontynuowana sztucznie, np. dwa realne kadry, początkowy i końcowy z generowanym filmem w środku.
Powstał w jakości 720p oraz 1080p przy 24fps, docelowo dociągnięty do FHD.
Nie jest sztuką zrobić 15 sekund w obecnych czasach. Powstaje wiele rzeczy, mamy coraz to lepsze ku temu narzędzia. Tutaj chciałem dostać dokładnie to co zamierzałem dostać. Ten film miał być symbolicznym i taki powstał.
Sporo kadrów jest zamglonych, są ściemnienia, jest kadr pod słońce, nachodzące się dwa i więcej kadrów czy ścieżek dźwiękowych.
Generalnie chciałbym aby każdy z zainteresowanych sam wydobył z siebie symbolikę tego klipu. Aby każdy w nim znalazł sens tego a nie innego przesłania. Coś więcej niż orzeł, który nie koniecznie jest orłem, a gniazdo jest dwoma różnymi miejscami.
A co autor miał na myśli.
Całość podzielona na dwie części. Pierwsza jest spokojna, nostalgiczna. Tory i spacerujący mężczyzna jest symbolem naszej drogi życia. Idziemy po nich pewni swego zdania.
Orzeł jest kolejnym symbolem. Ten orzeł to głównie ptak, który jest na tle szerokiego krajobrazu. To nie musi być orzeł i nie jest nim dokładnie, to może być nawet bocian czy gołąb. Chodziło mi o kompozycję i pewien ład.
Mysz, nie istotna kartka historii, ale też istotny byt. Pisklę, cel aby potrzymać gatunek.
Ten porządek zostaje zakłócony.
Przez mężczyznę idącego przez życie, który traci nad nim kontrolę, burzy ład. Jedna decyzja staje się podłożem do zmiany historii i ma wpływ na otoczenie.
Pisklę, które żywi się rodzicem, aby przetrwać.
Ucieczka staje się ograniczeniem. Oddech, bicie serca, mgła. Nie możemy uciec z torów i stajemy się uwięzieni we własnych decyzjach, gdzie na końcu pytamy, dlaczego, a przecież to była nasza decyzja.
Ten film nie musi być tragiczny, on jest snem. On jest refleksją do tego aby zwolnić i zastanowić się nad ważniejszymi rzeczami w życiu niż przemierzanie życia … torami.
Jeśli się ten film Wam spodobał i macie ochotę go udostępnić to dziękuję bardzo. Ciekawi mnie odbiór innych osób. W sumie to ciekawi mnie Wasz odbiór, być może inaczej go odbieracie. Sam film trafi też na stronę i na LinkedIn.
W planach mam jeszcze zamiar stworzyć awatara w HeyGen oraz inny klip lecz już nie na systemach API lecz lokalnie na PC na podłożu Comfy UI, gdyż tam też są coraz lepsze modele, generujące nie tylko video ale i audio czy modele 3D.
Ile mi to zajęło i ile to kosztowało?
Film powstawał 7 dni, po 2h dziennie.
Polegało to na generowanie głosu, video i efektów i na bieżąco ich składanie, czyli około minuta na dzień. Korzystałem z kilku stron AI, posiłkowałem się VPNem, jednak większość powstała na Veo. Mógłbym to zrobić w jedną dobę jednak, czas w jaki sposób to rozłożyłem, na przestrzeni tygodnia pozwolił mi na bieżąco wprowadzać poprawki i zmiany. Bywało, że kończąc film, zmieniałem początek dla konsystencji całego przekazu.
Sam film otrzymał finalnie 55 krótkich ujęć video, 5 kadrów graficznych, 2 podkłady muzyczne, 6 podkładów głosów i 7 efektów dźwiękowych. Film dostał przepływ optyczny klatek dla złagodzenia płynności filmu.
Klip, który wykonałem, kosztował mnie 0 zł, jednak miałem dostęp do subskrypcji Chat GPT, Midjourney, Eleven Labs, Kling oraz pełny pakiet od Adobe. Kilka kont pozwoliło mi przyspieszyć proces, dlatego coraz bardziej wchodzę w środowisko Comfy UI aby się uniezależnić od systemów API. Dla osób nie znających nowej technologii, może to być albo irytujące albo bardzo kosztowane. Nie każdy kadr jest taki jaki byśmy chcieli aby był, co podwaja lub potraja nam ilość prób. W dodatku, nie wiedza w środowisku AI, jest wykorzystywana, przez wielu „fachowców od treningu AI”, a z drugiej strony sfera elementów tworzonych w AI jest bardzo cienka. Deep fake czy scam jest już faktem i wystarczy nam jedno zdjęcie i 15 sekund głosu aby w pełni stworzyć video rozmowę tej osoby.
Także, AI jest podporą systemu nie tylko w grafice, podnosi nam jakość i wygodę w życiu lecz jest też narzędziem, gdzie aby być świadomym i bezpiecznym musimy być z nim na bieżąco.
Wracając do filmu z posta. W komentarzu jest zrzut z ekranu na finalną wersję, która wyszła z programu Adobe Premiere.
Wybrane grafiki obrazują moje umiejętności zmiany i efektu wizualnego danej osoby, przedmiotu czy krajobrazu na bazie oryginalnego podkładu. Finalny efekt jest subiektywny i obejmuje dany zakres czasowy. Każdy z nas inaczej postrzega różne rzeczy i każdy z nas dysponuje innym zakresem czasowym czy umiejętnościami. Cyklicznie publikowane posty z konkretnie tematycznym projektem mają za cel systematycznie gromadzić materiały obrazujące możliwości graficzne.
Miłego oglądania!