Video: OpenAI predstavila aplikáciu, ktorá posúva generovanie realistických videí na nový level

Americká spoločnosť OpenAI vo štvrtok predstavila aplikáciu s názvom Sora, ktorá využitím umelej inteligencie dokáže vytvárať krátke realistické videá. Spoločnosť tiež stojí za revolučným chatbotom známym ako ChatGPT a generátorom obrázkov Dall-e.

Reprofoto: X

Reprofoto: X

Sora dokáže vygenerovať video s dĺžkou do jednej minúty. Vychádza pritom buď len zo slovného opisu, ktorý užívateľ zadáva cez textový príkaz, alebo z fotografie, ktorú "uvedie do pohybu". Výsledok sa javí ako video spracované v realite, od práce počítača sa takmer nedá odlíšiť.

Na sociálnej sieti X (predtým známej ako Twitter) sa objavilo už niekoľko videí, ktoré boli vygenerované pomocou tohto nástroja. Medzi nimi napríklad aj video, ktoré zobrazuje detail na oko neznámej ženy. Málokto by vedel rozoznať, či ide o video vytvorené filmárom alebo počítačom.

Nástroj zatiaľ nie je verejne dostupný, no generálny riaditeľ spoločnosti OpenAI Sam Altman na stránke X uviedol, že spoločnosť v testovacej fáze projektu "ponúka prístup obmedzenému počtu tvorcov".

"Poskytujeme tiež prístup množstvu vizuálnych umelcov, dizajnérov a filmárov, aby získali spätnú väzbu o tom, ako posunúť model tak, aby bol čo najužitočnejší pre kreatívnych profesionálov," uviedla spoločnosť priamo na svojom webovom sídle.

Užívateľov sociálnej siete vyzval, aby posielali svoje nápady na to, čo by pomocou programu Sora malo byť vygenerované. Na X sa takýmto spôsobom objavili výsledné videá s rôznymi motívmi, napríklad šteniatka, ktoré sa hrajú v snehu, či filmový trailer v žánre sci-fi.

Sora nie je na trhu prvou aplikáciou, ktorá vie za pomoci umelej inteligencie previesť text či obrázok na video. Podobnú technológiu už uviedli spoločnosti ako Google, Meta či startup Runway ML. Vysoká kvalita videí, ktorú predviedla spoločnosť OpenAI, však užívateľov prekvapila a u niektorých vyvolala aj obavy o etické a spoločenské dôsledky.

"Budeme spolupracovať s tvorcami politík, pedagógmi a umelcami na celom svete, aby sme pochopili ich obavy a identifikovali pozitívne prípady využitia tejto novej technológie," uviedla spoločnosť Open AI.

Firma so sídlom v San Franciscu tiež varovala, že "súčasný model má nedostatky", medzi ktoré napríklad patrí zamieňanie pravej a ľavej strany. Program tiež nedokáže zachovať vizuálnu kontinuitu počas celej dĺžky videa.

"Môže mať problémy s presnou simuláciou fyziky komplexnej scény a nemusí pochopiť konkrétne prípady príčiny a následku. Osoba si môže napríklad odhryznúť zo sušienky, ale potom na sušienke nemusí byť žiadna stopa," uviedla OpenAI.

V najbližších dňoch bude verejnosť zrejme zaujímať aj to, akým spôsobom program Sora spoločnosť "trénovala". OpenAI totiž v súvislosti s vývojom ChatGPT v minulosti žaloval denník New York Times a niektorí autori za to, že na trénovanie použila diela chránené autorským právom.