OpenAI, krijuesi i ChatGPT dhe krijuesi i imazheve DALL-E, ka zbuluar një mjet të ri të quajtur ‘Sora’, i cili është në gjendje të krijojë, thjesht duke futur tekst, video realiste që mund të zgjasin deri në një minutë – një risi e madhe në këtë fushë të inteligjencës artificiale.
Bazuar në kërkimet e mëparshme mbi programet DALL-E dhe GPT, kjo platformë e re është ende në testim, sqaroi aleati fillestar i Microsoft me bazë në Kaliforni, i cili megjithatë prezantoi disa video dhe mënyrën se si u krijuan. Programi mund të krijojë video me një gjatësi maksimale prej një minutë “duke ruajtur cilësinë vizuale dhe duke respektuar kërkesën e përdoruesit”, tha OpenAI në faqen e saj të internetit.
Sora mund të “krijojë skena komplekse me fytyra të shumta, lloje specifike lëvizjesh dhe detaje të sakta”, thotë start-up në faqen e saj të internetit. Sora gjithashtu lejon që videot të krijohen nga një imazh statik, siguron gjigandi i AI, ose videot ekzistuese të zgjerohen.
Look at this cat video!
Do you notice anything odd?
Well this is not a real cat! It’s created by OpenAI’s new model called “Sora” ! pic.twitter.com/JYsO5ZdF1A— iArgue (@x_ai_a12) February 16, 2024
Sam Altman, kreu i OpenAI, tha në median sociale X se kompania e tij “do t’i ofrojë një numri të kufizuar krijuesish akses” në këtë mjet të ri, si pjesë e një faze eksperimentale.
Ai gjithashtu ftoi përdoruesit të bëjnë sugjerime për krijimin e videove dhe pak minuta më vonë ngarkoi ato më të suksesshmet në platformë. Mes këtyre videove shihet dy qen duke luajtur në dëborë në një mal. Një video tjetër tregon fluturimin e një kafshe imagjinare gjysmë rosë, gjysmë dragua përpara një muzgu të bukur.
Ok this… Is an AI video.#OpenAI #Sora https://t.co/7o80Bnz8Ob
— Vikram Arora (@neoviky) February 16, 2024
Sora shërben si bazë për “programe të afta për të kuptuar dhe simuluar botën reale”, shpjegon startup-i, i cili shpreson se ” do të jetë një moment historik i rëndësishëm në realizimin e AGI “, Inteligjenca Artificiale e Përgjithshme, një sistem shumë autonom që e mbart atë. do të tejkalojnë njerëzit në shumicën e punëve me kosto efektive.
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024
OpenAI paralajmëroi se “modeli aktual” i platformës ka “të meta”, duke ngatërruar të majtën me të djathtën dhe duke treguar një paaftësi për të ruajtur vazhdimësinë vizuale gjatë gjithë videos.
SORA can animate images pretty amazingly.
Prompt: “In an ornate, historical hall, a massive tidal wave peaks and begins to crash. Two surfers, seizing the moment, skillfully navigate the face of the wave.” pic.twitter.com/rNDB98jTe2
— AP (@angrypenguinPNG) February 16, 2024
“Për shembull, një person mund të kafshojë një cookie, por pas cookie-t mund të mos ketë shenja pickimi”, shpjegon kompania. Në zbulimin e këtij mjeti të ri, OpenAI tha se çështja e sigurisë është një problem i rëndësishëm dhe se do të organizohen simulime me përdoruesit që u kërkohet të keqfunksionojnë ose të krijojnë përmbajtje të papërshtatshme për të përcaktuar më mirë kufijtë e platformës.
“Ne do të ftojmë politikëbërësit, edukatorët dhe artistët nga e gjithë bota për të kuptuar shqetësimet e tyre dhe për të identifikuar rastet pozitive të përdorimit të kësaj teknologjie të re,” tha OpenAI. Meta, Google dhe Runway AI, të cilat po punojnë në aplikacione të ngjashme tekst-në-video, kanë treguar tashmë disa mostra.