un blog de Radu Dumitru

►► canalele mele de YouTube: youtube.com/RaduDumitru (personal) și youtube.com/NwraduBlog (tech) ◄◄

Sora, un AI text-to-video, funcționează incredibil de bine generând clipuri video pe baza unui text

16 Feb 2024  ·

TEHNOLOGIE  ·

20 comentarii

Dacă încă nu sunteți convinși că AI-ul va schimba foarte multe în lumea noastră în anii următori, intrați pe Sora de la OpenAI și uitați-va la exemplele de acolo.

Sora este un AI generativ de clipuri video făcut de OpenAI. Îi dai un text și îți generează un clip video bazat pe acea descriere. Și îl generează foarte bine, cel puțin din ce văd în cele vreo 20 de exemple din site. Este incredibil, de fapt, că marea majoritate a clipurilor sunt… perfecte. Le poți folosi oricând pentru b-roll sau în alte scopuri.

Nu le pot da embed aici, de asta zic să dați click pe linkul de mai sus și să vă uitați la exemplele lor. Câteva screenshot-uri:

 

Acum OpenAI spune că întâi îl va da spre testare unor experți în etică și unor artiști pentru a descoperi ce probleme ar putea genera un astfel de AI precum Sora. Nu probleme de funcționare, ci de etică, de factor de schimbare în diverse domenii.

Va fi greu în viitor. OpenAI își pune probleme de etică, dar hackerii sau țările care sponsorizează deepfake-uri nu. Clipurile video pot fi atât de ușor generate acum, la fel și imaginile. Vocea poate fi generată aproape identic cu a unei persoane plecând de la doar câteva secunde de înregistrări reale. Avea Linus un exemplu recent (aici la 2:51:40), ei vor să facă un canal întreg în care să prezinte componente folosind vocea sa, dar generată de un AI. Aproape orice poate fi deja creat artificial.

    20 comentarii

  1. Japoneza parcă are gleznele rupte. Apoi, nici în București nu vezi așa trotuar cu asfalt denivelat și neracordat la cota bordurii, AI încă nu cunoaște că doar așa se scurge apa.

      (Citează)

    • S-a umplut de medici ortopezi, angajati part-time ca ingineri, pe blogul asta.

        (Citează)

    • Vali:
      Japoneza parcă are gleznele rupte.

      Și pe la secunda 15 piciorul drept i se schimbă în piciorul stâng.

        (Citează)

    • How you dare ??

        (Citează)

    • Vali:
      Japoneza parcă are gleznele rupte. Apoi, nici în București nu vezi așa trotuar cu asfalt denivelat și neracordat la cota bordurii, AI încă nu cunoaște că doar așa se scurge apa.

      Normal, sunt multe greșeli. Dar te-ai uitat după ele pentru că ți s-a zis că este un clip făcut de un AI și ai stat să cauți greșeli.

      Acum un an nu exista așa ceva. Dall-E nu putea să pună degete corect nici măcar într-o fotografie. Acum există treaba de mai sus. Gândește-te la ce va fi peste un an, nu la glezne rupte.

        (Citează)

    • Chiar așa, cum îmi dau cu părerea despre ceea ce văd?

        (Citează)

  2. perfecte intr-adevar. in prima poza e un corgi injunghiat cu un selfie stick

      (Citează)

  3. e clar ca viitorul actorilor nu e prea bun, bagi scenariul si iese filmul

      (Citează)

  4. future is now. Incredibil.

      (Citează)

  5. Nu ni se spune ce hardware au folosit ca sa genereze ce vedem, si in cat timp. Imi imaginez ca are cerinte masive

      (Citează)

  6. E adevarat ca mai are unele neajunsuri cand e vorba de oameni/animale – tipa aia ba merge ba pluteste, dalmatianul cam sfideaza fizica si geometria cand trece de pe un pervaz pe celalalt, mai este un clip cu niste pui de lup care se “spawn-eaza” din neant etc. Probabil poti gasi “greseli” in fiecare clip daca te uiti atent sa le cauti. Dar… este probabil una dintre primele iteratii disponibile prostimii. Pana la urma nici primul iphone nu avea bluetooth, background-uri si alte prostioare standard pe alte telefoane la vremea aceea. Oricat de paranoia ar suna, sunt convins ca daca acum s-a facut public in stadiul asta, sunt unii “baieti” care au acces de mult timp la softuri similare si probabil mai rafinate. Si pe langa asta, cat de analitic credeti ca va privi sustinatorul sosoaca/simion/trump etc. clipuri de genul? Si nici nu trebuie sa faca parte din acele categorii, aratati-le parintilor vostri sa vedeti daca isi dau seama de astfel de “neajunsuri” fara sa ii avertizati dinainte.

      (Citează)

  7. Și îl generează foarte bine, cel puțin din ce văd în cele vreo 20 de exemple din site.

    Zic să așteptăm până putem să vedem ce generează din textul nostru, nu din exemple de pe site, aka marketing.

    Si DALL-E era promițător din marketing, am plătit o lună la el – un gunoi inutil, incomparabil mai prost decât Midjourney , de exemplu, care nici ăla nu e extraordinar, doar utilizabil.

      (Citează)

  8. Un video chiar despre Sora https://youtu.be/tWP6z0hvw1M

      (Citează)

  9. Eu eunul abia astept sa fie open free sa il incerc :D

      (Citează)

    Alătură-te discuției, lasă un mesaj

    E-mail-ul nu va fi publicat. Fără înjurături și cuvinte grele, că vorbim prietenește aici. Gândiți-vă de două ori înainte de a publica. Nu o luați pe arătură doar pentru că aveți un monitor în față și nu o persoană reală.

    Apăsați pe Citează pentru a cita întreg comentariul cuiva sau selectați întâi anumite cuvinte și apăsați apoi pe Citează pentru a le prelua doar pe acelea. Link-urile către alte site-uri, dar care au legătură cu subiectul discuției, sunt ok.


    Prin trimiterea comentariului acceptați politica de confidențialitate a site-ului.



    Vreți un avatar în comentarii? Mergeți pe gravatar.com (un serviciu Wordpress) și asociați o imagine cu adresa de email cu care comentați.

    Dacă ați bifat să fiți anunțați prin email de noi comentarii sau posturi, veți primi inițial un email de confirmare. Dacă nu validați acolo alegerea, nu se va activa sistemul și după un timp nu veți mai primi nici alte emailuri

    Comentariile nu se pot edita ulterior, așa că verificați ce ați scris. Dacă vreți să mai adăugați ceva, lăsați un nou comentariu.

sus