un blog de Radu Dumitru

►► canalele mele de YouTube: youtube.com/RaduDumitru (personal) și youtube.com/NwraduBlog (tech) ◄◄

Lumea roboților: o extensie de browser face rezumatul clipurilor video prin ChatGPT, chiar și în limba română

12 Apr 2023  ·

TEHNOLOGIE  ·

9 comentarii

Am butonat ieri un pic o extensie de browser numită Glarity. Aceasta folosește ChatGPT de la OpenAI pentru a face rezumat la clipuri video de pe YouTube și la diverse site-uri.

Funcționează pentru clipurile video în limba engleză pentru că acelea au transcrierea automată de la YouTube, acel auto-generated captions activabil prin butonul CC din YouTube. Glarity descarcă “subtitrarea” automată, o interpretează prin ChatGPT și îți oferă rezumatul ei într-o listă de 3 puncte.

Pur și simplu acest rezumat apare în browser, în dreapta clipului de YouTube. În cazul meu, rezumatul apare în limba română probabil pentru că așa am setat contul meu OpenAI (ai nevoie de un cont acolo, Glarity se conectează cu el la ChatGPT).

Treaba asta are mai multe implicații imediate. Orice clip video în engleză din YouTube este acum imediat indexabil, de exemplu, și nu doar de către Google. Orice clip devine o sursă de date, o mină, pentru un data miner automatizat. La unele clipuri nu mai ai de ce să te uiți, că le vezi direct rezumatul.

Am deschis un clip de pe Linus Tech Tips. Primul este un review amplu al noului procesor Ryzen 7800X3D. Rezumatul dat de extensie este cel de mai jos:

Rezumat
Ryzen 7 7800X3D este cel mai bun procesor pentru gaming de pe piață și AMD a manipulat intenționat comunitatea înainte de lansarea acestuia.
Repere
– AMD a lansat Ryzen 7 7800X3D, cel mai bun procesor pentru gaming de pe piață.
– AMD a manipulat comunitatea prin promovarea mai întâi a procesoarelor mai scumpe, Ryzen 9 x3D, înaintea lansării procesorului Ryzen 7 7800X3D.
– Tehnologia 3D Vcache îmbunătățește performanța și îi oferă lui AMD avantajul în competiție cu Intel.

Știu clipul, l-am urmărit de două ori, cele scrise mai sus sunt adevărate. Rezumatul este foarte scurt și nu pomenește nimic despre toate benchmark-urile făcute de autor și despre tehnologia din spatele performanței respective.

Rezumatul rant-ului este foarte corect. AMD a lansat întâi procesoare mai scumpe și mai slabe decât acesta de acum, care este mai ieftin și mai performant decât cele lansate acum o lună. Nu este ceva la care să te aștepți și probabil mulți early adopters s-au îndreptat spre varianta mai scumpă fără să știe că nu va fi cea mai bună a gamei!

Rezumatul pare scurt, dar în setările extensiei Glarity am găsit de fapt query-ul pe care-l înaintează către ChatGPT. Alături de transcrierea clipului video, îi cere și să-l rezume în maxim 3 idei. De asta sunt trei mai sus.

Am modificat eu query-ul din “3 brief points” în “5 points” și am obținut după un refresh rezumatul de mai jos:

Sumar
– 🎮 Ryzen 7 7800X3D este considerat cel mai bun procesor pentru gaming de pe piață, învingându-și rivalii direcți, în special Intel Core i7-13700K.
– 🚀 3D V cache este tehnologia care face diferența, permițând stivuirea cache-urilor vertical, mărirea capacității și reducerea timpilor de acces.
– 🤨 AMD este acuzat de manipularea comunității prin lansarea în prealabil a altor variante de procesoare, mai scumpe și mai puțin performante.
– 💰 Ryzen 9 x3d este depășit de modelul mai ieftin Ryzen 7 7800X3D, fiind o alegere inadecvată pentru gaming.
– 📈 Ryzen 7 7800X3D este ideal pentru gaming, obținând o performanță net superioară rivalilor săi, în special la jocuri video.

Am primit deci 5 idei și un pic mai detaliate. Ideea este, deci, că poți cere un rezumat cât de detaliat sau nu vrei tu.

Devine și mai interesant. Glarity poate face rezumat și dacă clipul video are captions în altă limbă, că întâi o traduce în engleză sau poate că o transmite direct așa către ChatGPT și știe robotul (domnul robot, adică, o să fiu respectuos de acum că nu se știe niciodată…) ce să facă în continuare.

De exemplu, propriul meu review la Samsung S23 are captions la clip. Sunt în română și le-am pus eu cu mâna mea. Glarity îmi oferă următorul rezumat pentru review:

Rezumat
Samsung S23 este un telefon compact excelent, cu un ecran foarte bun și un chipset performant, dar atenție la stocarea internă.

Cele mai importante informații
– 📱 Telefonul Samsung S23 este cel mai bun telefon compact de pe piață în acest moment.
– 📏 Are un ecran de 6,1 inci cu o luminozitate foarte mare și o rezoluție de 1080p.
– 🚀 Este echipat cu un chipset Qualcomm Snapdragon 8 Gen 2 și 8 GB de memorie RAM, fiind performant în toate tipurile de taskuri.
– 🔥 Într-un stress test, telefonul coboară până la 60% din performanța sa maximă atunci când este suprasolicitat, dar poate rula orice joc la calitate maximă.
– 💾 Trebuie să fii atent la stocarea internă, deoarece varianta de 128 GB are un tip de stocare mai lent decât celelalte opțiuni disponibile.

Nu este cel mai bun rezumat posibil. Tot ce a zis mai sus este adevărat, dar o parte din review-ul meu este și despre camera foto a telefonului, iar rezumatul nu spune nimic despre aceasta, ceea ce mă miră. În plus, treaba cu stocarea de tip UFS3.1 pe varianta de 128 GB am zis-o în treacăt, că oricum vorbim de sute de MB/s viteze de transfer.

Dar na, este un rezumat. Și totul este îngrijorător.

Este îngrijorător pentru motivul pe care l-am scris mai sus. Creatorii de conținut devine doar mine de date pentru unelte de data mining, care apoi iau acele date, le împachetează sau rezumă sau transcriu sau altă procesare, și le oferă mai departe pe propriul lor site, cu reclamele lor. Creatorul original de conținut pierde de fapt trafic, pierde view time, pierde pe toate planurile de fapt.

Este doar un exemplu de aplicație care interpretează clipuri video. Unelte similare ar putea lua textul unui articol, să-l treacă prin ChatGPT și să-l ofere mai departe rezumat. În era attention span-ului de câteva zeci de secunde, mulți ar prefera asta.

Asta este o problemă foarte mare și foarte reală a creatorilor de conținut, în special în engleză unde monetizarea se bazează pe publicitate, views și integrarea sponsorilor în text. De asta mulți își doresc legi care să reglementeze accesul la date sau măcar posibilitatea de a bloca ChatGPT și alte AI-uri asemănătoare (Google Bard, de exemplu) din a le accesa munca.

Limitarea accesului este practic imposibilă. ChatGPT nu a accesat review-ul meu sau al lui Linus. I-a primit transcrierea cu copy/paste. Este greu să te aperi de asta.

Și acum știu că vor fi unii care vor spune că este foarte bine așa. “Astfel de unelte sar peste publicitatea din site sau sponsorii integrați în clipul video, ce bine!”, vor spune unii. “Cum adică să vrei bani pentru munca ta, deși nici măcar nu-i obții de la consumatorul ei?”, ar spune alții.

În realitate, însă, o publicitate doar este înlocuită cu alta. Astfel de unelte nu sunt construite niciodată gratis. Cineva profită din asta. Nici măcar nu este autorul original al muncii, ci cel care o povestește mai departe. Într-un fel, este același scandal precum cel legat de Google News care lua moca știrile muncite de jurnaliști, le dădea mai departe cu publicitate Google și jurnaliștii originali nu primeau nimic.

Unealta are și aplicații reale. Le permite celor care nu cunosc engleza să afle rezumatul unui clip în engleză. Este utilă și pentru media-monitoring, pentru a afla rapid ce s-a zis în vreo 10 clipuri apărute peste noapte despre brandul sau produsul tău. Sunt și aplicații utile, dar puține.

 

 

Dacă instalați extensia, poate ar fi bine să o dezactivați când nu aveți nevoie de ea. Prin natura ea, vă citește întotdeauna site-urile pe care le accesați, chiar dacă își face magia doar pe câteva dintre ele. Nu se știe niciodată ce face cu restul datelor, de exemplu.

    9 comentarii

  1. Pai cati creatori de continut vin cu continut original? Si ei la randul lor citesc date culese de pe o pagina web.Pagini cu informatii tech ai deja. Cu ce te-ar ajuta rezumatul clipului? O aplicabilitate ar fi pentru persoane cu deficiente auditive daca tin mortis sa fie la curent cu ce posteaza x,y,z dar nu au timp sa vizioneze tot clipul cu captions.

      (Citează)

  2. Mie nu imi analizeaza decat comenturile la video, continutul nu, desi am dat enable la subtitles

      (Citează)

  3. E posibil ca in cativa ani internetul sa devina inutilizabil, pt ca vom vedea din ce in ce mai mult continut generat de AI intr-o prima faza si apoi continutul generat de AI va fi el insusi bazat pe continut generat de AI pt ca continutul generat de oameni va scadea.

    Facebook de exemplu a devenit inutilizabil, desi nu din cauza AI, dar e acelasi fenomen. Sunt atat de multe reclame si recomandari de grupuri de meme etc pe FB incat pur si simplu nu mai vad ce posteza oamenii pe care ii urmaresc.

      (Citează)

    • Și în același timp, oamenii pe care îi urmărești postează tot mai puțin pentru că își dau seama că conținutul lor se pierde între “sponsored”, “suggested” și grupuri.

        (Citează)

    • “pur si simplu nu mai vad ce posteza oamenii pe care ii urmaresc”

      Asta e adevarat dar are o alta cauza: Lumea pur si simplu nu mai posteaza nimic pe Facebook. Toata lumea tine contul, unii intra din cand in cand pentru evenimente / bilete / meme etc, dar nimeni nu mai posteaza nimic si atunci algoritmul umple timeline-ul cu reclame

        (Citează)

    • nu, nu, oamenii pe care ii urmaresc chiar posteaza la fel de mult, ca e vorba de “influenceri”, nu de prieteni de-ai mei.

      insa am observat ca pur si simplu FB le ascunde postarile: gen comentez acum la ceva si apoi pur si simplu imi dispare din feed postul respectiv, notificari de reactii nu mai primesc decat aleator etc, e nevoie sa caut persoana respectiva si apoi sa caut postul respectiv si apoi sa imi caut comentariul ca sa vad ce au mai zis altii

      e o schimbare clara care s-a intamplat in ultimul an si am confirmat-o si cu alti oameni

        (Citează)

  4. Nu stiu cat de mult vor fi afectati producatorii de continut video. De exemplu eu prefer sa citesc informatiile tehnice de pe un blog, un site cu analize/grafice/etc. Aleg sa ma uit la un clip pe Youtube cand nu am alta optiune de a gasi acele informatii.
    Asta inseamna ca daca tu, Radu, ai postat un articol despre procesoare si ai facut si un clip pe Youtube, eu nu o sa urmareasc niciodata clipul. Si nici nu o sa am nevoie de ChatGPT sa imi extraga informatiile, fiindca le gasesc pe blog.

    Clipurile in schimb au succes la noua generatie, cei care nu au chef sa citeasca si vor doar sa asculte ceva, sa se uite la imagini, etc. Iar oamenii acestia nu vor un sumar de 5 randuri, vor sa il vada si sa il asculte pe vloggerul lor preferat.

      (Citează)

    Alătură-te discuției, lasă un mesaj

    E-mail-ul nu va fi publicat. Fără înjurături și cuvinte grele, că vorbim prietenește aici. Gândiți-vă de două ori înainte de a publica. Nu o luați pe arătură doar pentru că aveți un monitor în față și nu o persoană reală.

    Apăsați pe Citează pentru a cita întreg comentariul cuiva sau selectați întâi anumite cuvinte și apăsați apoi pe Citează pentru a le prelua doar pe acelea. Link-urile către alte site-uri, dar care au legătură cu subiectul discuției, sunt ok.


    Prin trimiterea comentariului acceptați politica de confidențialitate a site-ului.



    Vreți un avatar în comentarii? Mergeți pe gravatar.com (un serviciu Wordpress) și asociați o imagine cu adresa de email cu care comentați.

    Dacă ați bifat să fiți anunțați prin email de noi comentarii sau posturi, veți primi inițial un email de confirmare. Dacă nu validați acolo alegerea, nu se va activa sistemul și după un timp nu veți mai primi nici alte emailuri

    Comentariile nu se pot edita ulterior, așa că verificați ce ați scris. Dacă vreți să mai adăugați ceva, lăsați un nou comentariu.

sus