un blog de Radu Dumitru

►► canalele mele de YouTube: youtube.com/RaduDumitru (personal) și youtube.com/NwraduBlog (tech) ◄◄

Suntem tot mai aproape de un translator universal

24 Nov 2016  ·

TEHNOLOGIE  ·

9 comentarii

Iată încă un proiect foarte util: un computer a fost învățat să citească pe buze și o face cu o acuratețe pe 93%, în timp ce oamenii cu astfel de pregătire reușesc abia un 52% (aparent nu-i ca-n filme).

Computer este puțin zis, este de fapt o inteligentă artificială în sensul de acum, nu în cel din cărțile SF, adică un computer ce este antrenat să recunoască buzele nu prin programare clasică, sunet cu sunet, ci fiind expus la zeci de mii de înregistrări de clipuri video, putând astfel să facă o analiză a micilor deosebiri de acolo și să învețe diferențele.

Aplicațiile sunt enorm de multe și la fel de importante pentru digitalizarea informației precum scannerul de cărți pe care vi l-am arătat zilele trecute. Cu astfel de calculatoare performante, o mulțime de clipuri video ar putea avea și versiune text, indexabilă. Toate discursurile, vlogurile, TED Talks-urile șamd, fără nici un efort suplimentar. Ba mai mult, cu algoritmi suficient de buni computerul ar putea “scrie” subtitrarea pentru orice film, iar alți algoritmi de acest tip ar putea să o traducă în toate limbile.

Încă un exemplu: mă chinui de ceva vreme să găsesc un program de dictare în română, care să recunoască măcar parțial ceea ce-i zic, micșorând astfel timpul necesar scrierii acestor articole uriașe. Nu există unul bun. Dacă în loc de recunoașterea sunetului aș trece la recunoașterea mișcării buzelor?

Dar dacă aș vorbi față în față cu un chinez, eu având ceva ochelari tip Google Glass pe cap care-i analizează buzele, detectează ce-a zis și-mi rostește în ureche traducerea în română?

Gândiți-vă la treaba asta. Un translator universal nu mai este ceva demn de Star Trek, ci avem toate tehnologiile necesare pentru ce-am spus mai sus, trebuie doar rafinate și integrate.

Un proces asemănător de machine learning am înțeles că s-a făcut și pentru Kinect de la XboX, sistemul fiind expus la zeci de mii de fotografii cu diverse poziții și învățând de acolo să le recunoască. Vorbeam despre asta cu Silviu, cititor al blogului și de altfel cel care mi-a arătat știrea aceasta, și-mi spunea că procesul pare simplu pe hârtie, dar nu-i și în practică.

Analogia dată de el a fost cu metoda de a învăța un șofer nou să navigheze prin oraș. Dacă-l duci de 10 ori în același cartier, a învățat doar acel loc. Dacă-l duci în 10 locuri total diferite, nu învăță de fapt nimic. Secretul este să ai multe cazuri ce variază între ele suficient de mult pentru a învăța ceva, dar suficient de puțin pentru a învăța cu acuratețe. Să găsești banda aceasta ideală este destul de dificil și pot apărea erori. Altfel spus, cei care au învățat acel computer sa citească buzele ar fi putut ajunge, la final, la concluzia că au expus sistemul la un set greșit gândit de 28.000 de clipuri video și trebuie să o ia de la capăt.

Dacă vreți să vedeți cum învață un AI să recunoască forme, jucați-vă cu Quick, Draw de la Google.

sursa: Core77.

    9 comentarii

  1. Pai de ce crezi ca a cumparat Microsoft pe Skype? Imediat dupa, au scos translatorul si traducatorul din diferite limbi…Skype dandu-le access la o baza de date imensa cu training seturi pentru algoritmii de ML

      (Citează)

  2. din pacate lumea il invata prostii: http://i.imgur.com/ff1P6dl.png

    altfel fun.

      (Citează)

  3. Si milioane de traducatori si interpreti sa ramana fara obiectul muncii?!

      (Citează)

    • miliarde! sunt miliarde!

        (Citează)

    • Și să încetinim tehnologia doar de dragul unor locuri de muncă? E tot mai faină viața în secolul 21 pentru că joburile sunt înlocuite de roboți și suntem nevoiți să evoluăm și să devenim mai relevanți în societate.

        (Citează)

    • @deea: stai fara grija traducatorilor. Actele traduse trebuie stampilate de un traducator autorizat de Ministerul Justitiei. Pana nu autorizeaza ministerul stampila translatorului google, traducatorii nu vor muri de foame. Deocamdata traducerile google sunt hilare. Mai au mult de munca.

        (Citează)

  4. Dragon Dictation in limba romana merge foarte bine. Stiu cine isi dicteaza cursurile in limba romana pentru a le avea in format electronic.
    :)
    Din pacate, doar pentru produsele Apple.

      (Citează)

  5. nu știu cum e pe Android dar pe io ies scrierea după dictare merge perfect
    textul ăsta l’am dictat aifonului în notes.
    observ că nu știe să pună virgula înainte de dar și în loc de ios a înțeles io ies.
    a pus singur A la android.

      (Citează)

  6. O mică precizare, translatorul universal din Star Trek știa să traducă limbi necunoscute, adică se prindea/învăța singur; ca și teleportarea, tehnologia asta e încă departe :-)

      (Citează)

    Alătură-te discuției, lasă un mesaj

    E-mail-ul nu va fi publicat. Fără înjurături și cuvinte grele, că vorbim prietenește aici. Gândiți-vă de două ori înainte de a publica. Nu o luați pe arătură doar pentru că aveți un monitor în față și nu o persoană reală.

    Apăsați pe Citează pentru a cita întreg comentariul cuiva sau selectați întâi anumite cuvinte și apăsați apoi pe Citează pentru a le prelua doar pe acelea. Link-urile către alte site-uri, dar care au legătură cu subiectul discuției, sunt ok.


    Prin trimiterea comentariului acceptați politica de confidențialitate a site-ului.



    Vreți un avatar în comentarii? Mergeți pe gravatar.com (un serviciu Wordpress) și asociați o imagine cu adresa de email cu care comentați.

    Dacă ați bifat să fiți anunțați prin email de noi comentarii sau posturi, veți primi inițial un email de confirmare. Dacă nu validați acolo alegerea, nu se va activa sistemul și după un timp nu veți mai primi nici alte emailuri

    Comentariile nu se pot edita ulterior, așa că verificați ce ați scris. Dacă vreți să mai adăugați ceva, lăsați un nou comentariu.

sus