Progresele înregistrate în tehnologia de recunoaștere a vocii, care va permite computerelor să înțeleagă perfect oamenii, pot deschide calea pentru realizarea unor noi aplicaţii în doar câţiva ani.

Vorbeşte cu mine

Tehnologia de recunoaștere a vocii a înregistrat progrese importante odată cu lansarea serviciilor Siri, OK Google și Cortana. Totuşi, se pare că mai există loc pentru îmbunătățiri. Xuedong Huang, din cadrul Departamentului de Cercetare Dezvoltare de la Microsoft, a afirmat că în ultimii 20 de ani tehnologia de recunoaştere a vocii s-a îmbunătățit continuu cu o rată de 20% în fiecare an.

Serviciul de recunoaștere vocală

Serviciul de recunoaștere vocală. Credit: http://www.pcmweb.nl

Acest lucru înseamnă că „în următorii patru-cinci ani, computerele vor fi la fel de bune ca oameni”, atunci când vine vorba de înțelegerea limbajului uman.

La începutul acestui an Google a anunțat că rata de eroare a recunoașterii vorbirii în cazul serviciului său de recunoaştere vocală a scăzut până la o valoare de 8%. Atunci când Microsoft a lansat tehnologia sa de recunoaștere a vorbirii în cadrul Windows 95, rata de eroare a fost de aproape 100%. Dacă experții au dreptate, atunci în următorii ani se va obţine o rată de eroare mai mică de 8%.

Etapa următoare

Huang afirmă, de asemenea, că precizia în tehnologia de recunoaștere a vocii va deschide calea pentru ceea Microsoft consideră a fi următoarea etapă: inteligența artificială reală.

Datorită îmbunătățirilor continue a aplicațiilor de recunoaştere vocală, oamenii pot purta conversații tot mai complexe cu gadgeturile lor. Ca urmare a faptului că vorbirea devine un mod tot mai utilizat pentru a interacționa cu tehnologia IT, se creează o bază pentru îmbunătăţirea inteligenței artificiale cu ajutorul căreia se vor putea realiza aplicații tot mai variate. Prin îmbunătăţirea tehnologiei de recunoaștere a vorbirii utilizatorii vor putea să-şi controleze nu doar propriile telefoane, ci şi alte gadgeturi sau dispozitive.

„Practic, bariera lingvistică va fi depăşită în următorii patru ani, pentru cele mai importante limbi și cele mai utilizate aplicaţii ale tehnologiei de recunoaştere vocală”, a declarat într-un comunicat de presă Arul Menezes, cel care conduce echipa de traducere automată de la Microsoft Research.

Sursă: Futurism