MojWindows

Výskumníkom zo spoločnosti Microsoft sa v krátkom čase podarilo zdokonaliť systém na rozpoznávanie reči, ktorý je postavený na metódach umelej inteligencie. Koncom minulého roka dosiahol systém pri prepise rozhovorov chybovosť 5,9%, čo Microsoft prezentoval ako rovnakú hodnotu, akú zaznamenal v prípade profesionálnych zapisovateľov.

Začiatkom marca ale toto tvrdenie čiastočne spochybnila spoločnosť IBM, ktorá Microsoft prekonala, keďže dosiahla chybovosť 5,5%. Zároveň vtedy uviedla, že pre vyrovnanie sa ľuďom je nutné dosiahnuť mieru chybovosti maximálne 5,1%. Práve túto hranicu sa Microsoftu aktuálne poradilo dosiahnuť pri spracovaní telefónnych konverzácií so špecifickými témami ako napríklad šport a politika. Ide o metódu nazývanú Switchboard.

Novú hranicu bolo možné dosiahnuť vďaka vylepšeniu používaných modelov, ktoré sú založené na neurónových sieťach. Zároveň bol do systému pridaný aj nový model CNN-BLSTM pre analýzu celkovej komunikácie, na základe čoho dokáže vyhodnotiť, akým smerom sa bude rozhovor uberať. Systém tak čaká ešte ďalšie zdokonaľovanie možností. Pripomeňme, že Microsoft ho využíva napríklad pre svoju digitálnu asistentku Cortana.

Microsoft ale pripomína, že hoci technológia postupne napreduje a prekonáva tak nové hranice, stále má pred sebou dlhú cestu. Obzvlášť problematické je porozumenie hlasu v hlučnom prostredí, pri veľkej vzdialenosti od mikrofónu, či v závislosti od akcentu a hovoreného štýlu. Technologické spoločnosti zároveň stoja pred výzvou, kedy je počítače nutné naučiť slová nielen rozpoznávať a prepisovať, ale aj správne interpretovať.

Zdroj: Fortune

22.08.2017

+