Lyssning

Microsofts taligenkänning i nivå med människors

För första gången någonsin kan en artificiell intelligens transkribera en konversation lika bra som människor.

Publicerad Uppdaterad

När människor försöker transkribera en konversation i realtid missar vi i snitt 5,9 procent av det vi hör. Microsoft meddelar nu att för första gången så kan en artificiell intelligens klara av uppgiften med samma felmarginal. 

”Vi har nått mänsklig motsvarighet. Det är ett historisk åstadkommande.”, säger chefsforskaren Xuedong Huang i Microsofts blogginlägg. 

Forskarna har klarat av att åstadkomma den historiska målsättningen på mindre än ett år. Arbetet med taligenkänning har i och för sig pågått sedan 1970-talet med amerikanska försvarsorganet Darpa (Defense Advanced Research Projects Agency) som pionjär. Men utvecklingen har verkligen tagit fart under senare tid. 

”Bara för fem år sedan så trodde jag inte att vi skulle lyckas med detta. Jag hade inte trott att det skulle vara möjligt.”, säger Harry Shum, chef för Microsofts AI och forsknings-grupp. 

Framsteget kommer enligt företaget att ha verklig inverkan på tjänster som exempelvis Cortana, Microsofts motsvarighet till Siri eller Googles assistent. 

Nästa målsättning för utvecklarna är att AI:n ska klara av att transkribera lika bra i röriga ljudmiljöer som på en fullproppad gata eller medan man kör bil. 

Källa