Kierownik Speech Technologies Mike Cohen Google rozumie mowę na poziomie większość z nas nie myśleć. On rozumie go na poziomie podstawowym kombinacjami dźwiękowymi i wskazówek kontekstowych. On musi - on jest odpowiedzialny za dział w Google, który działa na technologii rozpoznawania mowy Największa
Nauczanie komputer rozpoznawania mowy jest trudne.. Aby zrozumieć, angielskim, istnieje wiele przeszkód trzeba pokonać. Język angielski ma wiele homonimów - słów, które fonetycznie brzmi tak samo, ale mają różne znaczenie. Pomyśl o " na, " " dwie " i " za ". Ludzie mówiący z akcentem lub w dialekcie regionalnym może wymawiać słowa w sposób, który jest znacznie różni się od standardowej wymowy. A potem są słowa takie jak " trasie " które mają alternatywne wymowy - można powiedzieć " korzeń " lub " trasa " i obie są poprawne. Największa
Jak nauczyć komputer, aby te różnice? W jaki sposób można to maszyna rozumie to, co mówimy i odpowiednio reagować? Są to wyzwania, Cohen i jego twarz zespołu w Google. Rozmawialiśmy z Cohenem i poprosił go, aby dać więcej szczegółów na temat jego pracy w dziedzinie badań i aplikacji do rozpoznawania mowy. Największa
Na każdej stronie, zobaczysz nasze pytania w tytule i odpowiedzi Cohena w organizmie. Zaczęliśmy z podstawami technologii rozpoznawania mowy, jak zobaczysz na następnej stronie. Największa Jak działa technologia rozpoznawania mowy na poziomie podstawowym? Największa
OK, więc zasadniczo, tak że pole wbiegł w ciągu ostatnich kilkadziesiąt lat jest coraz bardziej w kierunku rozwiązań opartych na danych statystycznych, lub modelowania. Co mam na myśli, że jest raczej niż ludzie iść i spróbować zaprogramować wszystkie te zasady lub wszystkie z tych opisów, jak działa język, staraliśmy się budować modele, gdzie moglibyśmy nakarmić wiele, wiele danych do modeli i modele poznają struktury wypowiedzi z danymi. Tak więc podejście oparte na danych są metody oparte na budowaniu dużych modeli statystycznych języku karmiąc go dużo danych. Największa
To pierwsza zasada, a ruch w kierunku uczenia maszynowego, lub oparte na danych statystycznych lub podejścia faktycznie jedno z najważniejszych osiągnięć w historii dziedzinie rozpoznawania mowy. A więc pojawia się pytanie, jaki rodzaj modelu powinniśmy zacząć, które możemy następnie karmić tych danych, dzi