Proces ten jest jeszcze bardziej skomplikowane dla wyrażeń i zdań. - System musi dowiedzieć się, gdzie każde słowo zatrzymuje się i zaczyna. Klasycznym przykładem jest zdanie " rozpoznaje mowę, " co brzmi trochę jak " wraku ładna plaża " kiedy mówisz, to bardzo szybko. Program ma przeanalizować fonemów używając sformułowania, że przyszedł przed nim, aby zrobić to dobrze. Oto zestawienie tych dwóch wyrażeń: Największa
r eh k ao g n ay Z S P iy ch Największa
" rozpoznawać mowę " Największa
r eh k ay n ay s b iy ch Największa
" wrak ładna plaża " Największa
Dlaczego jest to tak skomplikowane? Jeśli program ma słownictwo 60.000 słów (częste w dzisiejszych programach), sekwencja trzech słowach może być każdy z 216 bilionów możliwości. Oczywiście, nawet najpotężniejszy komputer nie może przeszukać wszystkie z nich bez pomocy. Największa
To jest pomoc w postaci szkoleń programu. Według Johna Garofolo: Największa te systemy statystyczne potrzebują dużo przykładowych danych treningowych, aby osiągnąć ich optymalną wydajność - czasem rzędu tysięcy godzin mowy ludzkiej transkrypcji i setki megabajtów tekstu. Te dane treningowe są wykorzystywane do tworzenia modeli akustycznych słowy, listy słów, i [...] sieci prawdopodobieństwa wielu słów. Istnieją pewne techniki, w jaki sposób jeden wybiera, opracowuje i przygotowuje te dane szkoleniowe dla " trawienia " przez system i sposób modelu systemu są cali do regulowana pod koniec; do konkretnego zastosowania. Dane te mogą sprawić, że różnica między dobrze wykonującego oraz system źle wykonujących. - Nawet przy zastosowaniu tego samego algorytmu podstawowe
Podczas gdy programiści, którzy utworzone wstępne słownictwa systemu wykonać wiele z tego szkolenia, koniec Użytkownik musi spędzić trochę czasu na szkolenie go. W otoczeniu biznesowym, głównymi użytkownikami programu muszą spędzić trochę czasu (czasami tylko 10 minut) mówiąc do systemu szkolić go na ich specyficznych wzorców mowy. Muszą również wyszkolić system rozpoznawania warunków i akronimy szczególności do firmy. Specjalne wersje programów do rozpoznawania mowy dla gabinetów medycznych lub prawnych mają warunków powszechnie stosowanych w tych dziedzinach już przeszkolonych do nich. Największa
Następnie przyjrzymy się pewnych słabości i wad systemów rozpoznawania mowy. Największa Rozpoznawanie mowy : Słabości i wady Największ