W rozpoznawaniu mowy interfejs użytkownika zazwyczaj przetwarza sygnał, aby umożliwić ekstrakcję funkcji ze strumienia audio. W tym procesie dwukrotnie stosowana jest dyskretna transformata Fouriera (DFT). Pierwszy raz jest po okienkowaniu; po zastosowaniu binowania Mel, a następnie kolejnej...