但做出的手势和口中念出的手型却是不同的文字转WAV音频