所以他不会讲文字转WAV音频