就是尽量撇清自己文字转WAV音频