只是维持了一个正常的水平文字转WAV音频