其实是借吼声进一步压制文字转WAV音频