很显然是为了缓解尴尬文字转WAV音频