也需要沉稳的去处理文字转WAV音频