更多的是担忧文字转WAV音频