唯一要担心的似乎只有文字转WAV音频