或者两个都留下文字转WAV音频