到时候我们可能将面临两种不同的情况文字转WAV音频