只会在有足够的把握时文字转WAV音频