他们知道自己接下去要做的事情是什么文字转WAV音频