他希望能够提前知道到底几个人文字转WAV音频