根本就不知道怎么处理接下来的场面文字转WAV音频