而且我们需要找到那几个人质的位置文字转WAV音频