一边通过后视镜打量后面三个人文字转WAV音频