一部分负责捡文字转WAV音频