所以他选择了自行了断文字转WAV音频