不过很多事情本来就是不能按照常理来推断文字转WAV音频