另一方面也是考虑到胜率问题文字转WAV音频