剩余的两个途径一个是得到内文字转WAV音频