第一个方案是入股文字转WAV音频