我也认为这个方案不可取文字转WAV音频