最起码也应该有一个稳定的对象了文字转WAV音频