他们还能操控自身的文字转WAV音频