前者决定领域文字转WAV音频