而且两者的编制也是有限的文字转WAV音频