因此对于本尊的情况也只能用一个文字转WAV音频