然后形成一个修炼层次文字转WAV音频