每个角色都应当是主角文字转WAV音频