再加上另外三人的辅助文字转WAV音频