就是双方同时出剑文字转WAV音频