然后这才在两人旁边坐下文字转WAV音频