所以我能清楚地看到他面部的表情文字转WAV音频