一方面是为了确认身份文字转WAV音频