但他却也只能认输文字转WAV音频