所以他要做的就是保住第三的位置文字转WAV音频