虽然表面上他们好像是对着干文字转WAV音频