他要尽可能掌握主动文字转WAV音频