也可以理解为边学道的眼睛和耳朵文字转WAV音频