并且按照字迹的理解修炼文字转WAV音频