而是以少许气息分出文字转WAV音频