a是取自文字转WAV音频