于是两人本来是并排坐着文字转WAV音频