至少要多出来三四个小时的行程文字转WAV音频