我给了他们考虑时间文字转WAV音频