无疑要耗费更多的时间和精力文字转WAV音频