但是在提出这个想法的时候却没有考虑那么多文字转WAV音频