面临的问题主要有两个文字转WAV音频