所以他们都比较熟悉文字转WAV音频