也不是我们先说出来的文字转WAV音频