实际上在来之前他就知道文字转WAV音频