何况对方也不可能每次都能写出好的词作来文字转WAV音频