只是说了这两个外表特征文字转WAV音频