只不过是以灵识传音的形式的听到的文字转WAV音频