第一个承受的便是她自己文字转WAV音频