虽然整个过程她绝大部分时间都是闭着眼睛的文字转WAV音频