几乎是将整个人切成两半文字转WAV音频