在根据留下来的这些人的框架文字转WAV音频