这些人还是要全部带着文字转WAV音频