顶多也就是个普通熟人文字转WAV音频