最后形成了两道无比凝练的人影文字转WAV音频