获取的基因需要整合文字转WAV音频