他至少需要选出三本相对应地丹文字转WAV音频