则是大量密集的建筑文字转WAV音频