他说的这件事情是关于两个位面的文字转WAV音频