他大概能够猜到文字转WAV音频