因为他们从某些渠道隐约知道文字转WAV音频