更加不可能说提前发现了文字转WAV音频