因为这都是假设性文字转WAV音频