因为它的核心还是故事文字转WAV音频