却是有着明确的分类的文字转WAV音频