而是要时刻保持着消耗文字转WAV音频