可是每秒都要消耗1%生存值的文字转WAV音频