然后才决定是透支消费文字转WAV音频