他必须要统计出来确切的数量文字转WAV音频