而是在计算利益文字转WAV音频