前面就从案情本身来分析了文字转WAV音频