估计也就是当事人心里清楚文字转WAV音频