从声音的辨识度可以听出来文字转WAV音频