他能够客观地评价文字转WAV音频