因为自己说的都是真的文字转WAV音频