毕竟他们的确是自作自受文字转WAV音频