他们通常都能对以上这四种行为做出看似合理文字转WAV音频