他们两个决定用最友好的方式来决定谁上文字转WAV音频