虽然我推演计算的是和局文字转WAV音频