能够得出的结论也就是这些文字转WAV音频