并且从照片上面的体积来看文字转WAV音频