解决gbk页面采集报illegal multibyte sequence错误处理
最近在采集gbk网页数据发现解码报illegal multibyte sequence错误,于是采用最新的国标gb18030解决