爬虫状态码返回状态200,自己访问400,这是什么原因?,爬虫400,import urlli
爬虫状态码返回状态200,自己访问400,这是什么原因?,爬虫400,import urlli
import urllib2opener = urllib2.build_opener()html = Noneresponse = Noneresponse = opener.open('http://www.sxxrcs.com/was5/web/')html = response.codeprint html
比如这个爬虫,输出状态码是200。
可是直接访问http://www.sxxrcs.com/was5/web/是404,抓包响应的也是404,请问这是为什么?
用requests吧
import requestsr = requests.get('http://www.sxxrcs.com/was5/web/')print r.status_codeprint r.text
200正常啊,requests方便快捷。
编橙之家文章,
相关内容
- Python requests爬虫编码encoding error是什么问题,requestsen
- 适合Python应用的Vim缩进调试方法,pythonvim缩进调试,我的
- python list列表append方法的性能问题,pythonappend,作为客户
- Python有没有开源包处理GBK Unicode编码问题,pythonunicode
- 了解python flask.Response(generator())流内容处理的朋友请进,
- Ubuntu火狐浏览器可以用python脚本来控制吗?,ubuntupytho
- Python yield与斐波那契数列问题,pythonyield,def fib():
- Python函数无法运行源码有问题吗?,python源码,>>&g
- Python扩展包问调用C++扩展方式,python,对方只提供了.s
- 想用Python随机生成多个不重复坐标需要用到什么库或是
评论关闭