香港服务器访问国内站除了用代理ip外,还有什么方便抓取的好方法?,香港国内,我在做一只淘宝的爬虫,但
香港服务器访问国内站除了用代理ip外,还有什么方便抓取的好方法?,香港国内,我在做一只淘宝的爬虫,但
我在做一只淘宝的爬虫,但是用的是香港的服务器,但是比较困惑:
因为每次爬淘宝的首页时候,就自动给我跳转到香港淘宝~~
导致源代码和内容都不一样~
请问如果遇到这种情况要怎么处理呢?
简单来说,比如采集58同城
如果我是泉州的,我想采集北京的,要怎么采集?
因为我用我的ip打开会总跳转到北京,但是直接想采集58首页的
?
![图片上传中...]
有时候服务器会根据你的ip对应的地理位置信息作重定向的,这个你除了找代理应该没有别的方法了。。
如果是想采集的北京的,就去打子城名,不过有PGTID保护
http://bj.58.com/?PGTID=0d000...
建义使用selenium
禁止重定向,以requests为例子:
r = requests.get('http://github.com/', allow_redirects=False)r.status_code # 302r.url # http://github.com, not https.r.headers['Location'] # https://github.com/ -- the redirect destination
编橙之家文章,
相关内容
- python时间判断问题处理方法,python处理方法,A在库里已
- 关于python Regex匹配XML标签内容的一些疑问,pythonregex,总
- Python web框架开发需要学习哪些知识,pythonweb,需要哪些
- 定时运行python virtualenv程序没执行原因,pythonvirtualenv
- python django+celery+ansibleApi无返回,djangoansibleapi,1.python调
- Python处理二进制流应该怎么写,Python处理二进制流,我现
- Python判读变量是否定义用什么方法,python判读变量定义
- Python webpy模板变量可以遍历两次吗?为什么我的方法不行
- python处理小文件读写并行的一些疑惑,python读写,我有大
- python threading线程再次开启多线程AttributeError错误应对方
评论关闭