python中使用urllib2伪造HTTP报头的2个方法_

简要咨询咨询QQ 网站导航网站搜索手机站点联系我们

118bet金博宝下载

首页

118bet金博宝

188app金宝搏

118bet金博宝下载

当前位置：首页> 范文|应用文> IT技术专栏> 脚本栏目

python中使用urllib2伪造HTTP报头的2个方法

来源：阅读：1739 次日期：2014-07-08 19:10:53

温馨提示：小编为您整理了“python中使用urllib2伪造HTTP报头的2个方法”,方便广大网友查阅！

这篇文章主要介绍了python中使用urllib2伪造HTTP报头的2个方法,即伪造http头信息,需要的朋友可以参考下

在采集网页信息的时候，经常需要伪造报头来实现采集脚本的有效执行

下面，我们将使用urllib2的header部分伪造报头来实现采集信息

方法1、

#!/usr/bin/python

# -*- coding: utf-8 -*-

#encoding=utf-8

#Filename:urllib2-header.py

import urllib2

import sys

#抓取网页内容-发送报头-1

url= "http://www.xxx.net"

send_headers = {

'Host':'www.xxx.net',

'User-Agent':'Mozilla/5.0 (Windows NT 6.2; rv:16.0) Gecko/20100101 Firefox/16.0',

'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',

'Connection':'keep-alive'

}

req = urllib2.Request(url,headers=send_headers)

r = urllib2.urlopen(req)

html = r.read() #返回网页内容

receive_header = r.info() #返回的报头信息

# sys.getfilesystemencoding()

html = html.decode('utf-8','replace').encode(sys.getfilesystemencoding()) #转码:避免输出出现乱码

print receive_header

# print '####################################'

print html

方法2、

#!/usr/bin/python

# -*- coding: utf-8 -*-

#encoding=utf-8

#Filename:urllib2-header.py

import urllib2

import sys

url = 'http://www.xxx.net'

req = urllib2.Request(url)

req.add_header('Referer','http://www.xxx.net/')

req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.2; rv:16.0) Gecko/20100101 Firefox/16.0')

r = urllib2.urlopen(req)

html = r.read()

receive_header = r.info()

html = html.decode('utf-8').encode(sys.getfilesystemencoding())

print receive_header

print '#####################################'

print html

更多信息请查看IT技术专栏

更多信息请查看脚本栏目

【点此处就本文及相关问题在本站进行非正式的简要咨询（便捷快速）】【点此处查询各地各类考试咨询QQ号码及交流群】

上一篇： python实现多线程采集的2个代码例子

下一篇： Python中使用urllib2防止302跳转的代码例子

手机网站地址： python中使用urllib2伪造HTTP报头的2个方法

由于各方面情况的不断调整与变化，提供的所有考试信息和咨询回复仅供参考，敬请考生以权威部门公布的正式信息和咨询为准！

相关阅读脚本栏目

Bottle框架中的装饰器类和描述符应用详解 10月30日

Python探索之SocketServer详解 10月30日

Python探索之实现一个简单的HTTP服务器 10月30日

python探索之BaseHTTPServer-实现Web服务器介绍 10月30日

13个最常用的Python深度学习库介绍 10月30日

深入理解Python中的*重复运算符 10月30日

python logging日志模块详解 10月30日

System表空间不足的报警问题浅析 10月22日

Android开发自定义TextView省略号样式的方法 10月22日

MySQL 清除表空间碎片的实例详解 10月22日

Ubuntu下MySQL安装及配置远程登录教程 10月22日

Python 2.x如何设置命令执行的超时时间实例 10月22日

windows 64位下redis安装教程 10月22日

Android 自定义 HorizontalScrollView 打造多图片OOM 的横向滑动效果 10月22日

浅谈Node Inspector 代理实现 10月22日

java web开发之购物车功能实现示例代码 10月22日

Android开发中GridView用法示例 10月22日

Django ORM框架的定时任务如何使用详解 10月22日

SpringMail使用过程中的报错解决办法 10月22日

Android 使用自定义RecyclerView控件实现Gallery效果 10月22日

移动网站

最新信息

2024年玉溪市家园建设投资有限公司及所属子公司招聘公告

2024年昆明市嵩明县嵩阳一中招聘临聘教师公告

2024年保山市隆阳河图街道办事处招聘禁毒专干公告

2024年曲靖市富源县公安局后所派出所招聘2名警务辅助人员公告

2024年德宏州检察机关聘用制书记员笔试、技能测试公告

2024年迪庆州香格里拉市事业单位招聘拟聘用人员公示（第二批）

2024年昆明市嵩明县杨林镇中心学校官渡小学

2024年昆明医科大学第一附属医院招聘超声科打字员第一阶段考核成绩公告

2024年西双版纳州勐海县第二批城镇公益性岗位人员招聘公告

2024年昆医大附一院招聘科研助理人员面试成绩（综合成绩）公告

关于我们| 联系我们| 人才招聘| 网站声明| 网站帮助| 非正式的简要咨询| 简要咨询须知| 加入群交流| 手机站点| 投诉建议

工业和信息化部备案号：滇ICP备2023014141号-1 云南省教育厅备案号：云教ICP备0901021 滇公网安备53010202001879号人力资源服务许可证：（云）人服证字（2023）第0102001523号

联系电话：0871-65317125（9:00—18:00）获取招聘考试信息及咨询关注公众号：
咨询QQ：526150442（9:00—18:00）版权所有: